软件下载 > 开发工具 > 网站制作 > 火车采集器(LocoySpider) > 软件简介
火车采集器(LocoySpider)

火车采集器(LocoySpider)

软件类型:
网站制作
用户评分:
软件类型:
34.46 MB
软件类型:
2022-05-30
安全下载
鲁大师安全下载

火车头采集器是一个供各大主流文章系统,使用火车头采集器你可以瞬间建立一个拥有庞大内容的网站。zol提供火车头采集器官方版下载。

火车采集器(LocoySpider)软件特性

火车头采集器是一个供各大主流文章系统,论坛系统等使用的多线程内容采集发布程序。使用火车头采集器你可以瞬间建立一个拥有庞大内容的网站。zol提供火车头采集器官方版下载。

火车采集器(LocoySpider)

火车采集器(LocoySpider)是一款专业的功能强大的网络数据/信息挖掘软件,通过灵活的配置,您可以很轻松的从网页上抓取文字、图片、文件等任何资源。

火车采集器(LocoySpider)下载

火车采集器(LocoySpider)程序支持远程下载图片文件,支持网站登陆后的信息获取,支持探测文件真实地址,支持代理,支持防盗链的采集,支持采集数据直接入库和模仿人手工发布等许多功能特点。

火车采集器支持从任何类型的网站采集获取您所需要的信息,如各种新闻类网站、论坛、电子商务网站、求职招聘网站等。

同时具有强大的网站登录采集、多页和分页的采集、网站跨层采集、POST采集、脚本页面采集、动态页面采集等高级采集功能。

强大的php和c插件支持,让您可以通过二次开发实现您所想要的任何更强大的功能。

火车采集器(LocoySpider)软件特色:

1、通用性强

无论新闻、论坛、视频、黄页、图片、下载类网站,只要通过浏览器能看到的结构化的内容,通过指定匹配规则,都能采集到您所需要的内容。

2、稳定、高效

五年磨一剑,软件不断更新进步,采集速度快,性能稳定,占用资源少。

3、扩展性强、适用范围广

自定义web发布,自定义主流的数据库的保存和发布,自定义本地php及.net外部编程接口处理数据,让数据都能为你所用。

火车采集器(LocoySpider)更新日志

火车采集器V9.21版
1: 自动获取cookie功能优化
2: 数据库发布增加事务,优化数据库发布速度
3: 数据转换速度优化(针对Mysql和SqlServer数据库的导入), 同时去除网址库的清空逻辑
4: html标签处理错误问题处理
5: json提取关于数字转换为科学计数法问题处理
6: 发布测试时,图片上传无效的问题处理
7: 采集内容页处理错误时,增加对于当前出错标签的提示,以便快速定位出错标签
8: 任务批量编辑,增加可操作范围
9: 循环匹配匹配空格问题处理
10: 刷新分组中增加统计数据的刷新
11: post分页处理
12: 部分功能逻辑优化

火车采集器V9.9版
1.优化效率修复运行大量任务时运行卡顿问题
2.修复大量代理时配置文件锁死程序退出问题
3.修复部分情况下mysql链接不上问题
4.其它界面和功能优化


火车采集器V9.8版

1: “远程管理” 正式升级为 “私有云”,全面优化调整。
2: 发布模块增加自定义头信息的增加。
3: 采集线程间隔调整,增加自定义区间设置。
4:长时间使用后的运行卡顿问题修复。
5: 二级代理,IP输入框修改为普通TextBox。增加代理免验证的功能。
6: 分组丢失、死循环问题修复。
7: ftp上传,增加超时处理。

火车采集器火车采集器V9.6版
1: 多级网址列表,对于列表名增加重命名功能以及上下调整的功能。
2: 修复SqlServer数据库格式下,未能正确显示采集数量的问题。
3: 修复在新增标签时,若上一个编辑为固定格式数据,则新增的标签显示内容错误的问题。
4: 修复数据包登录中,若登录失效,未能自动重新登录的问题。
5: 修复FTP上传失败后,本地数据也被删除的问题。
6: 修复边采集边发时,文件上传FTP失败的问题。
7: 优化Excel保存时,对于ID,PageUrl显示列的位置。
8: 修复任务不能多选操作的问题。
9: 边采集边发布时,最大发布数的功能调整(原:最大发布数无效。 现:最大发布数生效,且在任务完成后,不会将以前的未发布数据再次发布)
10:修复对于存储过程语句,当数据为空值时,意外判断为“语句错误”的问题。
11:二级代理功能,修复定时拨号失效的问题。
12:二级代理功能,定时获取API功能优化,重新获取时,会自动删除上一批数据。
13:批量网址增加数据库导入的模式
14:导出到文件时,对于不合理的错误命名增加提示。
15:导出规则时,对于规则名称过长的规则,增加提示的功能。
16:规则编辑时,对于“包含”、“不包含”数据,复制粘贴多行时,会自动区分为多个数据。
17:添加对于芝麻代理的合作支持。

火车采集器V9.4版
1,批量网址更新,日期可以支持大于今天的数据。标签可以采用多参数同步变化
2,标签组合,增加对于循环组合的支持。
3,优化网址库排重逻辑,大大加快大网址库下的任务加载速度,优化网址库排重内存占用。
4,数据库发布模块,增加“insert ignore”模式的支持
5, 新增任务的云端备份、同步功能
6,http远程服务器,增加对于单条数据修改的API支持。
7,水印增加指定大小的压缩功能
8,修复FTP,SFTP链接未能正确断开的问题
9,修复Word2007无法保存图片的问题
10,修复标签超长时候的显示错误问题。
11,修复标签数据替换中的替换错误问题。
12,修复了数据倒序发布的问题。
13,优化了几个会导致采集器长时间运行后内存无法释放的问题。