火车采集器是一款计算机网络检测工具。该软件可以收集目标网站的整个站点,从源代码开始完成收集,并支持批处理任务。对于SEOer来说是非常强大和实用的。赶紧下载使用吧!
软件介绍
机车收集器是一个可以帮助你收集网页数据的工具。有了这个软件,你就可以一键设置采集的地址,输入你需要搜索的类型、图片、文字、flash动画等资源,然后你就可以立即分析你的URL地址,将获得的数据信息发送到指定的文件中保存,方便你在网络上搜索和下载信息。机车采集器可以实现多线程搜索管理,可以同时加载多个网址,并开启不同的搜索方式实现批量搜索下载文件处理,提高采集资源的速度,有需要的朋友可以下载试试!
软件功能
通过设置网站采集规则,列车采集员可以快速采集到所需的网站信息。可以手动输入、批量添加或者直接从文本中导入网址,可以自动过滤掉重复的网址信息。
支持多级网站集。多级网站集可以使用页面分析自动获取地址,并手动填写规则。针对多级分页中收集内容不同但地址相同的网址,火车收集器设置了GET、POST、ASPXPOST三种HTTP请求方法。
列车采集器支持网站采集测试,可以验证操作的正确性,避免误操作导致采集结果不准确。
收集完数据后,车辆收集器默认将数据保存在本地数据库(sqlite、mysql、sqlserver)中。用户可以根据自己的需求选择数据的后续操作来完成数据发布。它支持直接查看数据、在线发布数据和输入数据库,并支持用户使用和开发发布界面。
根据数据库类型,用相关软件打开即可直接查看数据,配置发布模块可将数据在线发布到网站,可设置自动登录网站获取栏目列表等。如果进入用户自己的数据库,用户只需要写几条SQL语句,程序就会根据用户的SQL语句导入数据;保存为本地文件时,支持本地SQL或文本文件(word、excel、html、txt)格式。
软件特色
为全网通
基于web结构的集合
火车收集器的收集原理是基于web结构的源代码抽取,适用于几乎所有的网页和网页中能看到的所有内容;
扩展性强
列车采集器支持多种接口和插件的扩展,打破了操作的限制,满足了更加多样化的使用需求,真正做到了全网通用。
功能齐全
集收集和发布于一体
列车采集器除了最基本的数据采集外,每一项功能都进行了优化,还集成了强大的数据处理和数据发布功能,全面提升了数据利用的全过程。
高效稳定
分布式高速采集系统
列车采集器采用分布式高速采集系统,将任务分配给多台服务器同时运行采集。多任务多线程的运行模式可以最大化运行效率。
占用更少的资源
分解了工作负载,减少了服务器占用的资源,使得列车采集器的性能更加稳定。
准确的数据
采集监控系统
实时监控采集,任务运行日志报错,及时修复,保证数据不遗漏。
精确的数据处理
多种精细化的数据处理方法,结合测试功能,使列车采集器实现了数据的精确采集和精确可用。
安装方法
下载后解压rar,打开exe文件。下一个。
同意协议,下一步
选择安装路径后,下一步是
等待进度条完成后。
安装完成。
更新日志
1:自动cookie获取功能优化
2.数据库发布增加了事务并优化了数据库发布的速度。
3.优化数据转换速度(用于导入Mysql和SqlServer数据库),同时去除地址数据库的清空逻辑。
7.在处理内容页面中的错误时,添加当前错误标签的提示,以便快速定位错误标签。
8.批量编辑任务,增加操作范围。
9.循环匹配中匹配空间的处理
10:在刷新组中添加统计数据的刷新。
11:分页后处理
12:一些功能逻辑优化