农企新闻网

如何使用火车头进行大量采集

发布者:刘阳
导读今日我们来聊聊一篇关于如何使用火车头进行大量采集的文章,网友们对这件事情都比较关注,那么现在就为大家来简单介绍下如何使用火车头进行大量采集,希望对各位小伙伴们有所帮助机车有什么好处?1、通用性强无论新

今日我们来聊聊一篇关于如何使用火车头进行大量采集的文章,网友们对这件事情都比较关注,那么现在就为大家来简单介绍下如何使用火车头进行大量采集,希望对各位小伙伴们有所帮助

机车有什么好处?

1、通用性强

无论新闻、论坛、视频、黄页、图片、下载网站,只要是通过浏览器可以看到的结构化内容,都可以通过指定匹配规则进行收集。

2.稳定高效

经过七年的打磨,软件不断更新完善,采集速度快,性能稳定,资源占用少。

3.扩展性强,适用范围广。

自定义web发布,保存和发布主流数据库,自定义本地php和。net外部编程接口来处理数据,让数据为你所用。

机车怎么用?

1.首先,打开机车软件。打开后,在左边空白处点击右键创建一个新组。在箭头处填写组名并保存。如图所示:

2.右键单击刚刚创建的组,然后单击新建任务。会弹出如下窗口:任务名称可以填写自己网站的名称,方便后期收藏。还有更多站点需要区分。自动识别不需要更改,那么第一步就是点击右边的添加,添加你要收藏的网址。接下来增加的是你要收集的规则,从哪个地方到哪个地方。例如:ul

李汽车收藏家/李

李汽车收藏家/李

李汽车收藏家/李

李汽车收藏家/李

李汽车收藏家/李

/ul

获取规则如下:第一个框填充ul,第二个框填充/ul。明白了吗?

3.填好之后,点击下面的测试网址领取。给你:点击加号出现你要收藏的文章。

4.双击一个网址进入第二步,如图:左边有两个板块,分别是标题和你要收藏的内容。对于内容,可以点击一篇文章查看源文件,进去看到文章起始代码的位置,截取这段代码放进去,类似于第一步的设置规则,这里就不详细解释了。设置完成后,可以点击测试效果。

5.完成后进入第三步,如图:勾选此框启用。

6.点击web发布配置管理进入下一个窗口,选择你要发布的模块,选择代码,然后写上你的网站后台登录地址,然后在内置浏览器中点击登录,会出现一个小窗口。登录后台账号密码成功后,点击确定返回当前窗口,点击获取列表,就会出现您网站的栏目。在配置名称中写入您的网站名称,然后单击保存。关闭此窗口。

以上就是如何使用火车头进行大量采集这篇文章的一些介绍,网友如果对如何使用火车头进行大量采集有不同看法,希望来共同探讨进步。