火车头采集器使用教程

2020年3月19日

火车头采集器使用教程

本教程使用火车头V9(又名高铁采集器)版本,网站为wordpress5.x版本。

网站服务器环境使用的宝塔面板,服务器系统是centos7,windows系统跟linux一样的操作原理思路,不必纠结用什么系统。

本教程将按照做一个wordpress采集站的过程步骤来写教程,内容基本都是基础知识。

关于采集内容

网站大量采集的话相比手打原创内容更难收录,但是优点是显而易见的。手打怎么也不可能日更数千篇文章甚至上万篇。我这个网站大多数是自己写的,也有直接手动复制粘贴的。更新了几年也还不到一千篇。

看自己的考虑了,这里只是废话一下提个醒。

采集的内容一定要版面整洁,不要乱糟糟的一大篇,那样没什么意义。采集之前先把网站的基础框架设计好!

其他说明
本教程李关于采集发布设置做了简化处理,没有采集图片,发布设置仅仅发布标题和内容。未设置时间、作者、标签等。教程后面我会单独开文章写这些。这里仅以最简化的步骤来进行。
接口文件没有区别,都是这一个。

需要先下载这些东西:

接口文件:火车头WP发布接口

发布模块(教程使用):火车头WP发布模块(仅包括标题内容)

发布模块:火车头WP发布模块(全发布参数,本教程不使用)

采集器这里就不放了,之前博客发了破解版被官方投诉了。

采集接口和模块更新点击下载新版采集接口和模块,博主目前用的这个

教程目录

火车头采集器wordpress5.x发布接口介绍

火车头采集器发布模块直接放到火车头采集器程序一下目录内即可,这一步不需要做其他设置,所以这个就不写教程了

放到\Module\这个目录内

火车头采集器使用教程–寻找目标网站

火车头采集器使用教程–批量添加目标网站列表链接

火车头采集器使用教程–分析目标网站文章链接位置及规则

火车头采集器使用教程–分析目标网站要采集内容的位置及规则

火车头采集器使用教程–采集内容发布规则设置

火车头采集器使用教程–测试采集和发布是否正常

下面是一些特殊教程文章

火车头采集器图片采集上传设置

火车头采集器采集发布文章作者、时间、标签等内容

火车头采集器定时采集更新网站内容(长期做站必用)

火车头采集今日头条文章的教程

火车头9.8版本,获取列表正常 但发布文章提示 分类id为空

火车头单篇文章采集多个tag标签并发布到wordpress

解决火车头采集器https报Object reference not set to an instance of an object错误

justnews主题,火车头发表文章到快讯文章的教程

火车头采集器下载中文图片地址报错:发生错误终止..

火车头采集器采集文章重复解决办法

火车头采集器高速采集:保存为本地文件然后导入数据库

火车头采集器V9版使用Post方法采集Ajax页面

火车头采集器采集瀑布流Ajax类网站

Posted by 柴郡猫