火车头采集器采集文章重复解决办法
这两天重新给一个垃圾站开启采集工作。发现了一些问题是采集结果始终是重复2次。采集器默认设置里的“排除重复设置”不起作用。
经过研究发现可以在内容采集规则里排除重复达到效果。
建议使用标题来进行排除重复。
实际效果如下
会自动删除重复的内容。在数据库中查看已经没有重复的了。
今天研究新站,发现很多同类型站点都做的有快讯页面。 研究了下发现这个页面还是挺实 ...
我们网站使用wordpress等程序的话在文章中加上合适的tag标签还是有挺多好 ...
火车头采集器使用教程–分析目标网站要采集内容的位置及规则 教程总目录:火车头采集 ...
火车头采集器使用教程–测试采集和发布是否正常 教程总目录:火车头采集器使用教程 ...
教程总目录:火车头采集器使用教程 前面文章我们写了通过post请求方式采集Aja ...
微信扫码办理香港虚拟手机号
Discussion
New Comments
成为第一个!