火车头采集器发布设置,要更好的使用火车头采集器软件,必须需要有基本的HTML基础,能看得懂网页源码,网页结构。 同时如果用到web发布或数据库发布,则对自己文章系统及数据存储结构要非常了解。当然对HTML和数据库不是很了解可以使用采集发布软件吗?当然不是,我们可以使用更简单的免费采集发布软件 各大网站发布详细如下图
各大网站自动发布: 无须花费大量时间学习软件操作,一分钟即可实现自动采集→内容处理→发布到网站。提供全自动系统化管理网站,无须人工干涉,设定任务自动执行,一个人维护成百上千网站也不是问题。
1、CMS发布:目前是市面上唯一同时支持帝国、易优、ZBLOG、织梦、WordPress、苹果CMS、人人CMS、米拓CMS、云优CMS、小旋风站群蜘蛛池、Thinkcmf、PHPCMS、Pboot、Fadmin、Destoon、海洋CMS、极致CMS、Emlog、Emlogpro、Typecho、TWCMS、WordPress社区版本、迅睿CMS、WXYCM、DZ论坛等各大CMS,并且可同时批量管理并发布的工具
2、对应栏目:相应文章可发布对应栏目(支持多栏目随机发布文章)
3、定时发布:可控制发布间隔/单日总发布数量
4、监控数据:软件上直接监控已发布、待发布、是否伪原创、发布状态、网址、程序、发布时间、全网搜索引擎推送收录等
指定网站采集: 任意网站的数据都可以抓取,所见即所得的操作方式,只要点点鼠标就能轻松获得自己想要的数据,支持多任务同时采集!
输入关键词采集文章: 同时创建多个采集任务(一个任务可支持上传1000个关键词,软件同时还配备了关键词挖掘功能)
监控采集: 能够定时的对目标网站进行采集,频率可以选择10分钟、20分钟、根据用户需求自定义设置监控采集(自动过滤重复,监控新增文章)。
标题处理设置: 根据标题或关键词自动生成标题(不管是双标题还是三标题都可以自由生成,间隔符号自定义填写,自建标题库生成,自媒体标题党生成,标题替换等等)
图片处理设置: 图片加标题水印/图片加关键词水印/自定义图片水印/自定义图片库替换。不仅可以保护图片的版权,同时还能防止图片被盗,图片加上水印后就形成了一张全新的原创图片。
内容自动伪原创设置: 伪原创是指把一篇互联网上其它文章进行加工,使其让搜索引擎认为是一篇原创文章,从而提高网站权重,从此再也不用担心网站没有内容更新!
关键词优化设置 :内链有助于提高搜索引擎对网站的爬行索引效率,更利于网站的收录。再搭配自动敏感词过滤避免被搜索引擎降权,让网站拥有更好的收录与排名。
火车头发布发布模块制作教程(WEB发布模块不一样,每个需要自行制作)
网站自动登录:设置网站登录信息的数据 获取栏目列表:设置发布的栏目列表
网页随机获取:设置post数据内的随机值
内容发布参数:设置发布页面POST数据包
高级功能:文件上传设置以及数据构造
打开fiddler(注意,如果有乱七八糟的数据流,请先Ctlr+X 清空数据流)分析fiddler里的数据包,将fiddler点击 ①? ② ,依次点击数据流列表⑤ 找到POST类型的数据流⑥, 然后点击⑦ 以文本的形式查看
根据上面的数据包得出: 网站编码是:utf-8 (可以在您的网站右击查看源代码,查找charset字段值,具体看编码)
网站地址是: 网站地址可以根据POST 和Referer字段自定义,一般我们用网站域名做网站地址,也可以找其他的2个设置的共同部分做网站地址。
cookie是: menuitems=1_1%2C2_1%2C3_1; PHPSESSID=f21a42f70199c81955f3219623343735; DedeUserID=1; DedeUserID__ckMd5=91a12e3e1eae3a4d; DedeLoginTime=1444806848; DedeLoginTime__ckMd5=65d5fa4845a7ec00; ENV_GOBACK_URL=%2Fdede%2Fdede%2Fcontent_list.php%3Fchannelid%3D1
user-agent是: Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/43.0.2357.124 Safari/537.36
然后我们把发布POST数据 里的值 替换成标签。双击选中表单值,然后鼠标悬停在 标签按钮上,对应选择要替换成的标签名即可,可选系统标签,常用标签,时间标签。
标题,来源,内容,时间 很方便确认识别。
在这里给大家讲解下“[分类ID]” 系统标签。
此标签是用于接下来我们的获取栏目列表设置做铺垫的。
那么如何确定 哪个表单名 就是 [分类ID]呢?