首页 » PHP笔记 » 怎么解决火车头采集器采集数据出现乱码

怎么解决火车头采集器采集数据出现乱码

高蒙 2015/12/17 22:10 5.0k浏览 0评论 火车头采集器


今天在采集数据的时候,发生了很奇怪的事情。就是我所采集的数据,都变成了乱码,数据简直就不能用,于是我就去分析这个问题到底怎么出现的?要怎么去处理?

经过我,仔细的比对和分析,终于得出。

原来是我在采集数据的时候,选用的编码格式都是勾选自动获取的,并没有根据当前采集的页面编码去设置,如果我采集的网站全站都是一个编码,要么utf-8,要么gb2312等等的话,这样选择是没有错的。

可是,我今天采集的数据,网页居然是两种编码,简直丧心病狂,于是,我就直接放弃了自动识别编码。

第一步:先用列表页的编码格式采集列表页的网址。

第二步:接着,等网址全部采集完毕的时候,选择内容页的编码格式,开始采集内容的任务。

所以,以后大家在采集数据的时候,如果再次遇到采集数据编码的时候,出现乱码。那么好好的检查你的编码格式是不是选择错误了,不要总是习惯自动获取页面编码格式。




相关文章

我有话说

站长昵称:(*)

输入内容:

选个头像:

评论列表

    ...

    高蒙

    男, PHP程序猿

    文章

    487

    标签

    42

    热度

    10w+

    南京, 江苏, 中国

    人生要是没有理想, 那跟咸鱼有什么分别。