怎么解决火车头采集器采集数据出现乱码

 火车头采集器   高蒙   阅读(3333)   评论(1)   2015-12-17 22:10:09    火车头采集器 采集数据出现乱码 


今天在采集数据的时候,发生了很奇怪的事情。就是我所采集的数据,都变成了乱码,数据简直就不能用,于是我就去分析这个问题到底怎么出现的?要怎么去处理?

经过我,仔细的比对和分析,终于得出。

原来是我在采集数据的时候,选用的编码格式都是勾选自动获取的,并没有根据当前采集的页面编码去设置,如果我采集的网站全站都是一个编码,要么utf-8,要么gb2312等等的话,这样选择是没有错的。

可是,我今天采集的数据,网页居然是两种编码,简直丧心病狂,于是,我就直接放弃了自动识别编码。

第一步:先用列表页的编码格式采集列表页的网址。

第二步:接着,等网址全部采集完毕的时候,选择内容页的编码格式,开始采集内容的任务。

所以,以后大家在采集数据的时候,如果再次遇到采集数据编码的时候,出现乱码。那么好好的检查你的编码格式是不是选择错误了,不要总是习惯自动获取页面编码格式。




相关文章



我要评论


站长昵称:(*)

输入内容:


评论列表


高蒙

男,程序猿一枚

 

人生要是没有理想, 那跟一条咸鱼有什么分别。


关于我

  http://www.shuchengxian.com

高蒙个人博客是以PHP技术为主的程序员个人博客。博客主要发布php开发中遇到的问题以及解决办法,同时个人博客也分享网站模板素材,jquery插件等方面素材。


站点声明:相关侵权、举报、投诉及建议等,请发E-mail:936594075#qq.com(#替换成@)。

Copyright © 2018, www.shuchengxian.com, All rights reserved. 个人博客皖公网安备 34152302000022号 皖ICP备15015490号

关键词:个人博客,PHP博客,PHP博客程序,高蒙博客,高蒙个人博客,php程序员博客,程序员个人博客