请稍等 ...

关于utf-8解码问题？

为什么有些url能运行和解码，有些url则报以上错误，尝试用那个chardet找出原始文档的编码，找不到，显示原始编码None，对编码解码的问题也是一知半解啊，不知道老师可否指点一下，只求知道原因，当然，如果能提供一些解决思路那就更好了啦，哈哈。(其实我弄了大半天都没解决，百度了一些解决方案，试过几个，都不行，主要是它有些URL页面是没问题的，可以顺利转换str和解码的，有些却不行，报以上错误，这点我很好奇，我个人的猜测：难道这就是传说中的反爬虫？他们这URL页面的编码的时候做了编码加密之类的动作？)

慕仙6146424 2017-11-20 16:16:03

源自：13-2 分析抓取目的确定抓取页面

850

收起

提交取消

1回答

慕粉3752101 回答被采纳获得+3积分 2017-11-20 20:11:52

可以试试看GBK8

1 回复有任何疑惑可以回复我~

收起回答

提问者慕仙6146424 #1

谢谢，还真行啊，把utf-8换成gbk就可以了，但是，这是为什么呢，是因为源文件是用gbk编码的？那如果是这样，我下次遇到同样的问题，还是用gbk？还是有什么方法的？求大神在指点一下迷津啊，其实我昨天用了一个笨方法，就是想把所有的编码格式都试一遍，后来试了几种就放弃了，因为我在想，就算让我试中了，那下次遇到同样的问题，总不能又这样做吧，所以，……求大神赐教一下思路！感谢！

回复有任何疑惑可以回复我~ 2017-11-20 23:59:59

芥子啊回复提问者慕仙6146424 #2

网页源码里会告诉你编码类型，不是反爬机制，比如这个页面的源码<head><meta charset = 'utf-8'>

回复有任何疑惑可以回复我~ 2019-06-29 13:44:21

相似问题

响应数据已经指定了utf-8格式，但是得到的相应数据仍然为乱码

关于 Unicode 的问题

使用GET传参数出现中文乱码问题

utf-8解码问题

GBK和UTF-8

登录后可查看更多问答，登录/注册

Python3.8系统入门+进阶 (程序员必备第二语言)

参与学习 14897 人
提交作业 1288 份
解答问题 4506 个

语法精讲/配套练习+思考题/原生爬虫实战

了解课程

本课精华内容

问答作业

老师，学习python对于文化程度相对低一点的，比如高中学历的，或者专科非计算机专业的人，以后的就业会有什么困难？怎么去克服好？学习应该往那个方向方便就业呢？

7.0k 7

爬虫方向的学习路线

3.2k 3

评论区消耗金为1003和914两种不同答案的原因

3.0k 5

VScode 安装完毕，插件也下载好没问题。但是没有出现pylint 绿色的波浪线。是设置问题么？

4.9k 23

小兄弟,我要投诉你了,你每一节视频有多时间是讲课的?都是跟别人聊天,我花钱是来学习的,不是来跟你聊天的,希望你尊重别人的宝贵时间.

3.2k 19

查看更多本课问答

微信客服

购课补贴
联系客服咨询优惠详情

帮助反馈 APP下载

慕课网APP
您的移动学习伙伴

公众号

扫描二维码
关注慕课网微信公众号

关于utf-8解码问题？

正在回答

1回答

相似问题