请稍等 ...
×

采纳答案成功!

向帮助你的同学说点啥吧!感谢那些助人为乐的人

关于utf-8解码问题?

https://img1.sycdn.imooc.com//szimg/5a128cf00001dce408440660.jpg

为什么有些url能运行和解码,有些url则报以上错误,尝试用那个chardet找出原始文档的编码,找不到,显示原始编码None,对编码解码的问题也是一知半解啊,不知道老师可否指点一下,只求知道原因,当然,如果能提供一些解决思路那就更好了啦,哈哈。(其实我弄了大半天都没解决,百度了一些解决方案,试过几个,都不行,主要是它有些URL页面是没问题的,可以顺利转换str和解码的,有些却不行,报以上错误,这点我很好奇,我个人的猜测:难道这就是传说中的反爬虫?他们这URL页面的编码的时候做了编码加密之类的动作?)

正在回答

1回答

可以试试看GBK8

1 回复 有任何疑惑可以回复我~
  • 提问者 慕仙6146424 #1
    谢谢,还真行啊,把utf-8换成gbk就可以了,但是,这是为什么呢,是因为源文件是用gbk编码的?那如果是这样,我下次遇到同样的问题,还是用gbk?还是有什么方法的?求大神在指点一下迷津啊,其实我昨天用了一个笨方法,就是想把所有的编码格式都试一遍,后来试了几种就放弃了,因为我在想,就算让我试中了,那下次遇到同样的问题,总不能又这样做吧,所以,……求大神赐教一下思路!感谢!
    回复 有任何疑惑可以回复我~ 2017-11-20 23:59:59
  • 芥子啊 回复 提问者 慕仙6146424 #2
    网页源码里会告诉你编码类型,不是反爬机制,比如这个页面的源码<head><meta charset = 'utf-8'>
    回复 有任何疑惑可以回复我~ 2019-06-29 13:44:21
问题已解决,确定采纳
还有疑问,暂不采纳
微信客服

购课补贴
联系客服咨询优惠详情

帮助反馈 APP下载

慕课网APP
您的移动学习伙伴

公众号

扫描二维码
关注慕课网微信公众号