请稍等 ...
×

采纳答案成功!

向帮助你的同学说点啥吧!感谢那些助人为乐的人

utf-8解码问题

老师我根据你后续更新爬取斗鱼的代码格式,一样的,但为什么爬取到的会出现格式读取问题?
htmls = str(htmls,encoding=‘utf-8’)
UnicodeDecodeError: ‘utf-8’ codec can’t decode byte 0x8b in position 1: invalid start byte
图片描述
网页源代码也是UTF格式啊,我看别人说改成GKB模式有人尝试成功了,但我的还是报错,搞不懂了想了好久,我看有说需要使用GZIP代码解压,是这样吗?解压就好了吗?

正在回答

1回答

这个应该是编码问题。我给你一个建议。下载阿里的Qoder: https://qoder.com/users/sign-up?referral_code=tsyoFXc7k48YX3IyntwoZZY93lo7Rgx2     

Qoder的轻量模型是免费的。

然后注册安装,把代码放在目录下,然后用Qoder打开,然后再对话里问他,测试下这个项目看看有什么问题。


1 回复 有任何疑惑可以回复我~
  • 提问者 道道半百_ouBJXZ #1
    qoder提示我要用gzip.decompress()进行数据解压
    回复 有任何疑惑可以回复我~ 2026-04-18 14:37:09
  • 提问者 道道半百_ouBJXZ #2
    谢谢老师,还有其他安装环境变量问题我都用qoder解决好了,很好用
    回复 有任何疑惑可以回复我~ 2026-04-18 15:15:57
  • 7七月 回复 提问者 道道半百_ouBJXZ #3
    哈哈,好。加油
    回复 有任何疑惑可以回复我~ 2026-04-19 14:09:50
问题已解决,确定采纳
还有疑问,暂不采纳
微信客服

购课补贴
联系客服咨询优惠详情

帮助反馈 APP下载

慕课网APP
您的移动学习伙伴

公众号

扫描二维码
关注慕课网微信公众号