请稍等 ...

utf-8解码问题

老师我根据你后续更新爬取斗鱼的代码格式，一样的，但为什么爬取到的会出现格式读取问题？
htmls = str(htmls,encoding=‘utf-8’)
UnicodeDecodeError: ‘utf-8’ codec can’t decode byte 0x8b in position 1: invalid start byte
图片描述
网页源代码也是UTF格式啊，我看别人说改成GKB模式有人尝试成功了，但我的还是报错，搞不懂了想了好久，我看有说需要使用GZIP代码解压，是这样吗？解压就好了吗？

道道半百_ouBJXZ 2026-04-14 15:43:47

源自：13-8 正则分析获取名字和人数

42

收起

提交取消

1回答

7七月回答被采纳获得+3积分 2026-04-16 15:02:00

这个应该是编码问题。我给你一个建议。下载阿里的Qoder： https://qoder.com/users/sign-up?referral_code=tsyoFXc7k48YX3IyntwoZZY93lo7Rgx2

Qoder的轻量模型是免费的。

然后注册安装，把代码放在目录下，然后用Qoder打开，然后再对话里问他，测试下这个项目看看有什么问题。

1 回复有任何疑惑可以回复我~

提问者道道半百_ouBJXZ #1
```
qoder提示我要用gzip.decompress（）进行数据解压
```
回复有任何疑惑可以回复我~ 2026-04-18 14:37:09

提问者道道半百_ouBJXZ #2

谢谢老师，还有其他安装环境变量问题我都用qoder解决好了，很好用

回复有任何疑惑可以回复我~ 2026-04-18 15:15:57

7七月回复提问者道道半百_ouBJXZ #3
```
哈哈，好。加油
```
回复有任何疑惑可以回复我~ 2026-04-19 14:09:50

相似问题

响应数据已经指定了utf-8格式，但是得到的相应数据仍然为乱码

GBK和UTF-8

使用GET传参数出现中文乱码问题

浏览器中文乱码

关于utf-8解码问题？

登录后可查看更多问答，登录/注册

Python3.8系统入门+进阶 (程序员必备第二语言)

参与学习 14896 人
提交作业 1288 份
解答问题 4506 个

语法精讲/配套练习+思考题/原生爬虫实战

了解课程

本课精华内容

问答作业

老师，学习python对于文化程度相对低一点的，比如高中学历的，或者专科非计算机专业的人，以后的就业会有什么困难？怎么去克服好？学习应该往那个方向方便就业呢？

7.0k 7

爬虫方向的学习路线

3.2k 3

评论区消耗金为1003和914两种不同答案的原因

3.0k 5

VScode 安装完毕，插件也下载好没问题。但是没有出现pylint 绿色的波浪线。是设置问题么？

4.9k 23

小兄弟,我要投诉你了,你每一节视频有多时间是讲课的?都是跟别人聊天,我花钱是来学习的,不是来跟你聊天的,希望你尊重别人的宝贵时间.

3.2k 19

查看更多本课问答

购课补贴
联系客服咨询优惠详情

帮助反馈 APP下载

慕课网APP
您的移动学习伙伴

扫描二维码
关注慕课网微信公众号