老师我根据你后续更新爬取斗鱼的代码格式,一样的,但为什么爬取到的会出现格式读取问题?
htmls = str(htmls,encoding=‘utf-8’)
UnicodeDecodeError: ‘utf-8’ codec can’t decode byte 0x8b in position 1: invalid start byte
网页源代码也是UTF格式啊,我看别人说改成GKB模式有人尝试成功了,但我的还是报错,搞不懂了想了好久,我看有说需要使用GZIP代码解压,是这样吗?解压就好了吗?
登录后可查看更多问答,登录/注册