UnicodeDecodeError-慕课网

1回答

7七月 2023-08-21 17:28:24

这个大概就是因为下载下来的代码无法用正则匹配解析。所以，应该看看下载下来的是什么内容

0 回复有任何疑惑可以回复我~

提问者慕勒1173257 #1

谢谢，因为老师上课提到的网站已经关了，我就用老师的逻辑拉了虎牙的，import re
from urllib import request

class Spider():
    url = "https://www.huya.com/g/lol"
    root_pattern = '<span class="txt">([\s\S]*?)</span>'
    name_pattern = '<i class="nick">([\s\S]*?)</i>'
    number_pattern = '<i class="js-num">([\s\S]*?)</i>'
    def __fetch_content(self):
        r = request.urlopen(Spider.url)
        htmls = r.read()
        htmls = str(htmls,encoding="UTF-8")
        return htmls

    def __analysis(self,htmls):
        root_html = re.findall(Spider.root_pattern,htmls)
        print(root_html[0])
    def go(self):
        htmls = self.__fetch_content()
        self.__analysis(htmls)

spider = Spider()
spider.go()

回复有任何疑惑可以回复我~ 2023-08-22 11:07:28

提问者慕勒1173257 #2
```
找到原因了，多了一个  > ,谢谢
```
回复有任何疑惑可以回复我~ 2023-08-22 11:54:17

UnicodeDecodeError

正在回答回答被采纳积分+3

1回答

相似问题

请选择置顶位置

本课精华内容

老师，学习python对于文化程度相对低一点的，比如高中学历的，或者专科非计算机专业的人，以后的就业会有什么困难？怎么去克服好？学习应该往那个方向方便就业呢？

爬虫方向的学习路线

评论区消耗金为1003和914两种不同答案的原因

VScode 安装完毕，插件也下载好没问题。但是没有出现pylint 绿色的波浪线。是设置问题么？

小兄弟,我要投诉你了,你每一节视频有多时间是讲课的?都是跟别人聊天,我花钱是来学习的,不是来跟你聊天的,希望你尊重别人的宝贵时间.

目的：装饰器的理解

目的：面向对象的理解

目的：理解循环

目的：了解字符串

目的：计算机进制基础

热搜

最近搜索清空

UnicodeDecodeError

正在回答 回答被采纳积分+3

1回答

相似问题

请选择置顶位置

本课精华内容

老师 ，学习python对于文化程度相对低一点的，比如高中学历的，或者专科非计算机专业的人，以后的就业会有什么困难？怎么去克服好？学习应该往那个方向方便就业呢？

爬虫方向的学习路线

评论区消耗金为1003和914两种不同答案的原因

VScode 安装完毕，插件也下载好没问题。但是没有出现pylint 绿色的波浪线。是设置问题么？

小兄弟,我要投诉你了,你每一节视频有多时间是讲课的?都是跟别人聊天,我花钱是来学习的,不是来跟你聊天的,希望 你尊重别人的宝贵时间.

目的：装饰器的理解

目的：面向对象的理解

目的：理解循环

目的：了解字符串

目的：计算机进制基础

正在回答回答被采纳积分+3

老师，学习python对于文化程度相对低一点的，比如高中学历的，或者专科非计算机专业的人，以后的就业会有什么困难？怎么去克服好？学习应该往那个方向方便就业呢？

小兄弟,我要投诉你了,你每一节视频有多时间是讲课的?都是跟别人聊天,我花钱是来学习的,不是来跟你聊天的,希望你尊重别人的宝贵时间.