如上图,很多次写代码都会报这个错误,对照着老师的课程代码检查好几遍都没找到问题(用的是cornflakes-linter)
鼠标悬停在root_html上时只有如下图的内容:
代码:
import re
from urllib import request
#爬取斗鱼绝地求生主播及其观看量,并降序排列
class Spider():
url = 'https://www.huya.com/g/2793'
root_pattern = '<span class="txt">[/s/S]*?</div>'
# 文本抓取方法
def __fetch_content(self):
r = request.urlopen(Spider.url)
htmls = r.read()
htmls = str(htmls, encoding='UTF-8')
return htmls
# 数据分析方法
def __analysis(self,htmls):
root_html = re.findall(Spider.root_pattern, htmls)
a = 1
# 总控方法
def go(self):
htmls = self.__fetch_content()
self.__analysis(htmls)
spider = Spider()
spider.go()