出现重复的URL-慕课网

1回答

bobby 2019-06-17 15:15:32

能否贴一下你的代码？以及你这里的出错的问题？你这个问题我还不是很明白是什么意思

0 回复有任何疑惑可以回复我~

提问者 weixin_慕勒4383646 #1

代码如下：
if tr.xpath("//td[3]/a[@class='forums_title ']/@href").extract():
     topic_url = parse.urljoin(domain, tr.xpath("//td[3]/a[@class='forums_title ']/@href").extract()[0])
     print(topic_url)
结果定位到许多重复的“topic_url“
其实，就是您代码中的parse_list板块定位topic URL的那段代码

回复有任何疑惑可以回复我~ 2019-06-22 18:40:17

提问者 weixin_慕勒4383646 #2

老师：
      其实就是您代码中的parse_list板块定位topic URL的那段代码
但在运行时出现重复结果

回复有任何疑惑可以回复我~ 2019-06-22 20:11:00

bobby 回复提问者 weixin_慕勒4383646 #3
```
你留下qq 我加你看看
```
回复有任何疑惑可以回复我~ 2019-06-24 09:35:26

点开查看后面2条评论

出现重复的URL

正在回答回答被采纳积分+3

1回答

相似问题

请选择置顶位置

本课精华内容

代码问题

老师我的jdproductPageComments 返回的是空白页什么也没有怎么办

代码问题这个错误怎么办

老师这个错误怎么解决

使用selenium点击后返回异常数据

词云热力图应该如何实现？

【讨论题】滑动验证码的解决办法

如果合适的话使用 asyncio 做爬虫的优势是什么？

热搜

最近搜索清空

出现重复的URL

正在回答 回答被采纳积分+3

1回答

相似问题

请选择置顶位置

本课精华内容

代码问题

老师 我的jdproductPageComments 返回的是空白页 什么也没有 怎么办

代码问题这个错误怎么办

老师这个错误怎么解决

使用selenium点击后返回异常数据

词云热力图应该如何实现？

【讨论题】滑动验证码的解决办法

如果合适的话使用 asyncio 做爬虫的优势是什么？

正在回答回答被采纳积分+3

老师我的jdproductPageComments 返回的是空白页什么也没有怎么办