请稍等 ...
×

采纳答案成功!

向帮助你的同学说点啥吧!感谢那些助人为乐的人

请问老师。提取不到url,网址https://d.weibo.com/623751_1/

 start_urls = ['https://d.weibo.com/623751_1/']              
  browser.get(self.start_urls[0])
                t_selector = Selector(text=browser.page_source)
                print(browser.page_source)
                url_123 = t_selector.css("a.W_autocut.S_txt1::attr(href)").extract()

![图片描述](http://img1.sycdn.imooc.com//szimg/5d0751d800019d2219201039.jpg)
```![图片描述](http://img1.sycdn.imooc.com//szimg/5d07524900019d2219201039.jpg)



![图片描述](http://img1.sycdn.imooc.com//szimg/5d0752e900019d2219201039.jpg)

正在回答 回答被采纳积分+3

3回答

bobby 2019-06-18 14:52:32

https://img1.sycdn.imooc.com//szimg/5d088a180001a37215950783.jpg 我刚才试了一下 能获取到啊 写法和你上面的写法一致:

url_123 = t_selector.css("a.W_autocut.S_txt1::attr(href)").extract()

0 回复 有任何疑惑可以回复我~
  • 提问者 贴心咯睡觉 #1
    好像是我没有sleep一下的缘故,谢谢老师
    回复 有任何疑惑可以回复我~ 2019-06-25 23:04:14
  • bobby 回复 提问者 贴心咯睡觉 #2
    好的,加油
    回复 有任何疑惑可以回复我~ 2019-06-26 19:47:11
bobby 2019-06-17 16:08:17

t_selector.css("a.W_autocut S_txt1::attr(href)") 这样试试呢

0 回复 有任何疑惑可以回复我~
  • 提问者 贴心咯睡觉 #1
    老师我截图了,还是获取不到
    回复 有任何疑惑可以回复我~ 2019-06-17 16:42:31
bobby 2019-06-17 15:06:28

你要提取的是哪个元素?能否截图我看看

0 回复 有任何疑惑可以回复我~
  • 提问者 贴心咯睡觉 #1
    我是模拟登陆了以后,想采集这个url下的所有文章的url,但是提取不出来,显示为空,browser.page_source我拷贝出来是有文章链接的
    回复 有任何疑惑可以回复我~ 2019-06-17 15:10:37
问题已解决,确定采纳
还有疑问,暂不采纳
微信客服

购课补贴
联系客服咨询优惠详情

帮助反馈 APP下载

慕课网APP
您的移动学习伙伴

公众号

扫描二维码
关注慕课网微信公众号