请稍等 ...
×

采纳答案成功!

向帮助你的同学说点啥吧!感谢那些助人为乐的人

知乎首页-question链接提取问题

https://img1.sycdn.imooc.com/szimg//59082fda0001da9813710882.jpg

https://img1.sycdn.imooc.com/szimg//5908305d0001cda019200970.jpg


老师您好,请教一个问题:

    图1您写的回调代码,实现起来好像不是很理想

    图2是我发现的一个规律,当知乎首页右侧的下拉菜单拉到底后会自动加载出新的页面,抓包看到是通过post提交,当offset,start每次加10就会加载新的页面。

    需求:是不是可以通过图2这种方式来多提取question链接,如果可以,是一个什么样的思路。

正在回答

3回答

亲 你这个思路是没有问题的,因为考虑到课程的复杂性所以前面这部分我讲的比较简单, 实际上后面selenium中有讲到关于如何模拟鼠标下拉,也可以获取更多的链接, 在这一章中我会讲解到获取到answer, 和你现在遇到的问题很类似, 你可以参考一下本章后面的小节, 大概意思就是在获取到所有的url之后,你自己去拼凑url然后yield request 回调函数写为parse就行了

0 回复 有任何疑惑可以回复我~
  • 提问者 慕先生0421411 #1
    非常感谢!
    回复 有任何疑惑可以回复我~ 2017-05-10 23:06:59
  • 提问者 慕先生0421411 #2
    请问老师在yield里面还需要加上什么参数才能成功请求到动态加载的页面?
    回复 有任何疑惑可以回复我~ 2017-05-24 19:51:38
bobby 2017-05-25 18:08:10

请求不了内容是什么意思?是没有进入parse函数吗, 而且你这里写成了parsea, 是拼写出错了吧

0 回复 有任何疑惑可以回复我~
提问者 慕先生0421411 2017-05-24 19:50:47

https://img1.sycdn.imooc.com/szimg//592573430001b7de13580599.jpg

https://img1.sycdn.imooc.com/szimg//59257343000101d907150951.jpg

请问老师在yield里面还需要加上什么参数才能成功请求到动态加载的页面?

0 回复 有任何疑惑可以回复我~
问题已解决,确定采纳
还有疑问,暂不采纳
意见反馈 帮助中心 APP下载
官方微信