采纳答案成功!
向帮助你的同学说点啥吧!感谢那些助人为乐的人
现在爬虫没有结束的机制,怎样才能知道没有要爬取的内容了然后优雅的结束爬虫呢?我能想到的就是设置一个超时时间,这个时间之外如果没有新的request从channel中传过来,就结束engine。但是有没有更好一些的办法呢。
或者我们也可以再加上一个条件,就是一段时间里没有request并且scheduler里面队列为空。不过这需要改一下scheduler接口。我们让scheduler来判断是否要退出,然后把这个信息通过一个channel送出去。
另外我们还可以通过捕获ctrl+c来更加优雅的处理一些退出前要做的事。这篇文章介绍了如何捕获ctrl+c https://studygolang.com/articles/6869
登录后可查看更多问答,登录/注册
语法+分布式爬虫实战 为转型工程师量身打造
3.9k 14
813 1
2.2k 1
1.2k 12
购课补贴联系客服咨询优惠详情
慕课网APP您的移动学习伙伴
扫描二维码关注慕课网微信公众号