背景:
我公司提供一些ip代理,但是没有给auth-pass,所以不能访问https的网站,比如https://book.jd.com/booksort.html,但是改一下就能访问了:http://book.jd.com/booksort.html。课程中有提到,可以直接在代理前面加上https, 我这样试了试,也是不能访问https链接的,而且好像也不能访问普通链接了。
我想请教老师的是:
1、对于https的链接,我该怎么找ip代理来访问呢?(除了买之外,比如我可以自己购买隧道加到自己的ip代理上面么?)
2、这些代理前面分别加http和https,对访问网站来说有区别么?构造一种还不行么,为什么要列出两种?
带你彻底掌握Scrapy,用Django+Elasticsearch搭建搜索引擎
了解课程