请稍等 ...
×

采纳答案成功!

向帮助你的同学说点啥吧!感谢那些助人为乐的人

老师,现在的淘宝他的查看源代码和f12看到的代码不一样。而且之前用的方法也没用了,怎么办??

正在回答

2回答

这块就是呀,你仔细看看,可以通过xpath或者是python的正则表达式,解析出来,然后转换成python对象。

https://img1.sycdn.imooc.com//szimg/5bdbf594000126ca13110572.jpg



0 回复 有任何疑惑可以回复我~
  • 提问者 慕容8195172 #1
    非常感谢!
    回复 有任何疑惑可以回复我~ 2018-11-02 17:45:43
  • Samuel10 回复 提问者 慕容8195172 #2
    同学你是怎么解析出来的呢
    回复 有任何疑惑可以回复我~ 2018-11-04 23:01:06
  • 提问者 慕容8195172 回复 Samuel10 #3
    还是用bejson那个看的。个人是这么看的哈。你最好问问老师找最好的办法
    回复 有任何疑惑可以回复我~ 2018-11-05 08:22:40
NavCat 2018-11-05 10:17:14

双11淘宝进行了较大的更新,使用正则实现淘宝数据抓取代码参考:

1.浏览器登录淘宝

2.按下图找到cookie

https://img1.sycdn.imooc.com//szimg/5be44ed90001cf4315910885.jpg

3.配置请求头信息

import requests
import re
import json
 
def spider_tb(sn ,book_list=[]):
    url = 'https://s.taobao.com/search?q={0}'.format(sn)
    headers = {
        'user-agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/68.0.3440.106 Safari/537.36',
        'cookie': '你的cookie'
    }
    # 获取html内容
    text = requests.get(url, headers=headers).text
 
    # 使用正则表达式找到json对象
    p = re.compile(r'g_page_config = (\{.+\});\s*', re.M)
    rest = p.search(text)
    if rest:
        print(rest.group(1))
        data = json.loads(rest.group(1))
        bk_list = data['mods']['itemlist']['data']['auctions']
 
        print (len (bk_list))
        for bk in bk_list:
            #标题
            title = bk["raw_title"]
            print(title)
            #价格
            price = bk["view_price"]
            print(price)
            #购买链接
            link = bk["detail_url"]
            print(link)
            #商家
            store = bk["nick"]
            print(store)
            book_list.append({ 'title' : title, 'price' : price, 'link' : link, 'store' : store })
            print ('{title}:{price}:{link}:{store}'.format( title = title, price = price, link = link, store = store )) 
 
 
 
if __name__ == '__main__':
    spider_tb('9787115428028')

4.查看结果

https://img1.sycdn.imooc.com//szimg/5be44f020001bc8818880924.jpg

3 回复 有任何疑惑可以回复我~
  • 提问者 慕容8195172 #1
    ????  老师太好了吧!!!
    回复 有任何疑惑可以回复我~ 2018-11-05 14:30:29
  • zorre #2
    OK了,果然需要这里的cookie和user-agent,tks teachere.
    回复 有任何疑惑可以回复我~ 2019-06-20 15:10:59
  • 老师,现在淘宝又改进了,这个代码也用不了,如今应该怎么爬呢
    回复 有任何疑惑可以回复我~ 2019-08-05 20:33:12
问题已解决,确定采纳
还有疑问,暂不采纳
意见反馈 帮助中心 APP下载
官方微信