老师，现在的淘宝他的查看源代码和f12看到的代码不一样。而且之前用的方法也没用了，怎么办？？-慕课网

2回答

NavCat 回答被采纳获得+3积分 2018-11-02 14:58:49

这块就是呀，你仔细看看，可以通过xpath或者是python的正则表达式，解析出来，然后转换成python对象。

0 回复有任何疑惑可以回复我~

提问者慕容8195172 #1
```
非常感谢！
```
回复有任何疑惑可以回复我~ 2018-11-02 17:45:43
Samuel10 回复提问者慕容8195172 #2
```
同学你是怎么解析出来的呢
```
回复有任何疑惑可以回复我~ 2018-11-04 23:01:06

提问者慕容8195172 回复 Samuel10 #3

还是用bejson那个看的。个人是这么看的哈。你最好问问老师找最好的办法

回复有任何疑惑可以回复我~ 2018-11-05 08:22:40

NavCat 2018-11-05 10:17:14

双11淘宝进行了较大的更新，使用正则实现淘宝数据抓取代码参考：

1.浏览器登录淘宝

2.按下图找到cookie

3.配置请求头信息

import requests
import re
import json
 
def spider_tb(sn ,book_list=[]):
    url = 'https://s.taobao.com/search?q={0}'.format(sn)
    headers = {
        'user-agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/68.0.3440.106 Safari/537.36',
        'cookie': '你的cookie'
    }
    # 获取html内容
    text = requests.get(url, headers=headers).text
 
    # 使用正则表达式找到json对象
    p = re.compile(r'g_page_config = (\{.+\});\s*', re.M)
    rest = p.search(text)
    if rest:
        print(rest.group(1))
        data = json.loads(rest.group(1))
        bk_list = data['mods']['itemlist']['data']['auctions']
 
        print (len (bk_list))
        for bk in bk_list:
            #标题
            title = bk["raw_title"]
            print(title)
            #价格
            price = bk["view_price"]
            print(price)
            #购买链接
            link = bk["detail_url"]
            print(link)
            #商家
            store = bk["nick"]
            print(store)
            book_list.append({ 'title' : title, 'price' : price, 'link' : link, 'store' : store })
            print ('{title}:{price}:{link}:{store}'.format( title = title, price = price, link = link, store = store )) 
 
 
 
if __name__ == '__main__':
    spider_tb('9787115428028')

4.查看结果

3 回复有任何疑惑可以回复我~

收起回答

提问者慕容8195172 #1
```
????  老师太好了吧！！！
```
回复有任何疑惑可以回复我~ 2018-11-05 14:30:29

zorre #2

OK了，果然需要这里的cookie和user-agent，tks teachere.

回复有任何疑惑可以回复我~ 2019-06-20 15:10:59

qq_慕先生353548 #3

老师，现在淘宝又改进了，这个代码也用不了，如今应该怎么爬呢

回复有任何疑惑可以回复我~ 2019-08-05 20:33:12

老师，现在的淘宝他的查看源代码和f12看到的代码不一样。而且之前用的方法也没用了，怎么办？？

正在回答

2回答

相似问题

请选择置顶位置

本课精华内容

老师，我好不容易安装好了mysqlclient，但是用不了mysqldb，怎么办？？

老师使用你参考的代码运行不成功是什么原因呢

Macbook上，数据库连接报错

老师请问helper怎么导入，

老师，在实现购书性价比的课中的排序，它仅仅只排列淘宝网的数据是为什么啊，其他的都能爬出来，但是排不了序？？

【讨论题】：如何设计一个更好的登录注册功能？

将爬取的数据写入数据库需要哪些操作？

结合 requests 的使用，将一个网站图片保存到本地该如

实现一个爬虫，还要突破哪些反爬的机制？

关于 Python 的 is和 ==，解释一下下面程序的结果

热搜

最近搜索清空