老师，我点刷新接口出不来是什么原因呢？-慕课网

NavCat 2018-11-05 10:19:28

淘宝双11做了较大调整，不按接口返回了，使用正则爬去代码参考

import requests
import re
import json

def spider_tb(sn ,book_list=[]):
	url = 'https://s.taobao.com/search?q={0}'.format(sn)
	#获取html内容
	text = requests.get(url).text

	# 使用正则表达式找到json对象
	p = re.compile(r'g_page_config = (\{.+\});\s*', re.M)
	rest = p.search(text)
	if rest:
		print(rest.group(1))
		data = json.loads(rest.group(1))
		bk_list = data['mods']['itemlist']['data']['auctions']

		print (len (bk_list))
		for bk in bk_list:
			#标题
			title = bk["raw_title"]
			print(title)
			#价格
			price = bk["view_price"]
			print(price)
			#购买链接
			link = bk["detail_url"]
			print(link)
			#商家
			store = bk["nick"]
			print(store)
			book_list.append({ 'title' : title, 'price' : price, 'link' : link, 'store' : store })
			print ('{title}:{price}:{link}:{store}'.format( title = title, price = price, link = link, store = store )) 



if __name__ == '__main__':
	spider_tb('9787115428028')

1 回复有任何疑惑可以回复我~

收起回答

提问者 Samuel10 #1
```
谢谢老师
```
回复有任何疑惑可以回复我~ 2018-11-05 11:12:25

提问者 Samuel10 2018-11-06 22:15:21

老师代码运行不成功是什么原因呢

0 回复有任何疑惑可以回复我~

收起回答

NavCat 2018-11-04 15:29:35

淘宝的更改了实现方式，不通过接口来返回数据了。你可以查看页面源代码，数据在页面上的js中

0 回复有任何疑惑可以回复我~

收起回答

提问者 Samuel10 #1
```
老师，我怎么获取js代码呢
```
回复有任何疑惑可以回复我~ 2018-11-04 15:48:34
提问者 Samuel10 #2
```
老师，我怎么获取js代码呢
```
回复有任何疑惑可以回复我~ 2018-11-04 15:57:11
NavCat 回复提问者 Samuel10 #3
```
跟爬取京东的一样，可以用正则表达式，或者xpath都可以的
```
回复有任何疑惑可以回复我~ 2018-11-04 16:03:51

点开查看后面3条评论

老师，我点刷新接口出不来是什么原因呢？

正在回答回答被采纳积分+3

3回答

相似问题

请选择置顶位置

本课精华内容

老师，我好不容易安装好了mysqlclient，但是用不了mysqldb，怎么办？？

老师使用你参考的代码运行不成功是什么原因呢

Macbook上，数据库连接报错

老师请问helper怎么导入，

老师，在实现购书性价比的课中的排序，它仅仅只排列淘宝网的数据是为什么啊，其他的都能爬出来，但是排不了序？？

【讨论题】：如何设计一个更好的登录注册功能？

将爬取的数据写入数据库需要哪些操作？

结合 requests 的使用，将一个网站图片保存到本地该如

实现一个爬虫，还要突破哪些反爬的机制？

关于 Python 的 is和 ==，解释一下下面程序的结果

热搜

最近搜索清空

老师，我点刷新接口出不来是什么原因呢？

正在回答 回答被采纳积分+3

3回答

相似问题

请选择置顶位置

本课精华内容

老师，我好不容易安装好了mysqlclient，但是用不了mysqldb，怎么办？？

老师使用你参考的代码运行不成功是什么原因呢

Macbook上，数据库连接报错

老师请问helper怎么导入，

老师，在实现购书性价比的课中的 排序，它仅仅只排列淘宝网的数据 是为什么啊，其他的都能爬出来，但是排不了序？？

【讨论题】：如何设计一个更好的登录注册功能？

将爬取的数据写入数据库需要哪些操作？

结合 requests 的使用，将一个网站图片保存到本地该如

实现一个爬虫，还要突破哪些反爬的机制？

关于 Python 的 is和 ==，解释一下下面程序的结果

正在回答回答被采纳积分+3

老师，在实现购书性价比的课中的排序，它仅仅只排列淘宝网的数据是为什么啊，其他的都能爬出来，但是排不了序？？