老师，我爬取京东数据显示不出来，请帮我看看。谢谢-慕课网

import requests from lxml import html def spider_id(sn): """ 爬取京东商城的图书信息 """ url = 'https://search.jd.com/Search?keyword={0}'.format(sn) #获取HTML信息 html_data = requests.get(url).text #获取xpath对象 selector = html.fromstring(html_data) #寻找书本列表 ul_list = selector.xpath('//div[@id="J_goodsList"]/ul/li') print(len(ul_list)) if __name__ == '__main__': sn = '9787115428028' spider_id(sn)

1回答

NavCat 2019-11-06 20:12:45

京东添加了反爬机制，在请求头中添加User-Agent即可，参考代码：

import requests
from lxml import html

def spider_id(sn):
    """ 爬取京东商城的图书信息 """
    url = 'https://search.jd.com/Search?keyword={0}'.format(sn)

    headers = {
        'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/73.0.3683.86 Safari/537.36'
    }
    #获取HTML信息
    html_data = requests.get(url, headers=headers).text
    # print(html_data)
    #获取xpath对象
    selector = html.fromstring(html_data)
    #寻找书本列表
    ul_list = selector.xpath('//div[@id="J_goodsList"]/ul/li')
    print(len(ul_list))

if __name__ == '__main__':
    sn = '9787115428028'
    spider_id(sn)

2 回复有任何疑惑可以回复我~

收起回答

提问者在高原的阿北 #1
```
谢谢老师
```
回复有任何疑惑可以回复我~ 2019-11-06 20:23:47
慕沐2093547 #2
```
老师又不行了、
```
回复有任何疑惑可以回复我~ 2020-01-03 22:48:18

NavCat 回复慕沐2093547 #3

我刚刚试了下是可以的哦，同学你遇到的是什么问题，贴下代码和错误截图，老师好帮你排查

回复有任何疑惑可以回复我~ 2020-01-07 14:32:54

点开查看后面4条评论

老师，我爬取京东数据显示不出来，请帮我看看。谢谢

正在回答回答被采纳积分+3

1回答

相似问题

请选择置顶位置

本课精华内容

老师，我好不容易安装好了mysqlclient，但是用不了mysqldb，怎么办？？

老师使用你参考的代码运行不成功是什么原因呢

Macbook上，数据库连接报错

老师请问helper怎么导入，

老师，在实现购书性价比的课中的排序，它仅仅只排列淘宝网的数据是为什么啊，其他的都能爬出来，但是排不了序？？

【讨论题】：如何设计一个更好的登录注册功能？

将爬取的数据写入数据库需要哪些操作？

结合 requests 的使用，将一个网站图片保存到本地该如

实现一个爬虫，还要突破哪些反爬的机制？

关于 Python 的 is和 ==，解释一下下面程序的结果

热搜

最近搜索清空