name取为空-慕课网

2回答

bobby 2020-08-03 09:46:36

加上user-agent就行了

import json

import requests

from scrapy import Selector


def parse_good(good_id):
    headers = {
        'user-agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/62.0.3202.89 Safari/537.36'}
    good_url = "https://item.jd.com/{}.html".format(good_id)
    html = requests.get(good_url, headers=headers).text
    sel = Selector(text=html)
    # 获取商品的名称
    name = sel.xpath("//div[@class='sku-name']/text()").extract()
    # 获取商品的价格
    price_url = "https://p.3.cn/prices/mgets?type=1&skuIds=J_{}&source=item-pc".format(good_id)
    price_text = requests.get(price_url).text.strip()
    price_list = json.loads(price_text)
    print(html)
    if price_list:
        price = float(price_list[0]["p"])

    # 获取商品的评价信息
    evaluate_url = "https://club.jd.com/comment/productPageComments.action?productId={}&score=0&sortType=5&page={}&pageSize=10&isShadowSku=0&fold=1".format(good_id,0)
    evaluate_json = json.loads(requests.get(evaluate_url).text)
    max_page = 0
    max_page = evaluate_json["maxPage"]
    statistics = evaluate_json["hotCommentTagStatistics"]
    summary = evaluate_json["productCommentSummary"]
    evaluates = evaluate_json["comments"]
    pass


if __name__ == "__main__":
    parse_good(100006842459)

0 回复有任何疑惑可以回复我~

收起回答

提问者山楂姑娘 #1
```
非常感谢！
```
回复有任何疑惑可以回复我~ 2020-08-03 15:11:12

bobby 2020-07-30 18:08:53

你把完整的代码贴一下我运行试试也有可能是遇到反爬了

0 回复有任何疑惑可以回复我~

收起回答

提问者山楂姑娘 #1

import json
import requests
from scrapy import Selector


def parse_good(good_id):
    good_url = "https://item.jd.com/{}.html".format(good_id)
    html = requests.get(good_url).text
    sel = Selector(text=html)

    # 获取商品的名称
    name = sel.xpath("//div[@class='sku-name']/text()").extract()

    # 获取商品的价格
    price_url = "https://p.3.cn/prices/mgets?type=1&skuIds=J_{}&source=item-pc".format(good_id)
    price_text = requests.get(price_url).text.strip()

    price_list = json.loads(price_text)
    if price_list:
        price = float(price_list[0]["p"])

    # 获取商品的评价信息
    evaluate_url = "https://club.jd.com/comment/productPageComments.action?productId={}&score=0&sortType=5&page={}&pageSize=10&isShadowSku=0&fold=1".format(good_id,0)
    evaluate_json = json.loads(requests.get(evaluate_url).text)
    max_page = 0
    max_page = evaluate_json["maxPage"]
    statistics = evaluate_json["hotCommentTagStatistics"]
    summary = evaluate_json["productCommentSummary"]
    evaluates = evaluate_json["comments"]

    pass



if __name__ == "__main__":
    parse_good(100006842459)

回复有任何疑惑可以回复我~ 2020-07-31 11:22:15

name取为空

正在回答

2回答

相似问题

请选择置顶位置

本课精华内容

代码问题

老师我的jdproductPageComments 返回的是空白页什么也没有怎么办

代码问题这个错误怎么办

老师这个错误怎么解决

使用selenium点击后返回异常数据

词云热力图应该如何实现？

【讨论题】滑动验证码的解决办法

如果合适的话使用 asyncio 做爬虫的优势是什么？

热搜

最近搜索清空

name取为空

正在回答

2回答

相似问题

请选择置顶位置

本课精华内容

代码问题

老师 我的jdproductPageComments 返回的是空白页 什么也没有 怎么办

代码问题这个错误怎么办

老师这个错误怎么解决

使用selenium点击后返回异常数据

词云热力图应该如何实现？

【讨论题】滑动验证码的解决办法

如果合适的话使用 asyncio 做爬虫的优势是什么？

老师我的jdproductPageComments 返回的是空白页什么也没有怎么办