请稍等 ...
×

采纳答案成功!

向帮助你的同学说点啥吧!感谢那些助人为乐的人

UnicodeEncodeError: 'gbk' codec can't encode character '\u200b'

import requests


def zhihu_test():
    url = "https://www.zhihu.com/question/320649155/answer/899683765"

    headers = {
        "user-agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/73.0.3683.75 Safari/537.36",
    }
    response = requests.get(url=url, headers=headers)

    return response


res1 = zhihu_test()
print(res1.text)
"""
错误代码
C:\Users\Administrator\Envs\scrapy_env\Scripts\python.exe D:/ArticleSpider/ArticleSpider/utils/zhihu_requests.py
Traceback (most recent call last):
  File "D:/ArticleSpider/ArticleSpider/utils/zhihu_requests.py", line 16, in <module>
    print(res1.text)
UnicodeEncodeError: 'gbk' codec can't encode character '\u200b' in position 6699: illegal multibyte sequence
"""

"""
把注释去掉  我的解决方法替换里面\u200b 为空,可以打印出来
"""
# res2 = res1.text.replace(u'\u200b', u'')
# res3 = res2.replace(u'\xba', u'')
#
# print(res3)

"""
请问次方法可行吗?会有什么问题?
还有重要问题没有解决,每个网页返回错误gbk后面 character数据都不一样,如何解决,昨天熬一晚
最后数值都不一样,会造成打印不出来和写入html文件错误
"""

正在回答 回答被采纳积分+3

1回答

bobby 2020-02-08 18:54:14

https://img1.sycdn.imooc.com/szimg/5e3e934509c3148a16750890.jpg这是我这里的运行情况,你这里报错是当前的代码引起的吗?

0 回复 有任何疑惑可以回复我~
  • 提问者 慕仔1376067 #1
    老师我看到你代码可以打印出来,但是我的会报错,我python3 版本为3.7.0
    回复 有任何疑惑可以回复我~ 2020-02-08 19:00:46
  • 提问者 慕仔1376067 #2
    当前代码我跑一边还是一样结果
    Traceback (most recent call last):
      File "D:/ArticleSpider/tools/test_bokeyuan.py", line 22, in <module>
        print(res1.text)
    UnicodeEncodeError: 'gbk' codec can't encode character '\u200b' in position 6699: illegal multibyte sequence
    回复 有任何疑惑可以回复我~ 2020-02-08 19:04:29
  • 提问者 慕仔1376067 #3
    老师我问题我找到了,换一个项目就可以运行不报错,同样的环境
    回复 有任何疑惑可以回复我~ 2020-02-08 20:00:46
问题已解决,确定采纳
还有疑问,暂不采纳
微信客服

购课补贴
联系客服咨询优惠详情

帮助反馈 APP下载

慕课网APP
您的移动学习伙伴

公众号

扫描二维码
关注慕课网微信公众号