采纳答案成功!
向帮助你的同学说点啥吧!感谢那些助人为乐的人
珍爱网http://m.zhenai.com/zhenghun 获取的源码有问题,http后面插入了unicode码,我用python倒是可以很方便的先过滤出unicode码然后decode为unicode-escape就解决问题了,Go语言不知道怎么实现,忘老师解惑。
不好意思,下午有事,回复晚了。 其实就是个获取网页源码。代码就是您课程上面的。另外,我用Python不做处理只是request的话,也是一样的情况,我刚发现了问题,是我自己的问题,我看运行完代码运行结果直接跑源码底部了,这个源码前面是正常的,后半部分才是我说的那个问题。我自己大意了。
您好,老师。可能我描述的不够清楚,这个问题指向的是“获取初始页的内容”这个章节,问题是:“获取真爱网初始页的时候,url地址会显示如下:http:\u002F\u002Fwww.zhenai.com\u002Fzhenghun\u00。。。。。。
会有'u002F'这样的码,您也可以试一下。
我试了是好的。是从哪里拿到的这个字符串?可以考虑整理一段简单的代码贴到 https://play.studygolang.com/ 来重现问题,然后分享出来。
具体碰到了什么问题?能解释一下“http后面插入了unicode码“是什么现象吗?
登录后可查看更多问答,登录/注册
语法+分布式爬虫实战 为转型工程师量身打造
3.8k 14
722 1
2.0k 1
1.1k 12