请稍等 ...
×

采纳答案成功!

向帮助你的同学说点啥吧!感谢那些助人为乐的人

对于汉字的反爬如何解决呢?

请问老师,对于汉字的反爬,又该如何应对呢?如下图:
图片描述
每次返回的字体内容不固定

正在回答 回答被采纳积分+3

1回答

小布_老师 2021-09-22 14:50:05

汉字字体的加密渲染,因为内容不固定,所以每次解析的时候,都需要网页上对应的字体文件,而不是固定的。

在解析爬虫的代码中,加上解析汉字的字体文件代码,从字体文件中,提取中对应的映射关系。

关系不固定,每次都需要解密一次字体文件。

0 回复 有任何疑惑可以回复我~
  • 提问者 好雨知时节__ #1
    那要怎么知道对应的是什么内容呢?总不能每次抓取,人工查看对应汉字吧
    回复 有任何疑惑可以回复我~ 2021-09-22 15:55:25
  • 小布_老师 回复 提问者 好雨知时节__ #2
    这个得分析字体文件,里面应该有具体的数据映射关系。
    如果真的没有,只能用训练机器学习来识别了。
    
    具体网站可以发一下,我有空也去翻着看看。
    回复 有任何疑惑可以回复我~ 2021-09-25 00:06:35
  • 提问者 好雨知时节__ 回复 小布_老师 #3
    字数补丁
    回复 有任何疑惑可以回复我~ 2021-09-25 00:56:50
问题已解决,确定采纳
还有疑问,暂不采纳
意见反馈 帮助中心 APP下载
官方微信