对于汉字的反爬如何解决呢？-慕课网

1回答

小布_老师 2021-09-22 14:50:05

汉字字体的加密渲染，因为内容不固定，所以每次解析的时候，都需要网页上对应的字体文件，而不是固定的。

在解析爬虫的代码中，加上解析汉字的字体文件代码，从字体文件中，提取中对应的映射关系。

关系不固定，每次都需要解密一次字体文件。

0 回复有任何疑惑可以回复我~

收起回答

提问者好雨知时节__ #1

那要怎么知道对应的是什么内容呢？总不能每次抓取，人工查看对应汉字吧

回复有任何疑惑可以回复我~ 2021-09-22 15:55:25

小布_老师回复提问者好雨知时节__ #2

这个得分析字体文件，里面应该有具体的数据映射关系。
如果真的没有，只能用训练机器学习来识别了。

具体网站可以发一下，我有空也去翻着看看。

回复有任何疑惑可以回复我~ 2021-09-25 00:06:35

提问者好雨知时节__ 回复小布_老师 #3
```
字数补丁
```
回复有任何疑惑可以回复我~ 2021-09-25 00:56:50

点开查看后面5条评论

对于汉字的反爬如何解决呢？

正在回答回答被采纳积分+3

1回答

相似问题

请选择置顶位置

本课精华内容

老师我已经模拟了加密密码登陆还是失败了

本节提到的版本号

对于汉字的反爬如何解决呢？

老师，Cookie和IP有关系吗？

http://www.shanzhi.spbeen.com/login打不开

分布式爬虫架构的架构方案讨论

HBase 和 Hive 的差别是什么，各自适用在什么场景中

分布式文件系统和大数据文件系统，有什么区别？

大数据框架，spark的优势在哪？

列出你知道的分布式爬虫管理系统。

热搜

最近搜索清空

对于汉字的反爬如何解决呢？

正在回答 回答被采纳积分+3

1回答

相似问题

请选择置顶位置

本课精华内容

老师 我已经模拟了加密密码登陆还是失败了

本节提到的版本号

对于汉字的反爬如何解决呢？

老师，Cookie和IP有关系吗？

http://www.shanzhi.spbeen.com/login打不开

分布式爬虫架构的架构方案讨论

HBase 和 Hive 的差别是什么，各自适用在什么场景中

分布式文件系统和大数据文件系统，有什么区别？

大数据框架，spark的优势在哪？

列出你知道的分布式爬虫管理系统。

正在回答回答被采纳积分+3

老师我已经模拟了加密密码登陆还是失败了