采纳答案成功!
向帮助你的同学说点啥吧!感谢那些助人为乐的人
如题~
同学你好, 这个问题提的很好。
布隆过滤器的思路是用多个位代表一个串存不存在。
比如说ACCGTAG -> ACCG CGTA GTAG , 然后hash 3个,对应3个比特。 那么判断的准确率就高。如果直接hash,对应的是一个bit,冲突率高,准确率低。
核心问题是,布隆过滤器要节省空间。用少量的空间,给出一个模糊的判断。
我明白了,布隆过滤器不能像一般的哈希表那些把key-value存下来(因为这样太浪费空间),所以无法用链地址法避免冲突,但是又要保证一定准确率,所以采用了分段hash的方法。 总的来说,布隆过滤器只是一个过滤器,不是字典或者集合。
登录后可查看更多问答,登录/注册
深度剖析大厂面试高频真题,让你秒变offer收割机
1.5k 6
1.1k 11
1.1k 10
800 10
884 8