回到基本周末阅读计数开花过滤器

||评论()

我在印度是为了AWS在孟买、钦奈和班加罗尔举行峰会(下周)。和往常一样,我在印度度过了一段美妙的时光,活动安排得很满,参与者非常热情,渴望学习,顾客非常感激,食物也非常美味。

本周的阅读是由一封来自中国的信件引发的马特·伍德谁偶然发现了布鲁姆过滤器数据结构的一个伟大的深入分析Michael Nielsen在他的数据驱动智能博客。我喜欢概率数据结构,布鲁姆过滤器有可能的假阳性的独特属性,但没有假阴性。它们已经被用于许多网络设备、网络协议和分布式应用程序中,在这些应用程序中,像“我以前可能见过这个吗”这样的问题需要能够在非常大的规模上运行。

为什么Bloom过滤器会这样工作迈克尔·尼尔森,《数据驱动的情报》,2012年9月26日

在2000年对原来的Bloom过滤器的改进被称为计数布鲁姆过滤器作为摘要缓存协议的一部分发布。在计数花开时,可以更容易地应用对集合的删除。

摘要缓存:一个可扩展的广域Web缓存共享协议李凡,裴Cao,朱莎·阿尔梅达,安瑞·博德,IEEE/ACM网络学报,8(3):281-293,2000。

评论

博客评论Disqus