日前,北京大学信息科学技术学院信息科学中心、机器感知与智能教育部重点实验室邓志鸿教授作为第一作者的论文A new algorithm for fast mining frequent itemsets using N-Lists(《一个基于N-Lists结构的快速挖掘频繁项集的新算法》)入选SCIENCE CHINA Information Science(《中国科学:信息科学》)2017年五年持续影响力论文奖。
这篇论文刊于2012年(第55卷9期2008~2030页),文中提出了一种名为“N-Lists”的新颖数据结构。该结构能够在尽量压缩数据的前提下完整保留数据的统计信息。基于“N-Lists”,论文还提出一种线性复杂度的项集模式计数算法,极大地提高了计算效率。论文发表后,“N-Lists”和相应的计数算法在国内外引起大量关注,被广泛应用于频繁项集挖掘、并行频繁项集挖掘、频繁带权项集挖掘、频繁模糊集挖掘、高效用项集挖掘和可删除集挖掘等数据挖掘任务。