每对项目最多只能放在一个特定的桶中,对每个桶中的项 目子集进行测试,减少候选集生成的代价
候选项集放入hash桶中
交易子集也放入hash桶中
算法举例——一个事务数据库
散列函数 h(x,y)=((x的下标)10+(y的下标)) mod 7 如:h(I1,I4)=(110+4)mod7=0 mod是求余数 创建散列表
Hash结构的作用——减少比较次数
Apriori算法检验方法: 建立Hash树,用于存放候选项集 确定最大的叶子大小,即: 存在叶子节点中的项集的最大数目 (如果项集个数超 过此数目,则分裂节点)