强关联规则
在D上满足最小支持度min-sup和最小可信度min-conf的关 联规则称为强关联规则 常用的关联规则算法
常用的关联规则算法
Apriori
关联规则最常用、最经典的挖掘频繁项集的算法,核心思想是通过连接产生候选项及其支持度,然后通过剪枝生成频繁项集无法处理连续型数值变量,往往分析之前需要对数据进行离散化。
Apriori性质
如果项目集X是频繁项目集,则它的所有非空子集 都是频繁项目集 如{I1,I2}频繁,则{I1}频繁。
FP-Tree
针对Apriori算法固有的多次扫描事务数据集的缺陷,提出的不产生候选频繁项集的方法。Apriori和FP-Tree都是寻找频繁项集的算法
Eclat算法
一种深度优先算法,采用垂直数据表示形式,在概念格理论的基础上利用基于前缀的等价关系将搜索空间划分为较小的子空间
灰色关联法
分析和确定各因素之间的影响程度,或是若干个子因素(子序列)对主因素(母序列)的贡献度而进行的一种分析方法