关联规则挖掘方法是一种基于规则的机器学习算法,以下关于关联规则挖掘方法的描述错误的是()
关联规则挖掘(如Apriori算法)用于发现数据集中项之间的有趣关系,典型应用是购物篮分析。核心概念包括:
支持度(Support):项集出现的频率。
置信度(Confidence):规则成立的可靠性。
正确性:正确。
解释:频繁项集的生成确实依赖最小支持度阈值。例如,Apriori算法通过逐层搜索和剪枝找到所有满足最小支持度的项集。
正确性:正确。
解释:从频繁项集中生成规则时,需计算规则的置信度(如 P(Y|X) = Support(X∪Y)/Support(X)),并筛选满足最小置信度的规则。
正确性:错误。
解释:
有监督学习需要明确的标签(如分类、回归),而关联规则挖掘是无监督的,它从无标签数据中发现模式。
关联规则的目标是发现项集间的关系,而非预测标签。
正确性:正确(基于Apriori原理)。
解释:
Apriori原理指出:频繁项集的所有子集必须也是频繁的(反之,若子集不频繁,则超集一定不频繁)。
这是算法剪枝的基础,例如,若 {A,B} 不频繁,则 {A,B,C} 无需计算。