首页 > 试题广场 >

关联规则挖掘方法是一种基于规则的机器学习算法,以下关于关联规

[单选题]

关联规则挖掘方法是一种基于规则的机器学习算法,以下关于关联规则挖掘方法的描述错误的是()

  • 生产关联规则一般利用最小支持度从数据库中找到频繁项集

  • 生成关联规则一般利用最小置信度从频繁项集中找到关联规则

  • 关联规则挖掘属于有监督学习算法

  • 如果一个项集是频繁的,那么它的所有子集也一定是频繁的

关联规则挖掘(如Apriori算法)用于发现数据集中项之间的有趣关系,典型应用是购物篮分析。核心概念包括:

  1. 支持度(Support):项集出现的频率。

  2. 置信度(Confidence):规则成立的可靠性。

  3. 频繁项集:支持度≥最小支持度的项集。

    选项A:生产关联规则一般利用最小支持度从数据库中找到频繁项集

    • 正确性:正确。

    • 解释:频繁项集的生成确实依赖最小支持度阈值。例如,Apriori算法通过逐层搜索和剪枝找到所有满足最小支持度的项集。

    选项B:生成关联规则一般利用最小置信度从频繁项集中找到关联规则

    • 正确性:正确。

    • 解释:从频繁项集中生成规则时,需计算规则的置信度(如 P(Y|X) = Support(X∪Y)/Support(X)),并筛选满足最小置信度的规则。

    选项C:关联规则挖掘属于有监督学习算法

    • 正确性错误

    • 解释:

      • 有监督学习需要明确的标签(如分类、回归),而关联规则挖掘是无监督的,它从无标签数据中发现模式。

      • 关联规则的目标是发现项集间的关系,而非预测标签。

    选项D:如果一个项集是频繁的,那么它的所有子集也一定是频繁的

    • 正确性:正确(基于Apriori原理)。

    • 解释:

      • Apriori原理指出:频繁项集的所有子集必须也是频繁的(反之,若子集不频繁,则超集一定不频繁)。

      • 这是算法剪枝的基础,例如,若 {A,B} 不频繁,则 {A,B,C} 无需计算。

发表于 2025-08-02 13:16:43 回复(0)

1. 关联规则挖掘

可以理解为 “找商品之间的购买规律”。比如超市分析数据后发现 “买面包的人大概率会买牛奶”,这就是一条关联规则。

2. 频繁项集

“经常一起出现的一组商品”。比如面包和牛奶经常被一起买,那 {面包,牛奶} 就是一个频繁项集。“最小支持度” 是用来判断 “多频繁才算频繁” 的标准,比如设定支持度≥10%,只有出现次数超过 10% 的商品组合才被认为是频繁项集。

3. 置信度

“规则的靠谱程度”。比如 “买面包→买牛奶” 的置信度是 80%,意思是买了面包的人里,有 80% 的人会买牛奶。“最小置信度” 是判断 “多靠谱才算靠谱” 的标准,比如设定置信度≥70%,只有靠谱程度超过 70% 的规则才会被保留。

4. 有监督学习 vs 无监督学习

  • 有监督学习:需要 “参考答案”(标签),比如预测房价时,需要先给模型看 “过去的房价数据 + 对应的价格”(标签),让它学习规律。
  • 无监督学习:没有 “参考答案”,比如关联规则挖掘,只需要一堆购买记录,让模型自己找规律,不需要提前告诉它 “哪些商品该关联”。

发表于 2025-11-15 16:17:49 回复(0)