首页 > 试题广场 >

下列算法中减少了常用词的权重,增加了文档集合中不常用词的权重

[单选题]

下列算法中减少了常用词的权重,增加了文档集合中不常用词的权重的是?

  • 词频(TF)
  • 逆文档频率(IDF)
  • Word2Vec
  • 隐狄利克雷分布(Latent Dirichlet Allocation)
过如意nb
发表于 2023-07-11 17:56:57 回复(0)
TF是指 当前文档中,该词出现次数占总词的频率     ,也就是说 在当前文档中,出现次数越多越重要(增加常用词的权重)
IDF是指 所有包含了该词的文档数 占据 所有文档总数 的比例,   也就是说 越多的文档出现过该词,该词越不重要,烂大街!相反,在各文档中出现次数越少的词也就越稀少(不常用的词反而更重要)
发表于 2022-04-27 15:09:03 回复(0)