在包含N个文档的语料库中,随机选择的一个文档总共包含T个词条,词条“hello”出现K次。如果词条“hello”出现在全部文档的数量接近三分之一,则TF(词频)和IDF(逆文档频率)的乘积的正确值是多少?
KT * Log(3)
T * Log(3) / K
K * Log(3) / T
Log(3) / KT
这道题你会答吗?花几分钟告诉大家答案吧!
扫描二维码,关注牛客网
下载牛客APP,随时随地刷题