首页 > 试题广场 >

自然语言处理中,One-Hot 编码方式和分布式(词向量)编

[单选题]
自然语言处理中,One-Hot 编码方式和分布式(词向量)编码方式是两种常用的词汇编码方式。对于这两种编码方式的比较,下列选项中,说法错误的是()
  • One-Hot 编码方式不能很好地表示不同向量之间的相似度
  • One-Hot 编码方式更容易产生稀疏性
  • 相同维度下 One-Hot 编码方式相比分布式编码方式能够表示更多的词汇
  • One-Hot 编码方式相比分布式编码方式,生成难度和训练难度更低
分布式词向量编码方式是指:将词语映射为低维、稠密、连续的实数向量,使得语义或语法相似的词在向量空间中距离更近。这种编码方式通常基于分布式假设(即上下文相似的词,其语义也相似),并通过大规模无监督语料训练得到。 总结:分布式词向量编码方式的核心是用低维稠密向量表示词语语义,并通过上下文学习词与词之间的相似性和关系,广泛应用于自然语言处理任务中[^0^]。
发表于 2025-09-04 01:19:40 回复(0)