首页 > 试题广场 >

预训练商品标题模型时,生僻品牌名(如“璘瑸”)词向量质量差。

[单选题]
预训练商品标题模型时,生僻品牌名(如“璘瑸”)词向量质量差。根治措施是:
  • 在输入层添加字符级CNN编码器
  • 词表启用BPE压缩减少OV
  • 对低频词施加更高初始化方差
  • 引入外部知识图谱嵌入
豆包说选b
发表于 2025-10-14 00:57:45 回复(0)
字符级CNN可以基于字形(如“璘瑸”由“璘”和“瑸”组成)学习词的表示,即使该词未在训练集中高频出现,也能通过字符组合生成合理的向量。这对中文生僻品牌名尤其有效,因为很多品牌名是自造词或罕见词,但由常见汉字组成。
发表于 2025-12-03 14:52:33 回复(0)