首页
题库
面试
求职
学习
竞赛
More+
所有博客
搜索面经/职位/试题/公司
搜索
我要招人
去企业版
登录 / 注册
首页
>
试题广场
>
在统计语言模型中,通常以概率的形式描述任意语句的可能性,利用
[单选题]
在统计语言模型中,通常以概率的形式描述任意语句的可能性,利用最大相似度估计进行度量,对于一些低频词,无论如何扩大训练数据,出现的频度仍然很低,下列哪种方法可以解决这一问题()
一元切分
一元文法
数据平滑
N元文法
查看答案及解析
添加笔记
求解答(3)
邀请回答
收藏(121)
分享
纠错
5个回答
添加回答
1
Eden_Zhou
在自然语言处理中,经常要计算单词序列(句子)出现的概率估计。我们知道,算法在训练时,语料库不可能包含所有可能出现的序列。因此,为了防止对训练样本中未出现的新序列概率估计值为零,人们发明了好多改善估计新序列出现概率的算法,即数据平滑算法。
发表于 2020-07-16 06:47:07
回复(0)
2
Miselever
在估计概率时,容易想到的方法是使用频率估计概率,然而
由于训练集不可能出现所有可能的序列,因此可能有很多序列的概率估计为0,但这些未出现的序列不代表着不会出现,为了解决这个问题,将这些未出现的序列赋予一个极小的不为零的概率值作为估计,这种方式就是数据平滑。
发表于 2021-02-27 17:35:47
回复(0)
0
牛客54560154号
在n-gram算法中,我们要计算每一组n-gram的出现概率,有些n-gram在数据集中没有出现过,那么在预测的时候,会导致某些n-gram的出现概率为0,为了改善这种问题,就有了平滑算法,最简单的加1法,就是让每个n-gram的基数为1。
发表于 2021-03-11 09:30:44
回复(0)
0
被普调的布拉德很忧伤
https://blog.csdn.net/quicmous/article/details/52160940
讲解了几种数据平滑的方法
发表于 2019-08-05 18:50:31
回复(0)
0
冲上顶峰
数据平滑,不清楚为什么
发表于 2019-06-01 19:25:06
回复(2)
这道题你会答吗?花几分钟告诉大家答案吧!
提交观点
问题信息
算法工程师
爱奇艺
自然语言处理
2019
上传者:
小小
难度:
5条回答
121收藏
2755浏览
热门推荐
相关试题
(verbal)最近的研究显示,许...
言语理解与表达
2019
普华永道
人力资源
审计
税务服务
风险管理
管理咨询
行政管理
评论
(3)
来自
职能类模拟题14
总共100个球,拿到第100个算赢...
爱奇艺
智力题
评论
(13)
下面描述中,符合结构化程序设计风格...
北京搜狐互联网信息服务有限公司
Java工程师
C++工程师
iOS工程师
安卓工程师
运维工程师
前端工程师
算法工程师
PHP工程师
2018
评论
(1)
相邻的糖果
贪心
评论
(3)
在 Bash 脚本中执行以下代码片...
Linux
评论
(1)
扫描二维码,关注牛客网
意见反馈
下载牛客APP,随时随地刷题