机器学习与数据挖掘-3

11.模型过拟合怎么处理(百度)

参考答案
1.获取更多数据,扩大数据量。
2.降低模型复杂度。
3.添加正则项。
4.改为集成学习。

 

12.介绍一下模型融合(百度)

参考答案
Bagging就是采用有放回的方式进行抽样,用抽样的样本建立子模型,对子模型进行训练,这个过程重复多次,最后进行融合。例如随机森林。

 

13.文本匹配算法(中电十所)

参考答案
传统的文本匹配算法Jaccard:两句子分词后词语的交集中词语数与并集中词语数之比。Simhash:先计算两句子的simhash二进制编码,然后使用海明距离计算,最后使用两句的最大simhash值归一化得相似度。
答案解析
选2-3个传统的文本匹配算法说一下原理即可

 

14.怎么防止过拟合(猿辅导)

剩余60%内容,订阅专栏后可继续查看/也可单篇购买

数据分析面试宝典 文章被收录于专栏

本面试宝典均来自校招面试题目大数据进行的整理

全部评论

相关推荐

评论
点赞
1
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务