机器学习与数据挖掘-3
11.模型过拟合怎么处理(百度)
参考答案
1.获取更多数据,扩大数据量。
2.降低模型复杂度。
3.添加正则项。
4.改为集成学习。
12.介绍一下模型融合(百度)
参考答案
Bagging就是采用有放回的方式进行抽样,用抽样的样本建立子模型,对子模型进行训练,这个过程重复多次,最后进行融合。例如随机森林。
13.文本匹配算法(中电十所)
参考答案
传统的文本匹配算法Jaccard:两句子分词后词语的交集中词语数与并集中词语数之比。Simhash:先计算两句子的simhash二进制编码,然后使用海明距离计算,最后使用两句的最大simhash值归一化得相似度。
答案解析
选2-3个传统的文本匹配算法说一下原理即可
14.怎么防止过拟合(猿辅导)
剩余60%内容,订阅专栏后可继续查看/也可单篇购买
数据分析面试宝典 文章被收录于专栏
本面试宝典均来自校招面试题目大数据进行的整理
传音控股公司福利 356人发布