首页
题库
公司真题
专项练习
面试题库
在线编程
面试
面试经验
AI 模拟面试
简历
求职
学习
基础学习课
实战项目课
求职辅导课
专栏&文章
竞赛
搜索
我要招人
发布职位
发布职位、邀约牛人
更多企业解决方案
AI面试、笔试、校招、雇品
HR免费试用AI面试
最新面试提效必备
登录
/
注册
巴啦啦能量
四川大学 算法工程师
发布于四川
关注
已关注
取消关注
有用的知识,马住~
@码农鬼仔:
《机器学习高频面试题详解》1.10:随机森林
点击上方卡片链接就可以进入专栏,专栏右上角有订阅选项,欢迎大家订阅~ 前言 大家好,我是鬼仔,今天带来《机器学习高频面试题详解》专栏的第1.10节:随机森林。这是鬼仔第一次开设专栏,每篇文章鬼仔都会用心认真编写,希望能将每个知识点讲透、讲深,帮助同学们系统性地学习和掌握机器学习中的基础知识,希望大家能多多支持鬼仔的专栏~ 目前这篇是试读,后续的文章需要订阅才能查看哦,专栏预计更新30+篇文章(只增不减),具体内容可以看专栏介绍,大家的支持是鬼仔更新的动力! 本文大纲 一、原理 1. 集成学习 2. 随机森林 二、面试真题 1. 简要介绍下集成学习? 2. 集成学习中bagging和boosting的区别? 3. 随机森林的随机性体现在哪里? 4. 随机森林为什么不能用全样本取训练m棵决策树? 5. 随机森林的优缺点? 一、原理 1. 集成学习 在实际应用中,单个模型可能无法满足要求,因此需要将多个基础模型组合起来,以提高模型的准确性和稳定性,这就是集成学习。集成学习不仅可以提高模型性能,还可以有效地减少过拟合的风险。同时,集成算法也存在一些缺点,由于集成算法需要将多个基础模型的结果组合起来,因此计算成本会比单个模型更高,导致运行时间变长。 集成算法可以分为两类:基于bagging(投票)的集成算法和基于boosting(加权)的集成算法。基于投票的集成算法是将多个基础模型的结果进行投票,以确定最终的结果;基于加权的集成算法是将多个基础模型的结果进行加权,以确定最终的结果。 集成学习的示意图如下: 1)Bagging算法 Bagging算法流程图如下: 在Bagging算法中,基学习器的训练集是通过随机采样得到的,随机采样常使用自助采样法(Bootstrap sampling),即有放回的采样:对于m个样本的训练数据集合,每次随机采集一个样本放入采样集,接着把该样本放回,下次采样时该样本仍有可能被采集到,这样采集m次,最终可以得到m个样本的采样集。以上操作重复N次,可以得到N个不同的采样集。对于这N个采样集,我们可以分别独立训练出N个弱学习器,最后通过集成策略(投票法/平均法)得到一个强学习器。 可以看到,Bagging算法中,基模型之间不存在强依赖关系,一系列基模型可以并行生成。因为采样与投票/平均过程的复杂度很小,所以Bagging算法的复杂度与直接使用基模型的复杂度同阶,算法高效。 2)Boosting算法 Boosting算法流程图如下: Boosting算法的基本思想是,将多个弱学习器组合成一个强学习器,从而提高学习性能。它的基本原理是,每个弱学习器都会从上一个弱学习器的错误中学习,从而提高学习性能。具体可以分为两种操作:重赋权法和重采样法。 重赋权法要求基学习器能对特定的数据分布进行学习,即在训练过程的每一轮中,根据样本分布为每个训练样本重新赋予一个权重。具体步骤如下:首先从训练集用初始权重训练出一个弱的基学习器1,根据基学习器的学习误差率来更新训练样本的权重,使得之前弱学习器1学习误差率高的训练样本的权重变高,使得这些误差率高的样本在后面的
点赞 22
评论 3
全部评论
推荐
最新
楼层
饭炒锅盖
门头沟学院 数字IC前端设计
楼主去哪里了
点赞
回复
分享
发布于 2023-04-10 01:00
山东
暂无评论,快来抢首评~
相关推荐
12-22 17:01
美团_前端开发实习生(实习员工)
宇信科技一面
几段实习经历时长差不多,他们的区别在哪里实习有做业务需求吗(简历没咋写)是webview嵌入进去的吗实习的团队是什么规模平时的工作流程是什么样的,从需求到设计到开发参与了哪些部分具体实习内容拷打post message通信原理 做法Vite有没有自己写过插件举一个实际开发中状态管理的例子有没有参加过公共组件的开发(参与过)介绍一下你觉得技术难度最高的一个组件的开发全流程(主要考察开发公共组件/业务组件需要考虑的点)反问
点赞
评论
收藏
分享
昨天 14:47
叮咚买菜_咚力生(管理方向)(准入职员工)
叮咚买菜内推,叮咚买菜内推码
📍 工作地点:在上海市浦东新区叮咚买菜总部,我入职时正好赶上换新办公楼,搬到张江之门啦,新环境新工位,想想就超开心🥳 附近租房价格也比较合理,没有市中心那么夸张。 📝 工作内容:类似采购,但在采购基础上赋予了更大的想象和职能。不再是传统的搬货采购模式,而是要根据消费者需求精准开发产品,全程负责到底。 这边以生鲜为例子:比如帮助一些因各种原因被雪藏的特色生鲜水果走出当地,推广到更多的地方,让消费者尝到美味的特色生鲜水果的同时带动当地的农牧民共同致富💰 例如:大凉山丑苹果,通过以离太阳更近离城市更远,天然无污染为卖点开发出的产品。霜冻菜以抗寒植物在寒冷条件下提升细胞渗透压将淀粉转化为糖的原...
点赞
评论
收藏
分享
11-11 11:34
湖南工业大学 Java
数字马力约面
为什么这么短时间有这么多人,之前看面经不是有40多分钟吗😅
9527LTL:
查看图片
点赞
评论
收藏
分享
12-24 20:49
武汉大学 Java
20251224【字节】面试算法真题(共1题)
题目1:字符串的排列
查看1道真题和解析
点赞
评论
收藏
分享
评论
点赞成功,聊一聊 >
点赞
收藏
分享
评论
提到的真题
返回内容
全站热榜
更多
1
...
工作半年后更确定:我们依然不欠优绩主义什么
6441
2
...
杂记近期所面试的三家中小厂
4900
3
...
牛客2025年终报告重磅上线——揭晓你的年度修炼成就!
4321
4
...
#牛客2025仙途报告#居然是五颗星
3743
5
...
牛客年终报告,今日道爷我成了
3061
6
...
【2025-年终总结】25届毕业生果果牛这一年~
2925
7
...
圣诞节用 AI 做个牛客运营翻翻乐!(含代码)
2652
8
...
互联网实习求职的黑话和timeline,你所需要知道的……
2477
9
...
我只是一个脆弱的人
2025
10
...
一个程序员的自救书|从酒吧陪玩DM到上岸大厂
1960
创作者周榜
更多
正在热议
更多
#
牛客2025仙途报告
#
6610次浏览
168人参与
#
礼物开箱Plog
#
2113次浏览
95人参与
#
2025年终总结
#
181558次浏览
3086人参与
#
哪些行业值得去?
#
14481次浏览
77人参与
#
职场新人体验
#
157078次浏览
1128人参与
#
工作两年,想和老板谈涨薪怎么说
#
38877次浏览
175人参与
#
你面试体验感最差/最好的公司
#
24241次浏览
412人参与
#
考公VS就业,你怎么选?
#
88270次浏览
497人参与
#
今年你最想重开的一场面试是?
#
7061次浏览
94人参与
#
秋招落幕,你是He or Be
#
17462次浏览
317人参与
#
一人说一个提前实习的好处
#
15996次浏览
251人参与
#
离家近房租贵VS离家远但房租低,怎么选
#
13785次浏览
130人参与
#
找工作,行业重要还是岗位重要?
#
86048次浏览
1709人参与
#
重来一次,你会对开始求职的自己说
#
7477次浏览
204人参与
#
各大公司公布25年Q3财报,你怎么看?
#
5080次浏览
50人参与
#
实习没事做是福还是祸?
#
19872次浏览
312人参与
#
大家每天通勤多久?
#
70779次浏览
472人参与
#
实习的内耗时刻
#
212103次浏览
1567人参与
#
工作中听到最受打击的一句话
#
9565次浏览
158人参与
#
机械制造秋招总结
#
97446次浏览
878人参与
牛客网
牛客网在线编程
牛客网题解
牛客企业服务