Ade201903072040415

2021-08-30 11:56 已编辑香港大学大数据开发工程师

关注

秋招知识点记录（二）——XGBoost,GBDT与RF

Random Forest和GBDT区别如下：

RF的基分类器可以是分类树也可以是回归树，GBDT只能是回归树。
RF不同基分类器可以并行，GBDT只能串行。
RF最终结果采用的策略是多数投票、一票否决、加权投票等，而GBDT是将所有结果（加权）累加起来。
RF对异常值不敏感，GBDT对异常值敏感
RF对训练集一视同仁，GBDT基于Boosting思想，基于权值，分类器越弱，权值越小
RF主要减少模型方差，所以在噪声较大的数据上容易过拟合，而GBDT主要较少模型偏差。
RF随机选择样本，GBDT使用所有样本。

Xgboost就是GBDT的一种，所以Xgboost和RF的区别和GBDT一样。

GBDT和Xgboost的区别如下：

基分类器的选择：传统GBDT以CART作为基分类器，XGBoost还支持线性分类器，这个时候XGBoost相当于带L1和L2正则化项的逻辑斯蒂回归（分类问题）或者线性回归（回归问题）。
梯度信息：传统GBDT只引入了一阶导数信息，Xgboost引入了一阶导数和二阶导数信息，其对目标函数引入了二阶近似，求得解析解, 用解析解作为Gain来建立决策树, 使得目标函数最优（Gain求到的是解析解）。另外，XGBoost工具支持自定义损失函数，只要函数可一阶和二阶求导。
正则项： Xgboost引入了正则项部分，这是传统GBDT中没有的。加入正则项可以控制模型的复杂度，防止过拟合。
特征采样： Xgboost引入了特征子采样，像随机森林那样，既可以降低过拟合，也可以减少计算。
节点分裂方式：GBDT是用的基尼系数，XGBoost是经过优化推导后的。
并行化：传统GBDT由于树之间的强依赖关系是无法实现并行处理的，但是Xgboost支持并行处理，XGBoost的并行不是在模型上的并行，而是在特征上的并行，将特征列排序后以block的形式存储在内存中，在后面的迭代中重复使用这个结构。这个block也使得并行化成为了可能，其次在进行节点分裂时，计算每个特征的增益，最终选择增益最大的那个特征去做分割，那么各个特征的增益计算就可以开多线程进行。
除此之外，Xgboost实现了分裂点寻找近似算法、缺失值处理、列抽样（降低过拟合，还能减少计算）等包括一些工程上的优化，LightGBM是Xgboost的更高效实现。

Reference:
[1]原文链接：https://blog.csdn.net/quiet_girl/article/details/88756843

全部评论

推荐最新楼层

12-24 17:59

万得信息_数据算法工程师(准入职员工)

图拉斯内推，图拉斯内推码

ai面总结：AI调教的很好，问的问题很有意思，整场面试不会有很大的压迫感，追问大多是根据你的回答提问。总时长：35分钟Q1:自我介绍，重点介绍一下个人背景和大学期间的主要经历。Q2：你对于在一家公司长期发展有什么看法？你认为哪几点因素会让你在一家公司长期工作？（有追问）Q3：你取得过的最大成就是什么？过程中最大的难点是什么？你是如何突破的？最终的结果怎么样？（有追问2个）Q4：请描述一个过往遇到的最有压力困难或最具挑战的一个场景，你是如何解决的？对你有什么影响？（有追问）Q5：依你的看法，请描述一个你近期完成的项目任务，如果重来一次，你会做哪些不同的事情来提升结果？（有追问2个）Q6：电商运营...

点赞评论收藏

分享

12-26 16:12

飞鱼科技_美术设计部_角色原画(准入职员工)

飞鱼科技内推，飞鱼科技内推码

游戏测试，记录了下我的面试题1.自我介绍2.测试用例平时能写多少条？3.会用 SQL 查数据吗？3. 可以简单介绍下你参与过的项目吗？项目有多少人，写了多少条测试用例，发现了多少个bug，你的测试用例中自己发散发现bug的比例占多少4.平时都用过哪些测试工具？5.说一下linux的增删改查6.缺陷报告里必须包含哪些内容？7.知道什么是回归测试吗？什么时候需要做？8.参加过需求评审吗9.会写简单的自动化脚本吗？10.期望薪资多少呢11.能接受偶尔跟着开发熬夜赶上线吗？12.对自己未来三年的职业规划是怎样的13.什么时候可以入职呢14.还有什么要问我的吗保卫萝卜研发商【飞鱼科技】2026届秋招启动...

点赞评论收藏

分享

11-18 20:04

泉州职业技术大学算法工程师

我这种流二本是不是找不到任何工作

投了很多小公司都得不到回复，大佬帮忙看看是什么问题呢

专业嗎喽：个人信息名字太大，合到电话邮箱那一栏就行，有党员写过党，剩下其他全删，站空太大了把实习经历丰富，放最前面，然后是个人评价，技能之类的，然后是学校信息。项目经历最后面，可以就选一个自己擅长的。现在是学校不是92就扣分的，没必要放前面。然后现在看重实习经历>竞赛经历（校园经历）>课程项目经历

点赞评论收藏

分享

12-08 18:11

曲阜师范大学 Java

27届双非最近想要找实习，佬们能拷打一下吗😇

程序员花海_：实习和校招简历正确格式应该是教育背景+实习+项目经历+个人评价其中项目经历注意要体现业务实习经历里面的业务更是要自圆其说简历模板尽可能保持干净整洁不要太花哨的

点赞评论收藏

分享

12-26 21:23

已编辑

门头沟学院 golang

双非计算机秋招总结，附带一些个人建议

bg：双非计算机本科，acmer，一段大厂后端实习offer情况：以下是个人秋招获得的offer，最后选择了腾讯后端开发。小马智行：16薪 + 股票 + 签字费，base广州京东：20薪 + 签字费，base北京美团：15.5薪，base北京腾讯：17薪 + 股票 + 签字费，base广州面试情况：共计30+技术面，覆盖后端，客户端，数据引擎开发，游戏服务端，智能驾驶，音视频等...网易雷火游戏服务端：一面 + 二面 + 三面 + hr面网易雷火游戏客户端（服务端是绿通，不冲突流程）：笔试 + 交叉A面 + 交叉B面炎魂网络游戏服务器：笔试 + 一面 + 二面百度后端：笔试 + 一面挂米哈游游...

点赞评论收藏

分享

评论

点赞

2

全站热榜

更多

创作者周榜

更多

正在热议

更多

# 牛客2025仙途报告 #

12142次浏览 226人参与

# 实习要如何选择和准备？ #

129781次浏览 1496人参与

# 2025年终总结 #

193929次浏览 3250人参与

# 上班后和你想的一样吗？ #

95090次浏览 701人参与

# 你有哪些缓解焦虑的方法？ #

44431次浏览 868人参与

# 元旦假期你打算怎么过 #

712次浏览 20人参与

# 找工作，行业重要还是岗位重要？ #

87250次浏览 1741人参与

# 今年你最想重开的一场面试是？ #

11651次浏览 125人参与

# 我们是不是被“优绩主义”绑架了？ #

1554次浏览 60人参与

# 你面试体验感最差/最好的公司 #

28329次浏览 464人参与

# 一人说一个提前实习的好处 #

21712次浏览 297人参与

# 礼物开箱Plog #

3064次浏览 100人参与

# 牛友们的论文几号送审 #

63081次浏览 833人参与

# 秋招落幕，你是He or Be #

21869次浏览 371人参与

# 机械人晒出你的简历 #

148238次浏览 885人参与

# 没有合适的工作，你会先找个干着，还是考公考研 #

149219次浏览 1241人参与

# 牛油的搬砖plog #

163522次浏览 1151人参与

# 工作中听到最受打击的一句话 #

12182次浏览 170人参与

# 重来一次，你会对开始求职的自己说 #

9845次浏览 236人参与

# 实习没事做是福还是祸？ #

23369次浏览 332人参与

牛客网
牛客网在线编程
牛客网题解
牛客企业服务