请问为什么GBDT需要对数据进行归一化

想请问一下同样是树结构,为什么随机森林不需要对数据进行归一化,GBDT需要对数据进行归一化呢
全部评论
因为GBDT的树是在上一颗树的基础上通过梯度下降求解最优解,归一化能收敛的更快,而随机森林本来就是通过减少方差提高性能的,树之间建立关系是独立的,不需要归一化
7 回复 分享
发布于 2019-03-08 17:58
刚看到一个靠谱的回答:“概率模型不需要归一化,因为它们不关心变量的值,而是关心变量的分布和变量之间的条件概率,如决策树、rf。而像adaboost、gbdt、xgboost、svm、lr、KNN、KMeans之类的最优化问题就需要归一化。”
3 回复 分享
发布于 2020-08-28 22:33
个人认为都不需要吧,都是以树模型作基学习器,特征的作用都只是用来分裂节点,scaling不scaling不会影响分裂的结果,影响分裂结果的应该是加法模型中的上一个模型在当前左右子节点产生的残差近似分数
3 回复 分享
发布于 2019-03-08 18:14
不知道说的是不是类别特征one-hot(离散特征连续化),按理来说连续特征归一化在GBDT这种(以树为基模型)不会改变结果(调个包看看就可以了)
点赞 回复 分享
发布于 2019-03-08 19:56
gbdt一样不需要啊 谁说需要的  醉了
点赞 回复 分享
发布于 2019-03-08 19:51
码一下 等大佬解答😂
点赞 回复 分享
发布于 2019-03-08 17:07

相关推荐

递归到脑子变傻:杭州还有上位机用VB的,实在没绷住
点赞 评论 收藏
分享
评论
4
14
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务