首页
题库
公司真题
专项练习
面试题库
在线编程
面试
面试经验
AI 模拟面试
简历
求职
学习
基础学习课
实战项目课
求职辅导课
专栏&文章
竞赛
搜索
我要招人
发布职位
发布职位、邀约牛人
更多企业解决方案
AI面试、笔试、校招、雇品
HR免费试用AI面试
最新面试提效必备
登录
/
注册
期待一个好结果吧
浙江大学附属中学 算法工程师
发布于上海
关注
已关注
取消关注
mark
@SweetBean:
算法岗常见面试题(六):优化器
学习资料(讲的很细很清楚):一个框架看懂优化算法之异同 SGD/AdaGrad/AdamAdam那么棒,为什么还对SGD念念不忘 (3)—— 优化算法的选择与使用策略(1条消息) 机器学习11种优化器推导过程详解(SGD,BGD,MBGD,Momentum,NAG,Adagrad,Adadelta,RMSprop,Adam,Nadma,Adamx)_日拱一两卒的博客-CSDN博客_机器学习优化器总结优化器的作用:更新和计算影响模型训练和模型输出的网络参数,使其逼近或达到最优值,从而最小化(或最大化)损失函数。发展路径:SGD -> SGDM -> NAG -> AdaGrad -> AdaDelta / RMSProp -> Adam -> Nadam -> AdamW发展阶段:没有动量:梯度下降<计算所有样本的梯度平均> / SGD<随机选择一个样本计算梯度> / 小批量随机梯度下降<每次处理一批样本>一阶动量(惯性):SGDM<梯度更新方向由历史梯度更新方向和当前梯度更新方向共同决定> / NAG<假设参数先按上一轮梯度更新方向变化,再计算当前梯度更新方向> 二阶动量(自适应学习率):AdaGrad<迄今为止所有梯度的平方和> / AdaDelta / RMSProp<只关注过去一段时间内的梯度更新频率> 一阶动量+二阶动量:Adam<SGDM+AdaDelta> / Nadam<NAG+AdaDelta> / AdamW<Adam+L2正则化>各种优化器如何选择刚入门选NAG或Adam如果模型非常稀疏,优先考虑自适应学习率的算法随机梯度下降算法的收敛速度和数据集大小的关系不大。因此,可以先用一个具有代表性的小数据集进行实验,测试一下最好的优化算法,然后通过参数搜索的方式寻找最优的训练参数。等等。BERT使用的优化器是什么?Adam相较于传统的SGD的优点是什么?(超参数一面)BERT使用的是Adam优化器。Adam结合SGDM和AdaDelta两种优化算法的优点。对梯度的一阶动量(惯性)和二阶动量(更新频率)进行综合考虑,计算出更新步长。一阶动量的优势在于他能够学习到历史梯度下降的惯性,避免受到单个样本分布的干扰,减少震荡,加快收敛;二阶动量的优势在于是自适应学习率,为参数的不同维分配不同的学习率,在模型稀疏的情况下效果很好。PS:Notion的笔记复制过来格式会变,这次就用截图吧,希望能看清楚。。。
点赞 16
评论 3
全部评论
推荐
最新
楼层
暂无评论,快来抢首评~
相关推荐
今天 11:33
门头沟学院 Java
找大模型开发基础知识准备
我觉得首先得好好学习python,而且python真的很简洁高效,人生苦短,得用python嘿嘿,还有python中的Flask要掌握了,就像Java中的spring boot一样还有就是基础知识啦,弄明白Transformer架构,也不用你推导公式,把每个细节都弄清楚,知道Encoder/Decoder是干啥的就行,明白什么是Embedding(词向量)。不懂的地方去OpenAI、DeepSeek或者阿里的千问这样效率贼高
AI求职实录
点赞
评论
收藏
分享
昨天 20:40
清华大学 Java
秋招拿到offer后底气真的会变足
秋招的战场上,每一次投递、面试、等待,都是对自己能力和心态的考验。拿到offer的那一刻,不只是一个纸面的证明,更是一种无声的底气。有了offer,你会发现,原本紧张的面试、犹豫的选择,仿佛都被这份信心照亮。它让你敢于直面未知,敢于提出自己的条件,敢于相信“我值得更好”。底气,不是自夸,而是实打实的实力支撑,是经历磨砺后的淡定从容。秋招的offer,是对努力最直接的回应,也是对未来最坚定的信号。拿到它的你,脚步不再轻浮,眼神不再迷茫——因为你知道,无论前路多远,你都有能力走下去。
论秋招对个人心气的改变
点赞
评论
收藏
分享
2025-12-07 15:42
中南林业科技大学 算法工程师
没点抗压能力,真的不要来大厂
众所周知,字节的福利非常香,无限量零食、咖啡&免费三餐、周边礼物很多、工作环境也是数一数二…… 但是字节太需要自律和抗压强的人了,入职两周了还没有彻底适应,我是第一次来到大厂实习,之前也没有进入过高强度互联网大厂,并且去到的实习岗位接触到的内容完全是全新的 我还是组里唯一的实习生,除了mt没有可以问的人,mt发送了很多文档,文档里面套文档,点开感觉无穷无尽,还好我的mt人比较好,在我看不懂的时候能在他空闲时候开会了解但是真的很需要有极强的学习力、抗压力、自驱力,因为进去大家节奏很快,这也导致压力很大,压力大还不知所措很痛苦,不过真的体验到了字节一天人间三天……想来的朋友还是掂量一下吧
在泡澡的90后很想退...:
真正需要极强学习能力的不是大厂工作,而是外包
字节跳动公司福利 1366人发布
点赞
评论
收藏
分享
01-13 12:25
河南工业大学 财务
好冷漠的话。
哞客37422655...:
这就是真实社会,没有花里胡哨的安慰,让你感受到阶级分明,不浪费彼此时间。虽然露骨但是唉
点赞
评论
收藏
分享
01-29 21:22
安徽师范大学 Java
插入/希尔/选择/堆/冒泡/快速/归并/计数排序等
/** * Created with IntelliJ IDEA. * Description: * User: czt20 * Date: 2026 -01-19 * Time: 13:13 */ public class sort { //直接插入排序 /*时间复杂度;O(n^2); * 空间复杂度;O(1); * 稳定性;稳定(也可以不稳定) * */ public static void insetSort(int[] arrays) { for (int i = 1; i < arrays.length; i++) { int j = i - 1; int temp = arr...
点赞
评论
收藏
分享
评论
点赞成功,聊一聊 >
点赞
收藏
分享
评论
提到的真题
返回内容
全站热榜
更多
1
...
AI 应用开发学习全景路线图
1.3W
2
...
害怕被嘲笑就不去做了吗?
4723
3
...
大厂到底想要什么样的人???
3599
4
...
面试官视角聊聊,AI大模型产品到底是做什么的?
2081
5
...
测试/测开方向刷题经验分享
1416
6
...
我用AI做了个小游戏,来玩!
1371
7
...
2026的你,应该知道哪些AI面试题?
1319
8
...
后端 offer选择
1128
9
...
字节财经业务一面凉经
1048
10
...
因为简历太烂被培训班找上了吗
968
创作者周榜
更多
正在热议
更多
#
在大厂上班是一种什么样的体验
#
3685次浏览
58人参与
#
找工作的破防时刻
#
251319次浏览
1948人参与
#
程序员找工作至少要刷多少题?
#
7977次浏览
122人参与
#
刚入职的你踩过哪些坑
#
3698次浏览
82人参与
#
论秋招对个人心气的改变
#
5229次浏览
91人参与
#
程序员能干到多少岁?
#
5283次浏览
83人参与
#
为了减少AI幻觉,你注入过哪些设定?
#
1592次浏览
51人参与
#
你投递的公司有几家约面了?
#
157635次浏览
994人参与
#
一张图晒一下你的AI员工
#
2539次浏览
59人参与
#
牛客AI体验站
#
2742次浏览
78人参与
#
OPPO求职进展汇总
#
770706次浏览
5396人参与
#
AI Coding的使用心得
#
2042次浏览
52人参与
#
我现在比当时_,你想录用我吗
#
3367次浏览
56人参与
#
关于春招/暑期实习,你想知道哪些信息?
#
3553次浏览
75人参与
#
晒晒你司的新年福利
#
3487次浏览
62人参与
#
腾讯工作体验
#
563194次浏览
3688人参与
#
实习,不懂就问
#
164724次浏览
1469人参与
#
如果公司降薪,你会跳槽吗?
#
138823次浏览
890人参与
#
我的AI电子员工
#
25925次浏览
158人参与
#
软开人,秋招你打算投哪些公司呢
#
180468次浏览
1388人参与
牛客网
牛客网在线编程
牛客网题解
牛客企业服务