大佬们问个问题 1.预训练的损失函数和微调的损失函数计算有什么不同？关注点有什么

重庆范冰冰

2024-08-20 10:09 已编辑南京航空航天大学算法工程师发布于江苏

关注

大佬们问个问题
1.预训练的损失函数和微调的损失函数计算有什么不同？关注点有什么差异？
2.预训练后的模型获得了什么样的能力？微调后又获得了什么样能力？

昨天面试的时候被问到了😭

全部评论

推荐最新楼层

爱打瞌睡的柯基

门头沟学院自然语言处理

预训练所有token位置都计算损失、SFT一般只有答案部分计算损失（提问部分label是-100）预训练是为了吃知识、SFT为了指令遵循

7 回复分享

发布于 2024-08-20 16:37 广东

CovetousC

天津大学算法工程师

这个预训练是指的视觉编码器的预训练，还是mllm的第一阶段预训练

点赞回复分享

发布于 2024-09-08 11:53 天津

希望有好offer

北京工业大学算法工程师

预训练和微调的任务不同损失函数肯定会不同吧？预训练不都是自回归而微调可能会根据下游任务设计不同的损失函数

点赞回复分享

发布于 2024-08-20 11:18 北京

02-03 20:40

清华大学 Java

秋招拿到offer后底气真的会变足

秋招的战场上，每一次投递、面试、等待，都是对自己能力和心态的考验。拿到offer的那一刻，不只是一个纸面的证明，更是一种无声的底气。有了offer，你会发现，原本紧张的面试、犹豫的选择，仿佛都被这份信心照亮。它让你敢于直面未知，敢于提出自己的条件，敢于相信“我值得更好”。底气，不是自夸，而是实打实的实力支撑，是经历磨砺后的淡定从容。秋招的offer，是对努力最直接的回应，也是对未来最坚定的信号。拿到它的你，脚步不再轻浮，眼神不再迷茫——因为你知道，无论前路多远，你都有能力走下去。

论秋招对个人心气的改变

点赞评论收藏

昨天 20:18

曼伦商贸_供应链管理(准入职员工)

三棵树内推，三棵树内推码

三棵树ai测评行为能力1.请做一段自我介绍，说说你的教育背景，实习经验等，用时不超过5分钟。2.在你的学习和项目经历中，你似乎经常面临时间紧迫、任务繁重的挑战，能否分享一个具体的例子，描述一下在面对这些压力时，你如何管理和应对及最终达成目标的。3.你参与的这个项目最终的成果如何，你的成果得到了哪些方面的认可和表彰。4.回忆一下在你的学习或实习经历中，有一次你主动追求极致，把事情做到最好的例子，你当时究竟做了什么，为什么选择这么做，怎么证明这件事已经做到了最好。5.请回忆一个在团队工作里，你和团队成员没能达成一致意见的情况，当时你具体是怎么做的，说了什么去影响对方，最后结果是怎样的呢？6.从你的...

点赞评论收藏

01-23 17:26

天津大学前端工程师

京东三面面试中

早上十一点面的，一直面试中，😇感觉要被挂了

点赞评论收藏

今天 00:59

已编辑

天津师范大学 Web前端

大四想找份前端开发实习

请问简历怎么改啊，投了好多但是没有回应，感觉是简历出问题了

溱元：大四没有实习真的很难了而且已经是大四下学期了，入行晚了看样子是刚学完三大件+框架吧简历真的需要再花时间好好打磨但是马上又快毕业了很多公司都要求实习6个月以上感觉最大的问题就是你没有时间了虽然可能有点扎心但就像黑马pink老师说的那样大四就不要再走it方向了时间来不及了

听劝，我这个简历该怎么改...

点赞评论收藏

02-02 10:47

文远知行_感知算法工程师(准入职员工)

文远知行内推，文远知行内推码

恍恍惚惚也实习快半年了，工作主要是后端开发。 进了才知道是自动驾驶头部的明星初创（不是的话别打我🫣）。每天从家走路15min/骑车5min到公司属实很爽。 整体规模不大，工作内容还是很丰富。从python后端到java后端，中间又穿插了一个月前端开发（噩梦hhh），以后很可能还会涉及scala。长远来看，应该还是java和scala为主，go也有使用但是不清楚我会不会用上。 我本身是第一段开发实习，加上底子很弱，确实学到很多也成长很多。被分到各种任务有时候还是蛮慌张的，好在结果整体还ok！ 不提倡狂加班，还是以结果为导向，干完就可以溜溜球。加上通勤很少，整体强度不算很大。组内氛围也是挺不错的...

文远知行公司福利 561人发布

点赞评论收藏

全站热榜

创作者周榜

正在热议

# 为了减少AI幻觉，你注入过哪些设定？ #

# 关于春招/暑期实习，你想知道哪些信息？ #