京东多模态大模型算法实习一面

1.项目介绍
2.讲一下实习工作
3.使用的数据集
4.使用了多少张卡?SFT 训练多久?
5.增加了串行流程后为什么还能提速?
6.讲一下对多模态大模型发展的看法
7.讲一下什么场景下用 SFT,什么场景下用 RL
8.SFT 的数据集是越大越好吗?会存在 scaling law 吗?
9.为什么使用强化学习会存在训练不稳定问题?为什么业界还在用?

反问
为推荐生成数据,业务驱动,也可以做研究
组内几百张 GPU,资源充足
全部评论

相关推荐

12-19 20:28
已编辑
门头沟学院 Java
美团履约 全栈工程师 (n+1)*15.5 其他
点赞 评论 收藏
分享
12-26 09:02
门头沟学院 Java
牛客87317764...:细节快手直播,里面现在一堆背锅的,不得不品1222事件的影响力,劝你还是别在这个节骨点选择快手
点赞 评论 收藏
分享
评论
1
收藏
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务