京东多模态大模型算法实习一面
1.项目介绍
2.讲一下实习工作
3.使用的数据集
4.使用了多少张卡?SFT 训练多久?
5.增加了串行流程后为什么还能提速?
6.讲一下对多模态大模型发展的看法
7.讲一下什么场景下用 SFT,什么场景下用 RL
8.SFT 的数据集是越大越好吗?会存在 scaling law 吗?
9.为什么使用强化学习会存在训练不稳定问题?为什么业界还在用?
反问
为推荐生成数据,业务驱动,也可以做研究
组内几百张 GPU,资源充足
2.讲一下实习工作
3.使用的数据集
4.使用了多少张卡?SFT 训练多久?
5.增加了串行流程后为什么还能提速?
6.讲一下对多模态大模型发展的看法
7.讲一下什么场景下用 SFT,什么场景下用 RL
8.SFT 的数据集是越大越好吗?会存在 scaling law 吗?
9.为什么使用强化学习会存在训练不稳定问题?为什么业界还在用?
反问
为推荐生成数据,业务驱动,也可以做研究
组内几百张 GPU,资源充足
全部评论
相关推荐
点赞 评论 收藏
分享
点赞 评论 收藏
分享