美团大模型算法实习一面
1. 项目细节:SFT数据合成、SFT/RL训练细节、奖励函数设计
2. 项目细节:多模态对齐(Text和Image)
3. 项目细节:证明Cold-Start SFT后再RL的模型比只RL效果好
4. 项目细节:为什么不用DPO、PPO等经典强化学习方法?
5. 项目细节:数据覆盖领域及微调保留通用能力的方法
6. 算法题:Leetcode大数加法
7. 八股:BERT模型结构和原理
8. 八股:用BERT做一个分类任务
9. 八股:Transformer的多头注意力机制原理
10. 八股:Decode-only与Encode-only架构区别及设计原因
2. 项目细节:多模态对齐(Text和Image)
3. 项目细节:证明Cold-Start SFT后再RL的模型比只RL效果好
4. 项目细节:为什么不用DPO、PPO等经典强化学习方法?
5. 项目细节:数据覆盖领域及微调保留通用能力的方法
6. 算法题:Leetcode大数加法
7. 八股:BERT模型结构和原理
8. 八股:用BERT做一个分类任务
9. 八股:Transformer的多头注意力机制原理
10. 八股:Decode-only与Encode-only架构区别及设计原因
全部评论
相关推荐
点赞 评论 收藏
分享
01-18 17:27
广东科贸职业学院 嵌入式硬件工程师 点赞 评论 收藏
分享

