美团大模型算法实习一面

1. 项目细节:SFT数据合成、SFT/RL训练细节、奖励函数设计
2. 项目细节:多模态对齐(Text和Image)
3. 项目细节:证明Cold-Start SFT后再RL的模型比只RL效果好
4. 项目细节:为什么不用DPO、PPO等经典强化学习方法?
5. 项目细节:数据覆盖领域及微调保留通用能力的方法
6. 算法题:Leetcode大数加法
7. 八股:BERT模型结构和原理
8. 八股:用BERT做一个分类任务
9. 八股:Transformer的多头注意力机制原理
10. 八股:Decode-only与Encode-only架构区别及设计原因
全部评论

相关推荐

评论
1
收藏
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务