百度aigc多模态算法实习三面
1. 实习介绍
2. 介绍一下自己做过的项目( baseline论文是什么,贡献点 )。介绍一下我做的改进;问论文视觉是用的什么?
3. 基于DAPO: 为什么对于长CoT加更多权重就会有用?
4. 问我熟悉主流的VLM的架构吗?(我说比较熟悉llava,让我介绍一下);问我llava 的projecter有哪几种?
5. 问long video understanding有什么关键的问题?
6. 介绍一下稀疏帧采样的方法都有什么;
7. 常规问题:deepspeed优化架构?DP了解吗,介绍下DP?normalization是放在激活函数之前还是之后,放在之前有什么好处?问我是否熟悉:RMS norm,layer Norm,激活函数(llava的),q-former,qk norm,rope,swigle
8. 手撕: 写一个layer norm
2. 介绍一下自己做过的项目( baseline论文是什么,贡献点 )。介绍一下我做的改进;问论文视觉是用的什么?
3. 基于DAPO: 为什么对于长CoT加更多权重就会有用?
4. 问我熟悉主流的VLM的架构吗?(我说比较熟悉llava,让我介绍一下);问我llava 的projecter有哪几种?
5. 问long video understanding有什么关键的问题?
6. 介绍一下稀疏帧采样的方法都有什么;
7. 常规问题:deepspeed优化架构?DP了解吗,介绍下DP?normalization是放在激活函数之前还是之后,放在之前有什么好处?问我是否熟悉:RMS norm,layer Norm,激活函数(llava的),q-former,qk norm,rope,swigle
8. 手撕: 写一个layer norm
全部评论
相关推荐
点赞 评论 收藏
分享
