26实习淘天大模型二面 凉凉
给我面没招了,感觉自己好菜、面试很难,还是要多多练习,感觉自己说不明白业务逻辑
1.实习介绍
2.了解 Transformer 吗,编码器和解码器的注意力有什么区别
3.后来有哪些比较经典的基于 Transformer 的语言模型,Qwen 相比于原始Transformer有哪些结构上的改动
4. 了解 RLHF 吗,DPO 和 PPO 有什么区别,Loss 是什么样的,各自的优缺点是什么
5.介绍一下 CLIP,还了解什么其他的对比学习方法
6.开放题:了解哪些多模态大模型,目前多模态大模型最大的问题是什么
7.代码:1143.最长公共子序列
1.实习介绍
2.了解 Transformer 吗,编码器和解码器的注意力有什么区别
3.后来有哪些比较经典的基于 Transformer 的语言模型,Qwen 相比于原始Transformer有哪些结构上的改动
4. 了解 RLHF 吗,DPO 和 PPO 有什么区别,Loss 是什么样的,各自的优缺点是什么
5.介绍一下 CLIP,还了解什么其他的对比学习方法
6.开放题:了解哪些多模态大模型,目前多模态大模型最大的问题是什么
7.代码:1143.最长公共子序列
全部评论
相关推荐
查看9道真题和解析