27实习字节大模型算法 二面 45min
1、实习介绍
2、讲述论文内容和细节
3、是否了解过多模态大模型,简单讲一下了解的多模态大模型
4、dpo 和sft 的区别,可以先dpo后sft吗?
5、如何处理reward hacking?
6、dpo如果应用在第一轮对话中应该怎样做你会如何构造这个数据集合?
7、手撕hot100:二叉树的右视图
2、讲述论文内容和细节
3、是否了解过多模态大模型,简单讲一下了解的多模态大模型
4、dpo 和sft 的区别,可以先dpo后sft吗?
5、如何处理reward hacking?
6、dpo如果应用在第一轮对话中应该怎样做你会如何构造这个数据集合?
7、手撕hot100:二叉树的右视图
全部评论
相关推荐
01-28 22:50
北京工业大学 Java 本人之前有一段一个月的水实习,也没有涉及到具体的工作内容,可以编写一些项目经历写在简历里么?应该如何包装呢?想在年后3月左右找一份日常实习。同时,有没有大佬帮我看看上一条帖子哇哇哇,求助求助!感激不尽
点赞 评论 收藏
分享
查看7道真题和解析