字节一面
1h
1. 为什么要用dpo,什么任务要用dpo,不用可以吗,用了好处在哪,能优化哪里
2. dpo ppo异同,dpo详细原理,loss
3. 任务为什么不能只用sft
4. 现在的推理模型是怎么训出来的,重点你感觉是哪里,哪里是让这些模型获得推理能力的点
5. r1原理
6. prm 和orm讲一讲,什么情况prm 什么情况orm,哪种更好,重点讲prm的优缺点,为什么现在的推理模型没有用prm
手撕。一个字符串列表,一个长字符串,判断长字符串是否能用这个字符串列表里的词组成。
没做出来,寄寄寄


1. 为什么要用dpo,什么任务要用dpo,不用可以吗,用了好处在哪,能优化哪里
2. dpo ppo异同,dpo详细原理,loss
3. 任务为什么不能只用sft
4. 现在的推理模型是怎么训出来的,重点你感觉是哪里,哪里是让这些模型获得推理能力的点
5. r1原理
6. prm 和orm讲一讲,什么情况prm 什么情况orm,哪种更好,重点讲prm的优缺点,为什么现在的推理模型没有用prm
手撕。一个字符串列表,一个长字符串,判断长字符串是否能用这个字符串列表里的词组成。
没做出来,寄寄寄
全部评论
第六点讲不明白,感觉面试官不是很认可我的回答
,手撕也没做出来,很寄的感觉
相关推荐
深情的鳄鱼不放弃:我也是26届的,我想进小红书实习
查看3道真题和解析 点赞 评论 收藏
分享
10-30 16:38
华东理工大学 嵌入式软件开发 从八月底开始投了135家,全都是嵌入式软件岗。只有经纬恒润给了面试,且二面挂。准备沉淀沉淀备战春招了😭lu过的大佬帮忙看看简历,是缺个对口实习,还是做个更有深度的项目,还是别转码了直接老老实实下车间😭
不知道怎么取名字_:两个方向
1.简历针对性准备下
2.面试前也需要准备的
主要还是要看各个公司需求,看公司行业和岗位描述,那里面已经写了对技术的需求,一份简历,不可能和所有嵌入式岗位都匹配的 点赞 评论 收藏
分享


