字节大模型算法面经
1.拷打论文、竞赛
2.对强化学习训练有什么了解吗?
3.如果有一个对话任务,没有固定答案,该怎么选RL训练策略
4.讲一讲GRPO的原理,优劣以及后续改进
5.预训练和SFT的loss计算差异?
6.Qwen3相比前代有什么改进?
7.目前LLM领域关注到哪些最新进展?
8.手撕:最长公共子序列
📳对于想求职算法岗的同学,如果想参加高质量项目辅导,提升面试能力,欢迎后台联系。
2.对强化学习训练有什么了解吗?
3.如果有一个对话任务,没有固定答案,该怎么选RL训练策略
4.讲一讲GRPO的原理,优劣以及后续改进
5.预训练和SFT的loss计算差异?
6.Qwen3相比前代有什么改进?
7.目前LLM领域关注到哪些最新进展?
8.手撕:最长公共子序列
📳对于想求职算法岗的同学,如果想参加高质量项目辅导,提升面试能力,欢迎后台联系。
全部评论
相关推荐
点赞 评论 收藏
分享
02-04 16:13
门头沟学院 算法工程师 字节抖音风控部门大模型算法一面1.自我介绍(论文、实习、项目)2.拷打项目(问的很细,占据主要面试时间)3.实习介绍4.讲讲dpo与kto的区别5.grpo的非规则奖励如何设计6.两道medium力扣
查看6道真题和解析 点赞 评论 收藏
分享
查看22道真题和解析 点赞 评论 收藏
分享