百度算法实习一面
1- 拷打后训练项目
2- 熟悉Verl框架吗?里面数据处理和训练流程逻辑,比如roll-out的生成、奖励函数打分、优势和loss的计算有了解吗
3- GRPO的优势是什么?
4- 拷打实习(agent相关)
5- 有没有研究过大模型上下文的工作,比如推理加速或长上下文扩展?
6- KV Cache的改进?
7- Coding:最长公共子序列
2- 熟悉Verl框架吗?里面数据处理和训练流程逻辑,比如roll-out的生成、奖励函数打分、优势和loss的计算有了解吗
3- GRPO的优势是什么?
4- 拷打实习(agent相关)
5- 有没有研究过大模型上下文的工作,比如推理加速或长上下文扩展?
6- KV Cache的改进?
7- Coding:最长公共子序列
全部评论
看起来有些难啊,算法工程师一般是自学有哪些途径吗?
相关推荐
查看28道真题和解析 点赞 评论 收藏
分享
