字节大模型算法实习二面 55min
整体面试还是不错的,但是没后续了,,,
1.项目介绍
2.训练样本大概多少条
3.为什么会想在重排做生成式
4.如果是做生成式召回应该对模型结构怎么修改
5.有考虑用别的强化学习的方法吗
6.dpo 的公式是什么
7. grpo 了解吗
8.beamsearch 怎么做的
9.大模型了解多少,强化学习了解什么
10.手撕 transformer 并计算 flops 和内存开销
1.项目介绍
2.训练样本大概多少条
3.为什么会想在重排做生成式
4.如果是做生成式召回应该对模型结构怎么修改
5.有考虑用别的强化学习的方法吗
6.dpo 的公式是什么
7. grpo 了解吗
8.beamsearch 怎么做的
9.大模型了解多少,强化学习了解什么
10.手撕 transformer 并计算 flops 和内存开销
全部评论
手撕 transformer 并计算 flops 和内存开销,是直接在自己本地IDE来写嘛?
相关推荐