斑马智行大模型算法实习一面
1. 项目和八股:
1.线性注意力的算子了解多少
2.mamba和RWKV的区别
3.具体说一下IA3
4.DPO什么情况下会没有效果
5.模型训练和sft有什么区别 计算损失有什么区别
6.ES的底层如何实现语义向量检索的
7.格式化回答风格除了设计prompt模板 还可以通过什么方面进行格式化
2.手撕
softmax 实现
1.线性注意力的算子了解多少
2.mamba和RWKV的区别
3.具体说一下IA3
4.DPO什么情况下会没有效果
5.模型训练和sft有什么区别 计算损失有什么区别
6.ES的底层如何实现语义向量检索的
7.格式化回答风格除了设计prompt模板 还可以通过什么方面进行格式化
2.手撕
softmax 实现
全部评论
相关推荐
01-22 18:28
门头沟学院 机械工程师
合适才能收到offe...:好事多磨!去年也是找了半年,投了一万多份简历才收到三个,选了一个干了一个月发现不对劲,然后又重新找了两个月。记住你现在最大的本钱就是年轻健康,保持乐观心态和积极向上,怎么走都会变好的 点赞 评论 收藏
分享
查看13道真题和解析