斑马智行大模型算法实习一面
1. 项目和八股:
1.线性注意力的算子了解多少
2.mamba和RWKV的区别
3.具体说一下IA3
4.DPO什么情况下会没有效果
5.模型训练和sft有什么区别 计算损失有什么区别
6.ES的底层如何实现语义向量检索的
7.格式化回答风格除了设计prompt模板 还可以通过什么方面进行格式化
2.手撕
softmax 实现
1.线性注意力的算子了解多少
2.mamba和RWKV的区别
3.具体说一下IA3
4.DPO什么情况下会没有效果
5.模型训练和sft有什么区别 计算损失有什么区别
6.ES的底层如何实现语义向量检索的
7.格式化回答风格除了设计prompt模板 还可以通过什么方面进行格式化
2.手撕
softmax 实现
全部评论
模型训练和sft有什么区别 计算损失有什么区别咋回答的
相关推荐
02-03 18:36
门头沟学院 测试工程师 点赞 评论 收藏
分享
点赞 评论 收藏
分享
查看13道真题和解析