蚂蚁大模型算法校招一面 50min
1.八股:介绍几种Attention(MHA,MQA,GQA)的区别
2.八股:分别讲一下Dense模型和MoE模型以及二者的区别
3.八股:讲一下MoE的路由机制是如何做的?
4.项目:介绍RAG项目,讲一下RAG项目的亮点
5.项目:如果召回的答案不是想要的,该怎么处理?
6.项目:讲一下BM25算法原理
7.项目:是否做过意图识别?如果要做意图识别,可以怎么实现?
8.项目:微调项目是如何模型选型
9.项目:如何做微调的?直接用 PEFT 库,还是用LLama Factory做的?
10.项目:讲一下DPO, PPO, GRPO的原理和区别,写一下DPO loss函数
11.代码题:lc15 三数之和
2.八股:分别讲一下Dense模型和MoE模型以及二者的区别
3.八股:讲一下MoE的路由机制是如何做的?
4.项目:介绍RAG项目,讲一下RAG项目的亮点
5.项目:如果召回的答案不是想要的,该怎么处理?
6.项目:讲一下BM25算法原理
7.项目:是否做过意图识别?如果要做意图识别,可以怎么实现?
8.项目:微调项目是如何模型选型
9.项目:如何做微调的?直接用 PEFT 库,还是用LLama Factory做的?
10.项目:讲一下DPO, PPO, GRPO的原理和区别,写一下DPO loss函数
11.代码题:lc15 三数之和
全部评论
如果微调是用llamafactory会减分吗
相关推荐
12-22 21:58
陕西理工大学 后端工程师 点赞 评论 收藏
分享
查看15道真题和解析