蚂蚁大模型算法校招一面 50min

1.八股:介绍几种Attention(MHA,MQA,GQA)的区别
2.八股:分别讲一下Dense模型和MoE模型以及二者的区别
3.八股:讲一下MoE的路由机制是如何做的?
4.项目:介绍RAG项目,讲一下RAG项目的亮点
5.项目:如果召回的答案不是想要的,该怎么处理?
6.项目:讲一下BM25算法原理
7.项目:是否做过意图识别?如果要做意图识别,可以怎么实现?
8.项目:微调项目是如何模型选型
9.项目:如何做微调的?直接用 PEFT 库,还是用LLama Factory做的?
10.项目:讲一下DPO, PPO, GRPO的原理和区别,写一下DPO loss函数
11.代码题:lc15 三数之和
全部评论
如果微调是用llamafactory会减分吗
点赞 回复 分享
发布于 12-25 16:28 浙江

相关推荐

评论
2
2
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务