1.八股:介绍几种Attention(MHA,MQA,GQA)的区别2.八股:分别讲一下Dense模型和MoE模型以及二者的区别3.八股:讲一下MoE的路由机制是如何做的?4.项目:介绍RAG项目,讲一下RAG项目的亮点5.项目:如果召回的答案不是想要的,该怎么处理?6.项目:讲一下BM25算法原理7.项目:是否做过意图识别?如果要做意图识别,可以怎么实现?8.项目:微调项目是如何模型选型9.项目:如何做微调的?直接用 PEFT 库,还是用LLama Factory做的?10.项目:讲一下DPO, PPO, GRPO的原理和区别,写一下DPO loss函数11.代码题:lc15 三数之和