1.项目介绍2.介绍一下实习工作3.数据集使用的是公开数据集还在有自己构造数据集4.数据集包含哪些任务?5.分别讲一下 Dense 模型和 MoE 模型以及二者的区别6.讲一下MoE的 路由机制是如何做的7.训练完验证使用的是什么数据集8.做这个工作的过程中的难点在哪9.如何做的 SFT10.介绍一下 PPO(近端策略优化)11.讲一下 RAG 项目12.分类任务常用的评测指标有哪些13.讲一下 LoRA 微调的原理14.A、B 矩阵怎么初始化的15.LoRA 微调秩设置的是多少16.算法题:三数之和