小红书LLM算法一面 55min
1️⃣ 自我介绍
2️⃣dpo训练对于系统问答的优化在哪里
3️⃣提高模型的准确率核心是什么
4️⃣rerank 用的什么模型
5️⃣swiGLU 的改进
6️⃣全参数微调 7B 需要多少显存
7️⃣FP16/BF16 区别
8️⃣介绍 gradient checkpoint
9️⃣RougeL 计算方法
1️⃣0️⃣代码:找数组第 k 大元素
2️⃣dpo训练对于系统问答的优化在哪里
3️⃣提高模型的准确率核心是什么
4️⃣rerank 用的什么模型
5️⃣swiGLU 的改进
6️⃣全参数微调 7B 需要多少显存
7️⃣FP16/BF16 区别
8️⃣介绍 gradient checkpoint
9️⃣RougeL 计算方法
1️⃣0️⃣代码:找数组第 k 大元素
全部评论
刚刷到一个字节的面筋跟你这个问的挺像
相关推荐
点赞 评论 收藏
分享
查看5道真题和解析