攒人品:小米 大模型算法面经

  1. flash attention解释下
  2. gqa解释下
  3. 怎么才能训练好一个sft过程?
  4. sft的loss计算是用什么计算的?
  5. lora原理
  6. lora参数权重初始化
  7. lora的r和缩放参数
  8. dpo的loss
  9. dpo数据集怎么构造比较好?
  10. 如果dpo训练过程中,accept回答和reject回答的loss都在升高,怎么办?
  11. 假如说dpo效果不好,怎么解决?
  12. 多轮对话一般要怎么训练?
  13. rag的流程?
  14. 检索时,只用关键字匹配会存在问题,怎么具体解决?(没有上下文语义信息)
  15. 给定一个网页,如何提取其中的关键信息
全部评论
是南京的岗位吗
点赞 回复 分享
发布于 12-24 21:30 北京
你这个base是那里的
点赞 回复 分享
发布于 12-24 19:08 陕西

相关推荐

12-25 16:26
已编辑
河北科技学院 Java
勇敢的牛油不服输:2800-300那不等于2500一个月吗兄弟们
点赞 评论 收藏
分享
12-24 20:44
武汉大学 Java
点赞 评论 收藏
分享
评论
1
2
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务