攒人品 智海星河大模型面经

  1. 用没用什么训练框架,还是pytorch直接?
  2. 怎么不考虑用一些主流的训练框架?
  3. 你认为有什么亮点?
  4. lora微调改的哪里?
  5. 介绍lora
  6. dpo和ppo之间的区别?
  7. 介绍下dpo的损失函数和ppo的损失函数?
  8. 有没有了解过其他的强化学习方法?
  9. 是否了解主流的一些模型?qwen?deepseek?
  10. transformer中decoder和encoder的差别?注意力机制的差别?
  11. decoder相比于encoder更善于什么?不善于什么?
  12. 注意力计算的公式是什么?复杂度是多少?

#荣耀##接好运#
全部评论

相关推荐

纯真的河老师在喝茶:第一个是这个时间点岗位少,第二个是这个简历重复度太高了,10个有9个简历差不多的
点赞 评论 收藏
分享
评论
点赞
收藏
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务