攒人品:作业帮大模型算法面经

作业帮大模型算法面经

  1. 讲一下kv cache是怎么节省空间的?kv cache的计算流程
  2. kv cache有没有改进空间
  3. 参数怎么调整的?有什么意义?top k/top p/温度参数
  4. 一个大的模型,怎么得到一个小模型?
  5. Tokenizer 训练用了什么模型?
  6. 讲一下 Grouped Query Attention
  7. 讲一下 RoPE旋转位置编码
  8. git操作 如何拉取一个分支的代码到本地
  9. 如何讲一个分支的代码提交远端?
  10. 如果批量的对一批文件做移动操作?
  11. 旋转位置编码可以加强长上下文,如果这个时候输入了一个超过最大长度的句子,该怎么处理?
  12. 如何量化评价模型?
全部评论

相关推荐

评论
1
收藏
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务