美团基础研发 大模型算法工程师实习面经

一面

  • 自我介绍
  • 项目+论文
  • 为啥项目中使用Ptuning?
  • 说一下Ptuning的原理
  • 如何关注训练过程中的指标? 训练步数如何确定?
  • RLHF的整个流程详细
  • llama factory代码看过吗?
  • DPO了解吗?
  • 算法题 二分,medium, 旋转数组的最小数字

二面

二面面试官问了很多开放性问题,就是丢给你一个一个问题/实际的步骤,问你怎么解决,怎么考虑,而不是问某某东西的原理

  • 自我介绍
  • 项目
  • 训练大模型的数据如何弄的?
  • RLHF的三个流程中你觉得哪个应该是最重要的?为什么?
  • 为啥RLHF中要用PPO?和其他RL算法的区别?
  • 为什么需要Rewar model?
  • Reward model 如何训练?Reward model 你觉得训练到什么程度可以?
  • Reward model不准确怎么办?
  • 如何提升RLHF的效率?你认为关键在哪里?
  • DPO的原理?
  • Rewar model和训练的LLM模型用同一个基座模型可能有什么作用?
  • Reward有多个目标可以怎么做?
  • 算法题 爬楼梯 面试官会引导逐步改善最开始写的解优化算法到最优空间复杂度
#面经##美团##大模型#
全部评论
佬是项目里用了RLHF吗
3 回复 分享
发布于 2024-03-25 09:16 江苏
Reward model 如何训练?Reward model 你觉得训练到什么程度可以?Reward model不准确怎么办?Rewar model和训练的LLM模型用同一个基座模型可能有什么作用?这几个问题 佬怎么回答的啊
点赞 回复 分享
发布于 2024-04-06 14:43 广东

相关推荐

11-21 14:10
门头沟学院 Java
1.  先简单介绍一下这个项目的背景,跟你使用的就是做的这个过程和它的一些系统功能。2.  分布式所就解决一个用户连续两次提交,是吗?3.  只是做了一个后端接口,前端工作有吗?4.  后端那部分是从 0 到 1 做的吗?还是说从网上找了一个项目,然后在上面改?5.  JWT 的这个在你这个项目里边的一个流程执行流程你能讲吗?6.  前端的部分不是没有搭建嘛?但其实登录这块跟前端前后端结合还是挺紧密的。那对于前端这部分你怎么处理的?7.  JWT 跟 Oauth 2.0 的话,它俩之间是一个什么样的关系?8.  讲讲你的对比过程9.  有生成 token 这一块,你刚才讲说这个 token 里只有用户名密码,还有什么?10. 调研业界的关于登录这一块,除了用 JWT 还有哪些使用方式吗?11. ES 这里面总共就是你这个题库内容有多少啊?12. 讲什么是倒排索引。13. ES 数据,你怎么灌进去的?包括是也用了DB?14. 你直接放在一个事务里不也可以吗?15. 用 Rocketmq 的时候有去看说市面上其他几种开源的这种消息队列吗?16. 队列这种,如果说里面涉及消息的幂等消费,这里边怎么处理的?17. 类加载这个过程你了解吗?18. 初始化的时候有静态代码,块有常量,然后有复合的函数,这些它不同的就是它的一个初始化顺序是什么样子?(看代码说输出)19. JVM的内存结构20. 那有哪些垃圾回收器?21. G1 相对于 CMS 有哪些提升?22. 价值比较大怎么认定?23. JVM中的参数有了解吗?24. 你项目里面现在用的什么垃圾回收器?25. spring 里边对于注入 bean 的话,有几种方式?26. spring 里面那个 AOP 能讲讲吗?27. 场景题:美团话费充值怎么设计mysql表结构,要存几张表,你觉得才能实现这个功能?28. 充值记录表你在这边写一个,写个建表语句
查看28道真题和解析
点赞 评论 收藏
分享
评论
13
90
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务