饿了么一面
📍面试公司:饿了么
💻面试岗位:大模型
❓面试问题:
1. ppo的特点,他的kl散度,重要性采样和kl散度的关系
2. grpo为什么loss和kl差不多
3. 原始的ppo是off policy怎么改成on的
4. grpo最原始是token还是sequence,后面要怎么改
5. ppo里面优势有什么作用,重要性采样有什么作用
6. peft介绍一下
🙌面试感想:
酣畅淋漓的拷打,接连道歉
#发面经攒人品##我的秋招日记##我的秋招“寄”录##饿了么#
💻面试岗位:大模型
❓面试问题:
1. ppo的特点,他的kl散度,重要性采样和kl散度的关系
2. grpo为什么loss和kl差不多
3. 原始的ppo是off policy怎么改成on的
4. grpo最原始是token还是sequence,后面要怎么改
5. ppo里面优势有什么作用,重要性采样有什么作用
6. peft介绍一下
🙌面试感想:
酣畅淋漓的拷打,接连道歉
#发面经攒人品##我的秋招日记##我的秋招“寄”录##饿了么#
全部评论
佬,饿了么有几轮技术面呀?
相关推荐
2025-12-14 11:43
黑龙江大学 Java
用微笑面对困难:确实比较烂,可以这么修改:加上大学的qs排名,然后大学简介要写一些,然后硕士大学加大加粗,科研经历第一句话都写上在复旦大学时,主要负责xxxx,简历左上角把学校logo写上,建议用复旦大学的简历模板 点赞 评论 收藏
分享
