字节大模型校招算法一面

1.项目介绍,问实习和论文
2.大模型的超长上下文问题怎么解决预训练和 SFT 的损失一样吗
3.RL 中 Reward 和优势有什么区别
4. LoRA 训练和全参训练的优劣
5.了解哪些常用的 RL 算法
6.最新的 GSPO 重要性采样
7.讲一下 DeepSeek R1,推理模型怎样训练
8.GRPO 比 PPO 强在哪
9.对 DAPO 和 VAPO 有了解吗
10.代码:接雨水
全部评论

相关推荐

面试官蛮好的针对实习项目的一些场景进行拓展提问,总体上来讲比较深入,但是也会耐心的引导回答,面了75min无手撕实习:架构介绍,我这里画了一张架构图,针对着讲了下项目的需求,以及如何发展的,怎么性能优化面试官问了消息队列的取舍(为什么用的Rabbit不用Kafka),RabbitMQ及时性为啥比Kafka强底层是怎么样的,推拉分别是啥,另外就是发送数据的去重是如何实现的,(项目了没有实现说了下方法,但是出现了大key问题,又换了个数据结构set,面试官觉得还可以)八股拷打:1.分布式环境资源抢占,如何解决2.分布式锁如何实现,Redis MySQL ZK 我这臭嘴就不该提ZK的,追问ZK底层实现(不会)3.用过Map嘛,怎么用的,底层是如何实现的,什么结构,不同版本之间的差别,如何保证并发安全,为什么1.7有环链,为什么2的n次方容量,扩容位置变化4.线程创建方式,线程池参数,工作流程,拒绝策略5.场景题:订单超时未支付处理无手撕,问了问算法刷的怎么样,说别到给我推到了第二轮挂算法上反问:面试官面试官这样的面试后续还会有几轮呀,答:有的xd有的这样的技术面还有两轮,建议给我转到秋招流程去,感觉滴滴的实习短的一轮就过了,为啥到我这三轮啊哭死了😭明天还有美团实习的面试,希望顺利吧
查看10道真题和解析
点赞 评论 收藏
分享
评论
点赞
1
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务