字节大模型实习算法二面

1.力扣:搜索旋转排序数组

2.ppo损失函数,解释,各部分是什么,ratio、advantage怎么理解,大模型advantage怎么计算,returns是什么

3.Adam

4.mha、mqa、gqa、mla

5.交叉熵损失手撕

6.位置编码有哪些,rope

7.mse损失,gae损失,大模型里面怎么算

8.大模型里面的ppo,returns是什么

9.vit位置编码、二维位置编码、相对位置编码、多模态位置编码
全部评论

相关推荐

评论
1
收藏
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务