字节大模型实习算法二面
1.力扣:搜索旋转排序数组
2.ppo损失函数,解释,各部分是什么,ratio、advantage怎么理解,大模型advantage怎么计算,returns是什么
3.Adam
4.mha、mqa、gqa、mla
5.交叉熵损失手撕
6.位置编码有哪些,rope
7.mse损失,gae损失,大模型里面怎么算
8.大模型里面的ppo,returns是什么
9.vit位置编码、二维位置编码、相对位置编码、多模态位置编码
2.ppo损失函数,解释,各部分是什么,ratio、advantage怎么理解,大模型advantage怎么计算,returns是什么
3.Adam
4.mha、mqa、gqa、mla
5.交叉熵损失手撕
6.位置编码有哪些,rope
7.mse损失,gae损失,大模型里面怎么算
8.大模型里面的ppo,returns是什么
9.vit位置编码、二维位置编码、相对位置编码、多模态位置编码
全部评论
相关推荐
12-18 10:53
南京大学 网页产品经理 点赞 评论 收藏
分享
点赞 评论 收藏
分享
点赞 评论 收藏
分享
