字节大模型算法实习一面 75min

1.自我介绍
2.LoRA 的 rank, alpha, dropout 参数及设置原因
3.Reward Model 的训练(公式解释)
4.Log Likelihood Loss 公式
5.最长公共子序列(LCSS)优化
6.反问环节
全部评论

相关推荐

评论
1
1
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务