快手LLM大模型实习一面 80min
1、实习介绍
2、reward函数是如何设计的?数据集的配比是怎样的?
3、inductive learning和transductive learning有什么区别?
4、Viking是什么?相关业务背景是什么?
5、冷启动时,不同专家模型特征输入为什么不同?
6.编码树如何构建?为什么使用高斯分布?
7、id特征为什么学习效果不好?
8、给你整数 delay 和 forget,以及整数 n。每个人在发现秘密后的 delay 天开始,每天可以分享给一个新的人。在发现秘密 forget 天后会忘记秘密,忘记后不再分享。求第 n 天结束时知道秘密的人数。
9、Loss乘10和学习率乘10之间有什么区别
2、reward函数是如何设计的?数据集的配比是怎样的?
3、inductive learning和transductive learning有什么区别?
4、Viking是什么?相关业务背景是什么?
5、冷启动时,不同专家模型特征输入为什么不同?
6.编码树如何构建?为什么使用高斯分布?
7、id特征为什么学习效果不好?
8、给你整数 delay 和 forget,以及整数 n。每个人在发现秘密后的 delay 天开始,每天可以分享给一个新的人。在发现秘密 forget 天后会忘记秘密,忘记后不再分享。求第 n 天结束时知道秘密的人数。
9、Loss乘10和学习率乘10之间有什么区别
全部评论
相关推荐
查看14道真题和解析 点赞 评论 收藏
分享