科大讯飞ai大模型算法二面 攒人品

1.完全是项目交流,非常对口的实习经历
2.实习中你主要负责哪一部分
3.对于大模型的回答,效果是怎么评估的
4.交付指标是什么?中间有哪些迭代过程?
5.基座模型baseline是多少
6.微调使用的数据量有多少,是怎么处理这些数据的
7.Badcase分布怎么样?优化方案能覆盖哪些badcase
8.人工分流具体是怎么做的
9.GRPO奖励怎么设计的
10.为什么不考虑训练一个reward model
11.语义等价问题怎么处理
12.项目是否上线?有什么反馈?
13.该项目如果继续做二期的话,你认为有哪些点可以做
14.强化学习on-policy vs off-policy 的理解与适用场景?
15.研究和落地你更偏好哪一个
全部评论

相关推荐

评论
点赞
收藏
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务