京东大模型算法实习二面
1. 为什么要用agent解决这个场景
2. 什么是agent
3. 你在里面做了哪些工作
4. 为什么要SFT
5. 训练前后区别在哪 举一个具体的例子
6. 数据怎么构建的
7. 什么平台上训练的 训练多久 学习率多少 为什么是这个学习率
8. 什么是语言模型
9. cnn能不能做语言模型
10. 现在大模型是什么架构
11. 写出伪代码 用abc 预测第四个token 告诉了我特征维度 头个数
12. 分头是怎么分的 怎么拼接
13. 场景题:做一个意图识别的分类任务,类别特别多 怎么做
2. 什么是agent
3. 你在里面做了哪些工作
4. 为什么要SFT
5. 训练前后区别在哪 举一个具体的例子
6. 数据怎么构建的
7. 什么平台上训练的 训练多久 学习率多少 为什么是这个学习率
8. 什么是语言模型
9. cnn能不能做语言模型
10. 现在大模型是什么架构
11. 写出伪代码 用abc 预测第四个token 告诉了我特征维度 头个数
12. 分头是怎么分的 怎么拼接
13. 场景题:做一个意图识别的分类任务,类别特别多 怎么做
全部评论
相关推荐
昨天 23:22
辽宁科技大学 Python 点赞 评论 收藏
分享
01-28 17:12
南昌大学 产品经理 点赞 评论 收藏
分享
查看17道真题和解析