小米大模型算法日常实习一面 50min
项目简单介绍
rag和agent项目拷打:
1.项目的输入和输出是什么?最后的结果有做过评估吗?有没有一个量化的指标
2.有没有做过拆解后每一步的评估,比如rag的效果和工具调用的结果?
3.你构建的Agent去自主选择工具,它选择的准确率有做过评估吗?是怎么评估的?
4.做RAG的时候,你是怎么去构建数据集的?召回准确率是多少?
5.剩下10%的误判问题,怎么去找到归因?包括怎么去优化它,在哪个阶段优化?
6.在增加Badcase数据量时,如何避免因为数据库膨胀导致检索效果下降?
后训练项目拷打:
1.训练工作是在什么算力平台做的?这个平台是自己搭的还是学校部署好的?
2.既做了SFT也做了GRPO,你的训练数据是怎么准备的?
3.你在用GRPO的时候有没有遇到过哪些困难?是怎么去解决的?
4.GRPO奖励函数怎么设计的,有没有出现奖励曲线一直震荡的情况?
5.有遇到过经典的OOM问题吗?会想到有哪些办法来控制显存的使用?有没有尝试过量化的方式?
6.为什么做两阶段的训练?sft后指标提升了多少?
手撕 买卖股票的最佳时机Ⅲ 非hot100困难
rag和agent项目拷打:
1.项目的输入和输出是什么?最后的结果有做过评估吗?有没有一个量化的指标
2.有没有做过拆解后每一步的评估,比如rag的效果和工具调用的结果?
3.你构建的Agent去自主选择工具,它选择的准确率有做过评估吗?是怎么评估的?
4.做RAG的时候,你是怎么去构建数据集的?召回准确率是多少?
5.剩下10%的误判问题,怎么去找到归因?包括怎么去优化它,在哪个阶段优化?
6.在增加Badcase数据量时,如何避免因为数据库膨胀导致检索效果下降?
后训练项目拷打:
1.训练工作是在什么算力平台做的?这个平台是自己搭的还是学校部署好的?
2.既做了SFT也做了GRPO,你的训练数据是怎么准备的?
3.你在用GRPO的时候有没有遇到过哪些困难?是怎么去解决的?
4.GRPO奖励函数怎么设计的,有没有出现奖励曲线一直震荡的情况?
5.有遇到过经典的OOM问题吗?会想到有哪些办法来控制显存的使用?有没有尝试过量化的方式?
6.为什么做两阶段的训练?sft后指标提升了多少?
手撕 买卖股票的最佳时机Ⅲ 非hot100困难
全部评论
这个手撕我做过,不过现在都不记得咋做的了
小米问的也这么难了吗?还是算法岗都这个水平
相关推荐
点赞 评论 收藏
分享
查看12道真题和解析