26校招商汤大模型算法一面
1、实习介绍,随后围绕项目问八股
2、对qwen-coder大模型的了解
3、Lora训练的原理,调过哪些参数,其含义,怎么设置的
4、训练过程中调过哪些参数,怎么设置的,loss曲线在训练过程中如果突然上升,一定是坏的吗?如何区分是训练参数不对和学到新东西导致的loss上升?
5、大模型训练的流程有哪些?文本是如何tokens化的?tokenizer的原理是什么?
6、RAG的流程?在打比赛时,有哪些提高的点?RAG中召回算法的原理?为什么还需要重排?如何提高RAG召回的效果,如何对向量化模型进行微调?
7、代码题1:a = [1],b=[a,a],b[0]=[0],随后b[1]=?如果不想改a的值怎么做?
8、代码题2:给一个数组,求划分方式,使得左半部分的最大值-右半部分的最大值 最大。
2、对qwen-coder大模型的了解
3、Lora训练的原理,调过哪些参数,其含义,怎么设置的
4、训练过程中调过哪些参数,怎么设置的,loss曲线在训练过程中如果突然上升,一定是坏的吗?如何区分是训练参数不对和学到新东西导致的loss上升?
5、大模型训练的流程有哪些?文本是如何tokens化的?tokenizer的原理是什么?
6、RAG的流程?在打比赛时,有哪些提高的点?RAG中召回算法的原理?为什么还需要重排?如何提高RAG召回的效果,如何对向量化模型进行微调?
7、代码题1:a = [1],b=[a,a],b[0]=[0],随后b[1]=?如果不想改a的值怎么做?
8、代码题2:给一个数组,求划分方式,使得左半部分的最大值-右半部分的最大值 最大。
全部评论
俩个手撕啊
商汤大公司,之前就听过
感觉你这面得好晚啊
相关推荐
点赞 评论 收藏
分享
查看15道真题和解析