京东大模型算法一面
1. 实习介绍
2. 看了今年哪些生成式推荐论文
3. 然后聊了半小时onerec,重点在多模态tokenizer和语义id
4. 拷打简历项目(infonce的温度系数作用,faiss ANN索引,正负样本,特征工程,推理测评指标等)
5. RoPE和ALiBi两种相对位置编码的原理
6. SwiGLU原理,比relu好在哪
7. attention常规八股(根号dk,时间复杂度,为什么要分多头)
8. 用过哪些大模型微调方式,LoRA微调原理
9. 了解模型蒸馏吗
10. 了解目前主流多模态模型吗,扩散模型公式怎么推导的
11. 手撕: lc53 最大子数组和改为求出这个子数组
2. 看了今年哪些生成式推荐论文
3. 然后聊了半小时onerec,重点在多模态tokenizer和语义id
4. 拷打简历项目(infonce的温度系数作用,faiss ANN索引,正负样本,特征工程,推理测评指标等)
5. RoPE和ALiBi两种相对位置编码的原理
6. SwiGLU原理,比relu好在哪
7. attention常规八股(根号dk,时间复杂度,为什么要分多头)
8. 用过哪些大模型微调方式,LoRA微调原理
9. 了解模型蒸馏吗
10. 了解目前主流多模态模型吗,扩散模型公式怎么推导的
11. 手撕: lc53 最大子数组和改为求出这个子数组
全部评论
相关推荐
苦难精算师:这么简单?
查看3道真题和解析 点赞 评论 收藏
分享
01-21 04:38
中国矿业大学 大数据开发工程师 点赞 评论 收藏
分享
01-24 11:58
首都经济贸易大学 前端工程师 点赞 评论 收藏
分享
等闲_:把mt的写上,还有我感觉也不咋用包装,把业务讲清楚就行,面试官也不是不清楚实习生会干啥 点赞 评论 收藏
分享
