淘天集团

收藏
互联网
10000人以上
未融资
杭州市
identity 科技人才最青睐校招雇主
查看官网
上传简历
职位类型
全部
最新
热门
1. 实习介绍2. 挑一个你最熟悉的大模型项目,讲讲它的目标,你主要负责什么,以及你觉得最有意思的技术点。3. 在Transformer的Decoder里,我们为什么需要用Mask把未来的信息“遮住”?从代码实现上讲,这个Mask具体是怎么作用在Self-Attention分数上的?4. 关于LayerNorm放在残差连接的“前面”还是“后面”(Pre-LN vs Post-LN),社区里有很多讨论。这两种设计选择,主要会影响训练过程的哪些方面?你更倾向于哪一种,为什么?5. 我们要在线上部署一个大模型提供服务,推理速度和吞吐量是个大问题。像vLLM这样的工具,它主要是通过什么核心思想(比如PagedAttention)来解决KV Cache的内存问题,从而提升推理效率的?6. 我们有一个基础模型,但它不太会“听人话”。如果想把它训练成一个能很好遵循指令的聊天助手,通常有几步?能简单说说SFT(监督微调)和基于人类反馈的对齐(比如PPO/DPO)分别是在解决什么问题吗?7. 假设我们有一个效果很好的70B大模型,但因为太大太慢,没法直接上线。现在需要你把它“变小变快”。你会考虑用哪些方法(比如剪枝、量化)?各自有什么优缺点?8. 相比于让大模型直接回答问题,现在很流行的RAG(检索增强生成)方案,它最大的好处是什么?主要解决了什么痛点?9. 我们的RAG系统上线后,发现有时候还是会“胡说八道”,或者答非所问。如果让你去排查,你会从哪些方面入手?(比如是检索模块没找对,还是生成模块没理解好?)10. 核心代码模式算法题:二叉树的中序遍历11. 反问
点赞 评论 收藏
分享
1.简单介绍实习的整个项目背景2.训练数据是怎么构建的,大概有多少量;测试集如何构建3.为什么你在项目中选择用 Qwen 的模型而不用内部模型;文本检索时有 embedding 初步排序和重排两种模型可选,为什么选择 Rerank 方式做重排,而非其他重排方式4.GRPO/ GSPO 训练的流程是什么,一条数据的处理过程及损失计算方式是怎样的, GSPO 相比 GRPO 做了哪些改进; GSPO 训练时,损失函数是怎么设计的;数据相同的情况下,为什么 GSPO 相比 GRPO 优化效果5.实习项目是否已上线,每天的访问量多少;系统中有很多重复或相似的用户问题,一直检索会浪费资源,有哪些优化方式能节约资源6.传统的记忆机制在使用过程中,该怎么进行更新和遗忘7.一个标准的 RAG 系统包含哪些模块,整个 RAG 流程是怎样的8.结合实践,写效果好的大模型 Prompt 一般有什么经验,其模块或每个部分应该写什么内容;除了你提到的, Prompt 还有其他比较重要的模块或部分吗;假如针对某个任务(比如 RAG 系统最后做总结)写了一个初始 Prompt ,发现结果有问题、不能很好遵循要求,有什么样的优化策略方式;还有其他能想到的优化方式吗9.你自己在以后的工作中,更感兴趣做模型优化还是做应用相关的工作?这方面是怎么考虑的10.手撕三选二:LC200最大岛屿,LC221最大正方形,LC31搜索旋转排序数组
点赞 评论 收藏
分享
查看22道真题和解析
点赞 评论 收藏
分享
分享我的面试经验
模拟面试
真实面试体验,快速补齐短板
应聘感受
暂无应聘感受
牛客网
牛客网在线编程
牛客网题解
牛客企业服务