字节豆包算法岗面经
✅一面
1.自我介绍,问实习和论文
2.看你实习微调过Qwen2,说说Qwen2的模型结构吧,Qwen2相比Qwen1做了哪些改进
3.为什么现在 Decoder - only 成为大模型的主流架构,相比于 Encoder - Decoder 的架构好在哪里
4.讲一下 RoPE 吧,目前常用的位置编码还有哪些, RoPE 有什么优点(相对位置、外推性……),如何进一步外推
5.为什么有了 SFT 之后还需要 RLHF
6.PPO和 DPO 的主要思想是什么, DPO 相比 PPO 的 RLHF 做了哪些改进,除此之外还知道哪些 RL 算法,知道 DeepSeek 的 GRPO 吗
7.代码:23.合并 K 个升序链表
一面整体来说还是比较基础的,都是一些八股的知识,没有考什么自由发挥的题。不过力扣还是难的,出了一道 hard
✅二面
1.自我介绍,选一个做的好的实习或者论文讲一下,这里问的比较细,动机是什么,为什么用当前的方案
2.了解 KV cache 吗, GQA 的思想是什么
3.讲一下 FlashAttention 的思想和做法
4.除了刚刚说到的这些,还了解过哪些模型训练推理优化的方法( DeepSpeed ,数据并行,张量并行,流水线并行……
5.开放题:如果要提升大模型的多轮对话能力,你有哪些可以改进的点
6.代码:刚刚提到了 GQA ,写一下 GQA 吧
二面更偏底层优化,没有过多的问一些大模型结构方面的东西,应该是考虑到一面都问过了。整体的考察比较灵活一些
✅三面:
1.自我介绍,过实习和论文,这里面试官会穿插问一些八股的知识,比如了解 Qwen 的结构吗,微调的数据配比是怎样的
2.大模型的灾难性遗忘问题怎么解决
3.了解 RAG 吗, GraphRAG 的做法
4.场景题:目前有一些专业领域知识,比如医疗知识或者法律条文,准备做一个智能助手,要让你搭建一个 RAG 链路,会怎么做
5.开放题:用过豆包吗,觉得目前豆包还存在什么问题
6.代码:416.分割等和子集
三面一些八股还是问的比较常规的,但是自由发挥的题目有点多,感觉有点难答,不过好在面试官会进行启发,抛出一些小问题来引导回答
📳对于想求职算法岗的同学,如果想参加高质量项目辅导,提升面试能力,欢迎后台联系。
1.自我介绍,问实习和论文
2.看你实习微调过Qwen2,说说Qwen2的模型结构吧,Qwen2相比Qwen1做了哪些改进
3.为什么现在 Decoder - only 成为大模型的主流架构,相比于 Encoder - Decoder 的架构好在哪里
4.讲一下 RoPE 吧,目前常用的位置编码还有哪些, RoPE 有什么优点(相对位置、外推性……),如何进一步外推
5.为什么有了 SFT 之后还需要 RLHF
6.PPO和 DPO 的主要思想是什么, DPO 相比 PPO 的 RLHF 做了哪些改进,除此之外还知道哪些 RL 算法,知道 DeepSeek 的 GRPO 吗
7.代码:23.合并 K 个升序链表
一面整体来说还是比较基础的,都是一些八股的知识,没有考什么自由发挥的题。不过力扣还是难的,出了一道 hard
✅二面
1.自我介绍,选一个做的好的实习或者论文讲一下,这里问的比较细,动机是什么,为什么用当前的方案
2.了解 KV cache 吗, GQA 的思想是什么
3.讲一下 FlashAttention 的思想和做法
4.除了刚刚说到的这些,还了解过哪些模型训练推理优化的方法( DeepSpeed ,数据并行,张量并行,流水线并行……
5.开放题:如果要提升大模型的多轮对话能力,你有哪些可以改进的点
6.代码:刚刚提到了 GQA ,写一下 GQA 吧
二面更偏底层优化,没有过多的问一些大模型结构方面的东西,应该是考虑到一面都问过了。整体的考察比较灵活一些
✅三面:
1.自我介绍,过实习和论文,这里面试官会穿插问一些八股的知识,比如了解 Qwen 的结构吗,微调的数据配比是怎样的
2.大模型的灾难性遗忘问题怎么解决
3.了解 RAG 吗, GraphRAG 的做法
4.场景题:目前有一些专业领域知识,比如医疗知识或者法律条文,准备做一个智能助手,要让你搭建一个 RAG 链路,会怎么做
5.开放题:用过豆包吗,觉得目前豆包还存在什么问题
6.代码:416.分割等和子集
三面一些八股还是问的比较常规的,但是自由发挥的题目有点多,感觉有点难答,不过好在面试官会进行启发,抛出一些小问题来引导回答
📳对于想求职算法岗的同学,如果想参加高质量项目辅导,提升面试能力,欢迎后台联系。
全部评论
我想问一下这个到底算是大模型应用开发还是算算法,我现在大二Java已经学的差不多了,想再学点大模型应用也就是微调相关的知识,二者能结合吗
相关推荐
点赞 评论 收藏
分享
10-29 15:51
嘉应学院 Java 点赞 评论 收藏
分享
11-04 21:22
天津理工大学 Java
想干测开的tomca...:让我来压力你!!!: 这份简历看着“技术词堆得满”,实则是“虚胖没干货”,槽点一抓一大把:
1. **项目描述是“技术名词报菜名”,没半分自己的实际价值**
不管是IntelliDoc还是人人探店,全是堆Redis、Elasticsearch、RAG这些时髦词,但你到底干了啥?“基于Redis Bitmap管理分片”是你写了核心逻辑还是只调用了API?“QPS提升至1500”是你独立压测优化的,还是团队成果你蹭着写?全程没“我负责XX模块”“解决了XX具体问题”,纯把技术文档里的术语扒下来凑字数,看着像“知道名词但没实际动手”的实习生抄的。
2. **短项目塞满超纲技术点,可信度直接*****
IntelliDoc就干了5个月,又是RAG又是大模型流式响应又是RBAC权限,这堆活儿正经团队分工干都得小半年,你一个后端开发5个月能吃透这么多?明显是把能想到的技术全往里面塞,生怕别人知道你实际只做了个文件上传——这种“技术堆砌式造假”,面试官一眼就能看出水分。
3. **技能栏是“模糊词混子集合”,没半点硬核度**
“熟悉HashMap底层”“了解JVM内存模型”——“熟悉”是能手写扩容逻辑?“了解”是能排查GC问题?全是模棱两可的词,既没对应项目里的实践,也没体现深度,等于白写;项目里用了Elasticsearch的KNN检索,技能栏里提都没提具体掌握程度,明显是“用过但不懂”的硬凑。
4. **教育背景和自我评价全是“无效信息垃圾”**
GPA前10%这么好的牌,只列“Java程序设计”这种基础课,分布式、微服务这些后端核心课提都不提,白瞎了专业优势;自我评价那堆“积极认真、细心负责”,是从招聘网站抄的模板吧?没有任何和项目挂钩的具体事例,比如“解决过XX bug”“优化过XX性能”,纯废话,看完等于没看。
总结:这简历是“技术名词缝合怪+自我感动式凑数”,看着像“背了后端技术栈名词的应届生”,实则没干货、没重点、没可信度——面试官扫30秒就会丢一边,因为连“你能干嘛”都没说清楚。 点赞 评论 收藏
分享

