成就我的未来

11-20 14:15 中南大学算法工程师

关注

美团算法大模型二面-秋招面经

1.简历实习项目
2.有没有试过外挂数据库来解决线上业务数据分布更新较快的问题
3.模型选型问题，为什么选qwen3-8b，如何估算模型开销。
4.最多做过几卡的模型训练?对deepspeed和Megatron有多少了解?
5.推理加速的方法。(vlm的page-attention, kv cacheprefix cachemla, flash-attention等
6.场景题:忽略
7.代码题:k个一组反转链表

全部评论

推荐最新楼层

11-20 17:06

西南石油大学数据分析师

数字马力面经

笔试（部分，不全）依赖注入SpringKafka软件工程模型Docker大模型预训练的目的集合JVM参数含义SLA协议幂等性类加载器的种类动态SQL标签Saas多租户服务单元测试编程题 drop table if exists exam_record; CREATE TABLE exam_record ( id int PRIMARY KEY AUTO_INCREMENT COMMENT '自增ID', uid int NOT NULL COMMENT '用户ID', exam_id int NOT NULL COMMENT '试卷ID', start_time datetime NOT NU...

晨晨owo：笔试好难

发面经攒人品

点赞评论收藏

分享

12-06 19:15

陕西理工大学算法工程师

26字节大模型算法秋招面经

1.实习介绍2.critique mode 怎么训练的，会不会存在 bias3.介绍下 RLHF 流程4.BN和 LN 的区别， BN 在训练阶段和推理阶段有何不同5.如果让你用 llm 做一个商品类目识别的项目，你会如何设计6.介绍下 transformer , attention 的细节和 mlp 的作用7.deepspeed的原理8.了解 dp 和 ddp ，介绍一下原理和异同9.在 nlu 任务上，你觉得 bert 和 llm 哪个效果会更好，为什么6.介绍下 RLHF 流程7. deepspeed 的原理8.了解 dp 和 ddp ，介绍一下原理和异同9.如果让你用 llm 做一个商品类目识别的项目，你会如何设计10.快排的思想，时间复杂度11.代码题: code ：手写一个多分类的公式，并用代码实现

点赞评论收藏

分享

12-06 08:15

门头沟学院 Java

小米一面面经

1.物理内存和数据内存讲一下有什么区别？2.大模型调参数讲一下？3.根据面向对象的多态思想讲一下你面前的桌子。4.关于adb命令的，怎么问忘记了。5.说一下你的实习经历吧，都做了什么？6.为什么想转测试？7.反问面试大概30分钟，没有手撕。面试官上午在boss上打招呼，下午投完简历过了5分钟打电话问我四点有没有时间可以约面，挺着急的。感觉我答的不好，不知道为啥过了

点赞评论收藏

分享

12-09 22:29

中山大学算法工程师

阿里大模型面经汇总

1.  注意力机制：请简述 MHA、MQA 和 GQA 三种注意力机制的核心区别。2.  模型架构：Dense 模型与 MoE 模型有何本质区别？3.  路由机制：MoE 模型中，路由（Routing）机制具体是如何工作的？4.  LoRA 微调：请阐述 LoRA 的原理，以及其中 A、B 矩阵的初始化方式和秩（Rank）的设置考量。5.  强化学习：请对比 DPO、PPO 和 GRPO 的原理与区别，并写出 DPO 的 Loss 函数公式。6.  推理加速：vLLM 中使用了哪些关键技术（如 PagedAttention、KV Cache）来优化推理？7.  并行框架：你对 DeepSpeed 这一加速推理与训练框架有多少了解？8.  BM25 算法：请讲解 BM25 算法的计算原理。9.  负载均衡：MoE 模型中专家（Expert）的负载不均衡问题该如何解决？10.  损失函数：能否通过修改损失函数的方式来缓解 MoE 的负载均衡问题？11.  数据分布：SFT 微调数据与预训练数据分布差异较大时，该如何处理？12. Scaling Law：SFT 微调的数据集是越大越好吗？是否存在 Scaling Law 现象？13. 训练稳定性：强化学习（RL）为何存在训练不稳定的问题？既然不稳定为何业界仍广泛使用？14. 三数之和：LeetCode 15. 三数之和。📳对于想求职算法岗的同学，如果想参加高质量项目辅导，提升面试能力，欢迎后台联系。

查看14道真题和解析

点赞评论收藏

分享

12-06 20:15

陕西理工大学算法工程师

26校招淘天大模型算法二面

1.介绍自己的项目2.BLEU和ROUGE3.self-attention求内积时为啥除以根号d4.LLM的评估5.介绍下simCSE6.解决tokens不够的问题应该怎么办7.详细介绍下deepspeed（三个stage结合参数回答）8.gpt和llama的区别（模型结构上的）9.PEFT的方式，LORA论文讲一下，对比p-tuning10.LLM训练的时候为什么warmup11.对比学习中的batch size是大一些好还是小一些好（大一些，甚至可以到10k+，为12.了构造好的negative样本）13.了解最新技术一般怎么通过什么渠道14.代码题：lc347 前 K 个高频元素

查看13道真题和解析

点赞评论收藏

分享

评论

点赞

2

全站热榜

更多

创作者周榜

更多

正在热议

更多

# 什么是优秀的实习经历 #

7906次浏览 205人参与

# 担心入职之后被发现很菜怎么办 #

265975次浏览 1130人参与

# 被上班搭子“传染”了哪些习惯 #

5170次浏览 97人参与

# 投格力的你，拿到offer了吗？ #

152152次浏览 813人参与

# 工作后，你落下了哪些病根 #

12770次浏览 182人参与

# 作业帮求职进展汇总 #

82544次浏览 543人参与

# 京东美团大战，你怎么看？ #

157861次浏览 859人参与

# 实习简历求拷打 #

10549次浏览 140人参与

# 如果今天是你的last day，你会怎么度过？ #

58844次浏览 324人参与

# 秋招被挂春招仍然能投的公司 #

6317次浏览 93人参与

# mt对你说过最有启发的一句话 #

34398次浏览 416人参与

# 为了找工作你花了哪些钱？ #

74763次浏览 359人参与

# 机械人晒出你的简历 #

146387次浏览 874人参与

# 嵌入式岗知多少 #

62938次浏览 555人参与

# 摸鱼被leader发现了怎么办 #

100205次浏览 640人参与

# 考研失败就一定是坏事吗？ #

200535次浏览 1368人参与

# 秋招特别不鸣谢 #

15178次浏览 174人参与

# 2023毕业生求职有问必答 #

218531次浏览 1662人参与

# 选实习，你更看重哪方面？ #

13416次浏览 214人参与

# 牛客十周岁生日快乐 #

197732次浏览 1895人参与

牛客网
牛客网在线编程
牛客网题解
牛客企业服务