技术蓄力中 - 个人主页动态 - 牛客网

今天 06:25

北京大学算法工程师

LLM实习小厂算法面经

全程拷打项目，重点在于：1.数据如何获取和筛选清洗，数据格式，输入输出，MCP的具体使用2.为什么选择Qwen3，某些sft是否必要3.多Agent如何实现协作，Langraph的特性和操作4.问了一点强化学习相关，还不是很熟悉没答太上来5.模型效果如何评测，数据集，评价指标6.Temperature为0时理论上应该可以复现模型输出，但实际上工程实现中并不能完整复现一模一样的输出，问为什么，如何解决？7.如果想要截断某个Agent的输出或者调用的大模型的输出，只保留最相关的部分，如何用代码实现8. 代码：一道hot100原题，排序数组查找第一个和最后一个，秒了

查看8道真题和解析

0 点赞评论收藏

分享

昨天 18:50

北京大学算法工程师

LLM大模型算法面经

1、说一下PPO算法2、在PPO算法中，PPO是如何平衡探索和利用的？3、PPO算法中GAE算法的公式以及原理4、说一下SAC算法5、在SAC算法中，熵是怎么设置的，在具体实现的时候有哪两种实现方法，熵是怎么更新的？6、为什么PPO类的算法是在线策略、SAC是离线策略7、GRPO算法和PPO有什么改进8、Lora算法的原理9、Lora中 矩阵A和B是怎么初始化的，他们的秩设置有什么原则10、怎么进一步降低Lora的参数 （也就是QLora的原理）11、什么是矩阵的秩12、能不能从特征值的角度来说一下矩阵的秩13、Transformer相比起以前的注意力机制有什么不同14、Deepseek 中的前馈神经网络层和Transformer的有什么不同15、 对比一下 Deepseek，Llama，GPT316、你认为强化学习有没有给大模型带来新的知识

查看16道真题和解析

0 点赞评论收藏

分享

01-31 14:20

北京大学算法工程师

京东零售LLM算法实习面经 50min

1.个人介绍；2.问实习经历，推理加速是怎么做的？问VLLM的基本原理？问有没有看过源码？3.讲VL模型的架构，如何训练的，怎么做的对齐？最后上线效果如何？4.问了agent相关的内容，项目里的agent架构如何做的，项目里的rag有哪些特别之处，对于图表如何处理等？5.问了智能客服的项目，用的什么模型，具体如何做的，模型怎么训练的？6.问我是否了解AIGC，我说我了解一点，但是不多，就没多问7.之后主要就是闲聊，手里有啥offer，实习能不能转正，来他们这里的意愿如何等

查看9道真题和解析

0 点赞评论收藏

分享

01-31 08:30

北京大学算法工程师

科大讯飞NLP面经-校招

一面 1.介绍实习2.你了解的多模态融合的方法有哪些（没答上来，因为多模态做的不多）3.介绍deberta（项目中用到了）二面1.介绍实习2.问了问具体用到的模型，显卡，还有一些做的最多的项目代码量，用到的ai这种3.开放题：多模态大模型和传统大模型的发展趋势4.八股讲了一个lora

查看6道真题和解析

0 点赞评论收藏

分享

01-30 21:10

北京大学算法工程师

百度LLM算法一面挂

项目拷打 1.grpo和gspo等老生常谈问题2.sft和rl的区别与理解3.如果想改变某个商品名称，采用sft还是rl？为什么？4.moe模型和dense模型区别5.moe模型结构6.moe的优缺点手撕  非hot100  求解开根号（精度1e-5）

查看7道真题和解析

0 点赞评论收藏

分享

01-22 16:11

北京大学算法工程师

cursor天下第一，最好用

如题，用了这么多的ai cursor确实是最牛的，目前没有写过代码，但是用它读代码确实还可以。trae是字节的 感觉一般般；copaliot是微软的，代码生成凑合吧，写出来的代码没有办法调用已有接口，上下文限制很大。

AI coding的好用...

0 点赞评论收藏

分享

01-11 05:25

北京大学算法工程师

小红书广告算法一面-日常实习

1.实习介绍2.介绍项目3.如果新增一个收藏的指标，应该如何加在PLE模型中4.介绍一下ESMM（包括后续改进）5.如何做Dropout6.其他归一化的方式还了解哪些7.介绍一下PLE，比MMoE好在哪？8.了解广告算法吗？9.介绍一下广告算法的利益均衡10.了解广告算法计费方式吗？11.介绍一下广告算法的其他链路12.介绍一下双塔模型，结构、样本13.讲一遍你知道的所有排序算法14.讲解一下快速排序最优和最差的情况15.如果遇到最差情况，更换哪一种排序算法可以解决（全都一样）16.手撕：快速排序

0 点赞评论收藏

分享

01-10 07:20

北京大学算法工程师

抖音大模型算法二面 45min

1.八股：XGBoost 如何计算特征重要性？Gini 系数在树模型中代表什么？它和信息增益的区别在哪？2.八股：Decoder-only 模型在推理时，预测第 i+1 个 token 时，输入用的是第 i 个 token 的 one-hot 还是概率分布？为什么？3.八股：KV Cache 的空间复杂度是多少？如何估算一个 7B 模型在 batch=1、seq_len=2048 下的显存占用？4.八股：AdamW 和 Adam 的核心区别是什么？Adam 相比 SGD 引入了哪些优化机制？Adam 全称是什么？5.项目：你们验证集的类别分布是否和线上一致？如何保证标注数据的高质量（比如通过交叉校验 or 专家审核）？6.项目：在当前 RAG 架构下，如果引入 Few-shot Prompting，为什么能提升输出质量？和微调相比各自适用场景是什么？7.项目：FAISS 是如何加速向量检索的？你用的是 IVF 还是 HNSW？索引构建时 nlist/nprobe 怎么调？8.手撕：最长回文子串（LeetCode 5）

查看18道真题和解析

0 点赞评论收藏

分享

01-10 02:30

北京大学算法工程师

字节大模型算法实习一面

1.项目介绍2.在参数高效微调中，为什么优先微调 Attention 层的 Q/K/V/O，而不是 FFN 层？3.RAG 和 GraphRAG 在处理多跳推理时的根本？4.RAG 的整体流程5.GraphRAG 系统整体流程6.RoPE 为什么能实现相对位置编码？7.Transformer 中因果注意力和双向注意力的区别8.手撕代码题：最长连续递增子序列（LeetCode 674）

查看7道真题和解析

0 点赞评论收藏

分享

01-08 05:25

北京大学算法工程师

阿里多模态大模型算法二面-实习面经

1.项目经历2.模型的 loss 函数前乘以10，会对训练造成什么影响？3.deepseek v3的 rope 实现？ deepseek r1的训练过程？4.做过 rag 是吗？介绍 graph rag ?5.bge 和 gte 模型怎么训练的？为什么不能直接用 bert - base 来做余弦相似度召回？6.对比学习的常用 loss 有哪些？ InfoNCE 的超参数？温度系数对训练的影响？7. gradient checkpointing 原理？ gradient _ accumulation 原理？8.多模态大模型的预训练原理？预训练一般分为几个阶段？ ViT 现在一般用什么方法进行预训练？9. 手撕：梯度下降求平方根。

查看9道真题和解析

0 点赞评论收藏

分享

01-07 16:30

北京大学算法工程师

腾讯算法实习一面 55min

1.自我介绍与项目反问2.你都读过哪些关于多模态的技术报告3.为什么现在大模型能处理动辄一两万 token 的长序列信息？4.qwen2.5和qwen3之间有什么区别你了解吗？5.序列长短不一，会浪费计算资源，怎么解决这个问题呢？6.qwen2.5- omni 个qwen3- omni 的区别和不同？7.你关于大模型理解的看法。8.代码：编辑距离onehot1009.代码：二叉树从内存中的读取

查看9道真题和解析

0 点赞评论收藏

分享

01-07 04:30

北京大学算法工程师

美团实习多模态算法二面 55min

1.项目介绍2.讲一下实习的工作3.介绍一下基于 MoE 的模型架构4.如果基于 MoE 的模型在训练时负载均衡不好怎么办?5.如何解决负载均衡问题?6.讲-下 DPO、PPO、GRPO 的区别8.如果在训练 DPO 的过程中，正例和负例的loss 都在下降，该如何解决?9.讲-下 RAG项目的亮点10.如果召回的答案不是想要的，该怎么处理?11.算法题:求根节点到叶节点数字之和(LeetCode 129，非Hot100)12反问环节

查看10道真题和解析

0 点赞评论收藏

分享

01-07 03:30

北京大学算法工程师

美团多模态算法实习一面

1.实习介绍2.项目是完全自己独立完成还是团队合作?3.实习期间遇到的最难问题是什么?4.讲一下 DPO/PPO/GRPO 的原理与区别5.多路召回策略方面:各策略召回文档的好坏如何评估?6.是否有成熟的评价体系衡量召回质量?7.性能指标提升如何对比?7%的提升对应的baseline 是什么?8.vLLM 部署方面:如何实现 2k tokens/s 的吞吐?9.并发与压力测试如何设置?10.MCP 协议相较于 Function Calla的优势?11.算法题:买卖股票的最佳时机

0 点赞评论收藏

分享

2025-12-31 13:20

北京大学算法工程师

字节大模型算法日常实习一面凉经

1. 这个岗位是抖音电商岗位，在data部门，主要是做山寨商标识别的，可能需要用到多模态模型对山寨logo识别，或用到AIGC模型生成一些山寨logo2. 介绍完自我介绍，就是一道力扣困难题，求两个有序数组中位数，要求时间复杂度log(m+n)，可能需要二分法，但之前看力扣答案还看不明白，再写下去属实是浪费时间3. 项目深挖，主要是问我textual Inverion和Lora的作用，没有问我的论文4. 八股：Lora实现细节，PPO实现细节，是否知道大语言模型常用的旋转位置编码，是否了解deepseek的GRPO，你对多模态模型了解多少5. 思维题：如果你和一个人比赛但是你的胜率较低，你是选择五局三胜还是三局两胜获胜的概率大？答案应该是三局两胜，我跟面试官说可以建一个二叉树用回溯法求全概率然后比较。但是他让我用直觉判断，果然我的直觉是不准的，选了五局三胜。6. 开放题：如果让你去生成一些山寨logo，该怎么做。我回答的是首选图像编辑模型，在原有logo的基础上通过语言进行额外控制，可以最大限度保留原logo特征；因为logo的颜色较为单一，可以考虑用controlnet➕线稿修改的方式生成。线稿修改可以人工提供一些样本，成本相较于直接人工绘制山寨logo较低。

0 点赞评论收藏

分享

2025-12-31 04:25

北京大学算法工程师

美团搜索推荐算法实习二面 45min

1.开放性讨论比较多2.介绍上段实习用的技术栈3.低活用户和高活用户具体表现在哪些方面的差异4.copc和pcoc的区别5.模型子集是如何划分的6.代码：一个长度为n的int型数组中，查找到出现次数大于n/2的数字（假设必然出现）7.还能怎么优化空间复杂度？8.延伸：假设数组是有序的

查看7道真题和解析

0 点赞评论收藏

分享

创作者周榜

更多

关注他的用户也关注了：

牛客网
牛客网在线编程
牛客网题解
牛客企业服务