晋级面霸 - 个人主页动态 - 牛客网

发布(64) 评论刷题收藏

今天 14:35

山东大学算法工程师

哈啰大模型算法实习一面 30min

1.实习介绍2.挖了一下简历里的项目（挖的不是太深）3.PyTorch 模型转换 ONNX 的流程及难点4.模型量化的具体实现5.如何检测转换后的精度损失6.多头注意力机制原理和机制7.叙述资格迹、MAPPO8.world model以及vla的看法

查看8道真题和解析

0 点赞评论收藏

分享

今天 04:20

山东大学算法工程师

百度aigc多模态算法实习二面

1. 实习介绍2. 介绍一下项目经历（面试官提问包括：这个是一个纯粹的指代分割任务还是什么？你这个具体是希望做什么改进？你改进的GRPO是怎么改的，希望达到什么效果？）3. 介绍一下GRPO和PPO4. 问有没有做过落地的项目？（介绍了一下实习的项目）

查看6道真题和解析

0 点赞评论收藏

分享

昨天 15:45

山东大学算法工程师

百度深度学习算法实习一面

1.讲实习经历，为什么这么设计2.讲看过的时序论文介绍了主流的模型3.TimesNet文章原文拿出来，问设计的缺陷4.流匹配5.了解时序的大方向吗？6.知道sundial吗？7.知道GIFT是什么榜单吗？

查看8道真题和解析

0 点赞评论收藏

分享

01-31 11:30

山东大学算法工程师

快手nlp算法实习二面

1.实习介绍2.介绍经历，疯狂拷打细节+施加压力3.代码题a.判断是不是回文数b.三数之和4.反问

查看3道真题和解析

0 点赞评论收藏

分享

01-31 07:40

山东大学算法工程师

小米Agent算法校招二面

1、方法能否迁移到其他GUI场景(不同的OS、分辨率)2、视觉Grounding方案 VS 直接LLM调用API方案3、未来GUl Agent的发展方向4、手撕:二叉树的层序遍历(BFS)5、反问环节

查看4道真题和解析

0 点赞评论收藏

分享

01-30 19:05

山东大学算法工程师

智谱大模型agent一面

项目深挖 1. 训练参数设置&资源配置细节2. DPO训练loss的直观含义（别讲公式！要大白话）3. 为啥不直接SFT，非要搞DPO？（核心是对齐效果差异）4. 负样本构造逻辑追问：长链路GUI下正负样本长度不一有啥影响？原因是啥？5. 为啥选GRPO？对比过其他算法吗？6. tool response需要loss mask吗？理由是啥？7. 训练任务中mcp构造数量+具体case8. 训了几版模型？印象最深的bad case是啥？八股问答1. 看过AUTOGLM论文吗？其他大模型论文呢？印象最深的点是啥？2. 给定模型层数+隐藏层维度，估算参数量级+解释计算逻辑3. 同参数同序列长度，计算kvcache大小手撕代码流式输入输出处理规则（划重点！优先级很关键）1. 被<think></think>包裹的字符直接隐藏（优先级最高）2. mcp调用只输出instruction里的内容3. 其余内容正常输出

查看13道真题和解析

0 点赞评论收藏

分享

01-30 10:45

山东大学算法工程师

腾讯推荐算法实习一面 65min

1.项目介绍2.我看你也做了两段实习，你在 oppo 面临过什么样的挑战，你当时是怎么思考和解决的？3.什么工具去做了这个 agent 框架？4.你后面打算考虑往哪方面发展？在研究和业务方面你更偏向于哪一块？5.开放题：我看你也做了这么多 LLM 的事情，你怎么看待 LLM 的发展？6.你对这个岗位有什么期待或者说是想做的事情吗？7.dpo 是在其他指标都优化的情况下漏检率上升在可接受范围内，当时的话你针对这个事情是怎么调整或者说去解决并落地的？8.假设后面来这边实习，面对工作安排，你会选择直接独立去做一个项目，还是前期先做一些基础性的工作？9.预期能实习多长时间，以及什么时候能到岗？

查看9道真题和解析

0 点赞评论收藏

分享

01-30 00:30

山东大学算法工程师

字节大模型算法校招二面

1.问论文/项目/竞赛2.预训练和SFT的loss计算差异？3.on policy和off policy?4.对目前LLM领域的最新进展一直在关注吗?5.Qwen3相比前代有什么改进？6.手撕：面试官说给个简单的，出了一个力扣easy

查看5道真题和解析

0 点赞评论收藏

分享

01-29 21:25

山东大学算法工程师

小红书大模型算法校招一面

一、实习介绍二、拷打 rag 项目：1.项目还可以提升的地方2.感觉自己可以多久完成这个项目3.dpo训练对于系统问答的优化在哪里4.提高模型的准确率核心是什么5.怎么提高数据的质量6.rag 文档怎么切分7.rag 向量化的模型8.rerank 用的什么模型9.有没有微调 rerank 模型/应该怎么微调10.dpo 用的什么库11.代码：已知无序数组，求第 k 大数

查看11道真题和解析

0 点赞评论收藏

分享

01-29 15:40

山东大学算法工程师

百度大模型算法实习面经

1.针对简历上的实习提问。2.kl散度和交叉熵的关系3.LoRA介绍，和全参sft怎么选择？小模型的sft和大模型的LoRA效果对比会是怎么样的？sft数据集如何构建？4.介绍AUC，AUC表达的是什么？5.recall重要的场景下，如果recall很高，precision很低怎么办？6.precision和recall都是什么，不同场景下precision和recall如何关注？哪个更重要？7.手撕-实现shuffle函数。

查看7道真题和解析

0 点赞评论收藏

分享

01-29 09:15

山东大学算法工程师

腾讯混元大模型算法二面-实习面经

1.过实习和论文2.之前实习用 DeepSpeed 微调过 Qwen2-72B，于是面试官问了 ZeRO-1，ZeRO-2，ZeRO-3 三个模式的区别3.当时你用 DeepSpeed ZeRO-3 来微调 Qwen2-72B，每一张卡占用的显存大概是多少，估算一下为什么是占这么多的显存4.除了 DeepSpeed，还用过其他的什么优化方法吗5.我看你也用到了 LORA，知道 LORA 的原理吗，A和 B两个矩阵怎么初始化，有了解过其他的初始化方法吗6.对 RLHF 了解的多吗7.代码:3.无重复字符的最长子串

查看5道真题和解析

0 点赞评论收藏

分享

01-10 23:15

山东大学算法工程师

小红书大模型算法实习二面

1️⃣实习介绍2️⃣基本就是顺着简历全在问八股1.Transformer 的结构，有哪些可以学习的参数2.多头自注意力结构，矩阵个数3.ffn结构4.encoded decoder 区别5.一个 decoder block 由几个部分组成6.encoder 的输出，作为什么到 decoder7.为什么 decoder 更适合生成8.decided mask 在推理中有用吗9.Transformers 各个架构的改进（attention/ffn/位置编码）分为：10.GQA MHA MQA 区别11.swiGLU 的改进12.rope 在哪里加入3️⃣然后开始项目，其实也问很多八股：1.用的什么开源 dpo 数据2.为什么没用 qwen-33.全参数微调 7B 需要多少显存4.FP16/BF16 区别5.AdamW 显存计算6.介绍 Flash attention7.介绍 gradient checkpoint8.RougeL 计算方法9.代码：找数组第 k 大元素

查看21道真题和解析

0 点赞评论收藏

分享

01-08 03:15

山东大学算法工程师

快手推荐算法日常实习一面 45min

1.问项目，问实习2.介绍SFT3.transformer详细介绍4.介绍解码采样策略5.Flash Attention介绍6.手撕multiheadattention7.字符串解码

查看7道真题和解析

0 点赞评论收藏

分享

01-07 12:33

山东大学算法工程师

树根互联日常实习一面

记录一下 1，自我介绍2，介绍一下论文3，论文里遇到的困难和解决方法4，数据集如何处理的5，ResNet6，dropout7，Unet的结构8，yolo v5和之前的网络有什么改进创新9，训练后的结果评价指标有哪些10，反问面试官比较友好，会引导解答

查看9道真题和解析

0 点赞评论收藏

分享

01-01 19:35

山东大学算法工程师

校招面经-虾皮大模型算法二面

1.项目baseline和最终效果2.你认为什么操作对准确率提升的贡献最大3.介绍reward fuction4.思维链怎么做的5.冷启动用了多少数据、数据分布怎么样6.为什么要用大模型做反思模块，不能用规则做吗7.Agent中的planner模块具体怎么做的8.用户不按照预期的输入使用怎么办？query改写怎么做9.Agent和workflow的区别10.图生图模型的微调数据是怎么构建的11.Hard case怎么构建12.全模态中的推理捷径是什么意思13.你的这个科研项目希望解决的具体业务问题是什么

查看13道真题和解析

0 点赞评论收藏

分享

创作者周榜

更多

关注他的用户也关注了：

牛客网
牛客网在线编程
牛客网题解
牛客企业服务