技术蓄力中

2025-12-18 09:20 北京大学算法工程师

关注

字节大模型校招二面面经

实习介绍——5min
项目相关细节提问——5min
1. 了解 DeepSpeed 吗？训练时用 ZeRO 优化主要是解决啥问题？ZeRO 的三个阶段分别都是啥？
2. TP 或 PP 了解吗？
3. 并行训练时，如果模型参数量不大，怎么决定用 PP 还是 TP 策略？它们各自有啥好坏？
4. 如果用 TP=2 的策略，self-attention 层里的 QKV 矩阵具体是怎么切分的？
5. 用 TP 的时候，主要会发生哪些通信？不同的切分方式会改变通信行为吗？举个例子呗。
6. 讲讲 Flash Attention 的原理，矩阵 tiling 的过程说细一点，最好把 shape 也讲清楚。
手撕算法：经典接雨水+最长上升子序列

全部评论

推荐最新楼层

不知道怎么取名字_

西安工程大学嵌入式工程师

接雨水这个我感觉不简单

1 回复分享

发布于 2025-12-20 21:51 陕西

湖南大学安卓

手撕算法是有点难度啊

点赞回复分享

发布于 2025-12-26 17:10 江西

01-06 20:59

同花顺_代码生成部_实习生(实习员工)

快手日常面试（二面感觉要凉）

哈喽大家，喵弟面经分享大厂的面试确实不一样，只能说顺子还是不赖的，好歹没算法一面 tl：23号投递 29号一面记忆不太清晰了 对手撕和场景题印象比较深1.实习与项目我看你项目中用到了zset做排行榜，那我现在要是有一千万个用户，该怎么办呢（回答的可以分积分段存，比如存下积分超过一定阈值的用户，或者直接类似于mysql，做一个分表存）zset底层结构讲一下，跳表的优点，为啥不用b+树呢mysql这块，如果有一个慢sql，你怎么办索引失效情况b+树相较于b树和哈希的优点是什么，为什么就选了b+树怎么保证缓存和数据库一致性（最后提到了消息队列）spring中设计模式的体现jvm中内存模型 八股涉及的...

查看14道真题和解析

点赞评论收藏

分享

01-08 05:25

北京大学算法工程师

阿里多模态大模型算法二面-实习面经

1.项目经历2.模型的 loss 函数前乘以10，会对训练造成什么影响？3.deepseek v3的 rope 实现？ deepseek r1的训练过程？4.做过 rag 是吗？介绍 graph rag ?5.bge 和 gte 模型怎么训练的？为什么不能直接用 bert - base 来做余弦相似度召回？6.对比学习的常用 loss 有哪些？ InfoNCE 的超参数？温度系数对训练的影响？7. gradient checkpointing 原理？ gradient _ accumulation 原理？8.多模态大模型的预训练原理？预训练一般分为几个阶段？ ViT 现在一般用什么方法进行预训练？9. 手撕：梯度下降求平方根。

查看9道真题和解析

点赞评论收藏

分享

2025-12-30 10:53

门头沟学院后端工程师

双非本秋招总结

面试情况汇川技术 二面挂 感觉是投晚了+要高了华宇信息技术 一面+二面+HR，HR面挂嘉为科技 OC拒了深蓝保（水滴集团） 二面挂最右 一面挂作业帮 二面挂，hard没撕出来有点可惜数字马力 OC拒了，长沙统一价诗悦网络 一面+HR面（线下面，泡了两周流程结束）CVTE 一面+HR面+体验实习挂东方财富 一面+二面+HR面+线下终面，已签三方小鹏汽车 Boss 约了一面（还是有补录的）八股分享JUC + JVM + MySQL：看稀土掘金竹子爱熊猫，一定要自己总结，形成自己的八股，这样后面复习起来很快，记的也深https://juejin.cn/user/862486453028888集合（H...

发面经攒人品

点赞评论收藏

分享

01-08 10:15

门头沟学院 Java

快手大模型算法二面-实习面经

1．问实习和论文2．讲一下 LoRA ，两个权重矩阵一般怎么初始化，能都全0吗3．除了 LoRA ，还了解哪些可以进行训练推理优化的技术4．现在的多模态大模型，动态分辨率一般都是怎么做的，位置编码怎么设计5．平常训练或者微调 LLM 或者VLM，有什么感受6. 专家划分子空间是区分不同任务但有时候并不能取得理想的效果这是为什么7. 概率题，一副扑克牌，去掉大小王，随机抽两张，花色相同的概率8. 场景题：目前有一个带货的直播间，设计一个方案，商品比较多怎么降低时延

查看8道真题和解析

点赞评论收藏

分享

01-10 17:25

华南理工大学算法工程师

字节大模型算法一面-实习面经 1h

1.拷打论文2.transformer和llama的LN有什么区别，手写RMSNorm3.FFN有什么不同，写Relu和SwiGLU4.数据清洗流程5.质量过滤用什么模型6.PPL公式是什么7.BERT的预训练任务、embedding8.讲讲位置编码9.你认为好的prompt的范式是什么10.开放性问题:端到端的大模型和多个小模型，各自的优缺点是什么11.手撕:两道

查看9道真题和解析

点赞评论收藏

分享

评论

3

11

全站热榜

更多

创作者周榜

更多

正在热议

更多

# 在大厂上班是一种什么样的体验 #

10565次浏览 132人参与

# 你认为工作的意义是什么 #

249182次浏览 1498人参与

# 程序员找工作至少要刷多少题？ #

18301次浏览 246人参与

# 为了减少AI幻觉，你注入过哪些设定？ #

4507次浏览 147人参与

# 我现在比当时_，你想录用我吗 #

8627次浏览 111人参与

# 机械人避雷的岗位/公司 #

43361次浏览 298人参与

# 一张图晒一下你的AI员工 #

4991次浏览 114人参与

# 论秋招对个人心气的改变 #

10741次浏览 154人参与

# 关于春招/暑期实习，你想知道哪些信息？ #

7408次浏览 119人参与

# 刚入职的你踩过哪些坑 #

6763次浏览 127人参与

# AI Coding的使用心得 #

4594次浏览 101人参与

# 晒晒你司的新年福利 #

8404次浏览 105人参与

# 牛客AI体验站 #

6692次浏览 185人参与

# 12306一秒售罄，你抢到回家的票了吗？ #

1926次浏览 47人参与

# 柠檬微趣工作体验 #

14769次浏览 83人参与

# 总结:哪家公司面试体验感最差 #

92979次浏览 430人参与

# 程序员能干到多少岁？ #

8537次浏览 115人参与

# 你认为小厂实习有用吗？ #

118018次浏览 679人参与

# 互联网公司评价 #

485559次浏览 4109人参与

# 应届生进小公司有什么影响吗 #

118260次浏览 1159人参与

牛客网
牛客网在线编程
牛客网题解
牛客企业服务