面面俱到神

01-10 04:35 华南理工大学算法工程师

关注

美团大模型算法校招面经攒人品

八股
1.bf16 和 float16 的区别？各占多少位？训练中如何选择？
2.DeepSpeed Zero 各阶段分别做了哪些优化？
3.如何估算 LLaMA-7B 模型推理时的显存占用？
4.Prefix LM、Causal LM、Encoder-Decoder 三类架构的适用场景与优缺点？
5.Qwen 或 DeepSeek 技术报告中提到的关键创新点有哪些？例如： RoPE 外推、MoE
6.PPO/GRPO 微调后，如何防止模型在分布外（OOD）问题上性能崩塌？
7.是否自己实现过 RLHF 流程？不用框架能否手写 PPO 核心逻辑？
8.模型部署用了什么框架（vLLM/TGI/自研）？如何优化推理延迟和吞吐？
9.未来希望专注大模型哪个方向？例如：对齐 / 推理加速 / 长上下文
手撕：
K 个一组翻转链表（LeetCode 25）

全部评论

推荐最新楼层

01-26 12:19

评论激励赏金任务来喽！01月26日任务

我能想出的方法能是什么好方法乱花渐欲迷人眼求大佬帮分析，帮忙想想给给理由吧最看不惯明知故问秋招测试/测开迟来的总结希望有经验的哥哥姐姐能帮忙解答一下，感谢^_^数据开发在AI时代的转变，数仓、RAG（检索增强）与 Agent如何支持企业级AI每天都在被动加班第K大斜率API 网关中的鉴权怎么做？携程用户运营：如何定义沉默用户？如何制定复活策略？MySQL慢查询优化流程RabbitMQ 如何保证消息的顺序性？计算机大三了，该怎么去实习啊（无标题）数字ic Offer帮选offer帮选实习的第一个需求嵌入式找实习求助实习租房还是青旅一线至少200，非一线150左右吧（非大厂）leader当着我的面...

点赞评论收藏

分享

01-29 19:29

已编辑

北京信息科技大学 Python

雄岸科技——大模型算法面经

1.自我介绍；2.本科毕设项目介绍；3.Retinaface和Facenet的具体网络模型；4.Retinaface是如何检测人脸的，Facenet是如何识别人脸的；5.项目的创新点有什么，评判指标是什么；6.检测和识别用的时间，其中esp8266，mg996r分别是做什么用的；7.大模型量化比赛项目介绍；8.AWQ和GPTQ是什么；9.什么模型适合用AWQ，什么模型适合用GPTQ；10.其中最优的参数是怎么得到的；11.llm- benchmarker怎么用的，是什么评判指标；12.了解算子吗？（marlin kernel）详细说一下这个算子是什么；13.除了量化其他的方法了解吗？（压缩、减枝、LoRA）14.LoRA是什么；QLoRA是什么？为什么要用LoRA；15.具体的原理是怎么样的；16.如何将LoRA结合到TransFormer各个层？17.介绍一下TransFormer的架构；18.Encoder和Decoder是由什么组成的；19.MHA细节是怎么样的(QKV)，softmax是干什么用的；20.单头注意力和多头注意力有什么区别；21.为什么MHA下面要除根号d；22.潜在多头注意力了解吗，多头注意力的作用；23.FFN详细说一下；24.残差链接有什么用；25.Layer Normalization有什么用；26.Layer Normalization和Batch  Normalization的区别；27.Qwen3的基础架构是怎么样的；28.Qwen3和Qwen2.5相比有什么区别；29.Qwen3和DeepSeek有多少个头；30.大模型要训练出思维链应该如何训练；31.如何平衡精度和推理速度，怎么做trade off的；32.了解Agent吗，做过什么agent项目33.Dense模型是什么；34.MoE、MLA是什么，详细讲一下；35.LoRA的偏置矩阵详细说一下，为什么LoRA初始化A要正态分布，B要初始化为0；36.秩是什么意思；怎么理解；37.Qwen3哪里做的好；38.快手实习项目介绍；39.经纬恒润实习项目介绍；40.了解量化交易吗；41.你平时做交易是趋势还是阶段？------二更已oc

你最近因为什么迷茫？

点赞评论收藏

分享

01-13 20:06

南京大学算法工程师

27届目前已开实习汇总，持续更新，分享给需要的牛友！

大家好，作为往届经历过实习和秋招的师姐，26届春招还没开始，最近就看到很多27届的学弟学妹已经开始焦虑实习了开个帖子记录27届新开实习，含暑期转正实习&日常实习，暑期不多，日常实习为主，暑期实习年后更新，可以先mark此贴持续更新，需要的牛油可mark,以下企业均可通过官网投递，祝各位都能成为offer收割机，以时间顺序✅小红书：未来市集实习生10.22开启，主要招产品经理日常实习，1.5发了小红书RED HR元气储备营，主要招HR实习生。非技术岗同学多多关注，不得不说，26届开得薪资真香，去年4月实习开了顶尖计划实习生，今年不知道有没有常规批次的，期待一波~✅腾讯：HR日常实习 11...

点赞评论收藏

分享

01-10 17:25

华南理工大学算法工程师

字节大模型算法一面-实习面经 1h

1.拷打论文2.transformer和llama的LN有什么区别，手写RMSNorm3.FFN有什么不同，写Relu和SwiGLU4.数据清洗流程5.质量过滤用什么模型6.PPL公式是什么7.BERT的预训练任务、embedding8.讲讲位置编码9.你认为好的prompt的范式是什么10.开放性问题:端到端的大模型和多个小模型，各自的优缺点是什么11.手撕:两道

查看9道真题和解析

点赞评论收藏

分享

01-07 11:25

门头沟学院 Java

字节大模型算法一面-实习面经

1、项目介绍2、讲述论文内容和细节3、对于模型训练过程中，如果出现样本标签数据分布极其不均衡，通常会采取什么方法来解决问题4、transformer的感受野encoder中是可以看到所有的token的，你认为感受野越大越好还是越小越好5、位置编码:sin cos，正余弦，bert可学习位置编码，rope相比于正余弦编码的优势6、欠拟合“和过拟合定义，通常如何解决?7、transformer的位置编码的基底是10000为什么设置100008、手撕:岛屿的数量

查看8道真题和解析

点赞评论收藏

分享

评论

2

6

全站热榜

更多

创作者周榜

更多

正在热议

更多

# 在大厂上班是一种什么样的体验 #

4518次浏览 67人参与

# 找工作的破防时刻 #

251588次浏览 1953人参与

# 程序员找工作至少要刷多少题？ #

9149次浏览 146人参与

# 你投递的公司有几家约面了？ #

157762次浏览 995人参与

# 论秋招对个人心气的改变 #

5787次浏览 104人参与

# 我的AI电子员工 #

26106次浏览 159人参与

# OPPO求职进展汇总 #

770860次浏览 5396人参与

# 为了减少AI幻觉，你注入过哪些设定？ #

1799次浏览 54人参与

# 刚入职的你踩过哪些坑 #

4130次浏览 91人参与

# 程序员能干到多少岁？ #

5681次浏览 90人参与

# 一张图晒一下你的AI员工 #

2878次浏览 62人参与

# 牛客AI体验站 #

3218次浏览 88人参与

# 我现在比当时_，你想录用我吗 #

3601次浏览 63人参与

# 想辞职但是不敢的原因 #

20141次浏览 88人参与

# ai智能作图 #

624672次浏览 5627人参与

# AI Coding的使用心得 #

2262次浏览 59人参与

# 关于春招/暑期实习，你想知道哪些信息？ #

3859次浏览 84人参与

# 牛客租房专区 #

146689次浏览 1463人参与

# 晒晒你司的新年福利 #

3906次浏览 70人参与

# 虾皮求职进展汇总 #

373350次浏览 2792人参与

牛客网
牛客网在线编程
牛客网题解
牛客企业服务