03-04 12:53 门头沟学院机器学习

关注

字节大模型算法二面难死了...

祝大家都能拿到满意的Offer！
1. 项目拷打
2. 详细阐述Transformer的底层原理，并说明其能够替代RNN的核心优势；结合Transformer架构的成熟度，分析Self-Attention机制在多模态对齐任务中是否存在瓶颈，以及在实际业务场景中，是否出现过注意力权重完全偏移的情况。
3. 讲解LoRA的技术原理，说明LoRA是否仅能嵌入Linear层；分析LoRA无法在LayerNorm层之后插入的原因，以及该操作会对模型训练稳定性产生哪些具体影响。
4. 结合实操经验，说明QLoRA降低训练资源成本的核心逻辑；列举常见的模型量化方式，并解释QLoRA选择NF4与FP16组合而非其他方案的原因，阐述NF4的分布拟合逻辑。
5. 针对采用multi-query attention优化后，decoder延迟仍居高不下的问题，分析潜在性能瓶颈；探讨vLLM自带的KV Cache是否会成为推理过程中的负担。
6. 分别说明Embedding模型与Rerank模型处理文本语料的核心流程，并结合实际应用场景举例说明。
7. 结合过往RAG项目经验，讲解从数据清洗到检索服务上线的完整链路搭建流程，重点说明chunk切分的具体策略。
8. 分析当前RAG技术落地的最大瓶颈，并阐述你在项目中采取过哪些优化手段来提升检索召回率（Recall）。
9. 针对XX领域大模型的训练工作，说明SFT（监督微调）数据集的构造方法与核心思路。
10. 结合LoRA微调实操经历，说明rank值的选择依据；在合并adapter权重的过程中，是否遇到过梯度爆炸问题，以及对应的解决方法。
11. 结合你的模型部署相关经验，说明模型参数量与硬件算力需求之间的对应关系（例如不同参数量级模型所需的算力配置标准）；以部署一个稀疏率千分之三的235B参数量MOE架构模型为例，估算其所需的算力规模。
12. 在搭建RAG知识库时，若需对文档进行动态更新，你采用的是全量嵌入还是增量处理方案？若为增量处理，如何规避新旧文档数据分布不一致导致的检索偏差问题。
13. 针对机械臂动作态融合相关工作，说明数据融合的具体实现方案，以及对比实验的设计思路与评估指标。

全部评论

推荐最新楼层

03-04 20:34

中南大学大数据开发工程师

24届校招生第一次跳槽

只面试了字节和狗东全部offer，字节五轮面试隔一天一面offer的也很快，京东同样五轮面试隔一天一面，但是京东base低年终高还是选择了字节

点赞评论收藏

分享

02-21 15:56

上海交通大学算法工程师

美团推荐算法一面

岗位名称：推荐算法面试时长：1h+自评分：7/10是否下一轮：待通知一、检索与排序在项目中使用的 BM25 原理是什么？相比 TF-IDF 改进在哪里？公式中每一项的含义是什么？（追问）k1 和 b 参数分别控制什么？如果 b=0 会发生什么？为什么在实际系统中要做混合检索？Sparse 检索和 Dense 检索的基本原理分别是什么？（追问）两种方式在长尾 Query 上的表现差异如何？Dense 检索中常见的相似度度量方式有哪些？为什么很多系统选择 Cosine 或 Inner Product？（追问）如果向量没有归一化，Inner Product 和 Cosine 的结果会有什么差异？在你...

技术必备题库

点赞评论收藏

分享

03-03 17:20

门头沟学院机器学习

科大讯飞大模型算法实习面经

发一下问题给大家参考，攒攒人品！1.实习经历项目2.Python列表与生成器区别3.两个张量 一个为1*2*3，一个为3*2*1 二者能进行哪些操作4.8B大模型用int8量化会占用多少硬盘内存5.如何让大模型能够实现128K的上下文6.后训练中强化学习方法介绍

查看6道真题和解析

点赞评论收藏

分享

03-04 22:29

门头沟学院算法工程师

影石多模态大模型算法工程师一面面经攒人品

社招第一次面试手撕了这么多代码.....太硬核了！基操：项目做的是什么？你训练算法过程中一般用哪些损失函数？中途插入问题：qwenvl系列的模块设计由哪些部分组成？然后就直接开始手撕代码了：多模态输入、Token 处理、Self/Cross Attention、Mask、LoRA、Dataset/DataLoader、训练流程、累计梯度、eval、多进程通信、微调方法 全都要会写代码。多模态大模型算法岗 · 高频面试题 + 标准答案（完整版）1. 多模态模型（图文）输入是怎么 Tokenize 的？答：文本用文本分词器转成文本 Token。图片不直接分词，而是切成固定大小的 Patch，每个 ...

查看39道真题和解析

点赞评论收藏

分享

02-27 08:25

门头沟学院 Java

阿里 Agent开发一面凉经-校招版

给我面没招了，强度也太大了....1.实习拷打2.项目拷打3.处理查询文档里的异构数据(如图片)时，具体的处理流程是什么?解析成纯文字后如何进一步加工?这样只返回文字给用户，图片信息不会丢失吗?4.你们是通过人工打标建立图片和文本的对应关系吗?文档量很大的情况下，打标工作能完成吗?5.如何保证大部分图片异构数据解析后回答的正确性?若回答错误，怎么识别问题?后续要验证回答准确性，你有什么方案?6.用于评测的另一个大模型，如何构造问题、分析文字并进行对比?这个大模型的正确率以及模型自我一致性怎么确定?7.你们的模型基于哪些异构图像做增强?模型会不会产生幻觉，生成文档外的内容?8.若用户的问题不在文档里，你们会怎么处理?是调用其他模型吗?大模型回答不了时，会提示用户补充问题吗?用户补充后仍无法解决该怎么办?模型如何判断何时需要让用户补充提问?9.你们有框架编排这些流程吗?用的是什么框架?10.怎么理解检索召回率?这些指标具体包含哪些评价项?什么是忠实度?召回率的分子分母是怎么定义的?11.你之前那段实习的具体工作内容是什么?针对设备故障叙述报告这类复杂文本，模型如何理解?是做了相关检测吗?大模型是怎么实现术语解释的?12.请讲一下LoRA技术，除了减少参数量，它还有什么优点?你做的LoRA相关工作，后续有落地应用吗?13.你写代码主要用Python吗?会不会用Java?了解Java的多线程、双亲委派模型以及消息中间件吗?有没有做过Java相关项目?14.你用过LangChain吗?如何用它解决大模型的幻觉问题?若不熟悉LangChain，还能通过什么方法做AI能力增强?

查看12道真题和解析

点赞评论收藏

分享

评论

4

7

全站热榜

更多

创作者周榜

更多

正在热议

更多

# 交出你的校招焚诀 #

5669次浏览 111人参与

# 机械人春招想让哪家公司来捞你？ #

387033次浏览 3157人参与

# 神州信息求职进展汇总 #

2727次浏览 50人参与

# 实习生至暗时刻 #

11548次浏览 239人参与

# 哪些公司开暑期实习了？ #

11687次浏览 103人参与

# 面试___岗的必刷题单 #

7464次浏览 141人参与

# 春招开局，你有保底offer吗？ #

17054次浏览 167人参与

# 你经历过哪些AI幻觉？ #

3336次浏览 86人参与

# AI面试问题分享 #

8912次浏览 190人参与

# 实习学到最有价值的工作习惯 #

62246次浏览 478人参与

# 三月的小目标 #

6329次浏览 123人参与

# 说说你知道的学历厂 #

384112次浏览 1361人参与

# 实习生的生存小技巧 #

4909次浏览 92人参与

# 你认为哪些项目算烂大街？ #

84221次浏览 640人参与

# 找AI工作应该卷什么？ #

2296次浏览 51人参与

# 实习吐槽大会 #

413198次浏览 2174人参与

# 小厂一定不能去吗？ #

17997次浏览 145人参与

# 秋招的嫡长offer #

405991次浏览 2187人参与

# 一汽大众工作体验 #

14672次浏览 26人参与

# 字节开奖 #

129159次浏览 595人参与

# 如果校招重来我最想改变的是 #

379402次浏览 3234人参与

牛客网
牛客网在线编程
牛客网题解
牛客企业服务