成就我的未来

2025-12-24 11:20 中南大学算法工程师

关注

字节大模型算法实习一面 1h

1.实习介绍
2.论文工作介绍
3.为什么构建这个benchmark
4.构建数据集的时候遇到哪些问题，怎么解决
5.选择这个微调模型的原因
6.mplug的框架
7.视觉编码器用的什么
8.线性投影层具体情况
9.qwen2的结构
10.transformer的计算
11.了不了解其他的transformer或者attention
12.用了多少卡
13.怎么做的分布式训练
14.zero3不适合训练使用的原因
15.介绍论文的多阶段CoT微调
16.lora的原理
17.lora的初始化
18.矩阵B 为什么用0初始化
19.手撕：一个字符串中出现次数最多的字符以及次数
20.反问的时候还问了强化学习的原理

全部评论

推荐最新楼层

文化小流氓

门头沟学院安卓

字节实习一共几面

点赞回复分享

发布于 2025-12-27 09:27 北京

01-16 11:29

东北师范大学 Java

一文读懂强化学习

从一个小故事说起你还记得小时候学骑自行车吗？没有人一上来就会骑。刚开始的时候，你歪歪扭扭地扶着车把，脚踩上踏板，车子晃了两下——砰，摔了。膝盖破了皮，疼得龇牙咧嘴。但你爬起来，又试了一次。这回你发现，身体稍微往左倾的时候，车把往右打一点，好像能稳住。于是你又骑了几米远，然后——又摔了。就这样摔了无数次之后，突然有一天，你发现自己居然能骑着车满院子跑了。那种感觉特别神奇，你也说不清楚具体是怎么学会的，但就是会了。这个过程，其实就藏着强化学习最核心的秘密。那到底啥是强化学习？咱们先别急着下定义，继续聊骑自行车这事儿。你想想，学骑车的时候，有没有人给你一本《自行车骑行标准教程》，上面写着左腿发力系数...

愿天下没有难改的BUG

点赞评论收藏

分享

01-10 23:15

山东大学算法工程师

小红书大模型算法实习二面

1️⃣实习介绍2️⃣基本就是顺着简历全在问八股1.Transformer 的结构，有哪些可以学习的参数2.多头自注意力结构，矩阵个数3.ffn结构4.encoded decoder 区别5.一个 decoder block 由几个部分组成6.encoder 的输出，作为什么到 decoder7.为什么 decoder 更适合生成8.decided mask 在推理中有用吗9.Transformers 各个架构的改进（attention/ffn/位置编码）分为：10.GQA MHA MQA 区别11.swiGLU 的改进12.rope 在哪里加入3️⃣然后开始项目，其实也问很多八股：1.用的什么开源 dpo 数据2.为什么没用 qwen-33.全参数微调 7B 需要多少显存4.FP16/BF16 区别5.AdamW 显存计算6.介绍 Flash attention7.介绍 gradient checkpoint8.RougeL 计算方法9.代码：找数组第 k 大元素

查看21道真题和解析

点赞评论收藏

分享

01-21 09:52

已编辑

北京邮电大学 Python

北京力拓飞远科技有限公司（测测）一面

多模态算法实习生2026.01.20，上午10:15，一面，线上，10多min，面试官没开摄像头 1.自我介绍 2.MindIE 现在的发展情况如何？ 在 910 服务器上，Mind IE 的性能比 VLLM 和 SGLang 等要快，都是适配该服务器的版本。 3.用 OneBench 测试时测吞吐了吗？ 没有做模型性能压测，只做了精度测试。 4.为什么选择这三个数据集做测试？ 因为是用中文数据微调，所以选中文数据集，LOGI 是中文逻辑推理数据集，MUSR 是中文意图识别数据集，还有一个综合类中文通用数据集，从不同角度对比能看出性能差异。 5.Qwen3 的 8B 有 thinking 能力...

查看17道真题和解析

点赞评论收藏

分享

01-10 22:35

浙江大学算法工程师

小红书大模型算法实习一面

1️⃣ 实习介绍2️⃣ 拷打 rag 项目：1.项目还可以提升的地方2.感觉自己可以多久完成这个项目3.dpo训练对于系统问答的优化在哪里4.提高模型的准确率核心是什么5.怎么提高数据的质量6.rag 文档怎么切分7.rag 向量化的模型8.rerank 用的什么模型9.有没有微调 rerank 模型/应该怎么微调10.dpo 用的什么库11.代码：已知无序数组，求第 k 大数

查看11道真题和解析

点赞评论收藏

分享

01-11 10:23

清华大学机械设计/制造

机器人方向咋样?

大家好，今天给大家分享机器人就业体验。网友1：机器人专业千万别走嵌入式，过来人的经验。网友2：非常好跟自动化差不多下可pLc，工业机器人调试，上可嵌入式上位机，反正不缺工作机会。网友3：说实话这个专业就是个四不像，说好听点叫多学科交叉，其实啥也学不精，机器人运动学求解学了一下，但不知道学这个干什么，ros系统学了，老师全程让复制粘贴代码，最后考试就是背代码，现场总线技术学了，全是照PPT读的，电机学，液压系统。如果你喜欢自动化，好好学电子技术，C语言和电气控制PLC之类的，如果你喜欢机器人就好好学C语言，Python，C++和ROS系统，跟着学校教学计划你最终什么也学不会。网友4：能干机器人不...

点赞评论收藏

分享

评论

2

3

全站热榜

更多

创作者周榜

更多

正在热议

更多

# 春招什么时候投？ #

1979次浏览 26人参与

# 聊聊Agent开发 #

7592次浏览 192人参与

# 春节前，你还在投简历吗？ #

3622次浏览 41人参与

# 推荐一个值得做的AI项目 #

2352次浏览 67人参与

# 你的房租占工资的比例是多少？ #

84998次浏览 873人参与

# 春节提前走，你用什么理由请假？ #

1640次浏览 31人参与

# 你上一次给父母打电话是什么时候 #

35349次浏览 246人参与

# 每个月的工资都是怎么分配的？ #

85757次浏览 672人参与

# 距离春招还有一个月，你现在是什么开局？ #

1819次浏览 33人参与

# 暑期实习什么时候投？ #

2342次浏览 44人参与

# 你认为哪个岗位找工作最卷 #

61797次浏览 250人参与

# 新年的第一句祝福 #

56253次浏览 393人参与

# 实习想申请秋招offer，能不能argue薪资 #

218097次浏览 1167人参与

# 工作一周年分享 #

51589次浏览 272人参与

# 非技术2023笔面经 #

332334次浏览 2711人参与

# 一份好的简历长什么样？ #

25158次浏览 447人参与

# 考公VS就业，你怎么选？ #

92466次浏览 514人参与

# 你觉得机械有必要实习吗 #

73856次浏览 489人参与

# 汇川技术求职进展汇总 #

179628次浏览 1058人参与

# 简历当中有水分算不算造假？ #

159358次浏览 2265人参与

牛客网
牛客网在线编程
牛客网题解
牛客企业服务