首页
题库
公司真题
专项练习
面试题库
在线编程
面试
面试经验
AI 模拟面试
简历
求职
学习
基础学习课
实战项目课
求职辅导课
专栏&文章
竞赛
搜索
我要招人
发布职位
发布职位、邀约牛人
更多企业解决方案
AI面试、笔试、校招、雇品
HR免费试用AI面试
最新面试提效必备
登录
/
注册
不想一直0offer
2024-12-18 09:28
中国科学院大学 算法工程师
发布于俄罗斯
关注
已关注
取消关注
虾皮 NLP 一面
体验非常非常差,面试官迟到一小时,面的时候刚睡醒,kpi连演都不演了
八股
1. 大模型微调用到了什么框架
2. Lora的训练原理和使用是怎么样的?
3. llama的模型结构
4. Pre-norm和Post-norm的差别是什么
全部评论
推荐
最新
楼层
牛客993965069号
北京航空航天大学 算法工程师
面试官迟到一小时?
点赞
回复
分享
发布于 2024-12-18 10:39
河北
暂无评论,快来抢首评~
相关推荐
12-06 20:15
陕西理工大学 算法工程师
26校招淘天大模型算法二面
1.介绍自己的项目2.BLEU和ROUGE3.self-attention求内积时为啥除以根号d4.LLM的评估5.介绍下simCSE6.解决tokens不够的问题应该怎么办7.详细介绍下deepspeed(三个stage结合参数回答)8.gpt和llama的区别(模型结构上的)9.PEFT的方式,LORA论文讲一下,对比p-tuning10.LLM训练的时候为什么warmup11.对比学习中的batch size是大一些好还是小一些好(大一些,甚至可以到10k+,为12.了构造好的negative样本)13.了解最新技术一般怎么通过什么渠道14.代码题:lc347 前 K 个高频元素
查看13道真题和解析
点赞
评论
收藏
分享
12-01 00:10
北京大学 算法工程师
美团大模型应用秋招一面
1. 实习项目问的很细,数据构造,微调参数等2. 如果子agent回复不对怎么办?反思?跳不出去怎么办?限制次数3. LORA和全参数微调的区别4. DPO,PPO,GRPO5. 逻辑回归、XGB和神经网络的区别6. XGB怎么做特征重要性的?gini系数是什么?7. Deepseek MLA?为什么压缩?8. Transformer encoder?为什么需要FFN?9. AUC物理意义,公式,公式含义code:重排链表
查看10道真题和解析
点赞
评论
收藏
分享
12-18 09:20
北京大学 算法工程师
字节大模型校招二面面经
实习介绍——5min项目相关细节提问——5min1. 了解 DeepSpeed 吗?训练时用 ZeRO 优化主要是解决啥问题?ZeRO 的三个阶段分别都是啥?2. TP 或 PP 了解吗?3. 并行训练时,如果模型参数量不大,怎么决定用 PP 还是 TP 策略?它们各自有啥好坏?4. 如果用 TP=2 的策略,self-attention 层里的 QKV 矩阵具体是怎么切分的?5. 用 TP 的时候,主要会发生哪些通信?不同的切分方式会改变通信行为吗?举个例子呗。6. 讲讲 Flash Attention 的原理,矩阵 tiling 的过程说细一点,最好把 shape 也讲清楚。手撕算法:经典接雨水+最长上升子序列
点赞
评论
收藏
分享
12-18 06:25
上海交通大学 算法工程师
腾讯混元大模型二面-秋招面经
1.自我介绍,过实习和论文2.知道哪些强化学习算法,除了 PPO和 DPO 这些呢3. 知道 LoRA 的原理吗, A 和 B 两个矩阵怎么初始化,有了解过其他的初始化方法吗4.除了 DeepSpeed ,还用过其他的什么优化方法吗5.ZeRO -1, ZeRO -2,ZeRO -3三个模式的区别6.讲一下 RLHF 的流程,之前有用 RLHF 做过模型对齐吗7.当时你用 DeepSpeed ZeRO -3来微调Qwen2-72B,每一张卡占用的显存大概是多少,估算一下为什么是占这么多的显存8. 在微调 Qwen 的时候,数据是怎么构造的9.代码:无重复字符的最长子串
点赞
评论
收藏
分享
12-18 17:25
山东大学 算法工程师
阿里实习大模型算法一面
1. Encoder与Decoder中注意力机制存在哪些差异?2. 注意力机制的计算流程是怎样的,为何在计算时要除以根号下Dk,掩码注意力机制又是怎样达成的?3. 阐述GQA、MQA、MLA的原理分别是什么。4. 位置编码的必要性体现在哪里,为何选用sin_cos函数进行位置编码?5. 询问之前实习中Agent的设计思路,以及所提创新方法的实现方式。6. 提及使用DeepSpeed开展SFT训练,请说明DeepSpeed ZeRO Stage 1 - 3的不同之处,以及何种情况下使用FSDP更为合适。7. 询问Agent工具的设计情况,是否采用workflow形式。8. 了解哪些Agent开发框架,像langchain和LlamaIndex,它们的核心应用场景有何区别?9. 针对数据输入输出格式,为保证大模型输出稳定json格式,采取了哪些措施?10. 若Agent推理API需要低延迟响应,会从哪些方面开展系统级优化工作?11. 代码考察:给出LeetCode第34题,在排序数组中查找元素的第一个和最后一个位置
点赞
评论
收藏
分享
一键发评
面试官迟到一小时?
接好运
kpi都不演了,太离谱
大模型微调框架是什么?
Lora训练原理讲得对
评论
点赞成功,聊一聊 >
1
8
分享
评论
提到的真题
返回内容
全站热榜
更多
1
...
工作半年后更确定:我们依然不欠优绩主义什么
6104
2
...
我建了一个分享实习业务的仓库,欢迎大家贡献哦
3792
3
...
牛客2025年终报告重磅上线——揭晓你的年度修炼成就!
3160
4
...
#牛客2025仙途报告#居然是五颗星
2528
5
...
腾讯 微信支付一面面经
2517
6
...
【2025-年终总结】25届毕业生果果牛这一年~
2184
7
...
牛客年终报告,今日道爷我成了
1964
8
...
一个程序员的自救书|从酒吧陪玩DM到上岸大厂
1918
9
...
在当下这个社会,在人生这个无常的时代,我真心希望你和各位牛友开心
1418
10
...
壕壕壕,京东发7个月年终,此生要做东孝子
1316
创作者周榜
更多
正在热议
更多
#
牛客2025仙途报告
#
12595次浏览
234人参与
#
实习要如何选择和准备?
#
129838次浏览
1499人参与
#
2025年终总结
#
194748次浏览
3259人参与
#
你有哪些缓解焦虑的方法?
#
44470次浏览
868人参与
#
元旦假期你打算怎么过
#
764次浏览
20人参与
#
上班后和你想的一样吗?
#
95123次浏览
701人参与
#
找工作,行业重要还是岗位重要?
#
87337次浏览
1741人参与
#
今年你最想重开的一场面试是?
#
12012次浏览
125人参与
#
我们是不是被“优绩主义”绑架了?
#
1614次浏览
62人参与
#
你面试体验感最差/最好的公司
#
28549次浏览
466人参与
#
双非本科的出路是什么?
#
189138次浏览
1499人参与
#
一人说一个提前实习的好处
#
22260次浏览
300人参与
#
牛友们的论文几号送审
#
63099次浏览
833人参与
#
机械人晒出你的简历
#
148323次浏览
885人参与
#
礼物开箱Plog
#
3116次浏览
102人参与
#
秋招落幕,你是He or Be
#
22159次浏览
373人参与
#
没有合适的工作,你会先找个干着,还是考公考研
#
149237次浏览
1241人参与
#
牛油的搬砖plog
#
163601次浏览
1152人参与
#
工作中听到最受打击的一句话
#
12397次浏览
172人参与
#
重来一次,你会对开始求职的自己说
#
9973次浏览
238人参与
牛客网
牛客网在线编程
牛客网题解
牛客企业服务