大模型应用工程师面经~ AI相关岗位内推

● 自我介绍
● 了解 DeepSeek-R1 吗?介绍一下?
● R1 的 MLA 是如何实现 KV-Cache 的节约
● R1 在 SFT 时冷启动的目的
● 位置编码是什么?解释 ROPE?
● 一个 14B 的模型,推理和训练要多少缓存
● 显存的占用和哪些因素有关
● 大模型灾难性遗忘是什么?如何解决?
● BF16、FP16、FP32 对比?
#AI内推[话题]#● Adam、AdamW 原理
● deepspeed 的三个阶段

● 自我介绍
● 手写 Self-Attention 公式,解释 Q/K/V 的作用
● 位置编码有哪些实现方式?相对位置编码相比绝对位置编码的优势?
● LayerNorm 和 BatchNorm 的区别?为什么 Transformer 用 LayerNorm?
● 多头注意力的本质是什么?头数如何影响模型性能
● 大模型训练中的显存瓶颈如何解决?
● LoRA/Adapter/P-Tunning 的区别?如何选择微调方法?
● 解释 PLHF 流程,客服场景如何应用?
● 大模型灾难性遗忘的原因和缓解方法?
● 如何实现混合精度训练(AMP)?遇到 NaN 怎么处理?
● Deeppspeed 的 ZeRO 阶段 1 2 3 分别优化了什么?
● 解释梯度累计的原理和实现代码?

26届校招华为AI岗位内推:
  "AI算法工程师"
  "大模型应用工程师"
  "AI数据工程工程师"
  "AI安全工程师"
  “AI软件开发工程师”
岗位多多,欢迎私聊,或者**************
#内推##AI面经##AI内推[话题]##牛客AI配图神器#
全部评论

相关推荐

2025-12-08 07:42
门头沟学院 Java
27届末九,由于是女生,身边人几乎没有就业导向的,自学只能跟着网课,没人指导,很迷茫。下图是我目前的简历,不知道有需要修改的地方吗?求拷打。下面是目前的学习情况:目前算法过完了一遍力扣100和代码随想录,不过不是很熟,面经看了小林coding、JavaGuide,有一些没用过的技术看得不是很明白,掌握得不是很扎实。再加上常年跟黑马网课听思路,真正自己动手写代码的时间很少,这让我一直不敢投简历,总觉得内里空虚。项目没准备好面试相关的问题,简历上相应的考点不熟。如此种种。。。看到很多很多学长学姐大佬们的面经,愈发觉得面试可怕,自己没准备好,总担心自己是不是无望后端开发了。看到牛客很多同届以及更小一届的同学都找到实习了,很希望自己也能找到实习。而自己又好像摸不到后端学习的门路,只能不断赞叹黑马虎哥写的代码真优雅!微服务架构实在巧妙!消息队列、redis、sentinel、nacos、mybatisplus等等的引入都会让我赞叹这些工具的设计者的巧思,以及包括但不限于Java语言的优雅。然而只是停留在了解的程度,并不熟练。我是很希望能够继续深入探索这些知识的,只不过有一大部分时间都花在学校课程上了。我感觉我被困住了,我一方面必须保证我能够有个不错的学业分使我能有我几乎不想选择的读研退路(还有个原因是复习不全我会焦虑考试挂科,因此我会做好全面的准备,而这一步很费时间),一方面在B站学习各种网课,一方面得考虑提升自己并不扎实的算法基础,另一方面还得准备八股面经。这让我有点苦恼,我好像没那么多时间,因为绝大部分时间都花在了复习学校科目中了。我好像处处用时间,但收效甚微。想问问各位大佬是怎么平衡时间的呢?算法、项目和八股是怎么准备的呢?有什么高效的方法吗?谢谢您们花时间阅读我的稿件!
菜菜狗🐶:大胆投,我当时也是害怕面试,投多了发现根本约不到面🤡
点赞 评论 收藏
分享
评论
点赞
收藏
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务