美的-NLP/大模型一面面经

📍面试公司:美的
👜面试岗位:NLP/大模型
📖面试问题:
1. 介绍bert
2. 因项目中用到了bert+crf,问了两者用到学习率是否一样?为什么不一样?
3. crf的转移矩阵和发射矩阵是什么?计算公式和计算结果是什么?
4. 大模型微调怎么做的?
5. Qwen的位置编码是怎么做的(rope和YaRN)
6. rope是加上去的还是乘上去的?bert的呢
7. rope是怎么应用在超出长度限制的输入上的,bert的位置编码可以用到超出长度限制的输入上吗
8. 如果大模型输入是4k长度,可以输出8k的长度输出吗
9. lora可以用在哪些地方?为什么可以用在ffn层?为什么作者一开始先用在q,k,v,o的权重矩阵上?
10. 如何理解低秩状态?
11. 在资源受限制的情况下(不能分布式),有10亿条数据,原本需要训练10亿次,怎么做能够减少训练次数,比如训练6-7亿次?这题不太明白,只回答了一个梯度累积

其他是一些项目问题
反问:
业务内容,岗位能力交叉性
🙌面试体验:已经无力,攒攒人品
#算法岗面试##算法面经#
全部评论

相关推荐

1. 实习介绍2. 说我做了很多项目,叫我推荐几个说,开始拷打项目,先讲拼团3. 拼团项目业务流程介绍、营销规则树、高并发、自己做的吗?4. 责任链模式一般用来解决什么问题5. 项目tps和qps多少?有点忘记了6. qps的瓶颈?7. 最终数据一致性8. 读多写少的优化策略:缓存策略、数据库优化、写操作优化、缓存一致性9. 读多写少的索引设计10. mysql单库单表 数据超过2kw,索引是否有效:有效、但性能慢:内存压力大、写入变慢、全表扫描失效灾难11. 为什么DDD架构设计?12. SpringBoot处理HTTP请求的核心流程13. HTTP传输数据的安全问题和防护14. HTTPS握手过程(TLS握手):Hello协商算法 → 证书验证身份 → 交换密钥 → 开始加密通信15. 拼团项目反思改进空间:高并发其他方案、部署、业务拓展16. 共享屏幕看我的Agent笔记17. 解释为什么做Agent开发?18. 出算法了,问我源码读的多不,我说不多,然后还是出常规算法题(估计想出多线程)19. 手撕:整数矩阵最长递增路径:DFS+记忆化搜索20. 为什么代码过度使用static,写习惯了leetcode、方便直接用21. Java中static编译后的效果:内存分配、字节码层面、类加载初始化、访问方式22. 手撕:连续子数组和为K的倍数的所有子数组:一开始暴力双层循环了,应该要哈希表存索引或者前缀和23. 代码怎么达到最优的性能:我答成了阿里代码规范、AI工具优化(回答空泛、缺乏具体优化案例)24. 反问什么部门和业务
查看19道真题和解析
点赞 评论 收藏
分享
面试算法题卡壳怎么办?在算法面试中遇到难题写不出来,几乎是每个候选人都会经历的事。作为面试官,我想说的是,能否妥善处理这种困境,往往比题目本身更能决定结果。当你思路卡住时首先,千万别沉默。面试官期待看到你的思考过程,而不是一个完美的答案。正确的做法是,主动说出你目前的思路和遇到的阻碍,并尝试寻求提示。比如你可以说:“我初步的想法是用动态规划,但在状态转移上卡住了,您能给我一点方向吗?”面试官给出提示后,你要快速跟进,展示出调试和迭代的能力。这说明你不仅会解题,更具备在实际工作中解决问题的能力。绝对要避免的行为· 完全沉默,不与面试官沟通· 轻易放弃,直接说“我不会”· 抱怨题目太难或不合理一个真实的案例我曾面试过一位同学,他解题速度不快,中间也有停顿。但他全程都在清晰地表达思考:“我打算用哈。。。查找,因为这里可能。。。这个。。。情况我先记下,写完主逻辑再处理”。虽然他最终没写出最简洁的代码,但我看到了他拆解问题、逐步推进的逻辑能力。最后他通过了面试,因为面试官看重的是解决问题的完整思维链条。面试官到底想看到什么· 清晰的解题思路和分析路径· 规范的编码习惯和边界处理· 主动沟通的意愿和协作意识· 在提示下快速调整和迭代的能力写不出最优解很正常,可怕的是没有思考过程。面试是展示你如何解决问题,而不仅是背诵解法。
如何判断面试是否凉了
点赞 评论 收藏
分享
12-04 15:26
已编辑
门头沟学院 Java
校招或社招两年内的同学,希望明年3月前入职,有意向私信联系。我们正在寻找对AI技术充满热情、具备扎实工程开发基础、具备业务和算法理解能力,愿意在AI Agent方向快速成长的同学。【职位】:AI Agent应用开发工程师【部门】:阿里巴巴淘天集团-天猫技术部【核心职责】:1、参与电商领域AI Agent系统的设计、开发、实现、测试和部署。2、将大型语言模型(LLMs)或其他AI模型集成到Agent系统中,实现特定任务或功能。3、负责Agent的工具调用、记忆机制、规划推理、环境交互等核心模块的开发。4、优化Agent的性能、稳定性和可扩展性。5、与业务运营、产品经理、算法等其他工程师协作,将Agent技术落地到实际应用场景。6、跟踪AI Agent领域的最新技术和发展趋势,并应用于产品开发。【能力要求】:1、熟练掌握Python或Java开发,熟悉常用异步编程、并发处理及性能优化技巧;理解电商Web框架、后端服务架构。2、理解LLM基本原理、常见架构及推理机制,有主流LLM API的实践经验,熟悉LLM优势和局限性,了解行业最新进展。3、熟悉Agent架构设计模式,工作流编排、ReAct、Multi-Agent协作等,了解主流Agent框架(LangChain等)、工具链,了解向量数据库、Embedding技术。了解模型微调方法(LoRA、SFT、强化学习等),了解Agent训练优化方法,了解 Agent 性能评估指标、安全可靠性与错误处理机制。4、对AI有浓厚兴趣,具备优秀的学习力、沟通协作能力,具备良好的问题拆解与系统思维能力,能从用户场景出发设计 Agent 解决方案;具备在不完全明确的需求和快速变化的技术环境下,自主探索并推动项目进展的能力。5、加分项:有实际Agent项目落地经验,掌握LLM微调、模型部署,熟悉强化学习、规划算法,有开源项目贡献、技术博客、竞赛经历。
投递阿里巴巴等公司10个岗位
点赞 评论 收藏
分享
评论
2
13
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务