阿里通义千问大模型算法凉经

1️⃣ 简单介绍一下你的实习经历吧?
2️⃣ LoRA的原理是什么,你是怎么理解的?
3️⃣ 你了解DeepSpeed吗?能说说ZeRO-1、ZeRO-2和ZeRO-3分别做了哪些优化吗?
4️⃣ Qwen的模型结构是怎么样的?和LLaMA、DeepSeek的主要区别在哪里?
5️⃣ 在实际应用中,你会怎么缓解大模型的幻觉问题?
6️⃣ 大模型的MoE结构相比于Dense结构,训练难点主要是什么?你觉得DeepSeek MoE效果好的原因有哪些?
7️⃣ FP16、BF16、FP32、INT8这些格式有什么区别?在训练和推理大模型时,一般会如何选择?
8️⃣ 可以讲一下RLHF的基本流程吗?并写一下PPO和DPO的Loss表达式。
9️⃣ 对于超长上下文,业界一般是怎么处理的?你了解Qwen是怎么做的吗?
🔟 (开放题)在你看来,目前大模型发展的上限可能在哪里?有哪些突破方向?
1️⃣1️⃣ (代码题)Leetcode 152:乘积最大子数组。
全部评论

相关推荐

头像
01-13 18:57
门头沟学院 Java
分享一篇找实习的腾讯云智的客户端开发面经如下。# 腾讯云智一面客户端开发面经总体来说不算压力面,但二叉树没做出来,蚌埠住了,二叉树给中序和后序,让我说前序(大二学的忘记了),本来其实可以用IDE,直接构造树,然后我直接打个前序遍历的,力扣原题。本次面试大致涉及以下内容:滑动窗口、动态规划(滚动数组)、二叉树构建和遍历、签名算法、爬虫、QPS、网络延迟、TCP 和 UDP、HTTP、TCP 用户数据报、HTTPS 加密过程、非对称加密和对称加密、单例模式、OOM 场景、链表找中间节点、双亲委派机制、Volatile。1)自我介绍(传统)面试官:先来个自我介绍吧我:xxxxx,省略几百个字,讲了2,3分钟结束,这时候面试官根本没听,其实在找算法题,没蚌住。2)最长无重复子串面试官:先做个算法吧我:好的好的,共享屏幕启动!5分钟解决了,稍微放慢点速度,2 分钟有点不礼貌了,然后介绍下原理,结束。3)二叉树中序和后序面试官:有带纸笔吗?二叉树给中序和后序我:整了半天,还写错了,其实力扣原题我反而背完了,大二数据结构画图忘了,只会算法递归+哈希表~4)实习经历面试官:介绍下你的实习经历我:阿巴阿巴,这边不阐述了,反正流水账。5)签名算法面试官:你签名算法是怎么做的,利用的什么?我:SHA 256,安全哈希,请求参数和 SK 做了加密,然后网关做一层判断,主要目的是中间人拦截修改问题。6)数据获取方式?面试官:你这个接口的数据是怎么获取的?我:Jsoup 解析 2345 天气预报的网站,然后存数据库持久化,缓存结合定时任务做一个性能的优化,还有一个 Expire 的过期时间。7)QPS ?面试官:你这个项目的 QPS 有测过吗?我:服务器是 2 C 2G,3M 带宽,20 - 50 的 QPS,还要考虑到服务器所在地区,会有一个网络延迟的问题,Jmeter 测试.jpg,本机能跑一两千(14核 20线程 I9)8)TCP 和 UDP面试官:TCP 和 UDP 的区别?我:是否面向连接?可靠?有状态?传输效率?传输形式(字节/报文)?首部开销?广播、多播?我这边简单提一下就行9)HTTP面试官:HTTP 在哪个层?基于哪个传输协议我:应用层、TCP 用户数据报10)HTTPS面试官:HTTPS 的作用和 HTTPS 加密过程?我:这个问过很多次了,这篇面经不讲了,没啥玩意,记忆个图就行了,追问了下 SSL 对称加密的算法,其实我不知道,把 DES、AES 都说了。11)单例模式面试官:单例模式的优缺点有哪些?我:暴露唯一实例,缓存池,节省资源开支,举了个 Spring 源码的单例注册表,缺点没讲出来,可能是单一职责原则(过于重),资源浪费(可能饿汉式?),并发问题?(非线程安全?)可能内存浪费?(大量单例对象存在)、没有抽象层12)OOM面试官 OOM 的场景?我:就讲了个内存泄漏的 ThreadLocal,元数据区可能是类加载过多,栈的话可能是递归问题,顺便讲了下新生代、老年代的垃圾回收,晋升机制,Dump、可视化分析工具讲了下,粗浅.jpg13)链表面试官:链表找中间节点我:一个是链表长度/2,或者快慢指针14)双亲委派机制面试官:讲一下双亲委派机制我:先讲过程、然后讲好处(安全、统一、防止重复加载)、怎么打破双亲委派、谁打破了?面试官问用了什么设计模式,我还真不知道?我说了责任链,但不确定,面试官也没说对,应该就是,链式感觉就是责任链。15)Volatile面试官:Volatile 的作用?我:常规的题目,就不详细说了,大家看博客即可,举个双重静态检索的例子?16)动态规划(滚动数组)面试官:做道题吧我:爬楼梯?...这我真熬不了 5 分钟,2分钟就秒了,直接 O(1)空间,不考虑先 O(n) 再 O(1)。
查看16道真题和解析
点赞 评论 收藏
分享
核心工作体验1. 节奏与强度:一线开发岗节奏最快,需求迭代紧,加班是常态(但多数大厂已规范加班制度,非无意义耗时长);资深技术/架构岗更重设计和方案,加班频次低但精神压力大,需对技术方向和系统稳定性负责;管理岗则兼顾技术和团队,更多是跨部门沟通、排期协调。2. 工作内容:很少做重复的基础编码,多是高并发、高可用的核心业务模块或技术基建,接触的业务场景大、数据量多,能接触到行业前沿的技术框架和解决方案,纯“搬砖”的工作会被标准化/自动化工具替代。3. 协作模式:流程高度体系化,从需求评审、开发、测试、上线到复盘,有明确的规范,跨团队协作多(比如和产品、测试、算法、运维配合),沟通成本高但效率有保障,每个人都是项目中的一个环节,注重团队配合而非个人单打独斗。4. 晋升与考核:有清晰的技术晋升通道(如阿里P序列、腾讯T序列),考核以结果为导向(业务价值、技术产出、团队贡献),35岁的职业瓶颈在大厂更明显,但只要有核心产出(比如负责过核心项目、做出技术突破),晋升和留任的机会远大于中小公司。大厂的核心优势(对程序员发展最有价值的点)1. 技术与资源优势:能接触到海量的用户和数据,有充足的技术预算做架构升级、技术调研,不用为“缺服务器、缺人力”发愁,适合深耕技术、积累高难度项目经验,为后续做架构师、资深专家打基础。2. 职业背书强:大厂的工作经历是行业内的“硬背书”,后续无论是内部晋升、跳槽到其他大厂/中小公司做技术管理,还是创业,都有更多话语权和机会,薪资溢价也更明显。3. 体系化的成长:有完善的技术培训、新人导师、技术分享体系,身边的同事多是名校/大厂背景的技术高手,“内卷”的同时也是互相学习,能快速提升技术视野和解决问题的能力。4. 薪资与福利:整体薪资(基本工资+绩效+年终奖+股票)远高于行业平均水平,福利体系完善(五险一金按最高比例交、补充医疗、餐补、班车等),尤其是资深技术和管理岗,股票分红是重要的收入组成。主要挑战(贴合技术岗的职业痛点)1. 竞争与淘汰压力:大厂实行“末位淘汰”或“绩效分级”,团队内竞争激烈,尤其是一线开发岗,若长期没有核心产出,容易被年轻程序员替代,35岁左右若未晋升到资深技术或管理岗,会面临明显的职业焦虑。2. 个人话语权有限:大厂的业务和技术方向由高层定,一线开发甚至资深技术岗,更多是执行层面,很难按照自己的想法做技术探索,创新空间会受业务需求限制。3. 工作与生活平衡难:一线开发岗为了赶项目、保上线,加班是常态,容易忽略生活和身体;即使是资深技术岗,也需要随时响应线上问题,工作的“边界感”弱。4. 技术深耕的局限性:为了适配业务快速迭代,大厂程序员多是“精通某一细分技术模块”,而非“全栈式精通”,若长期做单一业务,技术视野可能会被局限在公司的技术体系内。简单说,大厂对程序员而言,是“加速器”也是“过滤器”:能快速提升你的技术和职业高度,但也会用高节奏和高竞争,筛选出真正有核心能力、能适配发展的人,这也正好贴合你之前看到的“35岁瓶颈不是干不动,而是能力是否匹配年龄”的行业共识。
在大厂上班是一种什么样的...
点赞 评论 收藏
分享
评论
1
2
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务