阿里大文娱优酷大模型一面

阿里大文娱优酷,没做笔试直接约面试。
1.自我介绍
2.实习经历
训练数据有哪些组成部分?
每一个样本是只有一句话参与训练还是都参与?
用的什么训练框架?
SFT 的过程中有没有遇到什么困难?
你们这个流程中,有需要人力评估吗?在哪一部分?
多机多卡训练的时候用到了 deepspeed 吧?你了解 deepspeed 吗?
流水线并行了解吗?
你们训练的时候学习率怎么调的,用不用 warm up?
还有一些忘记了

智力题:10 个字的句子,最多能分成多少种分词?(实际上很简单,就是 10 个词中间 9 个空,分割过不分,2 的 9 次方。 我硬是用递归公式推了半天)

代码题: 给一个数 N,一个长度 L。 求一个非负整数连续序列,序列和等于 N,长度不小于 L。 多个答案的话要输出最小的长度。(有一些数学计算)

反问业务:做剧本辅助的大模型
面试官迟到五分钟进来说还在开会让我等一会。等了 30 分钟+面试 90 分钟,整体两个小时没绷住 hhh。 
全部评论
感觉是同一个面试官,完全一样的智力题和代码题,智力题我直接找规律把面试官看乐了
1 回复 分享
发布于 2024-09-05 06:18 美国
大佬oc了吗
点赞 回复 分享
发布于 2024-10-23 20:49 陕西
有大佬想来我们这吗 帮推
点赞 回复 分享
发布于 2024-09-03 22:02 上海
听里面的人说这个组挺不错的 可以冲
点赞 回复 分享
发布于 2024-09-03 21:40 北京
佬提前批流程过完了吗
点赞 回复 分享
发布于 2024-09-03 21:30 重庆
我看官网没有在招岗位 你啥时候投的
点赞 回复 分享
发布于 2024-09-03 21:11 北京
请问sft微调遇到什么困难怎么回答呀
点赞 回复 分享
发布于 2024-09-03 18:45 北京

相关推荐

算法岗越来越卷,还在纠结简历写什么? 拒绝千篇一律的“minist手写数字识别”! 今天盘点 3 个不同技术方向的硬核项目,建议根据自己的赛道,选一个死磕到底!👇1️⃣ 【LLM 应用赛道】—— 紧跟风口  📂 项目:基于 LangChain + RAG 的垂直领域问答助手为什么做: 现在 10 家面试 8 家问大模型。不懂 RAG(检索增强生成)真的很难聊!核心考点: 向量数据库 (Milvus/Faiss)、Prompt Engineering、文档切片策略、甚至 LoRA 微调。一句话亮点: “解决了大模型幻觉问题,实现了基于本地私有数据的精准问答。”2️⃣ 【硬核基建赛道】—— 专治手痒  📂 项目:从零手撸 Transformer (Pytorch复现)为什么做: 别只做“调包侠”!面试问 Multi-head Attention 细节又又又卡壳了?核心考点: Self-Attention 矩阵计算、Positional Encoding 原理、Mask 机制。一句话亮点: “不依赖高级 API,从底层张量运算构建模型,深入理解 Attention 机制。”3️⃣ 【AIGC 视觉赛道】—— 视觉魔法  📂 项目:Stable Diffusion 扩散模型复现与 LoRA 微调为什么做: CV 岗已经从“识别”卷到了“生成”。不要再玩那个YOLO !核心考点: DDPM/DDIM 采样原理、UNet 结构(mile-stone)、CLIP 多模态对齐、ControlNet 控制生成。一句话亮点: “掌握 AIGC 核心流派,具备模型微调与可控图像生成能力。”💡 最后的小建议: 项目在精不在多。 与其罗列 多 个 Demo,不如把其中一个吃透,把遇到的 Corner Case、性能优化、思考过程写进简历里。
一人推荐一个值得做的项目
点赞 评论 收藏
分享
1.你的 Agent 系统Prompt 是怎么设计和迭代的?有没有做过 Prompt 自动优化?当用户提出不完整的请求时,如何补全用户意图的?2.构建 Agent 的时候,遇到过哪些瓶颈?LangChain 的 memory 默认机制在多3.用户并发中怎么做隔离?你是如何保证线程安全的?4.微调 Llama2 你是怎么选择训练样本的?清洗逻辑是什么?你有没有观察到哪些训练样本质量问题对模型行为有很大影响?举例说明。5.DPO相比 SFT,有哪些优劣?它在 Agent 任务上效果提升明显吗?你怎么构造偏好对?构造逻辑是自动的还是人工?6.你说你服务部署在 vLLM 上,为何选择它?KV-cache 如何帮助推理加速?你自己做过哪些优化?7.假如需要支持 Streaming 输出,但当前服务延迟又超标,你会怎么折中设计?8.多轮对话上下文状态管理是如何做的?如何在高并发场景下保证一致性?9.你做的 Agent 使用了多少个外部工具,在调用链条上如何保障故障容错和超时机制?10.有没有做过工具调用失败后的feedback策略设计?11.训练过程中数据来自用户行为日志,你是如何从这些数据中抽取训练对话的?有没有做过归一化或事件抽象?12.有没有了解过带有时间窗口/偏移限制的对话系统?模型怎么“理解时间”?13.你觉得 Agent 哪些模块最容易在真实业务中出问题?你会如何监控和定位的?
查看13道真题和解析
点赞 评论 收藏
分享
评论
9
31
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务