阿里夸克算法实习面经 攒人品
1.Lora 的相关八股:常见参数、缩放
2.有没有做记忆衰退,避免旧数据干扰新任务?
3.Deepspeed zero3为什么比zero2更省显存
4.训练大模型的框架都有哪些呢
5.讲解一下 Flash Attention
6.讲解一下 Qwen 的滑动窗口注意力机制,计算量是多少?
7.PPO 的损失函数构成。
8.讲解一下KL散度。PPO和GRPO的损失函数有哪些区别?
9.在高并发查询 Agent 系统中,你会如何优化召回和生成阶段的延迟?
10.32B 模型全量微调 和Lora 微调的显存估算
11.你们这种模块堆叠的架构是怎么设计视觉问答模块和动作模块的协同逻辑的?
12. human feedback 是怎么被 agent 消化吸收的?
2.有没有做记忆衰退,避免旧数据干扰新任务?
3.Deepspeed zero3为什么比zero2更省显存
4.训练大模型的框架都有哪些呢
5.讲解一下 Flash Attention
6.讲解一下 Qwen 的滑动窗口注意力机制,计算量是多少?
7.PPO 的损失函数构成。
8.讲解一下KL散度。PPO和GRPO的损失函数有哪些区别?
9.在高并发查询 Agent 系统中,你会如何优化召回和生成阶段的延迟?
10.32B 模型全量微调 和Lora 微调的显存估算
11.你们这种模块堆叠的架构是怎么设计视觉问答模块和动作模块的协同逻辑的?
12. human feedback 是怎么被 agent 消化吸收的?
全部评论
这问题密度,感觉有希望啊
你这是日常实习?
相关推荐
01-07 11:35
北京邮电大学 golang 不敢追165女神:针对性地写吧,我看你这边是学习golang的,那golang大名鼎鼎的kv存储项目在你面试一些基础架构岗位或者kv存储岗位的时候都是非常加分的。
点赞 评论 收藏
分享
点赞 评论 收藏
分享
查看15道真题和解析