字节Tiktok直播多模态一面 面麻了

发一下问题给大家参考,攒攒人品!!!
1.项目是基于自己的兴趣,还是follow现成项目
2.这个项目是主要是为了解决什么问题
3.训练是基于 torch 写的,还是用现有的框架
4.保存加载checkpoint怎么实现的
5.项目怎么做到能跑起来?遇到什么困难?怎么解决?
6.Qwen tokenizer 中并没有图像相关的 token,那么在构建多模态输入时,应该如何在文本序列中表示图像位置
8.占位 token 在经过 tokenizer 和embedding 后,模型是否能够稳定地识别它的存在?它在 embedding 空间中是否具有明确的语义位置,还是只是一个噪声 token
9.你用什么指标测模型
10.Deepspeed
11.zero123
12.Zero3 是模型并行吗
13.8 卡环境下使用 ZeRO-3 训练时,数据并行度是多少
14.Megatron
15.8 卡环境下使用Megatron训练时,数据并行度是多少
16.训过PPO吗
17.PPO 的reward model是怎么训的
18.PPO 再往底层学了吗?讲一下蒙特卡洛和 TD error 的区别
19.为什么他们是两个极端
20.PPO 加载了哪几个模型?哪些模型是freeze,哪些是激活的?以及它每个模型做了什么
21.你的PPO 的 critic model 是怎么初始化的
22.LLM场景下,传统强化学习中的核心概念(Actor、Environment、State、Action、Reward、Value)分别对应什么
23.R和V的关系?Value 函数在估计什么量
24.DPO和PPO的关系
25.DPO加载几个模型
26.DPO的推导
27.重要性采样两个pi的比值落实到代码层面是什么计算的
28.LLaVA-one-vision、LLaVA-NeXT
29.llava怎么实现动态分辨率的
30.qwenvl系列是如何实现动态分辨率的
31.了解qwenvl系列吗
32.qwenvl在旋转位置编码上的改进
33.场景题:在视频多模态模型(如 Qwen-3B / Qwen-Omni)中,模型存在 video grounding 不准确和“幻觉定位”的问题。如何系统性地设计数据、训练策略、评估与约束机制,来有效提升模型的事件定位准确性
34.根号dk的作用
35.手撕self-attention
全部评论
这么难吗
点赞 回复 分享
发布于 昨天 22:26 广东

相关推荐

点赞 评论 收藏
分享
评论
点赞
1
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务