hi~同学,秋招遇“寒气”,牛客送温暖啦!23届秋招笔面经有奖征集中,参与就得牛客会员7天免费体验,最高赢300元京东卡!戳我去看>>>https://www.nowcoder.com/link/zhengjipinglun
点赞 评论

相关推荐

发一下问题给大家参考,攒攒人品!!!1.项目是基于自己的兴趣,还是follow现成项目2.这个项目是主要是为了解决什么问题3.训练是基于 torch 写的,还是用现有的框架4.保存加载checkpoint怎么实现的5.项目怎么做到能跑起来?遇到什么困难?怎么解决?6.Qwen tokenizer 中并没有图像相关的 token,那么在构建多模态输入时,应该如何在文本序列中表示图像位置8.占位 token 在经过 tokenizer 和embedding 后,模型是否能够稳定地识别它的存在?它在 embedding 空间中是否具有明确的语义位置,还是只是一个噪声 token9.你用什么指标测模型10.Deepspeed11.zero12312.Zero3 是模型并行吗13.8 卡环境下使用 ZeRO-3 训练时,数据并行度是多少14.Megatron15.8 卡环境下使用Megatron训练时,数据并行度是多少16.训过PPO吗17.PPO 的reward model是怎么训的18.PPO 再往底层学了吗?讲一下蒙特卡洛和 TD error 的区别19.为什么他们是两个极端20.PPO 加载了哪几个模型?哪些模型是freeze,哪些是激活的?以及它每个模型做了什么21.你的PPO 的 critic model 是怎么初始化的22.LLM场景下,传统强化学习中的核心概念(Actor、Environment、State、Action、Reward、Value)分别对应什么23.R和V的关系?Value 函数在估计什么量24.DPO和PPO的关系25.DPO加载几个模型26.DPO的推导27.重要性采样两个pi的比值落实到代码层面是什么计算的28.LLaVA-one-vision、LLaVA-NeXT29.llava怎么实现动态分辨率的30.qwenvl系列是如何实现动态分辨率的31.了解qwenvl系列吗32.qwenvl在旋转位置编码上的改进33.场景题:在视频多模态模型(如 Qwen-3B / Qwen-Omni)中,模型存在 video grounding 不准确和“幻觉定位”的问题。如何系统性地设计数据、训练策略、评估与约束机制,来有效提升模型的事件定位准确性34.根号dk的作用35.手撕self-attention
点赞 评论 收藏
分享
牛客网
牛客网在线编程
牛客网题解
牛客企业服务