京东大模型算法实习一面
总时长50分钟左右,攒人品中...
1 实习介绍
2 常见的的大模型,或者说VLM这块的模型,了解过哪些?
3 Qwen 2.5 VL相对Qwen 2 VL做了哪些改进?
4.追问了M-RoPE比原来的ROPE有什么改进?有什么优点?
5.原来的ROPE在升级成M-ROPE之前,它是怎么处理视频的?具体来说,对于每一个每一帧或者说每一个patch,是怎么处理的?
6.然后互相聊了不少项目,偏聊天风格,基本都是short talk,并不都是问答
7 项目:主要想解决的核心问题是什么?
8.项目:既然是一个垂类的一个场景,为什么要去用通用场景下的VLM来做?为什么不用已经具有领域知识的一些模型?
9.项目:为什么你的VLM是输出点的坐标,而不输出bbox呢,bbox按道理比点的坐标具有更多的图像信息吧?
10讲一下SAM2分割模型的原理
11 项目:SFT框架用的是什么?
12 项目:SFT数据的合成pipeline,详细讲解一
13 项目:数据是用算法生成的,你们怎么判断这一批数据是好的还是不好的呢?
14 算法题:lc70 爬楼梯
1 实习介绍
2 常见的的大模型,或者说VLM这块的模型,了解过哪些?
3 Qwen 2.5 VL相对Qwen 2 VL做了哪些改进?
4.追问了M-RoPE比原来的ROPE有什么改进?有什么优点?
5.原来的ROPE在升级成M-ROPE之前,它是怎么处理视频的?具体来说,对于每一个每一帧或者说每一个patch,是怎么处理的?
6.然后互相聊了不少项目,偏聊天风格,基本都是short talk,并不都是问答
7 项目:主要想解决的核心问题是什么?
8.项目:既然是一个垂类的一个场景,为什么要去用通用场景下的VLM来做?为什么不用已经具有领域知识的一些模型?
9.项目:为什么你的VLM是输出点的坐标,而不输出bbox呢,bbox按道理比点的坐标具有更多的图像信息吧?
10讲一下SAM2分割模型的原理
11 项目:SFT框架用的是什么?
12 项目:SFT数据的合成pipeline,详细讲解一
13 项目:数据是用算法生成的,你们怎么判断这一批数据是好的还是不好的呢?
14 算法题:lc70 爬楼梯
全部评论
为什么你的VLM是输出点的坐标,而不输出bbox呢,bbox按道理比点的坐标具有更多的图像信息吧咋回答的
相关推荐
超级无敌霹雳小猪猪:双九这么不自信的吗?
点赞 评论 收藏
分享
01-08 17:47
复旦大学 算法工程师
w1ert:经常逛外网就知道,社区真人反馈m2和m2.1的风评都挺好的,而且他们leader亲自下场回复,很真诚。之前在xhs上刷到实习的同学也说mentor和同事都很好,团队氛围和工作态度都很年轻化,进去之后可以安心做事学东西,感觉很适合校招进去。而且公司刚上市了,正在上升期,是我我也去MiniMax,大佬能不能进去给我内推呀 点赞 评论 收藏
分享

查看8道真题和解析