首页 > 试题广场 >

关于多模态大模型（如 BLIP-2、LLaVA、GPT-4V

[不定项选择题]

关于多模态大模型（如 BLIP-2、LLaVA、GPT-4V）的表述正确的是（多选）

```
LLaVA 完全移除视觉编码器
```

多数开源多模态 LLM 的视觉适配层参数量远小于语言模型主体，可视作 PEFT

GPT-4V 将视觉信息 token 化并与文本一起在统一 Transformer 建模

BLIP-2 冻结视觉编码器 + Q-former，将视觉特征对齐到语言模型可用空间

查看答案及解析

这道题你会答吗？花几分钟告诉大家答案吧！

提交观点

问题信息

来自：2025年秋招-华为-...

难度：

0条回答 0收藏 7浏览

热门推荐

相关试题

在图像分类任务中，若模型将大量负样...

评论(0) 来自2025年秋招-华为-1...
在 Transformer 中，位...

评论(0) 来自2025年秋招-华为-1...
交叉熵损失函数主要用于

评论(0) 来自2025年秋招-华为-1...
三项评分线性定价

评论(0) 来自2025年秋招-华为-1...
使用岭回归拟合样本数据，调节正则化...

评论(0) 来自2025年秋招-华为-1...

扫描二维码，关注牛客网
意见反馈
下载牛客APP，随时随地刷题

扫一扫，把题目装进口袋

求职之前，先上牛客: 扫描二维码，进入QQ群



扫描二维码，关注牛客公众号

公司地址：北京市朝阳区北苑路北美国际商务中心K1座一层-北京牛客科技有限公司
联系方式：010-60728802 投诉举报电话：010-57596212（朝阳人力社保局）
牛客科技© All rights reserved admin@nowcoder.com
京ICP备14055008号-4 增值电信业务经营许可证营业执照人力资源服务许可证
京公网安备 11010502036488号