首页 > 试题广场 >

在标准 Transformer 模型中，自注意力（Self-

[单选题]

在标准 Transformer 模型中，自注意力（Self-Attention）机制是其核心组件。假设输入序列的长度为 N，模型的隐藏层维度（或称为表示维度）为 d，那么标准自注意力模块的计算复杂度主要是？

```
O(N * d^2)
```
```
O(N^2 · d)
```
```
O(N · d)
```
```
O(N^2 * d^2)
```

查看答案及解析

这道题你会答吗？花几分钟告诉大家答案吧！

提交观点

问题信息

深度学习

难度：

0条回答 23收藏 53浏览

热门推荐

相关试题

在CNN网络中，图A经过核为3x3...

算法工程师顺丰集团 2019 深度学习

评论(48) 来自顺丰科技2019秋招视觉...
对于如下给定的5*5的图片，使用3...

深度学习

评论(1)
关于 Dropout 技术在神经网...

深度学习

评论(1)
某生鲜电商APP的核心目标是提升用...

产品常识

评论(1)
关于硬件产品的BOM成本与定价策略...

产品常识

评论(1)

扫描二维码，关注牛客网
意见反馈
下载牛客APP，随时随地刷题

扫一扫，把题目装进口袋

求职之前，先上牛客: 扫描二维码，进入QQ群



扫描二维码，关注牛客公众号

公司地址：北京市朝阳区北苑路北美国际商务中心K1座一层-北京牛客科技有限公司
联系方式：010-60728802 投诉举报电话：010-57596212（朝阳人力社保局）
牛客科技© All rights reserved admin@nowcoder.com
京ICP备14055008号-4 增值电信业务经营许可证营业执照人力资源服务许可证
京公网安备 11010502036488号