Query 和 Key 矩阵的点积操作,复杂度为 O(N^2 *
Softmax 操作,复杂度为 O(N *
Value 矩阵的加权求和操作,复杂度为 O(N * D^2)。
输出的线性变换层,复杂度为 O(N^2 * D^2)。
这道题你会答吗?花几分钟告诉大家答案吧!
扫描二维码,关注牛客网
下载牛客APP,随时随地刷题