快手多模态日常实习一面

1.默写二元交叉熵损失函数
2.是否了解Sigmoid函数,Sigmoid函数有什么缺点
3.MHA的运行机制
4.为什么Transformer使用三角函数位置编码,相比于[1,2,3..]这种硬编码的好处在哪?
5.Transformer的Attention计算过程中为什么要对QK的点积进行scale
6.CLIP学习的范式,是如何构造正负样本对,如何进行对比学习
7.解释Q-former机制,以及其中可学习Query的意义
8.Temperature有什么作用
9.聊项目
10.代码:搜索旋转排序数组
全部评论

相关推荐

牛客嘻嘻子:建议可以把mentor布置的任务和AI沟通一下
点赞 评论 收藏
分享
评论
2
2
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务