快手多模态日常实习一面
1.默写二元交叉熵损失函数
2.是否了解Sigmoid函数,Sigmoid函数有什么缺点
3.MHA的运行机制
4.为什么Transformer使用三角函数位置编码,相比于[1,2,3..]这种硬编码的好处在哪?
5.Transformer的Attention计算过程中为什么要对QK的点积进行scale
6.CLIP学习的范式,是如何构造正负样本对,如何进行对比学习
7.解释Q-former机制,以及其中可学习Query的意义
8.Temperature有什么作用
9.聊项目
10.代码:搜索旋转排序数组
2.是否了解Sigmoid函数,Sigmoid函数有什么缺点
3.MHA的运行机制
4.为什么Transformer使用三角函数位置编码,相比于[1,2,3..]这种硬编码的好处在哪?
5.Transformer的Attention计算过程中为什么要对QK的点积进行scale
6.CLIP学习的范式,是如何构造正负样本对,如何进行对比学习
7.解释Q-former机制,以及其中可学习Query的意义
8.Temperature有什么作用
9.聊项目
10.代码:搜索旋转排序数组
全部评论
相关推荐
查看14道真题和解析 点赞 评论 收藏
分享