得物推荐算法实习一面 1h(深度学习

1.平时接触过哪些深度学习模型?有用过推荐相关的模型吗?
2.ESSM中CVR任务的样本空间是什么?
3.Weight decay解释一下原理?
4.对于优化器有哪些了解,比如Adam,AdamWSGD等是否知道梯度更新的计算过程?
5.HSTU中注意力计算过程和Transformer的注意力计算过程的区别
6.HSTU中的工程优化了解吗?有了解其他生成式模型吗?
7.注意力计算中主要是矩阵计算比如QK,是线性变换,有非线性变换的过程吗?
8.SiLU激活函数和ReLU激活函数的区别?
9.为什么使用InfoNCE loss,和NCE loss,Samplesoftmax loss 有什么差异
10.RQ-VAE的损失函数计算中,梯度阻断是怎么做的?
11.除了RQ-VAE 还了解其他的VAE模型吗?
12.NDCG指标的计算过程是?NDCG指标中Normalize的过程体现在哪里?
全部评论

相关推荐

评论
点赞
收藏
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务