CUDA面经
实习和秋招都面了一些高性能计算的岗,分享一点被问过的cuda八股
SIMT是什么
occupancy和什么有关,怎么控制
bank conflict粒度
GEMM分块大小受什么影响
float4读写gmem为什么更快
block能否被调度到不同sm上
常用卡的cache是多大
divergency对性能的影响
nvidia gpu的指令级并行
手撕矩阵转置
手撕向量外积
SIMT是什么
occupancy和什么有关,怎么控制
bank conflict粒度
GEMM分块大小受什么影响
float4读写gmem为什么更快
block能否被调度到不同sm上
常用卡的cache是多大
divergency对性能的影响
nvidia gpu的指令级并行
手撕矩阵转置
手撕向量外积
全部评论
大佬,这个赛道很卷吗?
市面上会cuda的应该很少吧,感觉lz挺好找工作的?
感谢楼主分享,所以float4为什么会更快呀,这点一直挺困惑的
大佬点技能树的时候,会学tvm推理引擎,训练框架这些吗
楼主拿到哪家的offer了吗
佬最后去哪了?
mark
m
请问下大佬,面高性能计算岗,cuda的话怎样的项目算是比较有含金量
相关推荐
牛客30461999...:写的真好啊,文学功底好。有句话感触很深,AI的确提效了,按理说同样的工作内容,如果有AI的帮助,完全不用加班就能搞定。但现在加班现象依旧普遍,这是由社会观念、制度决定的,社会以生产最大为导向,AI节省的时间、创造的价值流向资本而不是打工人,同时有了AI竞争更大了,对工作的要求、速度要求都上升了。 点赞 评论 收藏
分享
10-30 11:21
北京邮电大学 Java 点赞 评论 收藏
分享

