CUDA面经

实习和秋招都面了一些高性能计算的岗,分享一点被问过的cuda八股
SIMT是什么
occupancy和什么有关,怎么控制
bank conflict粒度
GEMM分块大小受什么影响
float4读写gmem为什么更快
block能否被调度到不同sm上
常用卡的cache是多大
divergency对性能的影响
nvidia gpu的指令级并行
手撕矩阵转置
手撕向量外积
全部评论
大佬,这个赛道很卷吗?
3 回复 分享
发布于 2023-09-21 15:00 上海
市面上会cuda的应该很少吧,感觉lz挺好找工作的?
2 回复 分享
发布于 2023-09-08 14:13 上海
感谢楼主分享,所以float4为什么会更快呀,这点一直挺困惑的
2 回复 分享
发布于 2023-09-04 12:59 上海
大佬点技能树的时候,会学tvm推理引擎,训练框架这些吗
1 回复 分享
发布于 2023-09-17 10:06 山西
楼主拿到哪家的offer了吗
1 回复 分享
发布于 2023-09-04 14:03 广东
佬最后去哪了?
点赞 回复 分享
发布于 2025-04-23 17:24 安徽
mark
点赞 回复 分享
发布于 2024-05-13 15:05 上海
m
点赞 回复 分享
发布于 2023-09-06 21:37 江苏
请问下大佬,面高性能计算岗,cuda的话怎样的项目算是比较有含金量
点赞 回复 分享
发布于 2023-09-06 00:15 广东

相关推荐

01-23 09:22
已编辑
东北大学 Java
贡献第一个面经 也是大凉经 自我剖析 实习 项目 八股 掌握程度还是太浅 我已经记不清说了多少“不太记得” “有点忘了” “不知道”无手撕 面试官很好 有的问题还告诉我答案了 还涨知识了家人们 redis单个QPS最高能顶住2w多实习:kafka数据怎么推送来的使用的拒绝策略是abort直接拒绝 拒绝抛的异常实在哪里看 监控器还是日志, 日志里是怎么看 丢失数据的话怎么处理 有什么影响线程池优化为什么选择扩大核心线程数和最大线程池 初始设置的线程数的设置有什么依据吗 扩大任务队列不行嘛项目:点评没问另一个项目问的:为什么设计多级缓存 去掉多级缓存就用redis行不行 没回答上 被面试官评价为为了设计而设计 还问redis qps最高支持多少用到了jwt 问:签名 和 加密 的区别八股:ArrayList LinkedList区别 底层结构hashmap 和 concurrenthashmaphashmap为什么要引进红黑树Spring IOC 和 AOPspring bean作用域Synchronized 和reentrantlock线程运行状态JVM结构堆 栈 计数器内等存储内容垃圾回收器重载和重写== equals  equals比较值是怎么实现的mysql事务 acidmysql默认隔离级别事务隔离级别innodb 和 myisam区别 除了这两个还有其他的嘛为什么会回表讲讲索引最左匹配select * from... where a = .. ,b = .. , ... 这时候还会用到联合索引吗三握四挥tcp和http区别联系http和https区别智力题:64匹马 8个赛道 选跑最快的4匹马 最少需要多少次
查看29道真题和解析
点赞 评论 收藏
分享
评论
20
223
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务