CSIG 暑期实习提前批 腾讯云-技术与产品方向 面经

总的来说是一个做交付的组,一面问的很杂,表现出来的像是主要做运维,解决一些客户的线上问题,做一些 docker 的打包交付,vllm/sglang 只是想知道简单的配置选项

二面自我介绍完之后ld直接问我方向不是很匹配会不会去,我说不会,就友好结束了

qit

腾讯云 - 技术与产品方向

a. 自我介绍,对某AI芯片厂的经历比较感兴趣

i. 讲一个实习中最有亮点的算子,遇到什么问题,怎么解决

ii. 遇到过什么坑吗?

iii. 性能怎么调试?模型 -- 看op占比,算子 -- 看关键代码

iv. 精度怎么调式?op -- 单测,模型 -- 逐层对比

v. 对训练有什么了解吗,你们在训练过程中是如何做加速的?Torch 分布式? -- 了解比较少

b. 怎么定位一个偶发的 bug,比如 vllm 里面 cuda 给你报一个 out of index,异步调用看不到准确函数栈

i. CUDA DEBUG 宏,阻塞之后可以准确看到出问题的地方,抓输入,debug kernel

ii. 追问:如果就是线上偶发的呢,客户给你的?-- 不知道怎么回答了

c. 怎么优化寒武纪 vllm 性能的 -- balabala

d. 对docker了解吗?打过包吗?K8s知道吗?打包的过程怎么尽可能减少层数和体积

e. 量化了解吗?Fp16 -> fp8 一定有提升吗?-- 首先硬件要支持,对部分矩阵乘可能起作用

f. 写题

i. Float sqrt 二分法,注意 0 - 1 之内的数

ii. 简单括号匹配

g. Linux - 一个进程为 D 代表什么

h. Python 语法

i. 什么时候用多线程什么时候用多进程? -- 知道 GIL 锁,会 block 住的用多进程

ii. 值传递还是引用传递?打错了,我说值传递,但是传的是对象的指针,对象可以被修改 -- 应该是全部引用传递,不可变变量传的是值的引用

iii. Async def?-- 讲了是用户态实现,底层不感知 https://zhuanlan.zhihu.com/p/698683843?share_code=ArOs4en6kUj9&utm_psn=2003149396813051736

iv. 如果要实现一个 LLM 的压测,用什么?Async,因为多线程开销很大;追问具体怎么实现,怎么控制并发数,比如10000数据量100并发?不知道语法,讲了可以搞个信号量之类的变量用 atomic 来控制并发量

i. vLLM

i. 性能评价标准 -- TTFT / TPOT

ii. 怎么在不增加资源的情况下减小 TTFT,有什么选项可以调?-- llm server 有关于 prefill / decode 优先级的选项用于控制 chunked prefill 之类的东西,可以使策略偏向 prefill 任务?

iii. 那你讲讲 chunked prefill -- balabala,提升了 decode 计算强度提高效率

iv. Cuda graph 在 vllm 里面的作用?-- 对固定 shape 的输入可以建图,减少 kernel launch 的开销,追问只是对 decode 加速吗?

#腾讯技术提前批##提前批##暑期实习#
全部评论

相关推荐

昨天 10:31
已编辑
东南大学 Web前端
前几天面的腾讯S3(后台开发)一面,发出来攒攒人品面试时长40分钟,无手撕,已过,基本都是八股,难度还可以1. 针对你做过的项目,我们做几个技术上的了解。我看你这边有一个仿淘宝的神券系统,这个是你自己实际的项目还是学习的项目?2. 如果我们要去设计一套高并发的票务系统,如何去确保这个系统的高吞吐,并且确保它的稳定性和票不能够超卖?对于这么一个产品,你要怎么去设计?3. 你提到在前端调度上要做CDN,这是为了做什么?4. 请求到网关以后,你提到了限流,大概来讲一下有哪些限流的方式方法?5. 为什么要考虑异步的方式?(指抢购)6. 如果用异步处理,数据库接收的请求会不会变少?那我们如何去保证它的高吞吐?假设1秒钟有1万个请求,如果是用异步的方式,是不是1万个请求都要在队列里排队执行?7. 在异步之前有一个缓存这一层,缓存这一层你是怎么去设计的?它如何去确保不超卖的行为?8. 缓存和数据库存会不会存在最终不一致的情况?例如网络中断、退票或支付超时,怎么去确保缓存里的库存和数据库最终会保证一致?9. 布隆过滤器有没有了解?10. 缓存击穿和缓存雪崩这两个场景,我们一般是怎么去解决的?11. 介绍一下分布式锁,我们一般是用它去解决哪类问题?它的实现方式大概有哪些?12. 在消息队列里,我们是如何去确保消息的可靠性的?13. 在哪些场景下,我们不会使用ACK确认机制?14. 消息消费失败的话,一般会怎么去处理?15. 用消息队列时有一个常见问题是幂等性问题,我们一般怎么去解决,确保程序是幂等的?16. 你提到会把消息的唯一ID放到Redis里,这个key会一直存在吗?什么时候删除?过期时间怎么设置?17. 如果在数据库层面做幂等,你要怎么去设计表?18. 在Java里我们会用到AOP思想,你大概解释一下什么是AOP,以及我们会在什么场景下使用?19. 你用过Redis,大概解释一下Redisson实现分布式锁的原理。20. Java里面内存是怎么管理的?不同类型的变量存储在哪里?它们的生命周期又是怎样的?21. 在程序开发时,会出现栈溢出或堆溢出的情况,你能够解释一下在哪些情况下会出现,以及如何去解决?22. 在线程池里做开发时,如何去设置线程池的数量?23. 做项目时是怎么考虑系统安全性的?例如怎么识别用户身份,怎么判断用户权限?24. 你对比一下Cookie Session和JWT这两种方式的优缺点。25. JWT这边,如何去处理它过期的问题?26. 如何去让用户注销,也就是退出系统?27. JWT是怎么颁发给前端的?服务器怎么去颁发一个JWT?28. JWT是否可能会被篡改?如何防止被篡改?29. 你对OAuth2.0或SAML2.0这两个协议有了解吗?30. 权限方面你会怎么去设计?31. 假设需要对现在的项目做优化,需要考虑角色,登录后某些人只能访问某些接口,其他人全部接口都能访问,你要怎么去设计这个功能?32. 你对微服务的设计有没有了解?33. 你对K8s有没有了解? 不了解34. 你对服务的注册和发现有没有了解?35. 你这边有没有什么问题想问我的?
不知道怎么取名字_:无手撕啊,那挺爽,还以为大厂都会有手撕
点赞 评论 收藏
分享
今天 15:02
已编辑
南京大学 Java
3.3 一面岗位: 后台开发部门: 腾讯云场景题偏多,没问项目,没手撕,时长半小时1. 自我介绍2. Java基础:- Treemap & HashMap区别- ArrayList, 添加n个数(n较大),会发生什么(应该是想问ArrayList的扩容机制)- 考虑扩容的情况下这个过程的复杂度多少(说明复杂度计算思路即可,不需要给出具体的复杂度)3. 并发:- 项目里怎么用多线程的(一开始答了具体场景,不过面试官想听的是线程池,Synchronized这些...)- volatile & synchronized- 这里还问了一个,不过忘了...- 假设项目里用了很多synchronized拖慢了系统效率,让你重构项目,你怎么设计? (真不会,回了一个参考乐观锁的设计用版本号之类的,然后这个话题就过了)4. JVM- JVM垃圾回收,怎么判断对象有没有被引用? (可达性分析)- GC Root有哪些- 遇到OOM怎么排查5. 场景- 设计一个数据结构,用于在搜索框中搜索人名(不知道是不是这个意思,答了字典树这个结构)- 使用字典树存储的话空间复杂度是多少(同前面,给出计算思路就行,不需要具体的值)- 问了下简历上项目的背景,项目的具体内容没问- 项目里的难点/印象深刻的点,咋解决的- 针对上一点提了一个发散性的场景题(让你设计个xxx,你的思路)然后反问,无手撕。---春招第一面,被场景设计问题拷打麻了,就当练习了,不敢奢望能过,后续随缘了3.4更新,已挂
查看15道真题和解析
点赞 评论 收藏
分享
评论
3
收藏
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务