清程极智大模型系统工程师 凉经

清华系的AI infra创业公司,规模比较小,全是清华大佬,被狠狠吊打。

一面

八股

transformer的模型结构

有哪些位置编码?其特点是什么?

GQA

Flash Attention?

Page Attention

Decoder-Only和Encoder-Decoder-Only模型相比有什么区别?

手撕

CUDA规约计算

反问

培养及管理体系

二面

二面应该是技术负责人了,项目拷打,问的特别细特别深,当时面试完人麻了,也没有录音记录,所以细节已经忘掉了。

因为他们公司跟我实习的公司有业务合作,所以这位技术大佬比我还了解实习公司的业务,面试过程快扣出四室一厅了,毫无疑问的挂了。

#AIinfra##大模型##面经##清程极智#
全部评论
佬 是在哪投的这家公司呢
点赞 回复 分享
发布于 2024-08-29 17:27 广东

相关推荐

牛客41406533...:回答他在课上学,一辈子待在学校的老教授用三十年前的祖传PPT一字一句的讲解,使用谭浩强红皮书作为教材在devc++里面敲出a+++++a的瞬间爆出114514个编译错误来学这样才显得专业
点赞 评论 收藏
分享
评论
4
17
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务