offer选择 AI编译or架构设计?

投票
双九硕应届。
两家都在上海,薪资应该摩尔线程稍高一点点。
百度paddle是做AI编译器,在AI Infra业内的认可度较高,工作氛围不错,从现实来看是更稳妥的选择,但是工作内容不是很喜欢。
摩尔线程是做AI计算架构设计,上限高,和个人过往经历也更对口,工作内容很感兴趣,也很想为国产显卡出一份力。就是可能不是很稳定。

做理想主义者还是聚焦现实?

引流 #offer帮选##百度##摩尔线程##华为##字节##腾讯##美团##阿里##网易##荣耀##寒武纪##壁仞科技#
全部评论
佬,摩尔一共有几轮技术面呀
1 回复 分享
发布于 2024-11-13 16:22 湖北
佬,请问ai infra怎么入门呀,研0在纠结ai infra和搜推中
点赞 回复 分享
发布于 2025-02-11 23:41 山东
佬是硕士还是本科呀
点赞 回复 分享
发布于 2025-01-06 11:53 北京
m
点赞 回复 分享
发布于 2024-12-09 17:17 辽宁
计算架构设计主要是做什么的
点赞 回复 分享
发布于 2024-12-06 13:52 广东
佬 paddle是在北京莫?已经开奖了吗
点赞 回复 分享
发布于 2024-11-27 12:00 江苏
佬,你最后选择哪家公司啊?
点赞 回复 分享
发布于 2024-11-26 21:33 浙江
哥们怎么想的呢 我也发现大厂好多工作确实无聊
点赞 回复 分享
发布于 2024-11-17 16:43 北京
佬 摩尔给你开奖了吗
点赞 回复 分享
发布于 2024-11-12 15:07 湖北
确定自己真心喜欢摩尔岗位的话,选自己热爱的
点赞 回复 分享
发布于 2024-11-09 18:15 上海
感觉第一份工作还是去大平台好点
点赞 回复 分享
发布于 2024-11-09 16:40 四川

相关推荐

1.自我介绍;2.本科毕设项目介绍;3.Retinaface和Facenet的具体网络模型;4.Retinaface是如何检测人脸的,Facenet是如何识别人脸的;5.项目的创新点有什么,评判指标是什么;6.检测和识别用的时间,其中esp8266,mg996r分别是做什么用的;7.大模型量化比赛项目介绍;8.AWQ和GPTQ是什么;9.什么模型适合用AWQ,什么模型适合用GPTQ;10.其中最优的参数是怎么得到的;11.llm- benchmarker怎么用的,是什么评判指标;12.了解算子吗?(marlin kernel)详细说一下这个算子是什么;13.除了量化其他的方法了解吗?(压缩、减枝、LoRA)14.LoRA是什么;QLoRA是什么?为什么要用LoRA;15.具体的原理是怎么样的;16.如何将LoRA结合到TransFormer各个层?17.介绍一下TransFormer的架构;18.Encoder和Decoder是由什么组成的;19.MHA细节是怎么样的(QKV),softmax是干什么用的;20.单头注意力和多头注意力有什么区别;21.为什么MHA下面要除根号d;22.潜在多头注意力了解吗,多头注意力的作用;23.FFN详细说一下;24.残差链接有什么用;25.Layer Normalization有什么用;26.Layer Normalization和Batch  Normalization的区别;27.Qwen3的基础架构是怎么样的;28.Qwen3和Qwen2.5相比有什么区别;29.Qwen3和DeepSeek有多少个头;30.大模型要训练出思维链应该如何训练;31.如何平衡精度和推理速度,怎么做trade off的;32.了解Agent吗,做过什么agent项目33.Dense模型是什么;34.MoE、MLA是什么,详细讲一下;35.LoRA的偏置矩阵详细说一下,为什么LoRA初始化A要正态分布,B要初始化为0;36.秩是什么意思;怎么理解;37.Qwen3哪里做的好;38.快手实习项目介绍;39.经纬恒润实习项目介绍;40.了解量化交易吗;41.你平时做交易是趋势还是阶段?------二更已oc
你最近因为什么迷茫?
点赞 评论 收藏
分享
评论
4
9
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务