欢迎加入阿里云,打造支撑大模型时代的容器调度引擎!【加入全球云计算的未来】作为中国云计算市场的领军者,阿里云容器服务团队正以世界级技术实力重塑云原生基础设施。我们打造支撑百万级容器集群的调度引擎,服务全球数万企业客户,驱动AI大模型、高性能计算与Serverless等前沿场景落地。现面向全球招募资深工程师与技术专家,共同定义下一代云原生资源调度体系!【你将主导的技术疆域】- 异构算力智能调度系统主导Kubernetes在GPU/CPU/NPU等异构资源环境下的调度架构演进,解决AI大模型训练、推理等高负载场景中的资源碎片、拓扑亲和性与弹性伸缩难题设计并实现新一代智能调度算法,提升万亿参数模型训练效率,降低单位算力成本- 云原生生命周期与弹性引擎深入GPU虚拟化、设备插件、任务队列与抢占机制等核心模块,构建高可靠、低延迟的调度底座探索Serverless与AI基础设施的深度融合,打造“按需即用、秒级弹性”的下一代计算范式- 开源生态与行业标准引领代表阿里云参与CNCF等国际开源社区,推动GPU分时复用、拓扑感知调度、多租户隔离等创新方案成为行业标准与全球顶级云厂商、AI实验室及开源项目维护者协同,输出中国技术影响力【我们寻找这样的你】- 计算机科学、软件工程或相关专业本科及以上学历,3年以上分布式系统、云计算或基础设施研发经验- 精通Go/Python/C++中至少一种语言,具备扎实的系统设计与工程落地能力- 满足以下一项或多项者优先:有Kubernetes调度器(kube-scheduler)、Volcano、YuniKorn等调度框架深度开发或优化经验熟悉GPU架构、CUDA编程、NVIDIA MIG或多实例GPU技术,或参与过AI训练平台建设在资源调度、作业编排、弹性伸缩等领域有实际生产系统交付或开源贡献- 能将学术前沿(如ML for Systems、强化学习调度)转化为高可用工程方案- 具备技术领导力,渴望通过代码与架构影响亿级用户背后的云基础设施【你的成长与回报】- 技术纵深:直接参与阿里云ACK(容器服务 Kubernetes 版)核心调度系统,代码运行于全球数十个Region、百万级节点规模- 全球舞台:代表团队出席KubeCon、SIGCOMM、OSDI等国际顶级会议,与CNCF TOC成员、头部云厂商架构师深度交流- 职业跃迁:提供P6-P8级岗位发展空间,优秀人才可进入阿里云“星瀚计划”,享受股票期权、技术晋升双通道- 极客文化:开放、务实、敢为人先——在这里,你的每一个PR都可能改变云原生世界的运行方式工作地点:北京·朝阳科技园 / 杭州·云谷园区加入我们,在AIGC与云原生交汇的风暴中心,亲手构建驱动智能时代的调度基石!