云巨头锁定AI Agent未来现金流 直击2025 re:Invent

北京时间12月3日凌晨,2025 re:Invent如期到来,亚马逊云科技在这场技术盛宴上揭开了“Agentic AI”时代的帷幕。

其首席执行官Matt Garman在大会上披露了一组数据,亚马逊云科技年收入达到1,320亿美元,仅去年一年就增长了大约220亿美元。

得益于AI基础设施的强劲需求以及客户持续加速上云进程,亚马逊云科技第三季度净销售额(Net sales)达到330亿美元,同比增长20%,创下自2022年以来最高增速!同时,全年资本支出预期上调至1250亿美元。

营收高增速和不断加大的基建投入,不仅让市场看到了这家公司对AI行业的影响力与日俱增,也从行业层面证明了AI Agent时代已来。

对此,Matt Garman判断,Agent技术正处于关键转折点,从“技术奇迹”转变为能提供实际业务价值的实用工具。未来将出现数十亿AI Agent,为企业提效10倍以上。

这意味着市场对基础设施的要求被推向历史新高。为此,亚马逊云科技用从芯片、模型、数据到Agent的全面变革,构建AI业务价值实现的完整闭环,来迎接这一轮的增长周期。

看见亚马逊云科技的AI“野心”

在短短几年内,大模型的爆发逐渐把云厂商推上了无可争议的中心位置,“想要富,先修路”的逻辑在AI领域愈发确定。

然而,亚马逊云科技的逻辑与其他科技巨头有所不同。

对亚马逊云科技来说,现在最重要的是,瞄准AI Agent时代,构建其所需的的四大核心要素:AI基础设施、推理系统、数据、构建工具,巩固自身在全球云计算与AI领域的绝对领导地位。

在2025 re:Invent 上,亚马逊云科技将“AI四大支柱”的持续进化以全链路方式呈现了出来:

· 支柱一:算力革命。

Amazon Trainium芯片系列在算力革命中取得突破性进展。其中,Amazon Trainium 3 UltraServers 搭载了“云端首个3nm AI芯片”,刷新了训练与推理的性价比,并以100万颗芯片的落地规模证明了实用性;同时,Amazon Trainium 4的预告展示了更为长远的算力发展路线图。

· 支柱二:模型生态。

亚马逊云科技在模型生态方面努力解决企业在生成式AI时代遇到的最核心问题,就是模型的选择与适配。

这次,Matt发布了Amazon Nova 2系列模型,包括性价比超高的Amazon Nova 2 Lite,有能处理复杂任务的Amazon Nova 2 Pro,还有最厉害的Amazon Nova 2 Omni,它是业界第一个真正统一的多模态模型,支持文本、图像、视频、音频输入,还能输出文本和图像。

同时,Amazon Bedrock作为目前规模最大的模型平台之一,已经为全球10万家企业提供了生成式AI推理支持。在这个平台上,企业不光能使用Nova系列模型,还能用来自全球的顶尖大模型,甚至集合了众多中国的大模型Kimi,DeepSeek和MiniMax等。

丰富的模型选择,让企业就从“被迫适应模型”变成“选择最适合自己的模型”。

· 支柱三:数据底座。

Amazon Nova Forge提出“开放训练模型”概念,让企业第一次能把自己的专有数据注入前沿模型训练,而非仅停留在微调阶段。未来企业具备“训练一个属于自己的前沿模型”的能力,将成为行业竞争门槛重新划分的起点。

· 支柱四:AI工具链。

要真正发挥Agent的价值,企业需要具有全面能力的企业 AI 工具支持。这次发布的Amazon Bedrock AgentCore提供丰富的组件用于Agent构建、部署、运营、治理、评估,解决Agent落地最大的“不可信问题”,使企业能够规模化、安全地构建、部署和运营Agent。

从芯片到模型,从数据到Agent运行环境,显然相比其他科技巨头都在谈模型领先性,亚马逊云科技更关注的是如何建立一个“性能+成本+规模”的工业化体系。

Agent时代的“10倍效率”展望

生成式AI迈向 Agent 时代是必然趋势。过去的生成式AI只能“回答”,而 Agent已经能够“执行”。

Agent 具备可规模复制、可跨业务迁移和可持续学习的能力,将成为企业数字化的终极形态,也是企业投资生成式AI能否形成正向ROI的关键。

Deloitte数据显示,2025年的Agent已形成“技术-场景-价值”闭环,73%的部署企业实现成本下降,58%达成营收增长。

根据Gartner的预测,企业超过15%的日常工作决策将交由AI Agent自主完成。

Agent正在成为全球化AI竞争的真正核心。

然而,Agent的发展速度与基座能力呈现强绑定关系,只有能够同时提供高性能推理、低延迟响应与强数据隔离的基础设施,才能支撑Agent进入企业关键场景。

从本次大会看,亚马逊云科技已在算力和推理规模上形成行业级数据鸿沟。

Amazon Bedrock目前支撑超过10万家企业的生成式AI推理,平台上已有50多个客户的单体业务量突破万亿tokens,而S3每天处理的2亿次请求与超过500万亿对象存储,构成Agent持续学习、回溯和推理的关键数据基础。

凭借过去生成式AI的积累,亚马逊云科技推出三大“前沿Agent”:Kiro;Amazon Security Agent;以及Amazon DevOps Agent。它向市场展示了一个核心观点:未来的AI竞争,不是模型之争,而是生产力系统之争。这将决定亚马逊云科技未来增长曲线。

首先,在全球技术团队都面临“开发成本过高、迭代太慢、跨代码库协调极其耗时”的背景下,Kiro的出现重塑了软件工程的组织结构。

从Matt Garman的演讲可以看出,Kiro最大的价值不在于写代码,而在于理解复杂代码体系、保持跨会话记忆、协同执行大型工程任务。

在全球化的客户案例中,一个原本需要30名开发者、耗时18个月的大型工程,被Kiro缩短为6人、76天完成。开发流程第一次从“工程师监督每个细节”,转为“工程师只需要设定目标,Agent自主完成任务”。

这意味着未来的软件团队结构将从“人力密集型”变为“Agent密集型”,Agent将重写软件生产方式,从而让云厂商深入参与千行百业的数字化进程。

其次,企业在部署生成式AI过程中,最大的痛点之一是安全与交付速度天然对立,渗透测试昂贵且滞后,漏洞往往在开发后期才暴露,返工成本极高。而Amazon Security Agent 的出现,将安全从“被动检查”变为“主动、持续、内嵌式”的运行机制。

最后,第三个前沿Agent,Amazon DevOps Agent,破局“运维压力”,自主诊断,定位到IAM策略变更,准备好修复方案等待审批。

在云原生时代,分布式系统复杂度急剧上升,运维团队被告警淹没、疲于救火,真正的创新时间被不断侵蚀。而亚马逊云科技内部的测试结果显示,Amazon DevOps Agent 在数千次真实故障中,根因识别率达到 86%,并能从历史事件中持续学习,提出可操作的优化建议。这代表着亚马逊云科技赋予了企业“自驱动的运维助手”。

三大Agent 从不同角度展现了未来企业级AI的必然趋势。Kiro改变了开发方式,Amazon Security Agent 重塑了安全流程,Amazon DevOps Agent则重写了运维体系。

通过三大Agent,亚马逊云科技给出的信号是明确的:未来企业的价值创造,将由人和海量Agent并行执行。

AI将带来的生产力系统领先

过去两年,市场的焦点一直在大模型本身,而2025亚马逊云科技re:Invent明显把竞争推向了新的阶段,从“模型领先”到“生产力系统领先”。

对于投资者来说,亚马逊云科技押注的是企业大规模采用Agent之后带来的长期现金流与基础设施价值。

在2025亚马逊云科技re:Invent上,一组数据证明,亚马逊云科技正以积极的姿态备战这个海量Agent时代,其全球数据中心网络已扩展至38个区域、120个可用区,并在过去一年新增了38GW的数据中心容量,在过去12个月中增加了50%。此外,Matt Garman还在演讲的最后,一口气发布了25项云核心服务创新,覆盖计算、存储、数据库等领域。

这个规模增速和创新能力超过全球任何一家同类服务商。

从芯片到模型,从数据到Agent,亚马逊云科技正在加速构建完整的AI价值闭环,助力企业真正驾驭智能变革。在Agentic AI时代的前奏声中,亚马逊云科技已经找到了属于自己的那条最具确定性的进攻路线。

#亚马逊云科技 #生成式AI #出海

*2025亚马逊云科技re:Invent 中国行即将启幕!12月18日开始,北京、上海、深圳、成都四城线下巡演及线上专场将同步开启,无论你是云计算新手还是技术老兵,都将从高阶演讲、实战内容、技术分享和专家互动中受益。查询注册,抢占席位,把握Agentic AI时代的新机遇!

来源:美股研究社

全部评论

相关推荐

11-18 21:04
已编辑
华中科技大学 前端工程师
一共四面,进度挺快,希望能开高一点timeline:10.20 一面 50min10.22 二面 40min10.28 hr面 50min  秒过约10.30主管面但是因为种种原因一直改时间到11月11.11 主管面  50min一面:简历拷打20min,主要是实习业务和微前端框架,然后是八股:react hooks,有哪些,怎么用,useEffect和useEvent区别,useMemo和react.memo区别,为什么不能在条件里用浏览器css和js和dom的解析具体过程,谁先谁后表格缓存怎么做,首屏加载怎么监控的,虚拟表格实现原理,怎么做表格选型的平时怎么使用ai,有哪些心得怎么看待ai手撕忘了,应该不是特别难的不然我会记得p.s  面试官好有礼貌,唯一一个称呼为您的,答错了会有正确解答,最后问我还有什么简历没问的我还以为是我没啥能问的二面:1.受到ddos攻击后有哪些应对方案2.前端安全用过哪些3.webpack配置过什么,有用过什么插件4.树摇原理5.react和vue区别6.为什么要微前端改造7.微前端隔离的原理,快照和proxy的优缺点8.服务器部署原理,回滚原理这个的手撕也忘了,没印象就是不太难三面hr面:hr挺好的,没有压力1.个人经历询问2.为什么跑路了实习3.觉得最有成就感的事情4.有没有主导过项目5.三个词语形容自己  为什么这么说6.现在最想提升的方面7.为什么选AI初创不选大厂8.对AI的看法四面主管面:拖了好久才来面,还以为不想要我了一眼看出来是字节出来的,之前的同事都是这种高效礼貌疏离的1.讲讲你实习的优化的具体2.有没有什么沟通协作的经历3.形容自己有领导力的原因4.除了想要提升技术还有什么软素质想要提升5.其他offer 意向城市6.反问业务,是根据base地和个人倾向决定
查看27道真题和解析
点赞 评论 收藏
分享
11-21 15:20
门头沟学院 Java
一面 1.  介绍一个你熟悉的项目2.  当时为什么这个项目?上线了吗?3.  你认为什么是RAG?4.  它跟微调有什么区别?效果上会有什么区别吗?为什么有两种方式?5.  有实际做过微调吗?6.  Rag 去做判卷,你的检索内容是什么?7.  用的是什么向量数据库?为什么最后选了它?8.  Redis 的缓存策略,为什么要去设计的一个热点题目缓存这样的东西?9.  Rocketmq 我们在正常的发送和消费的时候,怎么保证这个消息是不丢失的。10. 在消息发送出来写到 broker 的时候,在你的发送里面要做什么样的设置才可以保证你一定会写入这个?11. 你在做哪些开源的事情?12. 你对哪一个技术中间件是最熟悉的?13. Redis 它为什么很快?14. 为什么单线程还会比多线程要快?感觉这有点反直觉。15. 多线程比单线程执行会多一些成本吗?16. 上下文切换有哪些具体的开销?17. 什么是程序计数器?18. 所以它是跟线程绑定的吗?19. Redis 多路复用20. 你了不了解 Redis 6.0 之后为什么引入了多线程?21. 你觉得你对Redis的掌握程度是怎么样的?评价一下22. 你现在学习是通过什么方式去学习一些新的知识?你有什么感兴趣的方向吗?23. 假设现在你跟你的mentor,你的导师上你们有意见冲突,你们的意见完全相反,在一件事情上,你会如何处理这样的事情?24. 算法题 mid 不含重复字符的最长子串的长度25. 你实际做项目里面,你觉得你碰到过最难的问题是什么?你如何解决它?
查看25道真题和解析
点赞 评论 收藏
分享
评论
点赞
收藏
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务