
智东西
2025年的大模子产业正在资格一场静默的分化。一边,少数明星模子的参数竞赛依然强烈;另一边,一个更根柢的救援已在基础枢纽层悄然发生:
AI的价值完毕旅途,正从“模子才智展示”转向“Agent实践部署”。
亚马逊云科技CEO马特·加曼(Matt Garman)在当天凌晨举办的2025 re:Invent主题演讲中直言:“Agent的出现使咱们在AI轨迹上发生了变化——从一个技巧遗址的期间,转向真确得到价值的期间。”
他的判断基于一组反差强烈的数据:一方面,生成式AI激勉全国狂欢,Amazon Bedrock已劳动跨越10万家企业,其中50多家客户处理了超1万亿tokens;另一方面,许多企业仍未看到AI投资带来相匹配的业务答复。

“Agent是企业从AI投资中得到骨子性买卖答复的场所。”Garman揭示了一个重要改换点,“我确信,在将来每个公司里面和每个可以念念象的边界皆会非凡十亿的Agent。”
一场重新界说AI价值完毕的竞赛依然打响。在亚马逊云科技2025 re:Invent的舞台上,AI芯片性能飙涨600%,构建AI Agent的四大技巧扶直同步升级,Agent部署的全栈干戈依然升级……到底什么才是企业收拢这场变革红利的抓手?
云计算一哥的一招一式,皆给了咱们解答Agent变革期间之问的绝佳参考。

算力竞争已插足云巨头自主可控、性能狂飙的阶段。亚马逊云科技在2025 re:Invent上亮出了其最顶端的兵器:基于自研3nm芯片的Amazon EC2 Trainium 3 UltraServers劳动器细腻全面推出,而下一代Trainium 4芯片的性能参数更令东谈主震荡。
“若是望望今天在Amazon Bedrock上初始的系数推理,大广大实践上依然由Trainium驱动了。”Garman走漏。更令东谈主印象潜入的是,亚马逊云科技已部署跨越100万颗自研Trainium芯片,而上一代Trainium 2的量产速率是其此前芯片的4倍。
最新性能数据揭示了这场算力鼎新的伏击进度:基于首款云霄3nm AI芯片Trainium 3,亚马逊云科技最新推出的Amazon EC2 Trainium 3 UltraServers劳动器,最极致的树立将144颗Trainium 3芯片互连,提供362PFLOPS(FP8)算力和跨越700TB/秒的总带宽。
该劳动器提供比较前代Trainium 2的4.4倍的计算性能、3.9倍的内存带宽普及,而能效譬如针——每兆瓦电力处理的AI token数目——普及了5倍。

更值得一提的是,关于下一代Trainium 4,亚马逊云科技甘愿了更大幅度的飞跃:瞻望提供6倍的FP4性能,4倍的内存带宽,2倍的内存容量,并营救通过NVLink Fusion和UALink进行推广,专为全国最大的模子历练需求而生。
但芯片性能只是故事的一半。亚马逊云科技同期推出了更具战术酷好酷好的Amazon AI Factories(AI工场)劳动——允许企业在我方的数据中心部署专用AI基础枢纽,同期享受亚马逊云科技的全套劳动和料理。
这一举措直击企业生成式AI出海和全国化部署中的核肉痛点:数据主权、合规条款与性能需求的均衡。企业可以在腹地艳羡数据放手权,充分欺骗既有空间与电力资源;同期得到与公有云换取的先进AI才智,无缝接入从Trainium、英伟达GPU到SageMaker和Bedrock的全栈AI劳动。
二、模子生态的多元主义:自研模子超GPT-5.1,中国模子占1/4席位与追赶“全能模子”的潮水相悖,亚马逊云科技接受了多元化的模子战术。“咱们从不确信会有一个模子统率一切。”Garman明确暗意,“相悖,会出现许多伟大的模子。”
这一理念在Amazon Bedrock平台上得到充分体现。往时一年,Amazon Bedrock平台提供的模子数目翻倍,2025 re:Invent上新增的18款全托管开源模子也包含4款中国顶尖模子,中国模子占1/4席位,包括千问、DeepSeek、Kimi及MiniMax多家模子已上线Amazon Bedrock平台。
对中国企业而言,这意味着在出海和全国化过程中,可以得到更濒临原土技巧性格的生成式AI营救。对全国用户而言,这代表了更凡俗的技巧接受。
亚马逊云科技最新推出的自研的Amazon Nova 2系列模子则展示了另一种可能。四款新式号袒护了从轻量推理到复杂多模态的全场景需求:
Amazon Nova 2 Lite:是一款快速且经济高效的推理模子,领有可以的指示罢职、器具调用、信息索求、代码生成等才智,在上述四大边界的才智基本全面高出了Claude Haiku 4.5、GPT-5 mini、Gemini 2.5 Flash等轻量级模子,仅在编程才智上略逊于GPT-5 mini。
Amazon Nova 2 Pro:是Nova系列中最智能的推理模子,营救翰墨、图像、视频、语音四种模态输入和文本模态输出,适用于高度复杂的使命负载,尤其是Agent场景。在两项Agent基准测试中,其发扬依然跨越了GPT-5.1(high)、Gemini 3 Pro Preview(high)等前沿模子。
Amazon Nova 2 Sonic:下一代语音转语音模子,能为AI应用提供及时、类东谈主的对话式AI体验。在语音意会和推理任务上,其性能依然跨越了GPT Realtime、Gemini 2.5 Flash等。
Amazon Nova 2 Omni:是业界首个营救文本、图像、视频和音频输入,并营救文本和图像生成输出的推理模子。不外,亚马逊云科技尚未公布其基准测试收获。

可以看到,特地是在Agent重要才智的基准测试中,Amazon Nova 2 Pro展现了令东谈主印象潜入的性能,这平直复兴了企业关于生成式AI在实践业务场景中可靠性的关爱。
尤其是在企业出海的场景中,接受至关要紧(Choice Matters)。AI的将来不会仅由1个模子统率,往时一年Amazon Bedrock上提供的模子数目依然翻倍,DeepSeek、Qwen等中国模子也在营救范围之内,这位中国企业的出海业务部署Agent提供了丰富接受。
三、数据与模子深度交融:灵通历练模子繁芜“RAG局限”“你的数据是唯一无二的,这即是你与竞争敌手的分离。”Garman反复强调这一不雅点。联系词,传统的数据与模子伙同技巧如RAG(检索增强生成)只可匡助模子更灵验地导航数据,无法让模子真确“意会”企业的深头绪边界常识,这也成为Agent价值开释的“拦路虎”。
亚马逊云科技的鼎新性的料理决策是:Amazon Nova Forge劳动,该劳动引入了“灵通式历练模子(Open Training Model)”的办法。

通过这项劳动,企业可以在模子历练的苟且阶段,将我方的特非凡据与亚马逊的历练数据集混杂,创建名为“Novellas”的定制模子。这一方法料理了传统微调中的中枢矛盾——在教训模子新边界常识的同期,幸免其“渐忘”已掌捏的中枢推理才智。
Amazon Nova Forge还提供了使用费力奖励函数和强化学习微调的才智,以进一步改良模子,让企业可以将确切环境集成到历练轮回中。由于基础模子已司意会业务,这些后历练技巧实践上会变得愈加灵验。
索尼是这一劳动的早期选择者。通过对Amazon Nova 2 Lite模子进行微调,索尼创建了深度意会本身业务和运营的定制模子,在援用一致性和文档依据等任务上发扬优于基准模子,标的是将合规审查和评估经过的成果普及100倍。
可以看到,关于寻求通过生成式AI完毕互异化竞争上风的企业而言,这一才智至关要紧。它意味着企业可以构建真确意会本身业务逻辑、经过和常识的Agent,而非只是使用通用的AI器具。
四、总结一件事:莫得魔法,唯有可部署的Agent2025 re:Invent上最引东谈主慎重的发布,粗略是三类“前沿Agent”的推出。这些Agent代表了AI才智的一次阶跃式普及:自主、大范围可推广且能长期初始,也给广阔开导者打了个样。
三类前沿Agent展示了AI重塑软件开导和运营的后劲:
Kiro autonomous agent透顶改变了开导范式。它与市面上常见的代码补全助手不同,而是能够自主处理复杂任务,如升级重要库时,自动识别系数受影响劳动,分析使用款式,按方法更新代码,初始完好意思测试,并一次性创建系数归拢就绪的拉取央求。亚马逊里面的一个案例夸耀,原来需要30名开导者18个月完成的重架构技俩,使用Kiro后仅需6东谈主76天完成。

Amazon Security Agent是一个络续、主动、内置的AI安全大师。将安全执行从“过后检讨”变为“络续镶嵌”。它能在策画阶段审查文档,编码过程中扫描曲折,并将渗入测试从腾贵的一次性行为救援为按需的络续考证过程,从而确保安全性。
Amazon DevOps Agent重新界说了运维反应机制。当警报触发时,它能立即诊铲除本原因,提供建立决策,使工程师能够专注于决策而非排查。这一才智关于保险全国化业务的集中性至关要紧。
Agent开导的基础枢纽雷同得到加强。Amazon Bedrock AgentCore自SDK预览版发布以来,5个月内下载量跨越200万次。新增的两项功能平直应答企业部署Agent的中枢关爱点:
Amazon AgentCore Policy(预览版):为Agent与企业器具及数据的交互提供及时笃定性放手。
它允许开导者在Amazon AgentCore Gateway器具调用初始前阻止,使用带有细粒度权限的策略,为Agent行为界诠释确的界限,如使用哪些器具、怎样使用器具,开导者也可以通过当然言语创建圭臬,如“报销金额大于1000好意思元时,就发愤退款”等。

Amazon AgentCore Evaluations(预览版):凭据实践行为络续检讨Agent质料。
这是一项全托管劳动,开导者可以使用内置评估器来算计常见的质料维度,如正确性、匡助性、器具接受准确性、安全性、标的顺利率和陡立文联系性,还可以创建基于模子的定制评分系统,凭据我方接受的教导和模子进行业务定制评分。

除了上述更新,Garman还在临了10分钟公布了25个新发布,包括搭载第五代AMD EPYC处理器的X8i Instances、搭载英特尔至强6的C8ine Instances、EC2 M3 Ultra Mac Instances等袒护计算、存储、数据库、大数据、安全等多个边界的新品,这些皆为企业Agent部署提供了踏实坚实的复旧。
结语:AI插足Agent时期,价值落地之战打响当AI插足Agent时期,2025 re:Invent的舞台展示了亚马逊云科技对Agent期间的全面布局,这不再是一场单点技巧的竞赛,而是全栈才智的比拼,其正在构建一个营救Agent从实验到落地分娩的完好意思平台。
当下世博shibo登录入口,每个产业东谈主士皆在见证生成式AI从技巧演示走向买卖价值,价值落地之战已打响。云巨头的这种“全家桶”式的全栈才智,粗略恰是企业将AI投资改换为实践业务答复所需要的基础枢纽。
