

AWS 并非靠保守政策成为大师逾越的云管事提供商。该公司正在加倍投资其 AI 基础要道,谋划在 2026 年插足 2000 亿好意思元成本支拨,其中大部分将插足到汇集管事组合中。
AWS 插足这 2000 亿好意思元并非盲目投资,而是在重写其汇集物理特点,以戒指延长并幸免潜在的瓶颈。通过空芯光纤等新兴时期、抓续专注于里面硬件开发以及从头狡计的戒指平面,该公司旨在为将来的多云圭臬建树标杆。
AWS 已构建了分层汇集生态系统,并正在提高数据中心功率容量。在 2025 年第三季度财报电话会议中,亚马逊 CEO 安迪·贾西示意,AWS 仅在 2025 年就加多了 3.8 GW 的数据中心容量。该公司有充分意义将系数元气心灵蚁集在 AI 基础要道上。
公司的汇集管事组合依然看到了企业的远大需求,终端了康健的同比增长。据北极星市集辩论预测,大师多云汇集市集量度到 2034 年将增长至 365 亿好意思元,这反应了企业 IT 架构为喜跃 AI 竞赛需求而发生的调遣。
AWS 汇集工程副总裁马特·雷德接受了等闲访谈。他指出,公司正在汲取斗胆形式,包括启用空芯光纤——传统光纤的新兴挑战者——来推广其在皆市区的汇集军械库。
数据中心学问:AWS 已为 2026 年制定了转折成本支拨谋划,汇集将大幅受益。空芯光纤等新兴时期如何相宜这种领域的支拨?
马特·雷德:咱们看到的情况是,由生成式 AI 和传统云职责负载驱动,客户全面加快增长,这径直调动为对更多带宽的需求。
这种需求以两种形势体现。源流,咱们部署的每台管事器皆需要相连到汇集,每台管事器的带宽需求随时分抓续增长。其次,咱们系数的数据中心必须互连——在可用区内、跨区域、区域间以及对皮毛连。这种抓续的带宽增长是咱们多年来一直看到的,但 AI 显著加快了这一程度。
咱们的优先级是可用性、可靠性和弹性。淌若汇集不职责,其他一切皆不足轻重。中枢目的是无照管推广。咱们毫不但愿汇集阻截业务发展。这意味着领有充足的端口、充足的带宽和充足的弹性,让客户十足无须议论汇集问题。
数据中心学问:空芯光纤持久以来因成本和供应问题被以为虚假用。什么发生了变化,AWS 目下本体在那儿部署它?
马特·雷德:在我 25 年的奇迹活命中,空芯光纤一直被辩论,络续当作表面观念。咱们一直知说念它在物理上是可能的,但无法大领域制造。
这种情况在四五年前启动改变,学术辩论校正了分娩时期。即使当今,它仍然是一项新兴时期。两个难题是可制造性——你能分娩长距离、可靠的光纤跨度吗?——和成本。
对咱们来说,主要用例是长距离互连。AWS 可用区由多个数据中心构成,客户将其视为一个逻辑要道。要终端这少量,咱们需要浮浅半毫秒以下的延长。这一照管截止了要道之间的距离。
空芯光纤让咱们大概扩大这个半径。当地皮或电力无法充足勾通时,它为咱们提供了更多活泼性。目下,它比传统光纤贵得多,但淌若它大概在咱们蓝本无法建设的处所终端推广,仍然可能是正确的权衡。
咱们在至极少的地点使用它——浮浅 5 到 10 个地点——出奇是存在地舆照管的处所。持久来看,淌若成本着落,我量度空芯光纤将变得愈加遍及。除了延长,它还具有更低的信号失掉,不错守旧更高的带宽或减少放大需求。
数据中心学问:在数据中心里面,AI 职责负载依然改变了游戏法例。您在领域化中看到了哪些新的汇集瓶颈?
马特·雷德:有两个卓著问题。源流是戒指平面可推广性。机器学习管事器需要的每管事器带宽是传统基于 CPU 系统的两到三倍。当咱们推广汇集以喜跃这种需求时,诱骗和光链路数目急剧增长。
此时,传统戒指平面形式就不再好用了。归附时分加多,拘谨变慢,你会际遇算法截止。浮浅在 2020 年,咱们构建了专诚为机器学习汇集狡计的新戒指平面。它大概终端故障的亚秒级归附、跨数千诱骗的一致编程,以及推广到数十万链路而不际遇瓶颈。
这个系统当今正成为咱们系数汇集的基础,不单是是机器学习,因为它压根上更好。
第二个挑战是布线。在超大领域下,单个数据中心可能稀有十万条物理链路。这在分量、路由、部署速率和持久留意方面形成问题。
咱们在更好的追踪系统、校正的电缆狡计和将多根光纤团聚到单个相连的新相连器时期方面进行了投资。这减少了部署时分并提高了领域化可靠性。
数据中心学问:AWS 狡计了大部分我方的汇集硬件。这种垂直整合提供了什么上风?
马特·雷德:咱们浮浅 15 年前启动开发我方的汇集硬件,源流只是为了管事器相连。今天,咱们险些通盘汇集——从机架顶部交换机到主干网和互联网角落——皆运行在咱们我方的诱骗上。
最大的上风是一致性。咱们在职何处所皆使用交流的基本构建块:交流的 ASIC、外形因子和操作系统。这简化了供应链,让咱们大概一次性在通盘汇辘集欺骗软件校正。
它还守旧咱们无法以其他形势构建的功能。举例,咱们的戒指平面部分运行在诱骗自己上。这在现成诱骗上是不能能的。
在操作上,它改善了配置、监控和维修。咱们不错自动化测试,准确取得咱们思要的遥测数据,并自动触发竖立。每一个渐进式校正皆能推广到通盘汇集。
数据中心学问:AWS 还构建了高精度时分管事。为什么这是必要的,它开释了什么才智?
马特·雷德:浮浅在 2019 年,咱们启动专注于时分精度。NTP 等圭臬形式可能进出几秒,这在大型分歧式系统中形成果真的问题,出奇是在一致性和排序方面。
纯软件科罚决策无法克服汇集变化性,因此咱们构建了与数据汇集并走运行的基于硬件的时分汇集。每个数据中心皆有通过 GPS 同步的原子钟。专诚诱骗分发时序脉冲,每台管事器上的硬件——使用咱们的 Nitro 平台——以纳秒级精度吸收该脉冲。
这在软件中终端了微秒级精度。它开释了高度一致的分歧式数据库等新功能,并使金融来回所等职责负载在云中变得可行。纳斯达克依然演示了来回所如安在这种架构上运行。这在十年前是不能能的。
{jz:field.toptypename/}数据中心学问:跟着功率和冷却照管加重,动力截止在多大程度上影响您的汇集路子图?
雷德:动力不会截止咱们的路子图,但效果是一个主要焦点。咱们密切关爱每比特瓦数——移动数据所需的功率。
因为咱们戒指我方的硬件,咱们不错在至极细腻的层面进行优化:电扇算法、组件选择,以及基于负载的动态功率缩放。每个诱骗的收益可能很小,但在数千台交换机和许大皆据中心中,它们积贮成总功耗的权贵减少。
这对环境、客户和咱们的成本结构皆有刚正。
数据中心学问:量度三到五年,今天常见的哪些汇集假定到本十年末将过期?
马特·雷德:两个主要调遣卓著。源流,液体冷却将成为汇集诱骗的圭臬,不单是是管事器。将液冷管事器与风冷汇集羼杂加多了复杂性,液冷提供效果上风。
其次,光学集成将发生变化。今天的可插拔光学器件提供活泼性和可留意性,这在领域化中很有价值。十足共封装光学器件持久以来一直被辩论,但在可靠性和操作权衡方面存在贫穷。
我以为行业将转向共封装相连器——将相连器更勾通 ASIC 集成,同期保抓光引擎模块化。这在不放弃供应商千般性的情况下终端效果收益,这对 AWS 领域至关进攻。
数据中心学问:临了,AWS 客户在 2026 年汇集方面应该期待什么?
马特·雷德:理思情况下,更多的透明性。更多容量、更多带宽、更低延长、更少丢包和更少抖动。
客户应该看到抓续的容量推广、校正的性能,以及与计较、存储和加快实例更紧密的集成。咱们的目的很浅易:确保汇集持久不会阻截客户思要构建的东西。
Q&A
Q1:空芯光纤时期比较传统光纤有什么上风?
A:空芯光纤的主要上风是延长更低和信号失掉更小。它能让AWS扩大数据中心之间的相连半径,在地皮或电力资源无法充足勾通的处所提供更多建设活泼性。此外,它还能守旧更高的带宽或减少信号放大需求。固然目下成本比传统光纤高得多,但在某些地舆照管条款下仍然是正确的时期选择。
Q2:AWS为什么要开发我方的汇集硬件而不使用现成家具?
A:AWS自主开发汇集硬件的最大上风是一致性。他们在系数处所使用交流的基本构建块,包括交流的ASIC、外形因子和操作系统。这简化了供应链,让他们大概一次性在通盘汇辘集欺骗软件校正。同期,这种垂直整合还守旧他们构建现成诱骗无法终端的功能,比如部分运行在诱骗自己上的戒指平面。
Q3:AWS的高精度时分管事科罚了什么问题?
A:传统的时分同步形式如NTP可能进出几秒,这在大型分歧式系统中会形成一致性和排序问题。AWS构建了基于硬件的时分汇集,每个数据中心皆有通过GPS同步的原子钟,大概在软件中终端微秒级精度。这使得高度一致的分歧式数据库和金融来回所等对时分要求极高的职责负载在云中变得可行。