
炒股就看金麒麟分析师研报,巨擘,专科,实时,全面,助您挖掘后劲主题契机!
华尔街见闻
AI算力竞赛的焦点正悄然滚动:跟着智能体AI爆发,CPU从数据中心破裂升级为关节瓶颈。CPU与GPU配比展望从1:8骤收至1:1,算力需求四倍激增。Intel、AMD提价搪塞劳作,英伟达、Arm同月文书强势入局,竞争花样加快重写。
AI算力竞赛的焦点,正在悄然从GPU转向一个恒久被冷落的脚色——CPU。
跟着AI智能体和强化学习(RL)使命负载的爆发式增长,CPU在数据中心的政策地位正资格结构性重估。盛名半导体分析机构SemiAnalysis首席分析师Dylan Patel在4月8日的一次深度访谈中直言,AI使命负载的范式正简易单的文本生成向复杂的智能体和强化学习演进,CPU正靠近“极其严重的产能劳作”。
商场商讨机构TrendForce的最新发挥印证了这一判断:现时AI数据中心的CPU与GPU配比约为1:4至1:8,而在智能体AI期间,这一比例展望将大幅收窄至1:1至1:2。
这一结构性调治已在供需两头激发四百四病。Intel和AMD已于2026年第一季度末对部分CPU居品线提价。与此同期,英伟达和Arm双双于2026年3月文书艰苍凉事器CPU商场——一家GPU巨头与一家IP授权商在褪色个月作念出换取聘用,绝非恰恰,而是商场信号的采集开释。
智能体崛起,CPU从破裂变瓶颈
在AI发展的早期阶段,CPU的脚色十分边际。Dylan Patel将其描画为:“负载很轻。你发一个字符串,它回一个字符串,浅显的推理,对CPU需求不大。”彼时,GPU凭借其大范围并行矩阵运算才气主导了AI算力需求,CPU仅承担向GPU压缩和路由内存数据的补助职能。
然则,以OpenAI o1为代表的新一代推理模子,以及随之兴起的AI智能体架构,从根柢上改动了这一花样。与静态谎言语模子不同,智能体AI需要动态与环境交互——决策任务、调用用具、在子智能体之间传递数据、评估任务是否完成。这一“编排层”(Orchestration)的一王人和谐使命,恰恰落在CPU肩上,使其成为典型的CPU密集型负载。
2025年11月发布的学术论文《A CPU-Centric Perspective on Agentic AI》进一步量化了这一压力:在智能体AI场景中,CPU用具管制(包括Python解说、网页爬取、词法概要、数据库检索等)产生的蔓延,可占总蔓延的高达90.6%;在大都量管制场景下,CPU动态能耗可达系统总动态能耗的44%。
Arm的测算则肃肃量角度揭示了需求缺口的量级:传统AI数据中心每吉瓦(GW)约需3000万颗CPU中枢,而在智能体AI期间,这一需求将激增至1.2亿颗——增幅达四倍。
Intel承压,AMD乘势膨大
CPU需求的结构性高涨,最初在传统x86商场激发了花样重塑。
Intel的Xeon管制器曾恒久占据数据中心CPU商场逾95%的份额。这一总揽地位自2021年起启动松动——Intel 7制程的良率问题导致Xeon Sapphire Rapids发布蔓延近两年,为AMD的EPYC Milan掀开了商场缺口。
2026年,Intel计划推出两款旗舰居品:领受Darkmont架构的Xeon 6+(Clearwater Forest),领有288核/288线程,TDP约450W;以及领受Panther Cove-X架构的Xeon 7(Diamond Rapids),最高256核/256线程,TDP高达650W。两款居品均基于Intel起先进的18A制程,并初度引入Foveros Direct搀杂键合本事。然则,TrendForce指出,受18A制程良率问题握续困扰,两款居品的量产时刻均可能推迟至2027年。
比较之下,九游appAMD的节拍更为稳健。其2026年旗舰居品EPYC Venice将领受台积电N2制程、Zen 6架构,并搭载CoWoS-L与SoIC先进封装,通过同步多线程(SMT)本事完结256核/512线程——线程数为现时商场最高。TrendForce展望,AMD将在2026年握续从Intel手中蚕食商场份额。
英伟达、Arm强势入局,竞争花样重写
传统x86双雄除外,一批非传统玩家正往常所未有的速率涌入职业器CPU赛谈,从根柢上改写竞争花样。
2026年3月,英伟达文书将Vera CPU当作寂然居品对外售售,以繁华客户对更纯真CPU:GPU竖立的需求。Vera领受英伟达自研Olympus架构,基于台积电N3制程与CoWoS-R封装,提供88核/176线程,并配备1.8 TB/s的NVLink-C2C互联,可与英伟达GPU完结内存分享。首批互助伙伴涵盖Alibaba、ByteDance、Cloudflare、CoreWeave、Oracle等。英伟达还推出了Vera CPU机架,单机架集成256颗CPU,料到22,528核/45,056线程,总内存达400 TB。
同月,Arm文书推出首款自研CPU居品Arm AGI CPU,闭幕了其35年纯授权商的历史定位。该居品基于台积电N3制程与Neoverse V3架构,提供136核/136线程,TDP为300W,复古DDR5-8800内存与PCIe Gen6。首批互助伙伴包括Meta、OpenAI、Cerebras、Cloudflare、SK Telecom等。Arm同步推出两款机架竖立:风冷版集成60颗AGI CPU(8,160核,约180 TB内存),液冷版则复古336颗CPU(45,696核,1 PB内存)。
主要云职业商(CSP)不异加快布局自研CPU。AWS于2025年12月发布基于台积电N3制程的Graviton5(192核/192线程),并与自研Trainium 3 AI ASIC协同部署以镌汰AI筹谋资本;微软于2025年11月推出Cobalt 200(N3制程,132核/132线程);谷歌则计划于2026年推出Axion C4A.metal裸金属版块及下一代Axion N4A,主打最高性价比。
IC后端假想职业商迎来增量机遇
非传统玩家的大范围入场,正在为IC后端假想职业商创造可不雅的增量业务。
TrendForce指出,AWS当今仍坚握自主完成CPU后端假想,而谷歌和微软均已将CPU后端假想职业外包给创意电子(Global Unichip Corp.,GUC)。跟着更多CSP和新兴CPU厂商加入商场,这一外包需求有望握续扩大。
TrendForce展望,2026年至2028年间,Broadcom、Marvell、GUC、Alchip、联发科等ASIC假想职业商将不竭链接来自上述客户的新增样式。关于寻找AI基础设施投资新切口的商场参与者而言,这一门径或者恰是GPU慷慨除外,尚未被充分订价的结构性机遇。
风险教唆及免责条目
商场有风险,投资需严慎。本文不组成个东谈主投资提议,也未商量到个别用户特地的投资计划、财务现象或需要。用户应试虑本文中的任何想法、不雅点或论断是否安妥其特定现象。据此投资,背负自诩。
新浪声明:此音信系转载悛改浪互助媒体,新浪网登载此文出于传递更多信息之宗旨,并不虞味着赞同其不雅点或阐明其描画。著作本色仅供参考,不组成投资提议。投资者据此操作,风险自担。
海量资讯、精确解读,尽在新浪财经APP
背负裁剪:凌辰 九游体育官方网站
滚球app中国官网下载入口