发布时间:2026年5月21日 · 作者:Phoenix Lee(locsic.com) 基于 NVIDIA 官方财报(截至 2026.04.26)及电话会议 核心判断:Agentic AI 的需求已经"parabolic",但 NVIDIA 面临客户变对手、中国市场归零、LPU 定位降级三重压力
一句话定调
NVIDIA 在 Q1 FY2027 交出了一份 $81.6B 的历史级成绩单,超出华尔街共识约 $2.5B——但真正值得关注的不是数字本身,而是数字背后的结构性变化:数据中心收入中,网络收入正在从"附属品"变成"利润中心";Hyperscale 和 ACIE 的收入首次几乎持平;Vera CPU 打开了一个 $2000 亿的新市场;而 Jensen Huang 对 LPU 的措辞从 GTC 上的"第七颗芯片"降级为财报电话会上的"niche product"。
AI 工厂的建设是人类历史上最大规模的基础设施扩张——这句话不是修辞,是事实。问题在于,这个扩张的红利能被 NVIDIA 独享多久。
核心数据一览
| 指标 | Q1 FY2027 实际 | vs 共识预期 | QoQ | YoY |
|---|---|---|---|---|
| 总营收 | $81.6B | ~$78.8-79.2B | +20% | +85% |
| Non-GAAP EPS | $1.87 | ~$1.77-1.78 | +18% | +140% |
| GAAP 净利润 | $42.96B | - | - | +129% |
| Non-GAAP 毛利率 | 75.0% | ~74.8% | 持平 | - |
| GAAP 毛利率 | ~73.5% | - | - | - |
| 数据中心营收 | $75.2B | ~$73.1B | +21% | +92% |
| ├ 计算 | $60.4B | - | - | +77% |
| └ 网络 | $14.8B | - | +35% | +199% |
| Edge Computing | $6.4B | - | +10% | +29% |
| Q2 FY2027 指引 | $91.0B ±2% | ~$86B | +12% | - |
| Q2 毛利率指引 | 75.0% ±50bps | - | 持平 | - |
股东回报:
- 本季度回购 + 股息:$20B
- 新增回购授权:$80B
- 季度股息:$0.01 → $0.25(25 倍提升)
- 私人公司/基础设施基金投资:$18.6B(本季度)
重要背景: Q2 指引 $91B 不含中国数据中心收入,且公司预计因 H20 出口限制将产生约 $80 亿损失。Q1 GAAP 数据包含了约 $55 亿的 H20 库存减记。
历史营收趋势:增速曲线的位置
| 季度 | 总营收 | QoQ | YoY | 数据中心 | 网络 | 毛利率(NG) |
|---|---|---|---|---|---|---|
| Q1 FY25 | $26.0B | - | - | $22.6B | - | 78.4% |
| Q2 FY25 | $30.0B | +15% | +122% | $26.3B | - | 75.7% |
| Q3 FY25 | $35.1B | +17% | +94% | $30.8B | - | 75.0% |
| Q4 FY25 | $39.3B | +12% | +78% | $35.6B | $11.0B | 73.5% |
| Q1 FY26 | $44.1B | +12% | +69% | $39.1B | - | 73.8% |
| Q2 FY26 | $51.0B | +16% | +70% | $45.2B | - | 75.1% |
| Q3 FY26 | $60.9B | +19% | +94% | $53.7B | - | 74.6% |
| Q4 FY26 | $68.1B | +12% | +73% | $60.9B | $10.9B | 73.0% |
| Q1 FY27 | $81.6B | +20% | +85% | $75.2B | $14.8B | 75.0% |
趋势解读:
-
YoY 增速在 Q1 FY27 重新加速。 从 Q4 FY25 的 78% 逐步下降到 Q1 FY26 的 69% 后,YoY 增速在 Q2 FY26 开始重新上升,Q1 FY27 达到 85%。这说明 AI 基础设施需求在经历了短暂的"增速正常化"后,进入了第二轮加速——驱动力从"训练"转向"训练 + 推理 + Agentic AI"。
-
毛利率在 75% 附近企稳。 从 Q1 FY25 的 78.4% 下降到 Q4 FY26 的 73.0% 后,Q1 FY27 回升到 75.0%。这个 V 形反弹的原因是 Grace Blackwell 系统的 ASP 较高,以及网络收入占比提升带来的产品组合改善。
-
网络收入的爆发式增长。 从 Q4 FY25 的 $11.0B 到 Q4 FY26 的 $10.9B,网络收入似乎"停滞"了——但 Q1 FY27 突然跳升到 $14.8B(+35% QoQ,+199% YoY)。这个跳升反映了 Grace Blackwell NVL72 大规模出货带来的 NVLink Switch 需求。
一、$81.6B 的背后:数字告诉了我们什么
1.1 超指引上线的质量分析
NVIDIA 连续七个季度超出华尔街共识,这一次 beat 幅度约 3%($81.6B vs $78.8-79.2B)。表面看,这是一个"常规 beat"——但对于一个季度营收已经接近千亿美元规模的公司来说,3% 的超预期意味着约 $2.5B 的额外收入,这比很多中型半导体公司一整年的营收还多。
但更值得分析的是 beat 的结构。
计算收入 $60.4B(YoY +77%)——增速低于数据中心整体增速(+92%),说明计算收入的增速在"正常化"。Grace Blackwell 的产能爬坡已经进入稳定期,不再有上一季度那种"产能受限带来饥渴感"的溢价效应。
但"正常化"不等于"放缓"。$60.4B 的单季计算收入意味着年化约 $242B——这仍然是一个令人眩晕的数字。考虑到 Vera Rubin 的 ASP 可能比 Grace Blackwell 更高(因为包含 Vera CPU + 更多 NVLink 组件),计算收入在 Q3-Q4 FY27 可能再次加速。
网络收入 $14.8B(YoY +199%,QoQ +35%)——这是整个财报中最被低估的数字。网络收入单季 $14.8B,意味着年化超过 $59B。如果单独拆出来,NVIDIA 的网络业务规模已经超过了大多数独立半导体公司的整体营收。更重要的是,199% 的同比增速说明:NVLink 和 Spectrum-X 正在从"免费搭售"变成"独立定价"的利润中心。
Edge Computing $6.4B(YoY +29%)——增速相对温和,但考虑到 Edge 业务的基数已经不小,29% 的增长依然健康。这部分业务包括自动驾驶(DRIVE Thor)、机器人(Isaac)和边缘 AI 推理。值得注意的是,Edge 业务不受中国出口限制的直接影响(主要客户是欧美汽车和工业公司),未来几个季度可能成为中国断供损失的"缓冲垫"。
EPS $1.87(YoY +140%)——EPS 增速远高于营收增速(+85%),说明运营杠杆在持续发挥作用。NVIDIA 的运营费用增速远低于营收增速——这是"平台公司"的典型特征:一旦基础设施(CUDA、软件栈、客户关系)建好,每一美元额外收入的边际利润率极高。
1.2 数据中心 $75.2B 的拆解:计算 vs 网络
| 细分 | Q1 FY27 | 占数据中心比 | YoY 增速 |
|---|---|---|---|
| 计算 | $60.4B | 80.3% | +77% |
| 网络 | $14.8B | 19.7% | +199% |
网络的占比从一年前的约 13% 提升到接近 20%。这个趋势只会加速——因为 Grace Blackwell NVL72 和即将到来的 Vera Rubin NVL72 都极度依赖 NVLink 互联,单机柜的 NVLink Switch 数量在持续增长。
一个值得深思的数字: NVIDIA 的网络业务如果按 Q1 年化计算($59B),已经接近甚至可能超过 Arista Networks(市值约 $120B,年营收约 $70 亿)的 8 倍以上。NVLink 正在成为 NVIDIA 最被低估的护城河——它不仅是技术优势,更是一个独立的利润中心。
另一个被忽视的角度: 网络收入的增长不仅仅是"更多 NVLink Switch"。它也包含了 Spectrum-X 以太网交换机和 ConnectX 网卡的贡献。随着 AI Cloud 提供商(CoreWeave、Lambda 等)大规模建设新数据中心,它们需要从零开始构建网络基础设施——这为 Spectrum-X 创造了巨大的增量需求。
1.3 新报告结构:Hyperscale $38B vs ACIE $37B
CFO Colette Kress 在电话会上首次披露了数据中心收入按客户类型的拆分:
- Hyperscale(超大规模云服务商): ~$38B,占数据中心收入约 50.5%
- ACIE(AI Clouds / Consumer Internet / Enterprise): ~$37B,占数据中心收入约 49.5%
这个拆分意义重大,值得逐条分析。
第一,客户集中度低于预期。 Hyperscale 占比"只有"约一半,意味着 NVIDIA 的客户基础比外界想象的更加分散。市场一直担心 NVIDIA 过度依赖少数几个超大规模客户(Microsoft、Google、Meta、Amazon),但 ACIE 板块——包括 CoreWeave、Lambda、NEBIUS 等 AI Cloud 公司,加上各类消费互联网和企业客户——贡献了几乎等量的收入。这降低了"单一客户流失"的风险。
第二,AI Cloud 的崛起速度惊人。 CoreWeave 作为 NVIDIA 的前两大客户之一(GTC 2026 上 Jensen 亲口确认),代表了一种新型的"中间层"客户:它们不直接开发自研 ASIC,而是依靠 NVIDIA 全栈方案来提供 AI 算力服务。这类客户的粘性远高于 Hyperscale——因为它们没有足够的规模和人才来走自研路线。CoreWeave 的商业模式就是"NVIDIA 算力的转售商",它与 NVIDIA 的利益完全一致。
第三,ACIE 中的 Consumer Internet 公司(Meta、字节跳动等)的份额。 虽然这些公司也在开发自研芯片(Meta 的 MTIA v3),但它们的自研进度落后于 Google,短期内对 NVIDIA 的依赖仍然很强。Meta 在 FY27 的 CapEx 指引约为 $60-65B,其中大部分用于 AI 基础设施——这块钱有相当比例流向 NVIDIA。
第四,Hyperscale 与 ACIE 的接近平衡,为 NVIDIA 提供了某种"议价权缓冲"。 当 Microsoft 或 Google 威胁要用自研 TPU/ASIC 替代 GPU 时,NVIDIA 可以把产能转向 AI Cloud 和企业客户。这种缓冲在半导体上行周期中尤其有价值——因为产能始终紧张,NVIDIA 不愁卖不出去。
但也要看到风险: ACIE 板块中的 AI Cloud 公司(如 CoreWeave)本身财务脆弱。如果 AI 推理的商业化回报不及预期,这些公司可能面临债务压力——这将直接影响 NVIDIA 的收入质量。NVIDIA 本季度投资 $18.6B 于私人公司和基础设施基金,部分原因是为了"绑定"这些 AI Cloud 客户,但这也增加了 NVIDIA 的信用风险敞口。
1.4 GAAP vs Non-GAAP: The Real Impact of the $5.5B Write-down
Before diving into gross margin analysis, it is worth clarifying the GAAP vs Non-GAAP differences in Q1:
| Metric | GAAP | Non-GAAP | Difference | Source |
|---|---|---|---|---|
| Gross Margin | ~73.5% | 75.0% | -1.5ppt | H20 inventory write-down |
| Net Income | $42.96B | ~$45B+ | -$2-3B | Write-down + stock-based comp |
| EPS | $1.76 | $1.87 | -$0.11 | Same as above |
GAAP net income of $42.96B ($1.76/share) vs prior year $18.8B ($0.76/share), YoY growth of +129%. Even after the $5.5B H20 write-down, NVIDIA's GAAP profit growth is historic.
The $5.5B write-down reflects H20 chips already manufactured or on order before the export license requirement was imposed. These chips can no longer be sold to Chinese customers.
The $8B Q2 loss projection is not a write-down but rather foregone revenue. NVIDIA could have sold these chips to China, but now cannot. The Q2 guidance of $91B already excludes this $8B, meaning the true global demand figure is closer to $99B.
This is a critical insight: NVIDIA's Q2 guidance of $91B actually implies non-China global demand of approximately $99B, which is even stronger than the headline number suggests.
1.5 毛利率 75% 的可持续性分析(含历史走势)
NVIDIA 的 Non-GAAP 毛利率连续多个季度维持在 73-76% 区间,Q1 为 75.0%,Q2 指引也是 75.0% ±50bps。
维持 75% 毛利率的三个支撑因素:
因素一:产品组合持续高端化。 Grace Blackwell NVL72 系统的 ASP 远高于上一代 Hopper,而 NVLink 网络组件的毛利率通常高于纯 GPU 计算。NVIDIA 正在从"卖芯片"转向"卖系统"——系统级方案的定价权远高于裸芯片,因为系统的替换成本更高。一个已经部署了 Grace Blackwell NVL72 的客户,不可能轻易换到 AMD MI400 或 Google TPU——因为整个软件栈(CUDA + Dynamo + NemoClaw)和运维体系都需要重写。
因素二:软件绑定效应。 CUDA 生态、Dynamo 推理引擎、NemoClaw Agent 平台——这些软件栈使得客户难以进行同类替代(apples-to-apples 替代),从而支持了 NVIDIA 的定价权。当一个客户在 CUDA 上训练了模型、用 Dynamo 做推理优化、用 NemoClaw 部署 Agent——换到 AMD 的成本不仅是硬件更换,而是整个软件栈的重构。这种"生态锁定"允许 NVIDIA 在硬件上维持溢价。
因素三:产能受限带来的"选择性销售"。 当需求远大于供给时,NVIDIA 可以优先满足高毛利客户和产品组合。Vera Rubin 的产能爬坡预计将持续整个 FY27,这意味着至少在未来 4-5 个季度内,NVIDIA 仍然处于"卖方市场"。在卖方市场中,毛利率天然得到保护。
毛利率面临的三个风险:
风险一:客户自研 ASIC 的长期替代效应。 一旦 Google 的 TPU JV 开始运营(预计 2027 年初 500MW 产能上线),NVIDIA 在 Google 数据中心的份额可能下降。Google 可能会要求更低的价格来维持与 NVIDIA 的关系——或者干脆减少 NVIDIA GPU 的采购量。类似地,Amazon 的 Trainium 3 已经在某些推理工作负载上实现了与 NVIDIA GPU 相当的性能/成本比。
风险二:网络收入占比提升的毛利率效应不明确。 虽然网络收入增速快,但 NVLink Switch 和 Spectrum-X 交换机的毛利率特征不同于 GPU。NVLink Switch 不需要昂贵的 HBM,但需要大量高速 SerDes 和先进的封装技术——这些也有成本。如果网络收入的毛利率低于 GPU,那么网络收入占比提升反而可能拉低整体毛利率。
风险三:地缘政治风险的财务冲击。 H20 出口限制导致的 $55 亿库存减记和 $80 亿收入损失,已经在 Q1 的 GAAP 数据中体现(GAAP 净利润 $42.96B,GAAP 毛利率约 73.5% vs Non-GAAP 的 75.0%)。如果未来出口限制扩展到更多国家(如中东某些国家),类似的减记可能再次发生。
我的判断: 75% 的毛利率在中期(FY27-28)是可持续的,但长期(FY29+)面临下行压力。关键变量有两个:
-
Grace Blackwell Ultra 和 Vera Rubin 的定价走势。 如果 NVIDIA 继续以"系统级方案"(GPU + NVLink + Vera CPU + 软件)而非"裸芯片"的方式销售,毛利率可以维持甚至提升。系统级方案的定价权远高于裸芯片。
-
推理市场的竞争格局。 推理对 GPU 的粘性低于训练——因为推理不需要 CUDA(任何兼容的推理框架都可以)。如果客户自研 ASIC 在推理市场取得突破,NVIDIA 的推理定价权将被侵蚀,这将拉低毛利率。
一个值得关注的数字: NVIDIA 的 Q2 毛利率指引是 75.0% ±50bps——在损失中国市场(通常毛利较低)的情况下,毛利率没有上升反而持平。这意味着 NVIDIA 在非中国市场的定价可能面临一定压力,或者网络收入占比提升的稀释效应已经开始显现。
二、Vera Rubin:比 Grace Blackwell 更成功的起点
2.1 Jensen 的原话分析
Jensen Huang 在电话会上对 Vera Rubin 的措辞值得逐字分析:
"Vera Rubin is off to a tremendous start." "It will be even more successful than Grace Blackwell." "It will be constrained throughout its entire life."
这三句话释放了三个不同的信号:
"Tremendous start"——确认 Vera Rubin 已经进入全量产阶段(CES 2026 上 Jensen 亲口宣布"full production")。Microsoft 和 CoreWeave 将是首批部署客户。部分合作伙伴已经开始在 Vera Rubin 系统上运行下一代 AI 模型。这是 Jensen 第一次用"tremendous"来形容一个新产品线的开局——他对 Grace Blackwell 的形容是"off to a great start"。
"More successful than Grace Blackwell"——这是一个极为大胆的预测。Grace Blackwell 是 NVIDIA 历史上最成功的产品之一,Q1 FY27 的数据中心收入几乎完全由 Blackwell 驱动。Jensen 预测 Vera Rubin 将超越这一成绩,意味着他对需求曲线的判断是——AI 工厂的扩张才刚刚开始。
"Constrained throughout its entire life"——这是最重要的信号。Jensen 在说 Vera Rubin 从投产到退市的整个生命周期内,需求都会大于供给。这不是营销话术,而是基于他对客户订单和产能规划的真实判断。如果你把这句话和 NVIDIA 在 Q1 同时宣布的 $80B 新增回购授权放在一起看——管理层有极高信心在未来几个季度持续产生超额现金流。
额外的信号: Jensen 还在电话会上说了一句——
"The buildout of AI factories — the largest infrastructure expansion in human history — is accelerating at extraordinary speed."
如果把 Jensen 的所有措辞串联起来,他的叙事是:AI 工厂的建设规模是"人类历史上最大",需求增速是"extraordinary",Vera Rubin 的生命周期需求将始终大于供给。这是一个极度乐观的判断——但考虑到 NVIDIA 连续七个季度 beat 共识,Jensen 的乐观至少到目前为止是被数据验证的。
2.2 130 万组件、72 GPU + 36 CPU 的交付挑战
Vera Rubin NVL72 是一个极其复杂的系统:
- 130 万个独立组件——相比 Grace Blackwell NVL72 的约 60 万组件,复杂度翻倍以上。
- 72 颗 Rubin GPU + 36 颗 Vera CPU——这是 NVIDIA 第一次在同一个机柜中同时部署自研 GPU 和自研 CPU。
- 336 亿晶体管的 Rubin GPU——单颗芯片的计算密度达到了新高度。
- HBM4 内存——每颗 Rubin GPU 配备 288GB HBM4,带宽 22 TB/s。单个 NVL72 系统的 HBM 总量超过 20TB。
- NVLink 6 互联——3.6 TB/s 的 GPU 间带宽,比 NVLink 5 有质的飞跃。
- ICMS 存储——每个 NVL72 需要 1,152 TB 的 NAND 存储,可能对全球 NAND 供给产生压力。
交付挑战的核心在于"系统级复杂性":
Grace Blackwell 的产能爬坡花了一个多季度才进入稳定期,期间经历了"液冷散热设计调整"和"NVLink 互联调试"等问题。Vera Rubin 的复杂度远超 Grace Blackwell,交付挑战只会更大。
具体来说,Vera Rubin 的交付面临以下几个关键挑战:
挑战一:液冷散热。 72 颗 Rubin GPU + 36 颗 Vera CPU + 36 个 NVLink Switch 的总功耗可能超过 120kW/机柜。Grace Blackwell NVL72 的功耗约 100-120kW,Vera Rubin 可能更高。这需要数据中心具备直接液冷(direct-to-chip liquid cooling)能力——而目前全球具备这种能力的数据中心比例仍然很低。
挑战二:HBM4 供应。 Rubin GPU 使用 HBM4(而非 Grace Blackwell 的 HBM3e)。HBM4 是新一代高带宽内存,SK Hynix 和 Samsung 都在产能爬坡中。如果 HBM4 供应紧张,Rubin GPU 的出货量将受限——这可能是 Jensen 说"constrained throughout its entire life"的一个重要原因。
挑战三:130 万组件的系统集成。 130 万个独立组件意味着供应链管理、质量控制和现场部署的复杂性呈指数级增长。任何一个组件的延迟或缺陷都可能导致整个系统的交付延迟。
挑战四:ICMS 存储对 NAND 供给的影响。 每个 NVL72 需要 1,152 TB 的 NAND 存储(约 1.1 PB)。如果 NVIDIA 在 FY27 下半年出货数千套 NVL72 系统,NAND 需求量将达到数 EB 级别——这可能对全球 NAND 供给产生可感知的压力,推高 NAND 价格。
但 NVIDIA 在 Grace Blackwell 的爬坡中学到了重要经验:
- 液冷散热系统——Vera Rubin 全面采用液冷,需要与数据中心的冷却基础设施深度集成。NVIDIA 正在与数据中心运营商紧密合作,提前规划液冷基础设施。
- 供应链垂直整合——NVIDIA 正在与 Coherent、Corning、Lumentum 等光互联厂商签订战略协议,确保光模块供应。与 SK Hynix 和 Samsung 的 HBM4 供应协议也在提前锁定。
- 系统集成合作伙伴——从"卖芯片"转向"卖系统",NVIDIA 需要更强的系统集成能力。NVIDIA 正在扩大其专业服务团队,帮助客户部署和维护 NVL72 系统。
我的判断: Vera Rubin 的初期交付(H2 2026)大概率会出现延迟和产能瓶颈,这几乎是确定性事件。但 Jensen 说"constrained throughout its entire life"意味着——即使延迟,客户的等待意愿依然很强。在 AI 基础设施的军备竞赛中,没有客户愿意等下一代产品。
对投资者的影响: Vera Rubin 的交付延迟不一定是负面信号——因为"延迟"意味着"需求大于供给",这本身就支持了高定价和高毛利率。真正需要担心的是"质量问题"——如果 NVL72 在客户现场出现大规模故障,那才是实质性的风险。
2.3 与 Grace Blackwell 产能爬坡对比
| 指标 | Grace Blackwell | Vera Rubin |
|---|---|---|
| 首次公布 | GTC 2024.03 | CES 2026.01 |
| 全量产时间 | Q4 FY2025 | Q1-Q2 FY2027 |
| 从公布到量产 | ~9 个月 | ~6 个月(加速) |
| 初期产能 | 有限,快速爬坡 | 预计更紧张 |
| 主要客户 | Microsoft、Meta、Google | Microsoft、CoreWeave(首批) |
| 单系统组件数 | ~60 万 | ~130 万 |
| GPU 架构 | Blackwell B200/B300 | Rubin R100 |
| CPU 搭配 | Grace(ARM v9) | Vera(ARM v9,自研) |
| 内存 | HBM3e | HBM4 |
| 互联 | NVLink 5 | NVLink 6 |
| 单 GPU 带宽 | 1.8 TB/s | 3.6 TB/s |
NVIDIA 明显在压缩产品周期——从 Grace Blackwell 的 9 个月缩短到 Vera Rubin 的约 6 个月。这种加速既是竞争优势(保持技术领先),也是风险来源(更短的验证周期可能导致更多初期问题)。
一个值得注意的细节: Vera Rubin 的首批客户从 Google、Meta 变成了 Microsoft、CoreWeave。这可能反映了 Google 正在将更多资源转向自研 TPU(Blackstone JV),而 Meta 的 MTIA v3 也在逐步成熟。NVIDIA 的核心客户群正在从"Hyperscale 为主"转向"Hyperscale + AI Cloud 并重"。
2.4 10x 性能/瓦特的实际含义
NVIDIA 声称 Vera Rubin 相比 Grace Blackwell 在推理成本上有约 10x 的改善。这个数字需要拆解:
- 计算性能: Rubin GPU 的 FLOPS 大约是 Blackwell 的 2.5-3x。
- 内存带宽: HBM4 的带宽提升约 2x(22 TB/s vs 12 TB/s)。
- 系统级优化: NVLink 6(3.6 TB/s vs 1.8 TB/s)+ Vera CPU + Dynamo 1.0 的组合优化贡献了剩余的效率提升。
- "10x 推理成本" 更多是一个系统级指标,包含了推理引擎(Dynamo)的优化、网络带宽的提升和 CPU-GPU 协同计算的效率。
实际含义: 如果 NVIDIA 能兑现 10x 推理成本下降的承诺,那么每 token 的计算成本将从"便宜"变成"几乎可以忽略"。这将直接推动 AI 的商业化落地——从"实验性部署"变成"大规模生产部署"。
10x 的商业意义可以量化:
假设 Grace Blackwell 的推理成本是每百万 token $0.15(大约是 2025 年底的市场价格),那么 Vera Rubin 的推理成本将是每百万 token $0.015。在这个价格水平上:
- 一个每天处理 10 亿 token 的 AI 服务,推理成本从 $150,000/天降到 $15,000/天
- 年化推理成本从 $5,475 万降到 $547.5 万
- 这使得 AI 的推理成本不再是一个需要"优化"的问题,而是一个可以"忽略"的运营开支
如果这个 10x 降本是真实的,它将从根本上改变 AI 的商业模式。 今天很多 AI 应用之所以"不赚钱",核心原因是推理成本太高。如果推理成本降低一个数量级,那么 AI 应用的盈利模型将从"亏损换增长"变成"健康的软件利润率"。
三、Vera CPU:NVIDIA 打开的 $2000 亿新战场
3.1 为什么 CPU 在 Agentic AI 时代重新重要
Jensen Huang 在电话会上花了大量时间讲 Vera CPU,这绝非偶然。他的核心论点是:
"AI 的'思考'部分使用 GPU,但 Agent 的执行主要在 CPU 上运行。Agent 使用 CPU 来完成被分配的任务,而且将来会有专门为 Agent 设计的 CPU 驱动 PC。"
这个论点的技术基础是:
1. Agentic AI 的工作负载分布。 一个 AI Agent 的生命周期包括:感知(接收输入)→ 推理(调用 LLM,GPU 密集)→ 规划(逻辑推理,CPU 密集)→ 执行(调用工具、API、文件操作,CPU 密集)→ 反馈(回到感知)。
Agent 80% 以上的运行时间实际上是在 CPU 上执行的。
为什么?因为 Agent 的大部分工作不是"生成 token"(GPU 的强项),而是"调用工具"和"编排任务"(CPU 的强项)。一个典型的 Agent 工作流:
- 接收用户请求(网络 I/O,CPU)
- 调用 LLM 生成初步回答(GPU,持续几百毫秒到几秒)
- 调用搜索引擎获取信息(网络 I/O,CPU)
- 调用 LLM 基于搜索结果生成最终回答(GPU)
- 将结果写入文件或发送邮件(文件 I/O 和网络 I/O,CPU)
- 记录审计日志(数据库 I/O,CPU)
在这个工作流中,GPU 只被调用了两次,而 CPU 贯穿整个生命周期。随着 Agent 的复杂度增加(多步推理、多工具调用、多 Agent 协作),CPU 的工作负载占比只会越来越高。
2. Token 处理成为 CPU 的核心任务。 Vera CPU 是"世界上第一款专为 Agentic AI 设计的 CPU"——它的设计核心是尽可能快地处理 token。在 Agent 的推理-执行循环中,CPU 需要不断地将 token 在 GPU 和 CPU 之间搬运、格式化、路由。传统 x86 CPU 在这一任务上效率低下,因为它们的设计初衷是通用计算(数据库、Web 服务器、虚拟化),而非高速 token 处理。
Vera CPU 的 88 个 Olympus 核心,IPC(每时钟周期指令数)提升了 1.5x,单线程性能号称是市场上最快的。这意味着在 token 路由和编排任务上,Vera CPU 可以比 Intel Xeon 或 AMD EPYC 快 50-100%。
3. Agent 需要自己的"PC"。 Jensen 预测未来每个 Agent 都需要一台专用的计算设备——不一定是传统意义上的 PC,但需要 CPU + 内存 + 网络的独立计算单元。这是一个全新的需求类别。
这个预测的背景是:当前大多数 AI Agent 运行在共享的服务器集群上,通过容器或虚拟机来隔离。但如果 Agent 需要长期运行("always-on assistant"),并且需要访问大量本地数据和工具,那么共享集群的效率会降低——因为资源争抢和隔离成本。专用 CPU rack 可以为每个 Agent(或 Agent 团队)提供独立的计算环境,提高执行效率和安全性。
3.2 $200 亿今年目标 vs Intel/AMD 现有市场
Jensen 在电话会上声称:
"Vera opens an entirely new TAM of $200 billion for Nvidia — a market that didn't exist before." "Approximately $20 billion worth of Vera CPUs have already been sold so far this year."
$2000 亿 TAM 的含义: 这个数字几乎等于全球服务器 CPU 市场的总规模。Jensen 不是在说 Vera CPU 会替代所有 x86 服务器——他是在说 Agentic AI 创造了一个全新的 CPU 需求类别,这个类别的规模可能与整个传统服务器 CPU 市场等量齐观。
$200 亿已经售出: 这个数字可信度较高,因为 Vera CPU 可以独立销售(Vera CPU Rack = 256 颗液冷 CPU 的纯 CPU 机柜),也可以与 Rubin GPU 捆绑销售(Vera Rubin NVL72 = 72 Rubin GPU + 36 Vera CPU)。考虑到 NVIDIA 本季度数据中心计算收入 $60.4B 的规模,其中 $20B 来自 Vera CPU 是合理的。
$200 亿在上下文中意味着什么?
对比一下:
- Intel 2025 年数据中心和 AI 集团(DCAI)全年营收约 $160 亿
- AMD 2025 年数据中心部门全年营收约 $130 亿
- NVIDIA 的 Vera CPU 在上市的第一个半年就达到了 $200 亿
这个数字如果是真实的,意味着 NVIDIA 在一个季度内的 CPU 收入就已经超过了 Intel 和 AMD 各自全年的数据中心 CPU 收入。 这是一个历史性的转折点——GPU 公司的 CPU 收入超过了 CPU 公司。
但要注意: $200 亿的"Vera CPU 已经售出"可能包含了捆绑销售中 Vera CPU 的价值分配。如果一台 Vera Rubin NVL72 的总价是 $X,NVIDIA 可能将其中 $Y 分配给 Vera CPU。这种内部定价方式使得"CPU 收入"的定义有一定的灵活性。
3.3 CPU-only rack 的战略意义
Vera CPU Rack 是 NVIDIA 产品线中最被低估的新品:
- 256 颗液冷 Vera CPU 在一个机柜中
- 6x CPU 吞吐量提升(vs 传统 x86 机柜)
- 2x Agentic AI 工作负载性能
CPU-only rack 的战略意义在于:
1. 降低客户门槛。 不是所有 AI 工作负载都需要 GPU。对于 Agent 的执行层、数据处理层、编排层,纯 CPU 机柜就够了。这让 NVIDIA 可以进入那些"不需要 GPU 但需要 AI CPU"的市场——比如传统企业的 IT 部门、中小型 AI 初创公司、以及只需要 Agent 执行能力(而非模型训练能力)的客户。
2. 扩大数据中心内的 NVIDIA 份额。 一个典型的 AI 数据中心可能在计算层(GPU rack)和网络层(NVLink/Spectrum-X)已经使用 NVIDIA,如果在 CPU 层也用 Vera,整个数据中心的 NVIDIA 渗透率将达到 90% 以上。这意味着客户的"去 NVIDIA 化"成本将从"更换 GPU"升级为"更换整个数据中心的计算层"。
3. 与 AWS Graviton 和 Google Axion 直接竞争。 AWS Graviton 和 Google Axion(ARM 架构服务器 CPU)正在侵蚀传统 x86 的份额。NVIDIA 用 Vera CPU 进入这个市场,比"保卫 GPU 阵地"更进一步的——它在说"整个数据中心的计算层都应该是 NVIDIA 的"。
4. 为"推理机柜"提供基础。 在 Agentic AI 时代,一个典型的数据中心可能有三种机柜:GPU 机柜(训练和推理)、CPU 机柜(Agent 执行和编排)、网络机柜(NVLink/Spectrum-X)。NVIDIA 已经在 GPU 机柜和网络机柜中占据主导地位,如果 CPU 机柜也用 Vera,那么 NVIDIA 将控制整个 AI 数据中心的所有计算层。
3.4 对 Intel 和 AMD 的实际冲击
从时间线看:
- 短期(FY27-28): 影响有限。Vera CPU 的主要客户是 NVIDIA 现有的 AI 基础设施客户,这些客户本来就不是 Intel/AMD 的核心目标。Intel 和 AMD 的传统 x86 市场(数据库、ERP、Web 服务器)不会因为 Vera CPU 的出现而立即萎缩。
- 中期(FY29-30): 影响开始显现。如果 Agentic AI 真的如 Jensen 预测的那样大规模落地,企业级客户可能开始用 Vera CPU 替代传统 x86 部署。特别是那些已经在使用 NVIDIA GPU 的客户——如果它们的 AI 机柜中已经用了 Vera CPU(作为 Rubin 的一部分),那么扩展到非 AI 工作负载的 CPU 也用 Vera 是一个自然的延伸。
- 长期(FY31+): 取决于软件生态。如果 OpenShell 和 NemoClaw 成功建立了 Agentic AI 的标准运行时环境,Vera CPU 将成为这一环境的最优硬件载体——就像 CUDA 让 GPU 成为 AI 训练的标准载体一样。但这个"长期"预测的假设前提是 Agentic AI 的大规模商业化落地——这是一个不确定的假设。
AWS/Meta 的 CPU 选择也将影响竞争格局。 AWS 已经在大力推广 Graviton(自研 ARM CPU),Meta 也在开发自己的 ARM 服务器 CPU。如果这些 Hyperscale 选择自研 CPU 而非 Vera CPU,NVIDIA 的 $2000 亿 TAM 将缩水。
风险提示: $2000 亿 TAM 的假设建立在 Agentic AI 大规模商业化的前提上。如果 Agent 的落地速度不及预期,Vera CPU 的 TAM 将大幅缩水。这是一个"if you build it, they will come"的赌注——NVIDIA 正在投入巨资构建硬件和软件基础设施,赌的是客户会来。
四、LPU:从"第七颗芯片"到"Niche Product"
4.1 Jensen 的原话分析
这是整场电话会中最值得反复品味的一段话:
"LPU is designed for low latency and high token rate, but its throughput is low. The use case for LPU is not broad. It will be a niche product for some time."
把这段话和两个月前 GTC 2026 上 Jensen 对 LPU 的高调宣传放在一起:
- GTC 2026(3 月): LPU 作为 Vera Rubin 平台的"第七颗芯片"隆重登场,Groq 3 LPU 由三星 4nm 代工,配备 512MB 片上 SRAM,计划 Q3 2026 出货。Jensen 将其定位为 Vera Rubin 推理加速器的"协同处理器",声称它能"在每一个 token 的每一层"提供加速。
- Q1 财报电话会(5 月): Jensen 主动将 LPU 降级为"niche product",明确承认其"throughput is low"和"use case is not broad"。
这两个时间点之间的反差,是 NVIDIA 在此财报中释放的最微妙信号。 Jensen 极少在公开场合对自己刚发布的产品做负面评价——尤其是在财报电话会这个面向投资者的场合。他选择在此时承认 LPU 的局限性,可能有两个原因:
-
管理预期。 Jensen 可能意识到,如果市场对 LPU 的期望过高("推理市场的革命性产品"),那么当 LPU 的实际贡献低于预期时,股价会受打击。提前降低预期是一种防御策略。
-
客户已经在用脚投票。 在 GTC 后的两个月里,NVIDIA 可能收到了主要客户对 LPU 实际价值的质疑。如果最重要的客户(Microsoft、Google、Meta)对 LPU 不感兴趣,Jensen 需要在投资者提问之前主动调整叙事。
4.2 与 GTC 2026 高调发布的反差
在 GTC 2026 上,NVIDIA 把 Groq 的 LPU 技术整合到 Vera Rubin 平台中,作为专门的"decode-phase co-processor"(解码阶段协处理器)。当时的外界解读是——NVIDIA 通过 $200 亿收购 Groq(2025 年 12 月完成),获得了低延迟推理的核心技术,这是对推理市场的一次重大押注。
NVIDIA 还在 GTC 上展示了 Groq LPX Rack——一个专用的 LPU 机柜,搭载 LP30 芯片(512MB SRAM,150 TB/s 带宽),计划由 Samsung 4nm 代工,Q3 2026 出货。这是 NVIDIA 第一次将非 GPU 架构的芯片作为核心产品线的一部分——被外界解读为 NVIDIA 对"推理专用芯片"市场的重大投入。
但 Jensen 在财报电话会上的措辞表明,NVIDIA 内部对 LPU 的定位已经发生了调整。从"核心组件"降级为"niche product",背后的原因可能包括:
1. 客户反馈不如预期。 在 GTC 后的两个月里,NVIDIA 可能收到了主要客户对 LPU 实际价值的质疑。对于拥有 Grace Blackwell NVL72 的大客户来说,额外的 LPU 加速器可能不是必需的——因为 Blackwell 本身的推理性能已经足够强。
2. Vera Rubin 本身的推理性能足够强。 如果 Vera Rubin + Dynamo 1.0 已经能实现接近 LPU 的推理延迟(对于大多数场景),那么额外的 LPU 加速器就显得多余。特别是 Dynamo 1.0 的"up to 7x"推理优化可能已经解决了大部分推理性能问题。
3. 成本效益分析。 LPU 依赖大量片上 SRAM(512MB/芯片),制造成本高,产出率低。在 Vera Rubin 的整体系统中,LPU 可能不是性价比最优的组件。NVIDIA 可能算了一笔账:把 LPU 的硅面积和成本花在更多的 Rubin GPU 或 NVLink Switch 上,可能对客户更有价值。
4.3 LPU 为什么不适合通用场景的技术原因
LPU(Language Processing Unit)的技术架构决定了它的适用范围有限:
1. SRAM 成本的天然限制
LPU 的核心优势在于片上 SRAM 提供的超高带宽(150 TB/s)。但 512MB 的 SRAM 在 4nm 工艺上占据了大量芯片面积——以三星 4nm 的密度计算,512MB SRAM 约占 200-250mm² 的芯片面积。这意味着 LPU 的制造成本与其实际提供的计算能力不成比例。
对比 Rubin GPU:Rubin GPU 虽然面积更大(约 2000mm² 以上),但它提供了 336 亿晶体管的通用计算能力 + 288GB HBM4 的巨大内存容量。从性价比角度看,GPU 的每美元计算能力远高于 LPU。
2. MoE 模型对 SRAM 容量的挑战
现代大语言模型越来越多地采用 Mixture of Experts(MoE)架构——包括 DeepSeek V4(1 万亿参数,激活约 370 亿参数)、GPT-5 系列等。MoE 模型的参数分散在多个 Expert 中,每个 token 只激活部分 Expert。这意味着 LPU 需要在 SRAM 中缓存所有 Expert 的参数——而 MoE 模型的总参数量可能达到万亿级别,远超 LPU 512MB SRAM 的容量。
对于 Dense 模型(如早期的 GPT-4),LPU 可以将整个模型或关键层加载到 SRAM 中,实现极低延迟推理。但对于 MoE 模型,LPU 的 SRAM 容量不够用,需要频繁从 HBM 加载数据——此时它的带宽优势就被抵消了。
一个简单的计算: 假设一个 MoE 模型有 128 个 Expert,每个 Expert 的大小约 8B 参数(2 bytes/参数 = 16GB)。128 个 Expert 的总参数量约 128 × 16GB = 2TB。LPU 的 SRAM 容量只有 512MB——连一个 Expert 的 3% 都存不下。在这种情况下,LPU 的 SRAM 优势完全消失。
3. 长上下文的带宽瓶颈
LPU 的设计假设模型参数可以常驻片上 SRAM。但在实际部署中,随着上下文长度(context length)从 128K 增长到 1M 甚至更长,KV Cache 的容量需求急剧增加。一个 1M 上下文的 KV Cache 可能需要 10-50GB 的存储——远超 LPU 的 512MB 片上存储能力。
这意味着 LPU 在处理长上下文时,仍然需要依赖外部内存(HBM 或 DDR)。此时它的带宽优势就被抵消了——因为瓶颈从"片上带宽"转移到了"外部内存带宽"。
4. 通用性的先天不足
GPU 之所以成为 AI 计算的标准载体,是因为它同时擅长训练和推理,同时擅长 Dense 和 MoE 模型,同时擅长短上下文和长上下文。LPU 只擅长一个特定场景:短上下文、Dense 模型的低延迟推理。这个场景虽然有价值(实时对话、代码补全),但不足以支撑一个独立的产品线。
总结: LPU 的技术架构在 2023-2024 年是先进的(当时主流模型是 Dense、短上下文),但在 2026 年的 MoE + 长上下文时代,它的适用范围已经显著缩小。NVIDIA 以 $200 亿收购 Groq 的时机可能已经错过了 LPU 技术的"最佳窗口期"。
4.4 对 Groq 收购的 ROI 反思
NVIDIA 在 2025 年 12 月以约 $200 亿的价格完成了对 Groq 的"acquihire"(人才+技术许可收购)。当时的逻辑是:Groq 的 LPU 技术可以补齐 NVIDIA 在低延迟推理上的短板。
Q1 财报电话会上的措辞变化暗示:这笔收购的 ROI 可能低于预期。
可能的原因:
1. $200 亿的价格过高。 Groq 在被收购前的估值约 $30-50 亿。NVIDIA 付了 4-6 倍的溢价,主要为了获取 Jonathan Ross(Groq 创始人,原 Google TPU 团队核心成员)和他的团队。但如果 LPU 被降级为 niche product,那么 Ross 和团队的核心技术价值也被相应降低。
2. 技术整合不如预期顺利。 Groq 的软件栈(基于其自有的编译器和调度器)与 NVIDIA 的 CUDA/Dynamo 生态整合需要更多时间。Groq 的编译器是为 Groq 的数据流架构(dataflow architecture)优化的,而 NVIDIA 的 GPU 是 SIMT 架构——两种架构的编程模型差异很大。
3. 市场定位被降级。 从"推理加速器"降级为"niche product"意味着 LPU 的收入贡献将远低于最初预期。如果 LPU 只是一个"特定场景的协处理器"而非"推理市场的主力产品",那么 $200 亿的投资回报周期将显著延长。
但也有积极的一面:
- 人才价值。 Jonathan Ross 和 Groq 团队仍然在 NVIDIA 内部,他们的芯片设计经验(特别是低延迟推理优化)可能被应用到未来的 GPU 或其他架构中。
- 技术储备。 LPU 的 SRAM 密集型设计可能在未来的产品中找到新的应用——比如用于 Agent 的 token 路由和缓存优化。
- 防御性收购。 即使 LPU 被降级,收购 Groq 也防止了它落入竞争对手手中(如 AMD 或 Intel)。这是一个"不买就输"的赌注——虽然赌注可能下大了。
对 Samsung 代工的意义: Groq 3 LPU 由 Samsung 4nm 代工,这是 NVIDIA 第一次将核心产品交给非 TSMC 代工。如果 LPU 被降级为 niche product,那么 Samsung 代工的战略重要性也相应下降。NVIDIA 的核心产品(Rubin GPU、Vera CPU、NVLink Switch)仍然由 TSMC 代工。
五、中国断供:$0 数据中心收入的 Q2
5.1 出口许可证要求的实际影响
2026 年 4 月,Trump 政府通知 NVIDIA,出口到中国及部分其他国家的芯片将需要申请出口许可证。这实际上禁止了 NVIDIA 向中国销售 H20 及其他数据中心芯片。
财务影响时间线:
- Q4 FY2026:$55 亿 H20 库存减记及采购承诺(部分在本季度 GAAP 数据中体现)
- Q1 FY2027:GAAP 净利润受 $55 亿减记影响($42.96B GAAP vs 更高的 Non-GAAP)
- Q2 FY2027:预计额外 $80 亿收入损失
- Jensen 原话:"In China, we have now dropped to zero"
历史背景——NVIDIA 中国市场的三年演变:
| 时间 | 政策变化 | NVIDIA 的应对 | 中国数据中心收入占比 |
|---|---|---|---|
| 2022 年 | A100/H100 出口限制 | 推出 A800/H800(降规版) | ~20-25% |
| 2023 年 | A800/H800 也被禁 | 推出 H20(进一步降规) | ~15-20% |
| 2025 年 4 月 | H20 也被禁止 | 无可降规的替代方案 | 快速下降 |
| 2026 年 Q1 | 全面出口许可证要求 | 中国收入归零 | ~0%(Q2 预期) |
关键数字: NVIDIA 在中国市场曾拥有约 95% 的 AI 芯片份额(2022 年前),年化收入约 $100-150 亿。这个市场在三年内从"核心收入来源"变成了"$0"。
一个值得注意的细节: Q2 指引 $91B 是"不含中国数据中心收入"的数字。这意味着,如果中国市场恢复(虽然概率极低),实际收入可能更高。但更重要的是——$91B 不含中国,意味着全球其他地区的需求强度被低估了。
5.2 Jensen 对中国市场的态度
Jensen 在电话会上和近期公开场合的措辞值得分析。
在电话会上:
"The Chinese government has to decide."
这句话的弦外之音是:NVIDIA 作为一家美国公司,在这个问题上没有选择权。Jensen 选择了将球踢给中国政府——暗示这是一个政治问题,而非商业问题。
但 Jensen 在接受美国"特别竞争研究项目"(Special Competitive Studies Project)采访时说得更加直接(2026 年 5 月初):
"我们在中国的业务现在已经完全停滞了。"("In China, we have now dropped to zero.")
Jensen 一直是华盛顿对华芯片限制最公开的批评者之一。他的核心论点是:限制只会加速中国发展自己的 AI 芯片产业,最终损害美国的长期利益。 他在多个场合重申了这个观点——包括在 2025 年接受采访时警告说,如果 NVIDIA 被禁止向中国销售芯片,"中国将不得不自己制造这些芯片——而他们会的。"
Jensen 的"中国焦虑"有其商业逻辑:
- 直接收入损失。 $80-150 亿/年的中国收入不是小数目——即使对 NVIDIA 来说。
- 长期生态风险。 中国开发者从 CUDA 迁移到华为 CANN/寒武纪 BANG 等本土框架后,即使制裁取消也不会回来。这是一个"不可逆"的生态转变。
- 全球南方市场的竞争。 如果中国的 AI 芯片生态成熟,它可能向中东、东南亚、拉美等预算敏感的市场输出——这些市场目前是 NVIDIA 的增量来源。
5.3 对华为昇腾、寒武纪等国产替代的加速效应
NVIDIA 中国归零的最大受益者是华为昇腾。
华为昇腾的现状(2026 年中):
- 产能: 2026 年计划生产约 60 万颗昇腾 910C,是 2025 年的两倍。总产品线产量目标 160 万片。
- 产品路线: 昇腾 950PR 已于 2026 年 Q1 推出,后续规划 960、970,性能逐代翻倍。
- 生态: DeepSeek V4 已经完成向昇腾 950PR 的大规模迁移,直接针对华为 CANN 架构进行代码重构。此外,寒武纪(思元 690)、海光、摩尔线程、壁仞、沐曦、昆仑芯、平头哥等 8 家国产 AI 芯片均已适配 DeepSeek V4。
- 集群方案: CM384 集群(384 颗昇腾 910C 全互联)在特定任务上可提供 300 PFLOPS BF16 算力(NVIDIA NVL72 的 1.7 倍),49.2 TB HBM 总量(NVL72 的 3.6 倍),但功耗是 NVL72 的近 4 倍。
- 市场预测: 华为预计到 2026 年将占据中国 AI 芯片约 50% 的份额。
关键洞察:华为的策略是"大力出奇迹"。
单颗昇腾 910C 的性能仍然落后于 NVIDIA Blackwell——但在系统层面,通过塞进更多的芯片、消耗更多的电力、使用更复杂的互联,华为可以在特定任务上接近甚至超越 NVIDIA 的性能。这个策略之所以可行,是因为中国有充沛且廉价的电力资源(煤炭与水电)。
CM384 vs NVL72 的技术对比:
| 指标 | NVIDIA NVL72 | 华为 CM384 | 比率 |
|---|---|---|---|
| GPU/CPU 数量 | 72 GPU + 36 CPU | 384 NPU | 5.3x |
| BF16 算力 | ~175 PFLOPS | ~300 PFLOPS | 1.7x |
| HBM 总量 | ~13.8 TB | 49.2 TB | 3.6x |
| 内存带宽 | ~864 TB/s | ~1,800 TB/s | 2.1x |
| 系统功耗 | ~145 kW | ~559 kW | 0.26x (华为更耗电) |
| 机柜数量 | 1 | 16 | 0.06x |
| 算力效率(W/PFLOPS) | ~0.83 kW/PFLOPS | ~1.86 kW/PFLOPS | 0.45x |
华为的系统在绝对性能(算力、内存容量、带宽)上超越了 NVIDIA,但代价是 4 倍的功耗和 16 倍的空间。这在电力和空间充裕的场景(如中国西部地区的数据中心)是可以接受的,但在电力紧张或空间有限的场景(如城市数据中心)则不可行。
DeepSeek V4 的迁移是一个里程碑事件。
DeepSeek V4 是中国在 2026 年推出的最先进的大语言模型(1 万亿参数,MoE 架构)。它完全运行在华为昇腾 950PR 上,彻底抛弃了 NVIDIA 的 CUDA 生态。这意味着:
- 算法-硬件协同优化已经成熟。 DeepSeek 团队花了数月与华为合作,针对 CANN 架构重写了底层代码。这不是简单的"移植",而是深度优化。
- "无卡可用"的压力催生了创新。 DeepSeek 在 2025 年初凭借 MLA(Multi-head Latent Attention)机制和极限算法压缩震惊硅谷——把训练成本打到了 OpenAI 的几十分之一。现在,同样的创新精神被应用到了硬件适配上。
- 生态正循环已经启动。 当最优秀的中国 AI 团队(DeepSeek)在国产芯片上成功训练和部署了最先进的模型,其他团队就有了明确的参考路径。这降低了"迁移到国产芯片"的心理门槛和技术门槛。
对 NVIDIA 的长期影响:
Jensen Huang 自己说得最好:
"美国硬生生逼出了一个有别于美国的完整硬件与软件栈。生态一旦建立并产生用户粘性,即便未来美国完全取消制裁,中国大厂也绝不会再轻易把核心底座交还给外企。"
这是 NVIDIA 中国市场面临的根本现实——即使制裁取消,中国客户也不会回来了。 过去三年的"国产替代"已经形成了不可逆转的生态惯性。
但这不意味着 NVIDIA 在全球市场会失守。 中国 AI 芯片的主要市场目前还是中国国内。向中东、东南亚和拉美等"全球南方"市场的扩展还需要时间。NVIDIA 在这些市场的优势——CUDA 生态、全栈方案、客户关系——仍然坚不可摧。
一个被忽视的风险: 如果中国的 AI 芯片生态成熟到可以向全球南方输出,那么 NVIDIA 将面临一个全新的竞争对手——它的价格可能只有 NVIDIA 的 1/3 到 1/2,虽然性能和软件生态有差距,但对预算敏感的市场可能"够用就好"。这是 Jensen 最大的"中国焦虑"——不是中国本身的市场,而是中国技术向第三国的扩散。
5.4 美国智库和 NVIDIA 管理层的判断
CSIS(美国战略与国际研究中心)的评估:
"美国的封锁不仅没有锁死中国,反而充当了最严酷的'自然选择'。它把中国 AI 军团硬生生逼上了'高效低耗、软硬协同'的另一条科技树分支,并在此刻枝繁叶茂。"
SemiAnalysis 的测算:
如果没有制裁,华为昇腾的年产能可以达到 500 万片以上,而目前被限制在 80-100 万片左右。中国 AI 实验室在前沿模型的长上下文训练稳定性、绝对算力密度上,依然存在客观差距——但差距正在快速缩小。
NVIDIA 管理层的应对: Jensen 在电话会上没有花太多时间讨论中国市场——可能因为他认为这是一个"已定价的风险"(priced-in risk)。市场已经知道中国收入归零,Q2 指引 $91B 也排除了中国。Jensen 更愿意把时间花在讨论 Vera Rubin 和 Vera CPU 的增长机会上——这些是他可以控制的事情。
5.4 NVIDIA 中国收入的历史演变
回顾 NVIDIA 中国数据中心收入从"核心市场"到"$0"的完整时间线:
| 时间 | 事件 | 中国在 NVIDIA DC 收入中的占比 | NVIDIA 的应对 |
|---|---|---|---|
| 2020-2022 | 无限制时期 | ~20-25% | 正常销售 A100/H100 |
| 2022.10 | A100/H100 出口限制 | 开始下降 | 推出 A800/H800(降规版) |
| 2023.10 | A800/H800 也被禁 | ~15-20% | 推出 H20(进一步降规) |
| 2024 | H20 持续销售 | ~10-15% | H20 定价较低 |
| 2025.04 | H20 也被禁止 | 急剧下降 | 无可降规的替代方案 |
| 2026.04 | 全面出口许可证要求 | 接近 0% | $55 亿库存减记 |
| 2026.Q2(预期) | 中国 DC 收人归零 | 0% | $80 亿收入损失 |
三年累计损失估算:
- 2022-2024:因出口限制导致的收入损失(降规版 vs 完整版的价差):~$30-50B
- 2025-2026:因 H20 禁令和全面断供导致的收入损失:~$100-150B
- 总计:~$130-200B 的潜在收入损失
这个数字在 NVIDIA 的历史语境中意味着:如果中国市场保持开放,NVIDIA 的 FY27 全年营收可能达到 $450-500B(而非 $385-400B)。中国市场的损失将 NVIDIA 的潜在增长率降低了约 15-20%。
5.5 特朗普政府"25% 税收"方案的分析
在全面断供之前,特朗普政府曾提出一个替代方案:允许 NVIDIA 和 AMD 将更高级的 H200 芯片卖给中国,前提是每卖一颗芯片要将 25% 的收入上交给美国国库。
这个方案的分析:
-
对 NVIDIA 的影响: 如果 H200 以 $30,000/颗的价格卖给中国客户,25% 的"税收"意味着 $7,500/颗上交美国政府。NVIDIA 的实际收入为 $22,500/颗——比不交税的情况少了 25%,但比完全不能卖要好。
-
对中国客户的影响: 如果 H200 加上 25% 税收后的实际成本为 $37,500/颗(假设 NVIDIA 将税收转嫁给客户),中国客户需要为同样的芯片多付 25%。考虑到 2023 年中国客户曾愿意为 H100 支付溢价 50% 以上,25% 的额外成本可能不会阻止购买。
-
为什么这个方案没有实施? 可能有以下原因:
- 美国国内政治压力("不应该卖任何先进芯片给中国")
- 中国政府的反应(可能拒绝接受这种"保护费"安排)
- 技术泄露的担忧(即使加了税收,H200 仍然可能被逆向工程)
Jensen 对这个方案的态度: 虽然没有公开表态,但 Jensen 可能倾向于接受这个方案——因为 25% 的税收总比 100% 的损失要好。但最终,全面断供成为了现实。
5.6 断供对中国 AI 产业的长远影响
短期影响(2024-2026): 混乱和调整期。中国企业被迫从 NVIDIA 生态迁移到国产替代方案,效率下降 30-50%。DeepSeek V4 的延迟发布可能部分归因于这种迁移。
中期影响(2026-2028): 国产生态成熟。华为昇腾、寒武纪等厂商的产品迭代加速,软件生态(CANN、BANG 等)逐步完善。DeepSeek V4 成功在昇腾上运行是一个里程碑。
长期影响(2028+): 中国可能形成一个完全独立的 AI 芯片生态——从硬件设计到制造(中芯国际等)到软件框架到模型训练。这个生态一旦成熟,将不再依赖任何美国技术——即使制裁取消,也没有理由回到 NVIDIA。
对全球 AI 格局的影响: 世界可能分裂为两个平行的 AI 生态系统——
- 美国/西方系统: 以 NVIDIA GPU + CUDA + Dynamo 为核心,覆盖北美、欧洲、日本、韩国等
- 中国系统: 以华为昇腾 + CANN 为核心,覆盖中国,并可能扩展到全球南方
这种分裂对 NVIDIA 的影响是深远的——它意味着全球 AI 芯片市场的"天花板"被永久性地降低了。如果中国市场(~25%)+ 全球南方(~10-15%)最终被中国生态覆盖,NVIDIA 的潜在市场将缩小约 35-40%。
六、竞争格局:客户变成对手
6.1 10-Q 文件中 NVIDIA 首次正式承认客户自研 ASIC 风险
在 Q1 FY2027 的 10-Q 文件中,NVIDIA 新增了两项风险披露:
- 客户自研 ASIC 竞争: "我们的一些最大客户正在开发或可能开发自己的 AI 加速器,这可能减少他们对 NVIDIA 产品的需求。"
- 客户争夺晶圆产能: "如果我们的客户同时也是我们的竞争对手,他们可能争夺相同的晶圆产能,影响我们的供给。"
这两条风险披露在之前的 10-K 和 10-Q 文件中从未出现过——它们的加入标志着 NVIDIA 管理层正式承认了"客户变对手"的结构性趋势。
第一条的触发因素是 Google(TPU + Blackstone JV)和 Amazon(Trainium 3)。 Google 和 Amazon 都是 NVIDIA 的大客户,同时也在积极开发自研 AI 芯片。当这些客户的自研芯片开始承担越来越多的推理工作负载时,NVIDIA 的收入增长将面临结构性压力。
第二条的触发因素更微妙。 NVIDIA 的客户(Google、Amazon、Apple 等)也是 TSMC 的大客户——它们在争夺相同的先进制程产能(3nm、2nm)。如果这些客户将更多产能用于自研芯片,NVIDIA 在 TSMC 的产能份额可能被压缩。这是一个"零和博弈"——在先进制程产能有限的情况下,客户自研芯片的每一片晶圆,都可能是 NVIDIA 的一片晶圆。
6.2 Google + Blackstone TPU JV:$50 亿股权投资
2026 年 5 月 18 日——NVIDIA 财报发布前两天——Blackstone 宣布与 Google 成立合资企业,投资 $50 亿股权建设 500MW 的 TPU 云数据中心,计划 2027 年上线。
这个 JV 的战略含义远超 $50 亿本身:
1. TPU 首次走向第三方销售。 Google 此前的 TPU 仅在 Google Cloud 内部使用。通过 Blackstone JV,TPU 将作为"compute-as-a-service"对外销售——这意味着 Google 正式进入 NVIDIA 的核心市场。Google Cloud CEO Thomas Kurian 表示:
"This joint venture with Blackstone helps meet growing demand for TPUs, which are optimized specifically for efficiency and performance in the AI era."
2. Blackstone 的角色。 Blackstone 是全球最大的另类资产管理公司(管理资产超 $1.3 万亿),也是全球最大的数据中心提供商。它带来的是资金和地产资源——TPU 数据中心需要大量的土地、电力和冷却基础设施。Benjamin Treynor Sloss 被任命为 JV 的 CEO,表明这是一个认真对待的商业项目。
3. 时间线: 2027 年上线 500MW 产能。500MW 的数据中心大约可以容纳 50,000-100,000 个 TPU——这相当于一个中等规模的 AI 训练集群。如果运营成功,Blackstone 计划"scale significantly over time"。
对 NVIDIA 的实际影响:
Google 一直是 NVIDIA 最大的客户之一。如果 Google 开始将 AI 工作负载从 GPU 迁移到自研 TPU,NVIDIA 的数据中心收入增速可能放缓。但需要注意几个缓冲因素:
- Google 的 GPU 使用量仍然在增长。 即使 TPU JV 上线,Google 在短期内的 GPU 需求依然强劲——特别是用于训练下一代 Gemini 模型。TPU 主要用于推理,而训练仍然以 GPU 为主。
- TPU 的软件生态仍然不如 CUDA。 Google 的 JAX/PyTorch/XLA 编译器栈虽然在 Google 内部使用良好,但对外部客户的吸引力有限——因为大多数 AI 开发者已经熟悉 CUDA。
- 500MW 的产能规模有限。 相比全球 AI 数据中心的数千兆瓦总规模,500MW 的 TPU 云只是沧海一粟。但如果 JV 成功并扩大规模,长期影响可能更大。
6.3 Cerebras 上市首日 $950 亿市值的信号
2026 年 5 月 14 日,Cerebras Systems 完成了 2026 年最大的 IPO:
- 发行价: $185/股,融资 $55.5 亿
- 首日收盘: $331.07/股,涨幅 68%
- 首日市值: $950 亿
- 合同积压订单: $246 亿(主要来自 OpenAI)
- 预计 2028 年营收: ~$55 亿
- 前瞻 P/S: ~17x
$950 亿市值传递了三个信号:
信号一:市场相信 AI 芯片的多元化。 投资者不再认为 NVIDIA 是唯一的 AI 芯片赢家。Cerebras 的晶圆级芯片(Wafer-Scale Engine)代表了一种与 GPU 完全不同的技术路线——而且有 OpenAI 这样的顶级客户作为背书。
信号二:OpenAI 对 NVIDIA 的依赖正在降低。 OpenAI 是 Cerebras 的最大客户($246 亿积压订单的主要来源)。如果 OpenAI 同时使用 NVIDIA GPU 和 Cerebras WSE,它对 NVIDIA 的议价权将增强。更重要的是,OpenAI 可能在未来将更多训练工作负载迁移到 Cerebras——这将直接影响 NVIDIA 的训练收入。
信号三:XPU 市场的 TAM 正在被重新定价。 Cerebras 预计 2028 年营收约 $55 亿,对应 $950 亿市值意味着约 17x 的前瞻 P/S。这个估值只有在市场相信 AI 芯片市场足够大、可以容纳多个玩家时才合理。Futurum Group 的分析指出,Cerebras 2028 年的 $55 亿营收只占预测中 XPU 总市场的约 3.4%——这意味着市场认为"3.4% 的份额就值 $950 亿"。
但第二天股价下跌——说明市场也在质疑。 Cerebras 的商业模式依赖于少数大客户(OpenAI 贡献了积压订单的大部分),客户集中度风险极高。如果 OpenAI 减少订单或转向其他供应商,Cerebras 的收入将大幅缩水。
6.4 "Frenemies" 格局对 NVIDIA 定价权和毛利率的长期影响
NVIDIA 面临的竞争格局正在从"纯竞争"变成"frenemies"(亦敌亦友):
| 客户/竞争者 | 自研芯片 | 与 NVIDIA 的关系 | 威胁级别 | 时间线 |
|---|---|---|---|---|
| TPU(Blackstone JV) | 最大客户之一,同时在推理市场直接竞争 | 高(中期) | 2027+ | |
| Amazon | Trainium/Inferentia | 大客户,AWS 也提供 NVIDIA GPU 实例 | 中 | 2026+ |
| Microsoft | Maia 100 | 最大客户,但自研芯片进度落后 | 低-中 | 2027+ |
| Meta | MTIA v3 | 大客户,自研芯片主要用于推理 | 中 | 2026+ |
| OpenAI | 通过 Cerebras 间接 | 核心客户,同时是 Cerebras 最大客户 | 中 | 2028+ |
| Cerebras | WSE-3/WSE-4 | 独立竞争者 | 中(长尾) | 2028+ |
| 华为昇腾 | 910C/950PR | 中国市场已归零,但可能向全球南方输出 | 中-高 | 2027+ |
长期影响的三个层面:
1. 定价权。 当 Hyperscale 客户有了替代方案(自研 ASIC 或 Cerebras),NVIDIA 的定价权将被侵蚀。最先受影响的是推理市场(inference),因为推理对 GPU 的粘性低于训练——推理不需要 CUDA,任何兼容的推理框架(如 vLLM、TensorRT-LLM)都可以在不同的硬件上运行。
2. 毛利率。 如果 NVIDIA 需要降价来保住客户份额,75% 的毛利率将面临压力。但短期内(FY27-28),由于 Vera Rubin 供不应求,NVIDIA 依然掌握定价权。真正的毛利率压力可能在 FY29+ 才会显现。
3. 客户关系的复杂性。 NVIDIA 需要"让客户离不开自己"(通过 CUDA 生态和全栈方案),同时不能"让客户太恨自己"(通过过度涨价)。这个平衡在未来几年将变得越来越难维持。Jensen 在公开场合总是强调"合作"和"赋能",但私下里,NVIDIA 的定价策略已经被一些大客户视为"垄断性溢价"——这是一个潜在的公关和政治风险。
6.5 Amazon、Microsoft、Meta 的自研芯片进展
除了 Google 之外,其他 Hyperscale 客户的自研芯片也在快速进展:
Amazon (AWS):
- Trainium 2 已经在 AWS 大规模部署,声称在某些推理工作负载上实现了与 NVIDIA GPU 相当的性能/成本比
- AWS 在 2026 年初与 Meta 签订了大型 Trainium 实例的合同——这是一个重要信号,表明 Trainium 不仅用于 AWS 内部工作负载,还开始吸引外部大客户
- Trainium 3(预计 2027 年)将进一步缩小与 NVIDIA GPU 的性能差距
- 对 NVIDIA 的风险:中等偏高。 AWS 是 NVIDIA 的大客户,但也在积极推广 Trainium 作为 NVIDIA GPU 的替代方案。Meta 选择 Trainium 实例是一个重要的市场验证
Microsoft:
- Maia 100 自研芯片的进度相对落后——据报道,Microsoft 在芯片设计上遇到了一些挑战
- Microsoft 仍然是 NVIDIA 最大的单一客户之一,Azure 的 AI 基础设施几乎完全基于 NVIDIA GPU
- 对 NVIDIA 的风险:低-中等。 Microsoft 的自研芯片进度落后于 Google 和 Amazon,短期内对 NVIDIA 的影响有限。但 Microsoft 有充足的资金和人才储备,长期来看一定会加速自研
Meta:
- MTIA v3(Meta Training and Inference Accelerator)主要用于推理工作负载
- Meta 在 2026 年的 CapEx 指引约 $60-65B,其中大部分用于 AI 基础设施——大部分仍将流向 NVIDIA
- 但 Meta 同时也在使用 AWS Trainium 实例(与 Meta 签订的合同),说明它在走"多供应商"策略
- 对 NVIDIA 的风险:中等。 Meta 的自研芯片主要影响推理市场,训练市场仍以 NVIDIA 为主
Apple:
- Apple 也在开发自研 AI 芯片(用于 Apple Intelligence 的服务器端推理),但目前规模较小
- Apple 的 CapEx 指引从 FY2026 的 ~$10B 大幅提升到 FY2027 的 ~$15-20B,其中大部分用于 AI 基础设施
- 对 NVIDIA 的风险:低。 Apple 的 AI 基础设施规模相对较小,且 Apple 更倾向于使用自研芯片而非第三方方案
总结: 四大 Hyperscale 的自研芯片进展不一——Google 最激进(TPU + Blackstone JV),Amazon 其次(Trainium 2/3 + Meta 合同),Meta 在追赶(MTIA v3 + 多供应商策略),Microsoft 最落后(Maia 100 延迟)。但所有主要客户都在朝同一个方向移动——减少对 NVIDIA 的单一依赖。这是一个不可逆的结构性趋势。
6.6 Broadcom 在 AI 芯片中的角色
在讨论客户自研 ASIC 时,不能忽视 Broadcom 的角色——它是大多数 Hyperscale 自研芯片的设计合作伙伴:
- Google TPU: Broadcom 参与了 TPU 的设计支持
- Meta MTIA: Broadcom 提供定制芯片设计服务
- 其他客户: Broadcom 正在与多家 Hyperscale 合作开发 AI 推理芯片
Broadcom 的模式是"为客户设计定制芯片"——它不直接与 NVIDIA 竞争,而是帮助 NVIDIA 的客户更快地开发自研芯片。这使得 Broadcom 成为了 NVIDIA 竞争格局中的一个"放大器"——它加速了客户从 NVIDIA GPU 向自研 ASIC 的迁移。
对 NVIDIA 的影响: Broadcom 的存在降低了客户自研芯片的门槛——即使客户没有深厚的芯片设计经验,也可以通过与 Broadcom 合作来快速推出自研芯片。这意味着自研 ASIC 的威胁可能比 NVIDIA 管理层预期的来得更快。
6.7 客户集中度风险的定量分析
根据 NVIDIA Q1 FY27 的数据,数据中心收入 $75.2B 中:
- Hyperscale(前四大客户:Microsoft、Google、Meta、Amazon)贡献约 $38B
- ACIE 贡献约 $37B
假设前四大客户各贡献约 $9-10B(平均),那么单一客户的收入集中度约为 12-13%。这是一个相对健康的水平——低于典型的"单一客户依赖"风险阈值(20%)。
但如果考虑计算收入($60.4B)而非整个数据中心收入,集中度可能更高。 因为网络收入($14.8B)通常由数据中心基础设施团队采购,不受单一客户的影响太大。如果把网络收入排除,前四大客户在计算收入中的集中度可能达到 50-60%——每个客户约 12-15%。
真正的风险不是"某一客户离开"——而是"多个客户同时开始用自研芯片替代"。 如果 Google 将 30% 的 GPU 工作负载迁移到 TPU,Amazon 将 20% 迁移到 Trainium,Meta 将 15% 迁移到 MTIA——NVIDIA 在 Hyperscale 市场可能损失 25-30% 的收入。这是一个中期(2028-2030)的风险。
NVIDIA 的应对策略: 通过 AI Cloud 客户(CoreWeave、Lambda 等)来分散 Hyperscale 风险。ACIE 板块已经贡献了约 50% 的数据中心收入——如果这个比例继续提升,NVIDIA 对 Hyperscale 的依赖将进一步降低。
七、网络:被低估的增长引擎
7.1 $14.8B 网络 revenue、199% YoY、35% QoQ
网络收入是 Q1 财报中最亮眼的数字之一:
| 指标 | Q1 FY27 | QoQ 变化 | YoY 变化 |
|---|---|---|---|
| 网络收入 | $14.8B | +35% | +199% |
| 年化运行率 | ~$59B | - | - |
| 占数据中心比 | 19.7% | +4.5ppt | +7ppt |
$59B 的年化运行率意味着: 如果 NVIDIA 的网络业务是一个独立公司,它将是全球最大的半导体公司之一——规模接近 AMD 全公司的营收(2025 年约 $280 亿)的两倍。
但网络收入的增长不仅仅来自 NVLink。 Q1 的 $14.8B 网络收入中,贡献来源包括:
- NVLink Switch(NVLink 5): Grace Blackwell NVL72 需要大量 NVLink Switch。随着 NVL72 出货量增加,NVLink Switch 的收入也在增长。
- Spectrum-X 以太网交换机: 用于 AI Cloud 提供商和企业级 AI 数据中心的以太网网络。
- ConnectX 网卡: 用于 GPU 服务器与网络之间的连接。
- InfiniBand(Quantum 系列): 用于传统 HPC 和高端 AI 训练集群。
7.2 NVLink 从"免费互联"到"利润中心"的转变
在 Hopper(H100)时代,NVLink 被视为 GPU 的附属品——客户购买 GPU 时"免费获得"NVLink 互联能力。但到了 Grace Blackwell 和 Vera Rubin 时代,情况发生了根本变化:
1. NVLink Switch 成为独立产品。 Grace Blackwell NVL72 需要 36 个 NVLink Switch,每个 Switch 都是一个复杂的芯片(包含 NVLink 交换芯片和大量高速 SerDes)。这些 Switch 不再是"赠送品",而是单独计价的组件。
2. 定价权来自技术垄断。 NVIDIA 在 NVLink 互联技术上几乎没有竞争对手。PCIe 的带宽远不够用(PCIe 6.0 的双向带宽约 256 GB/s,而 NVLink 6 是 3.6 TB/s,差距 14 倍)。其他互联方案(如 AMD 的 Infinity Fabric)的带宽也远低于 NVLink。没有替代方案,客户必须为 NVLink 付费。
3. 网络毛利率可能高于计算。 虽然网络组件的绝对售价低于 GPU,但 NVLink Switch 和 Spectrum-X 交换机的毛利率可能更高——因为它们的制造成本相对较低(不需要昂贵的 HBM),而定价权极强。
一个关键的计算: 假设一台 Grace Blackwell NVL72 的总价约 $3-4M,其中 NVLink Switch 的价值约占 20-30%($600K-1.2M)。如果 NVIDIA 出货 10,000 台 NVL72,仅 NVLink Switch 的收入就是 $6-12B——这解释了为什么网络收入在 Q1 突然跳升到 $14.8B。
7.3 Spectrum-X 以太网 vs InfiniBand 的路线选择
NVIDIA 在数据中心网络上有两条并行路线:
InfiniBand(Quantum 系列):
- 优势:超低延迟、超高带宽、天然适合 HPC 和大规模训练
- 客户:传统 HPC 用户和顶级 AI 实验室
- 定位:高端市场
- 代表客户:Stargate 项目(OpenAI + SoftBank)
以太网(Spectrum-X 系列):
- 优势:与现有以太网基础设施兼容、部署门槛低、成本更低
- 客户:企业级 AI、AI Cloud 提供商、大规模推理集群
- 定位:大众市场
- 性能:Spectrum-X 声称比标准以太网提升 1.6x 网络性能
- 代表客户:CoreWeave 等新建数据中心的 AI Cloud 提供商
NVIDIA 的双轨策略意味着: 无论客户选择哪种网络技术,NVIDIA 都能覆盖。这进一步巩固了 NVIDIA 在数据中心网络领域的垄断地位。
一个值得关注的趋势: Spectrum-X 的增长速度可能快于 InfiniBand。原因是 AI Cloud 提供商(如 CoreWeave、Lambda、NEBIUS)在建设新数据中心时,更倾向于使用以太网(因为运维人才更多、成本更低、兼容性更好)。随着这些 AI Cloud 公司的收入占比提升(ACIE 占 49.5%),Spectrum-X 的份额也会提升。
7.4 光互联投资(Coherent/Corning/Lumentum 战略协议)
在 Q1 FY2027,NVIDIA 与多家光互联公司签订了战略协议:
- Coherent: 提供光收发器和光模块,用于 NVLink 和 Spectrum-X 的长距离互联。
- Corning: 提供光纤和光缆,用于数据中心内部和数据中心之间的互联。
- Lumentum: 提供激光器和光子芯片,用于下一代光互联。
为什么光互联如此重要?
当 NVLink 的带宽达到 3.6 TB/s 时,铜缆互联在物理上已经接近极限(信号衰减、功耗、布线复杂度)。铜缆的有效传输距离约 1-2 米——这意味着 NVLink 只能在"机柜内"使用。要扩展到"跨机柜"和"跨数据中心",必须使用光互联。
光互联的战略意义在于:
-
解锁"多机柜"AI 训练。 当前最大的 AI 模型(万亿参数级)需要数千到数万颗 GPU 的集群。如果 NVLink 只能在机柜内使用(72 颗 GPU),那么跨机柜的通信就需要通过其他互联方式——这会成为瓶颈。光互联可以让 NVLink 突破机柜边界,实现跨机柜的高速通信。
-
"分布式 AI 工厂"的基础。 Jensen 多次提到"AI 工厂"的概念——但 AI 工厂不一定要集中在一个地点。如果光互联足够快,多个地理位置的 AI 工厂可以像一个虚拟的超级计算机一样协同工作。
-
新的收入来源。 光互联设备和服务的市场规模可能达到数百亿美元/年。如果 NVIDIA 通过战略投资和协议控制了光互联供应链,它将进一步扩大在数据中心基础设施中的份额。
7.5 网络竞争格局:NVIDIA 的优势与挑战
虽然 NVIDIA 在 AI 数据中心网络领域占据主导地位,但竞争格局也在变化:
NVIDIA 的三大优势:
-
NVLink 技术垄断。 没有任何竞争对手能提供 NVLink 级别的带宽(3.6 TB/s)。AMD 的 Infinity Fabric 带宽约 500 GB/s(仅 NVLink 的约 14%),Intel 的 UPI 带宽更低。在 GPU 间高速互联这个细分市场上,NVIDIA 没有真正的竞争对手。
-
全栈集成效应。 NVLink 与 NVIDIA GPU、Vera CPU 和 Dynamo 推理引擎深度集成。使用 NVIDIA 全栈方案的客户,网络性能可以发挥到极致——而使用第三方网络的客户,需要自己处理 GPU-网络之间的适配和优化。
-
Mellanox 的专利和人才。 NVIDIA 通过 2020 年以 $69 亿收购 Mellanox,获得了大量 InfiniBand 和高速网络的专利和工程人才。这些资产现在构成了 NVIDIA 网络业务的技术基础。
三个竞争与挑战:
-
Ultra Ethernet Consortium (UEC)。 一群网络公司(Arista、Broadcom、Cisco 等)正在推动"Ultra Ethernet"——一种面向 AI 工作负载优化的以太网标准。如果 UEC 成功建立了一套开放的高性能以太网标准,它可能成为 Spectrum-X 的替代方案——因为客户可能更倾向于使用开放的、多供应商的标准,而非 NVIDIA 的专有方案。
-
自研网络芯片。 Google 和 Amazon 都在开发自研的网络芯片(用于 TPU 和 Trainium 集群的互联)。如果这些芯片成熟并开始在第三方市场提供,它们可能减少对 NVIDIA 网络组件的依赖。
-
光互联的新进入者。 一些初创公司(如 Ayar Labs)正在开发全新的光互联方案——使用硅光子技术来实现芯片间的高速通信。如果这些技术成熟,可能在未来挑战 NVIDIA 的铜缆互联方案。
我的判断: 在短期(FY27-28),NVIDIA 在网络领域的地位不可撼动。但在中期(FY29+),随着 UEC 的成熟和自研网络芯片的进展,NVIDIA 的网络份额可能面临压力——特别是在以太网领域(Spectrum-X),因为以太网是一个更开放、竞争更激烈的市场。
7.6 Mellanox 收购的 ROI 回顾
回顾 2020 年 NVIDIA 以 $69 亿收购 Mellanox 的交易:
- 收购时(2020 年),Mellanox 年营收约 $14 亿
- Q1 FY27 网络收入 $14.8B(单季)= Mellanox 年营收的 10.6 倍
- 网络业务年化运行率 $59B = 收购价格的 8.6 倍
这笔收购的 ROI 已经超过了任何人的预期。 Jensen 在 2020 年看到的是:AI 计算的瓶颈不是单颗 GPU 的性能,而是 GPU 之间的通信速度。Mellanox 的 InfiniBand 和以太网技术解决了这个瓶颈——而解决瓶颈的价值随着 AI 集群规模的扩大而指数级增长。
这个故事和 CUDA 类似——Jensen 在 2006 年就开始投资 CUDA,当时 GPU 主要用于游戏。很多人质疑 NVIDIA 为什么要在"与游戏无关"的通用计算上投入巨资。但 15 年后,CUDA 成为了 AI 计算的标准平台——而 NVIDIA 在 CUDA 上的累计投资回报是数千倍。
Jensen 的战略模式: 在市场认识到需求之前,提前投资于"瓶颈解决技术"。Mellanox(网络)是 2020 年的例子。Groq(LPU)可能是 2025 年的尝试——但根据 Q1 电话会的措辞,这个尝试的成果可能低于预期。
八、软件护城河:Dynamo 1.0 + NemoClaw + OpenShell
8.1 Dynamo 1.0 的"up to 7x"加速对客户粘性的价值
NVIDIA 在 GTC 2026 上发布了 Dynamo 1.0——一个开源的 AI 推理操作系统:
- 核心功能: 管理 GPU 集群的推理工作负载,优化模型在多 GPU 之间的分配和调度。包括动态批处理、KV Cache 管理、前缀缓存优化等。
- 性能提升: 官方声称"up to 7x"推理加速(与未优化的基准相比)。
- 开源策略: Dynamo 1.0 是开源的,类似于 CUDA 早期的策略——通过开源降低使用门槛,然后通过生态绑定建立护城河。
- 与 NVIDIA 硬件的深度优化: 虽然 Dynamo 是开源的,但它对 NVIDIA GPU 的优化最深(利用 Tensor Core、NVLink、GPU Direct 等专有特性)。
"Up to 7x"的含义:
这个数字不是通用加速——而是在特定场景(如多轮推理、KV Cache 管理和 GPU 间通信优化)下的峰值改善。实际部署中的平均加速可能在 2-3x。但即使如此,这也是一个显著的效率提升。
对客户粘性的价值:
如果一个客户使用 Dynamo 1.0 来优化其 NVIDIA GPU 集群的推理性能,那么它迁移到其他硬件(如 AMD MI400 或 Google TPU)的成本就不仅是"更换硬件"——还需要"重写推理调度层"。Dynamo 管理的不仅仅是推理调度——它还管理 KV Cache 的分布和回收、GPU 间的通信优化、以及推理请求的路由。这些功能在不同硬件上的实现方式完全不同——迁移成本极高。
与竞争对手的对比: AMD 的 ROCm 推理栈和 Google 的 TPU 推理栈都没有等价的 Dynamo 产品。AMD 依赖开源的 vLLM 和 TensorRT-LLM(后者是 NVIDIA 的),Google 依赖内部的 XLA 编译器。Dynamo 的出现使得 NVIDIA 在推理领域建立了另一个"CUDA 式"的护城河。
8.2 NemoClaw(OpenClaw agent platform)的战略意图
NemoClaw 是 NVIDIA 在 GTC 2026 上发布的企业级 Agentic AI 平台:
- 基于 OpenClaw: OpenClaw 是 2026 年初爆火的开源 Agent 框架(GitHub 历史上增长最快的仓库之一),NVIDIA 基于它构建了企业级版本。
- 核心组件: OpenShell(安全运行时)+ Nemotron(开源模型)+ Privacy Router(隐私控制)
- 与 CrewAI 合作: CrewAI 提供多 Agent 编排能力,NemoClaw 提供安全执行环境。
- 一键部署: NemoClaw 的安装只需一条命令——这大大降低了企业的使用门槛。
NemoClaw 的战略意图:
NVIDIA 正在从"卖硬件的公司"变成"卖 AI 基础设施的公司"。NemoClaw 的定位是——如果企业想要部署生产级的 AI Agent,NVIDIA 提供从底层硬件(Vera Rubin + Vera CPU)到中间件(Dynamo + NemoClaw)到上层模型(Nemotron)的全栈方案。
这个定位的精妙之处在于:
- 锁定企业客户。 一旦企业在 NemoClaw 上构建了 Agent 工作流,更换到其他平台的成本极高——因为 Agent 的安全策略、权限控制、审计日志都嵌入了 OpenShell。
- 推动硬件销售。 NemoClaw 对 Vera CPU 和 Vera Rubin 的优化最深——虽然理论上可以运行在其他硬件上,但性能远不如在 NVIDIA 全栈上的表现。
- 建立新的标准。 如果 NemoClaw/OpenShell 成为"企业 AI Agent 的标准运行时",那么 NVIDIA 将控制 Agentic AI 时代最重要的软件层——就像 Microsoft 控制 PC 操作系统一样。
8.3 OpenShell 的安全运行时定位
OpenShell 是 NVIDIA Agent Toolkit 的一部分——一个安全执行环境,用于运行自主 AI Agent:
- 沙箱化执行: Agent 在 OpenShell 中运行时,其行为被限制在安全边界内。Agent 不能访问未授权的文件系统、网络资源或系统调用。
- 权限控制: 企业可以精细控制 Agent 能访问哪些数据和系统——类似于一组"能力令牌"(capability tokens)。
- 审计追踪: 所有 Agent 操作都有完整的审计日志——这在金融、医疗等受监管行业中是必需的。
OpenShell 解决的是 Agentic AI 落地的最大痛点——安全。 企业不敢部署 AI Agent 的核心原因不是技术不成熟,而是担心 Agent 失控——比如意外删除数据、发送不当邮件、或执行未经授权的交易。OpenShell 通过提供一个"安全沙箱"来降低这个风险。
为什么这很重要:
Agentic AI 的商业化面临一个"先有鸡还是先有蛋"的问题——企业需要安全工具才能部署 Agent,但安全工具需要 Agent 在生产环境中运行才能验证。OpenShell 试图打破这个循环——提供一个"安全第一"的运行时,让企业可以放心地部署 Agent。
如果 OpenShell 成功,它将成为 Agentic AI 时代的"容器"——就像 Docker 容器成为微服务时代的标准运行时一样。这不仅仅是一个技术工具,更是一个生态入口——控制了运行时,就控制了整个生态。
8.4 软件绑定比硬件更难替代
NVIDIA 正在构建的软件护城河可以用一个层次图来表示:
应用层:NemoClaw (Agent 平台)
↓
运行时:OpenShell (安全沙箱) + Dynamo (推理引擎)
↓
框架层:CUDA (计算框架) + NVLink (通信框架)
↓
硬件层:Vera Rubin (GPU) + Vera CPU + NVLink Switch
每一层都在增强客户粘性:
| 层次 | 技术 | 替代难度 | 替代成本 |
|---|---|---|---|
| 硬件层 | GPU/CPU/Switch | 中 | $B级 |
| 框架层 | CUDA | 高 | $B级 + 数年时间 |
| 运行时 | Dynamo/OpenShell | 极高 | $B级 + 数年 + 组织变革 |
| 应用层 | NemoClaw | 极高 | 需要重写所有 Agent 工作流 |
替代难度递增: 替代 NVIDIA 的硬件(用 AMD MI400 或 Google TPU)只是第一步。替代 CUDA 是第二步(非常难,因为全球有数百万开发者和数十亿行 CUDA 代码)。替代 Dynamo + NemoClaw + OpenShell 是第三步(目前几乎不可能,因为还没有等价的替代品)。
这就是 Jensen 所说的"full-stack"护城河——不是在某一个层面领先,而是在所有层面领先,使得任何单一层面的替代都变得不完整。
用一个类比来说:替代 NVIDIA 的 GPU 就像从 iPhone 换到 Android 手机——硬件可以换,但如果你所有的 App(CUDA)、照片(KV Cache)、密码(OpenShell)都存在 iOS 上,换机的成本就不仅仅是买一部新手机了。
九、Q2 指引 $91B:不含中国的 $91B 意味着什么
9.1 全年推算:$81.6B → $91B → 后续季度增速
如果 NVIDIA 的 FY27 按以下路径走:
| 季度 | 营收 | QoQ | YoY | 备注 |
|---|---|---|---|---|
| Q1 FY27(实际) | $81.6B | +20% | +85% | Grace Blackwell 全面交付 |
| Q2 FY27(指引) | $91.0B | +12% | - | Vera Rubin 开始初期交付,中国归零 |
| Q3 FY27(推算) | $100-105B | +10-16% | - | Vera Rubin 产能爬坡 |
| Q4 FY27(推算) | $105-115B | +5-10% | - | Vera Rubin 全面交付 |
如果 Q3/Q4 维持环比增长,FY27 全年可能达到 $380-400B。
对比 FY26 全年营收约 $196B,这意味着 FY27 的 YoY 增长约 94-104%。
但环比增速在放缓。 QoQ 从 Q1 的 +20% 降到 Q2 指引的 +12%。如果这个趋势继续,Q3 可能是 +8-10%,Q4 可能是 +5-8%。这意味着增速在"正常化"——但请注意,这里的"正常化"是在一个 $100B+ 的基数上实现的。
9.2 如果下半年继续环比增长
NVIDIA 已经连续多个季度实现环比增长,Q2 指引 $91B 继续了这一趋势。如果下半年继续环比增长(即使增速放缓到 5-8%),FY27 全年将超过 $400B。
$400B 意味着什么?
- NVIDIA 的 FY27 营收可能接近 Intel 在其巅峰期(2021 年)的全年营收($790 亿)的 5 倍。
- FY27 数据中心营收(~$350B)将超过全球智能手机市场的年营收。
- NVIDIA 的净利润(假设 55% 的 Non-GAAP 净利率)可能达到 ~$210B——这将是人类历史上单一公司年度利润的最高纪录之一,仅次于 Saudi Aramco 在油价巅峰期的利润。
- NVIDIA 的 FY27 自由现金流可能达到 ~$180B——这解释了为什么管理层有信心宣布 $80B 的新增回购授权和 25x 的股息提升。
9.3 $91B 不含中国意味着什么——隐含的全球需求强度
这是 Q1 财报中最被低估的一个数字。
NVIDIA 的 Q2 指引 $91B 是在中国数据中心收入为零的假设下给出的。如果中国市场仍然开放(假设 Q1 的中国市场贡献率约 5-10%),Q2 的"真实需求"可能是 $95-100B。
这意味着全球非中国地区对 AI 基础设施的需求强度被低估了约 5-10%。
当市场在讨论"NVIDIA beat 共识 $2.5B"时,很少有人提到这个 beat 是在损失了一个曾经占 20-25% 收入的市场的情况下实现的。如果把中国市场加回来,NVIDIA 的实际需求强度远超表面数字。
另一个角度: 如果中国市场永久性归零,NVIDIA 未来的增长将完全依赖非中国地区。但这并没有阻止 NVIDIA 给出 $91B 的指引——说明 Jensen 对全球其他地区的需求有极高的信心。
$91B 的隐含信息:
- 全球 AI 投资没有减速。 即使失去了中国,$91B 的指引意味着全球其他地区的 AI 投资在加速——北美、欧洲、中东的主权 AI 投资、东南亚的新兴 AI 基础设施,都在贡献增量。
- 推理需求开始贡献显著收入。 Q2 是 Agentic AI 需求开始转化为硬件收入的第一个季度。随着更多企业部署 AI Agent,推理服务器的需求将持续增长。
- Vera Rubin 的初期出货。 虽然 Vera Rubin 的大规模出货在 Q3-Q4,但 Q2 可能有少量的初期出货——这将贡献一定的增量收入。
9.4 股东回报信号
NVIDIA 在 Q1 宣布的股东回报方案传递了强烈的信号:
$80B 新增回购授权:
- 这不是一个"季度性"的回购——而是一个"长期"的授权,可以在未来多个季度执行。
- 管理层显然认为当前股价被低估——否则不会用 $80B 来回购。
- Jensen 在接受 CNBC 采访时说股价表现是"宇宙最大的谜团之一"("one of the mysteries of the universe"),暗示他认为市场没有充分反映 NVIDIA 的基本面。
季度股息从 $0.01 提升到 $0.25(25x):
- 这是一个"质变"——从象征性的股息变成了有意义的现金回报。
- 以当前股价计算,年化股息率约 0.25-0.30%——虽然不高,但方向明确。
- 更重要的是,25x 的提升传递了管理层对未来现金流的极高信心。
$18.6B 私人公司/基础设施基金投资:
- NVIDIA 不只在回报股东,还在主动投资生态系统——特别是 AI Cloud 提供商和基础设施项目。
- 这些投资既是"绑定客户"的策略,也是对未来 AI 基础设施需求的直接押注。
8.5 软件护城河的量化价值
NVIDIA 的软件生态有多大的商业价值?虽然没有直接披露,但可以通过以下方式估算:
方法一:毛利率溢价法。 如果没有 CUDA 生态和全栈软件绑定,NVIDIA 的定价权将显著下降。假设没有软件护城河时,毛利率从 75% 下降到 65%(10 个百分点),那么软件护城河的年化价值约为:
FY27 预估营收 $390B × 10% = ~$39B/年
方法二:替代成本法。 如果一个 Hyperscale 客户要从 NVIDIA 全栈迁移到 AMD + Arista + 开源推理引擎的替代方案,需要投入:
- 硬件重置成本:$B级
- 软件重写成本(从 CUDA → ROCm):数千人年
- Dynamo 推理引擎替代:需要自行开发或使用开源方案(性能可能下降 2-3x)
- NemoClaw/OpenShell 替代:目前没有等价产品
- 人员培训和组织调整:$100M+
综合估算: NVIDIA 的软件护城河每年创造 $30-50B 的价值——这体现在更高的毛利率(vs 没有软件绑定的硬件公司)、更高的客户留存率和更高的增量收入上。
8.6 与竞争对手的软件生态对比
| 公司 | 计算框架 | 推理引擎 | Agent 平台 | 安全运行时 | 生态成熟度 |
|---|---|---|---|---|---|
| NVIDIA | CUDA | Dynamo 1.0 | NemoClaw | OpenShell | ★★★★★ |
| AMD | ROCm | vLLM/MI-open | - | - | ★★★ |
| JAX/XLA | TPU 推理 | Vertex AI | - | ★★★★ | |
| Amazon | - | Neuron | Bedrock | - | ★★★ |
| Intel | oneAPI | OpenVINO | - | - | ★★ |
| Cerebras | Cerebras SW | CS-3 | - | - | ★★ |
NVIDIA 的软件生态在深度和广度上都领先于所有竞争对手。特别是 Dynamo(推理引擎)和 NemoClaw(Agent 平台)——这两个产品目前没有等价的替代品,是 NVIDIA 在推理和 Agentic AI 领域的独特优势。
9.4 AI 投资周期:我们在曲线的哪个位置?
理解 Q2 指引 $91B 的含义,需要把 AI 投资放在更长的周期背景中:
AI 基础设施投资的三个阶段:
| 阶段 | 时间 | 特征 | 主要驱动力 | NVIDIA 受益程度 |
|---|---|---|---|---|
| 第一阶段:训练基础设施 | 2023-2025 | GPU 短缺、大规模训练集群 | GPT-4/5 级模型训练 | 极高(CUDA 垄断) |
| 第二阶段:推理+训练并行 | 2025-2027 | 推理需求快速增长、Agentic AI 崛起 | 推理商业化 + Agent 落地 | 高(全栈优势) |
| 第三阶段:Agentic AI 全面落地 | 2027-2030? | Agent 无处不在、CPU 需求爆发 | 企业级 Agent 部署 | 中-高(面临 ASIC 竞争) |
NVIDIA 目前正处于从第一阶段向第二阶段过渡的关键时期。Q1 FY27 的数据(特别是网络收入 199% YoY 和 Vera CPU $200 亿已售)表明,第二阶段的需求已经开始释放。
关键问题:第二阶段能持续多久?
这取决于两个变量:
-
推理的商业化回报。 如果企业能从 AI 推理中获得足够的商业回报(收入增加或成本降低),它们将持续投入——形成正循环。目前的数据是混合的:一些企业(如 Microsoft Copilot)已经产生了可观的收入,但大多数企业的 AI 投资仍在"烧钱"阶段。
-
Agentic AI 的落地速度。 如果 Agent 在 2027-2028 年实现大规模商业化(即大多数知识工作者每天使用 AI Agent),那么第二阶段的需求将持续到 2030 年。如果 Agent 的落地速度低于预期,第二阶段可能在 2028 年就结束。
我的判断: 我们正处于 AI 投资第二阶段的中早期。推理需求刚刚开始释放(Q1 FY27 的数据证明了这一点),Agentic AI 的商业化还在"早期尝鲜"阶段。未来 2-3 年,AI 投资的增速可能放缓(从 85% YoY 降到 30-40%),但绝对增量仍然巨大——因为基数已经很大了。
9.5 NVIDIA 的定价权:还能维持多久?
NVIDIA 的定价权是其商业模式的核心。目前,NVIDIA 在 AI GPU 市场的定价远高于成本——这是 75% 毛利率的来源。但定价权能维持多久?
定价权的三个来源:
-
技术领先。 NVIDIA 的 GPU 在 AI 训练和推理上比竞争对手快 2-3x。客户愿意为这种性能优势支付溢价。
-
生态绑定。 CUDA + Dynamo + NemoClaw 的全栈生态使得迁移成本极高。客户即使想换到 AMD,也需要重写大量代码。
-
产能稀缺。 当需求大于供给时,NVIDIA 可以选择性地销售给高价值客户——这支持了高定价。
定价权面临的压力:
- 短期(FY27-28): 压力较小。Vera Rubin 供不应求,客户没有议价空间。
- 中期(FY29-30): 压力中等。如果 Cerebras WSE-4 在训练市场上取得突破,或者 Google TPU JV 成功,部分客户可能开始要求更低的定价。
- 长期(FY31+): 压力较大。如果 AMD MI500 系列、Cerebras WSE-5、以及中国的替代方案都达到可接受的性能水平,NVIDIA 的定价权将被显著侵蚀。
一个历史类比: Intel 在 2000-2010 年间享有类似的定价权——x86 CPU 市场几乎垄断,毛利率长期在 60% 以上。但 ARM 的崛起(手机 + Apple Silicon)最终打破了 Intel 的垄断,毛利率从 65% 下降到 50% 以下。NVIDIA 可能面临类似的长期威胁——但时间线可能更长,因为 AI 芯片的技术门槛更高。
9.6 股息提升的信号解读
NVIDIA 将季度股息从 $0.01 提升到 $0.25(25 倍),这不是一个随意的决定。
25 倍股息提升背后的三个信号:
信号一:现金流信心。 $0.25/股 × ~245 亿股 = ~$61 亿/年的股息支出。这相对于 NVIDIA FY27 预估自由现金流(~$180B)来说微不足道。管理层有充分的信心维持甚至进一步提高股息。
信号二:股东回报承诺。 结合 $80B 新增回购授权和 $20B 本季度回购+股息,NVIDIA 在 FY27 的股东回报总额可能达到 $60-80B——这相当于 FY26 全年营收的 30-40%。这个比例在大型科技公司中是领先的(对比 Apple 的回购比例约 15-20%)。
信号三:吸引新的投资者群体。 提升股息可能吸引那些有股息要求的机构投资者(如养老基金、保险公司)——这些投资者通常不会投资"零股息"的成长型股票。通过提升股息,NVIDIA 正在扩大其潜在投资者基础。
Jensen 关于股价的评论: Jensen 在接受 CNBC 采访时说 NVIDIA 的股价表现是"宇宙最大的谜团之一"("one of the mysteries of the universe")。这个评论暗示他认为市场低估了 NVIDIA——而 $80B 回购授权和 25 倍股息提升是管理层用行动(而非语言)来表达这一判断。
十、投资判断
10.1 Bull Case
核心假设:
- Vera Rubin 交付顺利,FY27 下半年成为主要增长驱动力
- Agentic AI 大规模商业化落地,推动推理需求指数级增长
- 网络收入持续超预期,成为独立的利润中心
- Vera CPU 打开 $2000 亿 TAM,FY28 开始贡献显著收入
- 客户自研 ASIC 的替代速度低于市场预期
- NVIDIA 软件栈(Dynamo + NemoClaw + OpenShell)成功建立生态锁定
- 全球 AI 投资持续加速,FY27 全年超过 $400B
FY27 全年营收: $400-420B FY27 Non-GAAP EPS: $8.0-8.5 目标市值: $5.5-6.5 万亿(基于 30-35x 前瞻 P/E)
10.2 Bear Case
核心假设:
- Vera Rubin 交付延迟或初期质量问题,影响 FY27 下半年收入
- Agentic AI 商业化落地低于预期,推理需求增速放缓
- Google + Blackstone TPU JV 在 2027 年上线后侵蚀 NVIDIA 份额
- 毛利率因竞争加剧和产品组合变化而下降至 72-73%
- 中国市场永久性失守,且国产替代开始向全球南方市场输出
- AI 投资进入"消化期",Hyperscale CapEx 增速放缓
FY27 全年营收: $360-380B FY27 Non-GAAP EPS: $6.5-7.0 目标市值: $3.5-4.0 万亿(基于 25-28x 前瞻 P/E)
10.3 Base Case
核心假设:
- Vera Rubin 交付有小幅延迟但整体顺利
- AI 基础设施需求保持强劲但增速逐步正常化
- 客户自研 ASIC 在推理市场取得有限进展,训练市场仍是 NVIDIA 主导
- 毛利率维持在 74-75%
- 中国市场不恢复,但不进一步恶化
- 网络收入持续高增长,但增速逐步放缓
FY27 全年营收: $385-395B FY27 Non-GAAP EPS: $7.5-8.0 目标市值: $4.5-5.0 万亿(基于 28-32x 前瞻 P/E)
10.4 关键风险矩阵
| 风险 | 级别 | 时间线 | 影响 | 概率 |
|---|---|---|---|---|
| 毛利率见顶 | 中 | FY28+ | 每下降 1%,减少 ~$4B 净利润 | 40% |
| ASIC 替代(推理市场) | 高 | FY28-29 | 可能损失 10-15% 推理收入 | 35% |
| 中国永久失守 | 高 | 已发生 | 损失 ~$80B/年潜在收入 | 95% |
| 反垄断 | 低-中 | FY28+ | 可能限制定价或强制拆分 | 15% |
| Vera Rubin 交付问题 | 中 | FY27 H2 | 影响短期收入增速 | 50% |
| AI 需求"突然熄火" | 低 | FY28+ | 最大尾部风险 | 10% |
| 国产芯片向第三国输出 | 中-高 | FY28+ | 长期竞争格局变化 | 25% |
| 光互联/电力瓶颈 | 中 | FY27-28 | 限制数据中心扩张速度 | 30% |
10.5 股价反应模式:beat 但跌的魔咒是否继续
历史规律: NVIDIA 过去六个季度连续 beat 共识,但其中四次在财报发布后股价下跌。Polymarket 在财报前将 beat 概率定在 97.2%——但当 beat 是"确定性事件"时,beat 本身就不再是催化剂。
Q1 FY2027 的情况:
- 财报发布后盘后交易:+约 6%(次日盘前数据)
- 次日开盘后:继续走强,市场对 Q2 指引 $91B 的反应正面
- 市场对 beat 的反应是正面的——可能因为 Q2 指引 $91B 大幅超出共识的 $86B
"beat 但跌"魔咒的原因:
- 期权市场的影响。 NVIDIA 的期权交易量巨大,财报后的 Gamma 效应经常导致股价反向波动。大量看涨期权的卖方需要在财报后对冲——这会产生抛压。
- 预期已经 price in。 当 beat 成为"确定性事件"时(连续 7 个季度 beat),beat 本身不再是催化剂。市场已经将 beat 纳入定价——真正驱动股价的是 Q2 指引和 Jensen 的电话会发言。
- 管理层指引的保守性。 NVIDIA 的指引通常低于实际结果 3-4%,市场知道这一点。
我的判断: 这次 beat 的质量较高($91B 指引 vs $86B 共识,超出 $5B),且股息 25x 提升是一个正面意外,可能打破"beat 但跌"的魔咒。但短期内(财报后一周),股价走势更多受宏观因素(Trump 关税政策、美联储利率预期、美债收益率)影响,而非 NVIDIA 的基本面。
长期股价的驱动力: NVIDIA 的长期股价取决于两个问题——
-
AI 需求的持续性。 如果 AI 投资在 FY28-29 开始放缓(类似于 2000 年互联网泡沫的破灭),NVIDIA 的估值将面临重大调整。但如果 AI 投资持续增长(即使增速放缓),NVIDIA 的收入和利润将继续创新高。
-
竞争格局的演变。 如果 NVIDIA 的全栈护城河(硬件 + 软件 + 网络)持续加固,客户自研 ASIC 的替代速度低于预期,那么 NVIDIA 可以维持高毛利率和高增长。但如果 Google TPU JV 成功、Cerebras 的技术路线被验证、或者中国的替代方案向全球输出——NVIDIA 的增长前景将被重新评估。
10.6 估值方法论讨论
NVIDIA 当前的估值水平一直是市场争议的焦点。以下从多个角度分析:
方法一:前瞻 P/E 法
| 情景 | FY27 EPS(估) | FY28 EPS(估) | 30x P/E 目标价 | 35x P/E 目标价 |
|---|---|---|---|---|
| Bull | $8.5 | $10-11 | $255-330 | $298-385 |
| Base | $7.8 | $9-10 | $234-300 | $273-350 |
| Bear | $7.0 | $8-9 | $210-270 | $245-315 |
以当前股价约 $130-140 计算,NVIDIA 的前瞻 P/E(基于 FY27 EPS)约 17-18x——对于一家 YoY 增长 85-100% 的公司来说,这个估值并不高。
方法二:PEG 比率
PEG = P/E / EPS 增长率
- FY27 EPS 增长约 100%+(从 FY26 的 ~$3.8 到 FY27 的 ~$7.8)
- 前瞻 P/E 约 17-18x
- PEG ≈ 0.17-0.18
PEG < 1 通常被认为是"低估"——而 NVIDIA 的 PEG 约 0.17,远低于 1。这是 Jensen 说股价是"宇宙最大的谜团"的数学基础。
但为什么市场不给 NVIDIA 更高的估值?
市场可能考虑了以下折价因素:
-
增速不可持续的预期。 市场可能认为 85-100% 的 YoY 增速在未来 2-3 年内将大幅放缓——当增速降到 20-30% 时,P/E 也应该相应下降。
-
客户自研的长期威胁。 Google TPU JV 和 Amazon Trainium 的进展让市场担心 NVIDIA 的"长期份额"——即使短期增速强劲,长期增速可能被自研芯片侵蚀。
-
中国永久失守。 失去一个曾经占 20-25% 的市场,对长期增长的拖累是显著的。
-
地缘政治风险。 如果出口限制进一步扩大(如限制向中东或东南亚的销售),NVIDIA 的增长前景将被进一步压缩。
-
"AI 泡沫"的尾部风险。 虽然当前的数据支持 AI 投资的合理性,但如果 AI 的商业化回报在 2027-2028 年大幅低于预期,整个 AI 供应链(包括 NVIDIA)将面临重大调整。
10.7 NVIDIA 与历史高增长公司的对比
| 公司 | 峰值营收增速 | 峰值毛利率 | 峰值 P/E | 增速持续多久 | 后续走势 |
|---|---|---|---|---|---|
| NVIDIA (FY27) | +85-100% | 75% | ~17x | ? | ? |
| Intel (1999) | +15-20% | 60% | ~50x | 10 年 | 2010 年后衰退 |
| Cisco (1999) | +40-50% | 65% | ~130x | 3 年 | 互联网泡沫破灭 |
| Apple (2011) | +60-70% | 40% | ~15x | 5 年 | 增速放缓但保持盈利 |
| Amazon (2020) | +35-40% | 40% | ~80x | 持续 | 云计算驱动第二曲线 |
| TSMC (2022) | +40-50% | 55% | ~20x | 2 年 | 周期性回落 |
NVIDIA 的当前估值(~17x 前瞻 P/E)在这些高增长公司中是最低的——这反映了市场对增速可持续性的怀疑。如果 NVIDIA 能在 FY28-29 维持 30-40% 的增速(即使低于当前的 85%),当前估值将显得非常便宜。
与 Cisco 的对比特别有启发性: Cisco 在 1999 年互联网泡沫期间的峰值 P/E 约 130x——因为它被视为"互联网基础设施的垄断者"。NVIDIA 今天被称为"AI 基础设施的垄断者",但 P/E 只有 17x。这种差异反映了两个时代不同的市场情绪——也反映了 NVIDIA 的基本面比当年的 Cisco 强得多(75% 毛利率 vs Cisco 的 65%,更强的生态绑定)。
10.8 关键催化剂日历
以下事件可能成为 NVIDIA 股价的短期催化剂:
| 时间 | 事件 | 可能影响 | 概率 |
|---|---|---|---|
| 2026.06 | Q2 季度中更新 | 如果上调指引,正面 | 30% |
| 2026.07 | Hyperscale Q2 财报(MSFT/GOOG/META/AMZN) | CapEx 指引影响 NVIDIA 预期 | 中性 |
| 2026.08 | NVIDIA Q2 FY27 财报 | $91B 能否 beat 是关键 | 70% beat |
| 2026.09 | Vera Rubin 首批客户部署反馈 | 如果顺利,正面 | 60% |
| 2026.10 | 美国大选 | 贸易政策可能变化 | 不确定 |
| 2026.11 | NVIDIA Q3 FY27 财报 | Vera Rubin 产能爬坡进展 | - |
| 2027.01 | Google TPU JV 进展 | 如果提前上线,负面 | 20% |
| 2027.02 | NVIDIA Q4 FY27 财报 | FY27 全年数据 + FY28 指引 | - |
十一、深度思考:NVIDIA 的终局是什么?
11.1 情景一:NVIDIA 成为"AI 时代的 Intel + Microsoft"
在最好的情景下,NVIDIA 将同时控制 AI 硬件和软件的标准——就像 Intel 在 PC 时代控制了硬件标准(x86),Microsoft 控制了软件标准(Windows/Office)一样。
在这个情景中:
- 硬件层: Vera Rubin + Vera CPU + NVLink 成为 AI 数据中心的标准架构(类似 x86 在 PC 时代的地位)
- 软件层: CUDA + Dynamo + NemoClaw + OpenShell 成为 AI 开发的标准平台(类似 Windows 在 PC 时代的地位)
- 网络层: NVLink + Spectrum-X 成为 AI 集群互联的标准方案(类似 Ethernet 在企业网络中的地位)
如果这个情景实现,NVIDIA 的年收入可能达到 $500-700B(FY30+),市值可能超过 $10 万亿——成为全球市值最高的公司。
这个情景的概率:25-30%。 实现这个情景需要多个条件同时满足:Agentic AI 大规模商业化、客户自研 ASIC 的替代速度低于预期、NVIDIA 软件护城河持续加深、中国替代方案不向全球输出。
11.2 情景二:NVIDIA 成为"AI 时代的 ARM"
在一个中性的情景中,NVIDIA 在训练市场保持主导地位(类似 ARM 在移动芯片设计中的地位),但在推理市场和 CPU 市场面临越来越激烈的竞争。
在这个情景中:
- 训练市场: NVIDIA 保持 70-80% 的份额,因为 CUDA 和训练工具链的生态绑定太强
- 推理市场: 份额下降到 50-60%,因为自研 ASIC(TPU、Trainium)和推理专用芯片(Cerebras)在特定场景上更优
- CPU 市场: Vera CPU 取得有限成功,在 AI 数据中心中有一定份额,但传统 x86 和自研 ARM(Graviton、Axion)仍然占据大部分市场
- 网络市场: NVLink 在 GPU 互联中保持垄断,但以太网领域(Spectrum-X)面临 UEC 的竞争
如果这个情景实现,NVIDIA 的年收入可能在 FY30 达到 $400-500B,增速放缓到 15-25%,市值约 $5-7 万亿。
这个情景的概率:40-45%。 这是最可能的情景——NVIDIA 保持领先但份额逐步被侵蚀。
11.3 情景三:NVIDIA 成为"AI 时代的 Sun Microsystems"
在最差的情景中,AI 投资在 2028-2029 年经历一次重大调整(类似互联网泡沫的破灭),NVIDIA 的收入和利润大幅下降。同时,客户自研 ASIC 在训练市场取得突破,打破了 CUDA 的垄断。
在这个情景中:
- 触发因素: AI 商业化回报大幅低于预期 → Hyperscale 削减 CapEx → NVIDIA 收入下降 30-40%
- 叠加因素: Google TPU JV 和 Cerebras 在训练市场上证明了可行性 → 客户开始从 GPU 迁移
- 进一步恶化: 中国替代方案(华为昇腾)向全球南方市场输出 → NVIDIA 的可寻址市场缩小
如果这个情景实现,NVIDIA 的年收入可能在 FY30 下降到 $200-250B,毛利率下降到 60-65%,市值可能跌至 $2-3 万亿。
这个情景的概率:15-20%。 虽然不太可能,但不能忽视——历史上每一次技术革命都伴随着泡沫和调整。
11.4 对 AI 产业格局的长期预测
无论 NVIDIA 的终局如何,Q1 FY27 的数据已经确认了几个长期趋势:
-
AI 基础设施将成为与电力网络同等量级的基础设施类别。 Jensen 说的"AI 工厂"不是比喻——它是真的。全球 AI 基础设施的投资规模(数千亿美元/年)已经接近或超过了某些国家的 GDP。
-
AI 芯片市场的竞争将持续加剧。 NVIDIA 今天的垄断地位不是永久性的。Google、Amazon、Cerebras、华为等竞争者都在快速进步。5-10 年后,AI 芯片市场可能从"一家独大"变成"多强并存"。
-
软件生态比硬件规格更重要。 CUDA 的护城河比 GPU 的 FLOPS 数更难跨越。Dynamo + NemoClaw + OpenShell 的组合正在构建比 CUDA 更深层的护城河。如果 NVIDIA 在软件上持续领先,即使硬件优势被缩小,它仍然可以维持高利润率。
-
地缘政治将永久性地分裂全球 AI 生态。 中国正在建立一个独立的 AI 芯片和软件生态——这不会因为制裁的取消而逆转。全球 AI 生态可能分裂为"美国系统"和"中国系统"两个平行世界。
-
Agentic AI 是下一个增长飞轮。 如果 Agent 在 2027-2030 年实现大规模商业化,它将推动推理需求、CPU 需求和软件需求的指数级增长——这将使得当前的 $81.6B 季度营收看起来像一个"起步价"。
总结
三个最重要的结论
1. AI 基础设施的需求是真实的、持续的、且在加速——但 NVIDIA 的份额红利正在被侵蚀。
$81.6B 的营收和 $91B 的 Q2 指引证明 AI 工厂的建设不是泡沫。但 Google 的 TPU JV($50 亿,500MW)、Cerebras 的 $950 亿市值 IPO、以及 NVIDIA 在 10-Q 中首次承认客户自研 ASIC 风险——都在暗示一个趋势:NVIDIA 的客户正在变成 NVIDIA 的竞争者,而且它们有钱、有人才、有动力。 这个转变不是"会不会"的问题,而是"速度有多快"的问题。
2. NVIDIA 正在从"GPU 公司"转型为"AI 基础设施公司"——Vera CPU、网络和软件是这场转型的三个支点。
GPU 仍然是 NVIDIA 的核心,但 Vera CPU 打开了 $2000 亿的新市场(且 $200 亿已经在今年前几个月售出),网络收入年化 $59B 且增速远超计算,软件栈(Dynamo + NemoClaw + OpenShell)正在构建比 CUDA 更难替代的护城河。如果这场转型成功,NVIDIA 的长期增长空间将远超 GPU 市场的边界。 NVIDIA 将不再是一个"芯片公司",而是一个"AI 时代的操作系统公司"——提供从硬件到软件的完整基础设施。
3. 中国市场的永久性失守是 NVIDIA 最大的结构性风险——不仅损失收入,更催生了一个独立的竞争生态。
Jensen 说得对:美国的制裁帮中国"砸碎了买办式的科技幻想",催生了一个从硬件(昇腾 910C/950PR)到软件(CANN/CUDA 兼容层)到模型(DeepSeek V4)的完整替代生态。这个生态一旦成熟并向全球南方输出,NVIDIA 面对的将不是一个缺失的市场,而是一个新的竞争对手。 华为的 CM384 集群已经在特定任务上超越了 NVIDIA NVL72——虽然代价是 4 倍的功耗和 16 倍的空间,但在预算敏感的市场中,这可能是可接受的。
下一个观察节点
| 时间 | 事件 | 关注点 |
|---|---|---|
| 2026 年 6 月 | Q2 FY27 季度中 | Vera Rubin 初期交付情况、NAND 供给压力 |
| 2026 年 8 月底 | Q2 FY27 财报 | $91B 指引能否 beat;中国市场收入是否真的为零;Vera Rubin 产能爬坡进展 |
| 2026 年 Q3 | Vera Rubin 大规模交付 | 130 万组件系统的交付质量和客户反馈 |
| 2026 年 Q3 | Groq 3 LPU 出货 | LPU 的实际客户采用情况(niche or not?) |
| 2027 年初 | Google + Blackstone TPU JV 上线 | 500MW 产能的客户采用情况 |
| 2027 年 H1 | Vera CPU Rack 大规模部署 | CPU-only rack 的客户接受度和实际工作负载表现 |
| 2027 年 | DeepSeek V5 / 华为昇腾 960 | 中国 AI 芯片的代际进步速度 |
附录:关键数据来源
- NVIDIA Q1 FY2027 官方新闻稿(2026.05.20)
- NVIDIA Q1 FY2027 电话会议实录(2026.05.20)
- NVIDIA Q1 FY2027 10-Q 文件(待 SEC 提交)
- NVIDIA FY2026 10-K 年度报告(2026.03)
- NVIDIA GTC 2026 Keynote(2026.03.17)
- Jensen Huang CES 2026 演讲(2026.01.06)
- Blackstone + Google TPU JV 公告(2026.05.18)
- Cerebras IPO 定价及首日交易数据(2026.05.14)
- CNBC/QYahoo Finance: NVIDIA Q1 FY2027 收益直播报道
- SemiAnalysis: CM384 集群 vs NVL72 对比分析
- Coherent/Corning/Lumentum 战略协议公告
- Tom's Hardware: Vera Rubin、Vera CPU 和 Groq 3 LPU 技术分析
- Futurum Group: Cerebras IPO 分析报告
- The Information: DeepSeek V4 迁移至华为昇腾的报道
- Jon Peddie Research: NVIDIA-Groq 技术整合分析
本文基于公开信息撰写,不构成投资建议。所有数据截至 2026 年 5 月 21 日。
附录 B:Hyperscale CapEx 与 NVIDIA 收入的关联分析
NVIDIA 的数据中心收入与 Hyperscale 客户的 CapEx 高度相关。以下是主要客户的 FY2026-27 CapEx 指引:
| 公司 | FY2026 CapEx 指引 | FY2027 CapEx 预估(市场共识) | 主要用途 |
|---|---|---|---|
| Microsoft | ~$80B | ~$95-100B | Azure AI 基础设施 |
| Google/Alphabet | ~$75B | ~$85-95B | Google Cloud + TPU JV |
| Amazon | ~$75B | ~$80-90B | AWS AI 基础设施 + Trainium |
| Meta | ~$60-65B | ~$70-80B | AI 训练 + 推理 |
| Apple | ~$10B | ~$15-20B | Apple Intelligence |
| 合计(Top 5) | ~$300-305B | ~$345-385B | - |
关键推断: 假设 Hyperscale CapEx 中约 40-50% 用于 AI 计算硬件(GPU/TPU/ASIC + 网络),那么 FY2027 Top 5 Hyperscale 的 AI 硬件支出约 $140-190B。
NVIDIA Q1 FY27 的 Hyperscale 数据中心收入约 $38B,年化约 $152B——与上述推断基本吻合。这意味着 NVIDIA 在 Hyperscale AI 硬件支出中的份额约 80-100%——如果考虑部分 CapEx 用于非 NVIDIA 硬件(自研 TPU/Trainium、网络设备、电力和冷却),NVIDIA 的实际份额可能在 70-80%。
这个份额在 FY28-29 可能下降——但下降的速度取决于自研芯片的成熟度。 如果 Google 的 TPU JV 成功并扩大规模,NVIDIA 在 Google 的份额可能从 ~80% 下降到 ~50-60%。如果 Amazon 的 Trainium 3 在推理市场上获得更多客户,NVIDIA 在 AWS 的份额也可能下降。
对 NVIDIA 收入的敏感性分析:
| 场景 | Hyperscale 份额 | FY27 全年 Hyperscale 收入 | FY28 全年 Hyperscale 收入(预估) |
|---|---|---|---|
| 份额不变 | ~80% | ~$152B | ~$190-200B |
| 份额小幅下降 | ~75% | ~$152B | ~$180-190B |
| 份额中幅下降 | ~65% | ~$152B | ~$155-165B |
| 份额大幅下降 | ~50% | ~$152B | ~$120-130B |
在"份额中幅下降"场景下,NVIDIA 的 Hyperscale 收入仍然在增长——只是增速放缓。真正的风险在于"份额大幅下降"场景,这需要多款自研芯片同时成熟并获得广泛客户采用。
附录 C:Vera Rubin 技术规格汇总
| 参数 | Vera Rubin NVL72 | Grace Blackwell NVL72 | 提升 |
|---|---|---|---|
| GPU 数量 | 72 (Rubin R100) | 72 (Blackwell B200/B300) | - |
| CPU 数量 | 36 (Vera) | 36 (Grace) | 自研 CPU |
| GPU 晶体管数 | 336B | 208B | +62% |
| HBM 类型 | HBM4 (288GB/GPU) | HBM3e (192GB/GPU) | +50% 容量 |
| HBM 带宽 | 22 TB/s per GPU | 12 TB/s per GPU | +83% |
| NVLink 版本 | NVLink 6 | NVLink 5 | - |
| NVLink 带宽 | 3.6 TB/s per GPU | 1.8 TB/s per GPU | +100% |
| 总 HBM 容量 | ~20.7 TB | ~13.8 TB | +50% |
| ICMS 存储 | 1,152 TB NAND | ~576 TB NAND | +100% |
| 独立组件数 | ~130 万 | ~60 万 | +117% |
| 液冷 | 必须 | 必须 | - |
| 推理成本(vs GB) | ~1/10 | 基准 | ~10x 改善 |
| 首批客户 | Microsoft, CoreWeave | Microsoft, Meta, Google | - |
| 代工厂 | TSMC | TSMC | - |
核心改进总结:
- 计算:GPU 晶体管数 +62%,FLOPS 约 +2.5-3x
- 内存:HBM 容量 +50%,带宽 +83%
- 互联:NVLink 带宽 +100%
- 存储:ICMS NAND 容量 +100%
- CPU:从 Grace(ARM v9,非自研核心)到 Vera(ARM v9 Olympus,自研核心)
- 系统复杂性:独立组件数 +117%
附录 D:Vera CPU Rack 技术规格
| 参数 | Vera CPU Rack | 传统 x86 机柜 |
|---|---|---|
| CPU 数量 | 256 颗液冷 Vera CPU | 32-64 颗风冷 Xeon/EPYC |
| 核心总数 | 22,528 (88 核/CPU × 256) | 2,048-6,144 |
| 架构 | ARM v9 (Olympus 核心) | x86 |
| IPC | 1.5x vs 标准 ARM | 基准 |
| CPU 吞吐量 | 6x vs 传统机柜 | 基准 |
| Agentic AI 性能 | 2x vs 传统机柜 | 基准 |
| 冷却方式 | 液冷 | 风冷 |
| 功耗 | 估计 ~75-80kW | ~15-25kW |
| 目标场景 | Agent 执行/编排 | 通用计算 |
Vera CPU Rack 的设计目标非常明确:不是替代传统 x86 服务器做通用计算,而是为 Agentic AI 的执行层提供专用的 CPU 集群。
附录 E:季度财务数据汇总(FY25-FY27)
| 指标 | Q1FY25 | Q2FY25 | Q3FY25 | Q4FY25 | Q1FY26 | Q2FY26 | Q3FY26 | Q4FY26 | Q1FY27 |
|---|---|---|---|---|---|---|---|---|---|
| 总营收 ($B) | 26.0 | 30.0 | 35.1 | 39.3 | 44.1 | 51.0 | 60.9 | 68.1 | 81.6 |
| QoQ | - | +15% | +17% | +12% | +12% | +16% | +19% | +12% | +20% |
| YoY | - | +122% | +94% | +78% | +69% | +70% | +94% | +73% | +85% |
| 数据中心 ($B) | 22.6 | 26.3 | 30.8 | 35.6 | 39.1 | 45.2 | 53.7 | 60.9 | 75.2 |
| NG 毛利率 | 78.4% | 75.7% | 75.0% | 73.5% | 73.8% | 75.1% | 74.6% | 73.0% | 75.0% |
| NG EPS | $0.61 | $0.68 | $0.81 | $0.89 | $0.91 | $1.03 | $1.20 | $1.32 | $1.87 |
趋势分析:
-
营收增速在 Q1 FY27 重新加速到 +85% YoY。 这打破了从 Q1 FY25 开始的增速下降趋势(122% → 94% → 78% → 69% → 70% → 94% → 73% → 85%)。增速的重新加速说明 AI 需求进入了第二轮增长。
-
Q1 FY27 的 QoQ 增速 +20% 是过去 5 个季度中最高的。 这说明 Grace Blackwell 的全面出货对收入的提振效果显著。
-
EPS 的增速(+140% YoY)持续高于营收增速(+85% YoY)。 这说明运营杠杆在持续发挥作用——每增加一美元收入,边际利润率在提高。
附录 F:NVIDIA FY27 全年情景分析
| 情景 | Q1(实际) | Q2(指引) | Q3(推算) | Q4(推算) | 全年 | YoY | NG EPS(估) |
|---|---|---|---|---|---|---|---|
| Bull | $81.6B | $93B | $110B | $120B | $404.6B | +106% | $8.5 |
| Base | $81.6B | $91B | $102B | $110B | $384.6B | +96% | $7.8 |
| Bear | $81.6B | $89B | $95B | $100B | $365.6B | +86% | $7.0 |
| Recession | $81.6B | $87B | $85B | $80B | $333.6B | +70% | $6.2 |
Bull 情景假设: Vera Rubin 交付顺利,Agentic AI 需求超预期,网络收入持续高增长。 Base 情景假设: Vera Rubin 交付有小幅延迟但整体顺利,AI 需求保持强劲但增速正常化。 Bear 情景假设: Vera Rubin 交付延迟,AI 投资增速放缓,客户自研 ASIC 开始替代。 Recession 情景假设: 宏观经济衰退,AI 投资大幅削减,H2 出现环比下降。
附录 G:关键术语表
| 术语 | 英文全称 | 含义 |
|---|---|---|
| Agentic AI | - | 自主 AI 代理,能独立执行多步骤任务的 AI 系统 |
| ASIC | Application-Specific Integrated Circuit | 专用集成电路,为特定用途设计的芯片 |
| ACIE | AI Clouds / Consumer Internet / Enterprise | NVIDIA 对非 Hyperscale 客户的分类 |
| CANN | Compute Architecture for Neural Networks | 华为昇腾 AI 芯片的软件框架 |
| CUDA | Compute Unified Device Architecture | NVIDIA 的 GPU 并行计算平台 |
| Dynamo | - | NVIDIA 的开源推理操作系统 |
| HBM | High Bandwidth Memory | 高带宽内存,用于 AI 加速器 |
| Hyperscale | - | 超大规模云服务商(Microsoft、Google、Amazon、Meta) |
| ICMS | Inference Cache and Memory Subsystem | Vera Rubin 的推理缓存和存储子系统 |
| InfiniBand | - | 一种高带宽、低延迟的网络通信协议 |
| KV Cache | Key-Value Cache | 大语言模型推理中的键值缓存 |
| LPU | Language Processing Unit | 语言处理单元,Groq 的推理专用芯片 |
| MoE | Mixture of Experts | 混合专家模型架构 |
| NemoClaw | - | NVIDIA 的企业级 Agentic AI 平台 |
| NVLink | - | NVIDIA 的高速 GPU 互联技术 |
| NVL72 | NVLink 72 | 72 颗 GPU 的 NVLink 机柜系统 |
| OpenShell | - | NVIDIA 的 AI Agent 安全运行时 |
| Spectrum-X | - | NVIDIA 的以太网 AI 网络平台 |
| SRAM | Static Random-Access Memory | 静态随机存取存储器,片上高速缓存 |
| TPU | Tensor Processing Unit | Google 的 AI 加速器 |
| UEC | Ultra Ethernet Consortium | 超以太网联盟 |
| Vera CPU | - | NVIDIA 的自研 ARM 数据中心 CPU |
| WSE | Wafer-Scale Engine | Cerebras 的晶圆级 AI 芯片 |
本文基于公开信息撰写,不构成投资建议。所有数据截至 2026 年 5 月 21 日。
