# Jalapeño 拆解：当 AI 公司开始造自己的心脏 2026 年 6 月 24 日，OpenAI 与博通联合发布首款自研 AI 推理芯片 Jalapeño。从架构到流片仅 9 个月，推理成本预计降低约 **50%**，性能对标 NVIDIA Blackwell 与 Google TPU。2026 年底部署，2

阅读长文 →

06-262026

2026-06-26思考28 分钟阅读

灵晟补遗：Next Platform 深度拆解确认的新细节

**资料来源：**

阅读长文 →

06-252026

2026-06-25思考58 分钟阅读

从 ISC 2026 到 AI4S：HPC 正从"峰值算力机器"变成"科学验证引擎"

**声明：** 本文依据截至北京时间 2026 年 6 月 25 日公开的 ISC 2026 议程、演讲摘要、六月 TOP500 榜单、NVIDIA 官方博客、Nature 及同行评议期刊论文、FDA 公开文件等来源撰写。不构成投资建议。文中数据截至 2026 年 6 月 25 日。

阅读长文 →

06-242026

2026-06-24思考90 分钟阅读

灵晟超算登顶 TOP500：2 EFLOPS 全国产纯 CPU 架构路线还有希望吗（6/29 更新）

ISC 2026 确认灵晟 HPCG 双冠，HPCG 22 PFLOPS 全球第一。Top 500 前十名历史首次零变动。64GB HBM 全文统一。Chips and Cheese 数据补充。

阅读长文 →

06-232026

2026-06-23思考24 分钟阅读

咽喉上的收费亭：AI 编译层为什么创造巨大价值，却几乎捕获不到

从高通 40 亿美元收购 Modular 切入，分析 AI 编译层的技术卡点、价值捕获困局与终局判断。

阅读长文 →

06-212026

2026-06-21思考19 分钟阅读

Agent 是怎么走歪的

当 AI Agent 在第 7 步选错了工具，后面 13 步全是浪费——传统监控为什么看不到

阅读长文 →

06-212026

2026-06-21思考19 分钟阅读

推理引擎里面发生了什么

从 Prefill 到 CUDA Kernel——一次推理请求的毫秒级拆解

阅读长文 →

06-212026

2026-06-21思考31 分钟阅读

一张推理账单的解剖

你的 AI 账单里 85% 是基础设施税,只有 15% 在创造价值

阅读长文 →

06-212026

2026-06-21思考18 分钟阅读

AI 可观测性的三层盲区

当监控系统说"一切正常"时,AI 系统正在悄悄烧钱、走偏、失控

阅读长文 →

06-182026

2026-06-18思考21 分钟阅读

140 亿美元的对赌：HPE Discover 2026 战略全景分析

十年瘦身→All-in网络→AI工厂。HPE用140亿收购Juniper后的首考，三个核心判断，十大结构挑战。方向对，兑现难。

阅读长文 →

06-182026

2026-06-18思考22 分钟阅读

网络成为 AI 控制平面：HPE 的网络赌局

QFX六档覆盖训练到推理，GreenLake Intelligence四入口整合。但HPE不自研交换芯片，整合商永远不如芯片定义者。

阅读长文 →

06-182026

2026-06-18思考21 分钟阅读

拆解 HPE AI 工厂：计算、存储、软件和 Cray 的整合实验

DL 394 Gen 12、Alletra MPX 10000 MCP原生存储、GreenLake全栈软件、Cray基因转用。六大设备缺口，2027见分晓。

阅读长文 →

06-182026

2026-06-18思考16 分钟阅读

当 AI Agent 成为工作负载：HPE 的智能体基础设施蓝图

零代码注册、三层身份、NVIDIA沙箱、MCP原生存储。HPE是第一家给Agent搭全套基础设施的传统厂商。

阅读长文 →

06-182026

2026-06-18思考17 分钟阅读

从 Allbirds 转行 AI 基建谈起：产品力和营销如何支撑企业长青

Allbirds 卖了鞋、改名叫 Smartbird，背后是一家公司的全部价值建立在故事上的代价。营销是放大器，产品力是底盘；产品力撑不起的企业，故事讲完了就空了。

阅读长文 →

06-172026

2026-06-17思考29 分钟阅读

没有自己大模型的工具公司没有独立未来？SpaceX $600亿收购Cursor与AI Coding的终局

SpaceX以$600亿全股票收购Cursor母公司Anysphere。Cursor同时在Compile大会公布1.5万亿参数自训练模型。这不仅是AI coding赛道最大的并购——它揭示了"四块拼图"框架：自训练能力、10万卡算力、RL资本、让出独立性。AI搜索和AI视频是下一个最脆弱的领域。

阅读长文 →

06-162026

2026-06-16思考24 分钟阅读

MaaS 推理技术栈：六个杠杆如何把成本打掉 96%

DeepSeek 把单 token 推理成本降低 96% 的技术拆解。六个杠杆的原理与效果，推理引擎对比，以及前沿方向。

阅读长文 →

06-162026

2026-06-16思考27 分钟阅读

Token 分发时代：MaaS 服务模式与商业解剖

中国 MaaS 市场保本线 5-7 元/百万 token，主流厂商定价普遍压在保本线以下。四种服务模式（直营/云生态/聚合路由/平台）如何共存？三条竞争路径各自的优劣与天花板。杰文斯悖论贯穿全文。

阅读长文 →

06-152026

2026-06-15思考50 分钟阅读

显存的暴政：KV Cache 如何重塑 AI 推理的每一层

1M上下文时代，KV Cache 成为推理成本的核心矛盾。

阅读长文 →

06-142026

2026-06-14思考35 分钟阅读

当 SSD 变成内存：AI 推理正在重写存储层级

2026 年上半年，三个事实摆在一起看，矛盾尖锐得很难忽视。

阅读长文 →

06-132026

2026-06-13思考16 分钟阅读

算力不是战斗力：SpaceX Colossus 出租事件揭示的 AI 基础设施真相

22万张GPU建好不到一年就被出租。SpaceX的Colossus出租事件揭示算力拥有与有效使用之间的巨大鸿沟。

阅读长文 →

06-122026

2026-06-12思考11 分钟阅读

一份报告砸了光通信板块：CPO 真的被证伪了吗？

2026 年 6 月 9 日，SemiAnalysis 发给机构客户一份报告，标题叫《Powered Down, Lights Off》。当天 AAOI 跌 14%，COHR 跌 11%，GLW 跌 9%，MRVL 跌 9%，LITE 跌 8%，CIEN 跌 7%。一天之内，整个光电子产业链被按在地上。

阅读长文 →

06-122026

2026-06-12思考13 分钟阅读

RAMageddon：AI 数据中心的内存饥荒与存储超级周期

DRAM 合约价单季暴涨 90-95%，SK Hynix 利润率超过 NVIDIA。AI 到底消耗了多少内存和存储？谁在赚真钱？超级周期还是超级泡沫？

阅读长文 →

06-122026

2026-06-12思考31 分钟阅读

当 Agent 需要一个“工位”：OpenAI 收购 Ona 背后的执行环境战争

OpenAI 收购 Ona 不是买工具，而是买判断力。本文拆解 Agent 执行环境的技术层级、大厂策略差异和独立平台格局。

阅读长文 →

06-112026

2026-06-11思考13 分钟阅读

文本扩散 vs 自回归：生成范式之争

DiffusionGemma 1107 tok/s、Mercury 商业落地、Dream 7B 匹敌同级 AR。文本扩散两年从论文走到产品，但推理质量仍是致命短板。三条路线格局、场景分析和架构融合趋势。

阅读长文 →

06-112026

2026-06-11思考28 分钟阅读

Agent 支付协议战争：当 AI 开始花钱

过去 18 个月，Agent 支付从零到六大协议并立。Visa 和 Mastercard 分别押注消费者端和机器端，AI 公司、支付网络和加密基础设施在标准、责任、监管三条战线上争夺。文章拆解六大协议的技术定位、Visa × OpenAI 的六步购买流程、分层结算的必然性，以及五个未解决的核心问题。

阅读长文 →

06-102026

2026-06-10思考12 分钟阅读

当 AI 学会撒谎：Claude Fable 5 的行为学档案

Anthropic 放出了四个月前说太危险的模型。同样的权重，加了一层安全分类器。但 System Card 里真正值得读的不是 benchmark，而是五个行为案例——模型谎称完成了测试、伪装代码来源逃避审查、没跑测试就宣布发现安全漏洞。这五个案例揭示的不是能力不足，而是动机错位。

阅读长文 →

06-082026

2026-06-08思考13 分钟阅读

让 K8s 理解超节点：openFuyao 与灵衢的云化突围

灵衢云化层通过 openFuyao 把硬件能力封装为 K8s 原生接口。InferNex 推理集群级编排是当前最有商业价值的组件。本文分析 openFuyao 架构、InferNex 竞争力、超大规模调度挑战，做出灵衢软件栈整体战略判断，并从三篇推演中还原 41 条系统级功能规格。

阅读长文 →

06-082026

2026-06-08思考11 分钟阅读

超节点的心脏：灵衢服务层如何编织 8192 张卡

灵衢服务层回答「8192 张卡怎么协同工作」——UBS Engine 控制面、MemFabric 统一内存编织、HCCL 集合通信、NPU Direct 存储直连、超级 VM 虚拟化。本文逐组件拆解，对比 NVIDIA 服务层，评估开源替代性，推演 15 条服务层功能规格缺口。

阅读长文 →

06-082026

2026-06-08思考34 分钟阅读

让 Linux 理解超节点：灵衢内核层的技术解剖

灵衢（UnifiedBus）超节点选择在 Linux 内核里植入系统性改动：独立总线类型、跨节点地址翻译、统一内存管理、URMA 通信原语。本文逐模块解剖内核层，对比 NVIDIA 的拼接路线，反推 32 条功能需求规格。

阅读长文 →

06-072026

2026-06-07思考12 分钟阅读

光纤层的答案：Optical Shuffle 如何让 AI 集群绕过收发器瓶颈

Panduit 工程师 Castro 在 IEEE 802.3 提出 Optical Shuffle，通过 Lane Breakout + 光纤重排将 32K GPU 集群的收发器削减 33%，Spine 交换机减少 75%。与 AWS RNG 的拓扑优化正交叠加，三层优化（拓扑+连接+光纤）理论可将光模块成本降至胖树的 15-25%。

阅读长文 →

06-052026

2026-06-05思考18 分钟阅读

数据中心网络的一条新路线：RNG 打开了什么可能性

AWS 在 2026 年 4 月悄悄把所有新建非 GPU 数据中心的默认网络架构从胖树换成了 flat topology（RNG）。路由器减少 69%，吞吐提升 33%。这不是实验，是生产默认。但 RNG 的意义不是「能不能替代胖树」——而是「胖树之外的设计空间被打开了」。

阅读长文 →

06-042026

2026-06-04思考18 分钟阅读

Token 大撤退：当 AI 账单开始比人贵

Uber 四个月烧光全年 AI 预算。某企业一个月给 Anthropic 刷出 5 亿美元账单。Klarna 用 AI 替掉 700 人后悄悄重新招人。与此同时，OpenAI 和 Anthropic 季度收入突破百亿美元。一边是用户的焦虑，一边是厂商的狂欢。问题不只是贵——而是你花的每一块钱里，有多少在解决问题，有多少在帮模型公司冲收入？

阅读长文 →

06-042026

2026-06-04思考41 分钟阅读

NVIDIA Rubin 重新流片：AMD GPU 产品力值得期待？

富邦报告曝光 Rubin 因 MI450 竞争压力推回重做。从规格对比到 AMD AI infra 全栈分析——硬件架构、软件体系、客户案例、ROCm 生态现状。

阅读长文 →

06-032026

2026-06-03思考53 分钟阅读

Build 2026：微软的 Agent OS 赌局

Windows 从"运行应用的操作系统"变成"运行 Agent 的平台"——这不仅是技术路线的改变，而是一个万亿市值公司在重新定义自己的核心身份。

阅读长文 →

06-022026

2026-06-02思考52 分钟阅读

从 CLOS 到 ZCube：智算集群网络拓扑演进

从 Charles Clos 1953 年的无阻塞电话交换网络，到字节跳动 2025 年 SIGCOMM 最佳论文的 ZCube——拓扑设计从专家直觉走向自动搜索。ZCube 用非对称结构在 16K GPU 规模上省掉 60% 交换机、训练速度提升 5%，而智谱 AI 的生产验证证明它不只适用于训练。

阅读长文 →

06-022026

2026-06-02思考52 分钟阅读

从 RoCE 到 MRC:AI 集群传输协议与芯片重构

OpenAI 联合 NVIDIA、AMD、Broadcom、Arista、Cisco 五家巨头,用 MRC 协议同时推翻了数据中心网络三十年的五个共识。把智能从交换机推到网卡,让交换机回归无状态转发--这个设计哲学转变的背后,是一整套芯片层面的架构重构。

阅读长文 →

06-012026

2026-06-01思考24 分钟阅读

PC 被重新发明：Computex 2026 与 NVIDIA 的基础设施野心

黄仁勋在 GTC Taipei 发布了 RTX Spark——33 年技术积累浓缩成一颗芯片，正式宣告 PC 进入 agent 时代。Vera Rubin 全面量产、DSX 开源 AI 工厂框架、88 核 Vera CPU……这不是一场产品发布会，是一份基础设施公司的战略宣言。

阅读长文 →

2026年5月 27 篇

05-312026

2026-05-31思考77 分钟阅读

270亿美元的暗线：AI数据中心配电革命与模拟芯片新格局

当机架功耗从15kW飙向1.5MW，配电架构被迫从54V向800V直流转型。这个物理定律强制的变革，正在催生一个从79亿到270亿美元的模拟芯片新市场——而中国企业在其中的位置，比大多数人以为的要靠前。

阅读长文 →

05-302026

2026-05-30思考25 分钟阅读

灵衢协议深度分析：中国算力突围的互联赌注

灵衢（UnifiedBus）是华为自研的统一互联协议，用五层协议栈替代 PCIe+NVLink+RDMA，支撑 8192 卡无收敛全互联。本文从物理层到生态层逐层拆解灵衢的设计逻辑，对比 NVLink/UALink/海光 HSL/博通 SUE 等全球竞品，分析灵衢的竞争窗口、核心风险和商业价值。五条核心判断：灵衢是华为互联补算力的命门，竞争窗口在…

阅读长文 →

05-282026

2026-05-28思考18 分钟阅读

CPU回来了：AI推理时代服务器处理器格局重写

NVIDIA Vera、AMD Venice、英特尔至强 6 三条路线竞速。GPU:CPU 配比从 8:1 向 1:1 演进。新增国内 CPU 四条路线全景分析（x86/ARM/自主/RISC-V）、整机厂商格局、份额与趋势判断。

阅读长文 →

05-272026

2026-05-27思考18 分钟阅读

从CoWoS到韬定律：3D堆叠芯片的技术演进与路线分叉

华为韬定律用架构换密度，台积电把混合键合压到4.5微米，SkyWater用碳纳米管造出真3D芯片原型。三条路线都在做垂直集成，但代价和天花板完全不同。

阅读长文 →

05-272026

2026-05-27思考12 分钟阅读

780万美元的AI机架：大摩拆解Rubin揭示的价值链重构

大摩拆解英伟达Rubin VR200 NVL72机架：内存成本暴涨435%跃升为第二大BOM项目（占比26%），GPU占比从65%跌至51%。AI硬件的价值重心正在从"买算力"转向"买内存和带宽"。

阅读长文 →

05-262026

2026-05-26思考31 分钟阅读

两场革命，一张网络：AI 训练集群的拓扑与协议协同重构

10 万 GPU 规模的 AI 训练网络，正在物理层（拓扑）和逻辑层（协议）同时经历范式重构。ZCube 用非对称拓扑省掉 60% 交换机，MRC 把智能从交换机推到网卡——但真正的故事是：这两场革命互为前提，必须协同设计。本文建立双轴框架，覆盖 RoCEv2→MRC→UET 协议演进、Clos→Rail→ZCube→OCS…

阅读长文 →

05-262026

2026-05-26思考30 分钟阅读

从 ZCube 谈起：面向 PD 分离推理的网络拓扑设计

当推理取代训练成为 AI 基础设施的主战场，GPU 集群的网络拓扑需要从头重新思考。本文从 ZCube 出发，分析 PD 分离推理下的网络瓶颈，推导 P:D 配比与放置策略，提出 RailFly 拓扑族及其纯推理进阶形态 Rail-Fabric。

阅读长文 →

05-252026

2026-05-25思考15 分钟阅读

DeepSeek V4 + 昇腾：国产大模型推理的全栈验证

KADC 2026 系列分析 · 第 4 篇 · 端到端验证链 / 国产推理算力

阅读长文 →

05-252026

2026-05-25思考15 分钟阅读

Agent Infra：一个新基础设施类别的诞生

KADC 2026 系列分析 · 第 3 篇 · Agent 基础设施 / 通算+智算协同

阅读长文 →

05-252026

2026-05-25思考15 分钟阅读

CANN 开源：昇腾从"建生态"到"进生态"的战略转折

KADC 2026 系列分析 · 第 2 篇 · 软件生态 / 开发者战略

阅读长文 →

05-252026

2026-05-25思考15 分钟阅读

昇腾超节点的架构跃迁：从训练优先到 Agent 优先

KADC 2026 系列分析 · 第 1 篇 · AI Infra / 硬件架构演进

阅读长文 →

05-252026

2026-05-25思考35 分钟阅读

RailFly：面向 PD 分离推理的网络拓扑设计

以 ZCube 为基准，分析 PD 分离推理下网络拓扑的核心价值与局限，推导 P:D 配比与放置策略，提出 RailFly——覆盖训练+推理混合负载的务实拓扑族，及其纯推理进阶形态 PDX-Fabric。

阅读长文 →

05-252026

2026-05-25思考22 分钟阅读

代码世界建模：AI 推理训练的一条暗线

从一位 Anthropic 研究员透露的秘密出发，我们追踪了六篇论文，揭示了一个比预期更大的训练范式：基于验证器的过程监督——代码执行预测成为通用推理的预训练场，也是第一条不依赖人类数据的智能提升路径。

阅读长文 →

05-242026

2026-05-24思考35 分钟阅读

DeepSeek V4-Pro 的 PDC 分离推理：从计算原理到部署配置

面向 NVIDIA B300 与华为 Ascend 950 Supernode，回答三个问题：几个 P 对几个 D？P/D 各用多少 GPU/NPU？内部并行怎么配？ > > 本文不仅给结论，更完整展示每个关键数字是怎么算出来的——读者可以跟着推导链自己验证。

阅读长文 →

05-232026

2026-05-23思考55 分钟阅读

昇腾 950：华为 AI 芯片的第三条路

按架构师报告校准：B300 36PFLOPS dense FP8、新增 SLA-safe EP 粒度配置表、高利用率下 B300 全面更优、950DT 打平临界值 $1.1-1.3/NPU-hour。

阅读长文 →

05-212026

2026-05-21思考22 分钟阅读

博通 Tomahawk 6 vs NVIDIA 网络芯片：从硅片到 AI 工厂的全栈对标

从交换芯片到光封装，从 Scale-Up 互连到整机柜交付，从标准组织到客户阵营——一次覆盖 Broadcom TH6 与 NVIDIA Spectrum-X 的全栈对标分析。

阅读长文 →

05-212026

2026-05-21思考40 分钟阅读

NVIDIA Q1 FY2027 财报深度分析：$81.6B 背后的技术信号与战略博弈

Agentic AI 需求已经 parabolic，但 NVIDIA 面临客户变对手、中国市场归零、LPU 定位降级三重压力。数据中心 $75.2B（网络 YoY +199%）、Vera Rubin 全程供不应求、Vera CPU 打开 $2000 亿新市场、Groq LPU 降级为 niche product、Q2 指引 $91B 不含中国。

阅读长文 →

05-212026

2026-05-21思考35 分钟阅读

Google I/O 2026 深度技术分析（增强版）：Agentic Gemini 时代的全面启动

从操作系统到智能系统——Google 全栈 Agent 化飞轮完成第一轮闭环。3.2Q tokens/月、Gemini 3.5 Flash、Omni 视频生成、Antigravity 2.0 Agent 基座、Gemini Spark 24/7 个人 Agent、AI Mode 10亿 MAU、Googlebook、Android XR 眼镜，以及…

阅读长文 →

05-202026

2026-05-20思考35 分钟阅读