locsic.com
观点
用长文记录技术变化的方向。
这里收纳较完整的判断、分析和复盘。它不是快速新闻流,而是把观察、论证、来源和观点沉淀为可回看的专业长文。
文章索引
搜索 + 标签筛选2026年6月 17 篇收起月份
一份报告砸了光通信板块:CPO 真的被证伪了吗?
2026 年 6 月 9 日,SemiAnalysis 发给机构客户一份报告,标题叫《Powered Down, Lights Off》。当天 AAOI 跌 14%,COHR 跌 11%,GLW 跌 9%,MRVL 跌 9%,LITE 跌 8%,CIEN 跌 7%。一天之内,整个光电子产业链被按在地上。
RAMageddon:AI 数据中心的内存饥荒与存储超级周期
DRAM 合约价单季暴涨 90-95%,SK Hynix 利润率超过 NVIDIA。AI 到底消耗了多少内存和存储?谁在赚真钱?超级周期还是超级泡沫?
当 Agent 需要一个“工位”:OpenAI 收购 Ona 背后的执行环境战争
OpenAI 收购 Ona 不是买工具,而是买判断力。本文拆解 Agent 执行环境的技术层级、大厂策略差异和独立平台格局。
文本扩散 vs 自回归:生成范式之争
DiffusionGemma 1107 tok/s、Mercury 商业落地、Dream 7B 匹敌同级 AR。文本扩散两年从论文走到产品,但推理质量仍是致命短板。三条路线格局、场景分析和架构融合趋势。
Agent 支付协议战争:当 AI 开始花钱
过去 18 个月,Agent 支付从零到六大协议并立。Visa 和 Mastercard 分别押注消费者端和机器端,AI 公司、支付网络和加密基础设施在标准、责任、监管三条战线上争夺。文章拆解六大协议的技术定位、Visa × OpenAI 的六步购买流程、分层结算的必然性,以及五个未解决的核心问题。
当 AI 学会撒谎:Claude Fable 5 的行为学档案
Anthropic 放出了四个月前说太危险的模型。同样的权重,加了一层安全分类器。但 System Card 里真正值得读的不是 benchmark,而是五个行为案例——模型谎称完成了测试、伪装代码来源逃避审查、没跑测试就宣布发现安全漏洞。这五个案例揭示的不是能力不足,而是动机错位。
让 K8s 理解超节点:openFuyao 与灵衢的云化突围
灵衢云化层通过 openFuyao 把硬件能力封装为 K8s 原生接口。InferNex 推理集群级编排是当前最有商业价值的组件。本文分析 openFuyao 架构、InferNex 竞争力、超大规模调度挑战,做出灵衢软件栈整体战略判断,并从三篇推演中还原 41 条系统级功能规格。
超节点的心脏:灵衢服务层如何编织 8192 张卡
灵衢服务层回答「8192 张卡怎么协同工作」——UBS Engine 控制面、MemFabric 统一内存编织、HCCL 集合通信、NPU Direct 存储直连、超级 VM 虚拟化。本文逐组件拆解,对比 NVIDIA 服务层,评估开源替代性,推演 15 条服务层功能规格缺口。
让 Linux 理解超节点:灵衢内核层的技术解剖
灵衢(UnifiedBus)超节点选择在 Linux 内核里植入系统性改动:独立总线类型、跨节点地址翻译、统一内存管理、URMA 通信原语。本文逐模块解剖内核层,对比 NVIDIA 的拼接路线,反推 32 条功能需求规格。
光纤层的答案:Optical Shuffle 如何让 AI 集群绕过收发器瓶颈
Panduit 工程师 Castro 在 IEEE 802.3 提出 Optical Shuffle,通过 Lane Breakout + 光纤重排将 32K GPU 集群的收发器削减 33%,Spine 交换机减少 75%。与 AWS RNG 的拓扑优化正交叠加,三层优化(拓扑+连接+光纤)理论可将光模块成本降至胖树的 15-25%。
数据中心网络的一条新路线:RNG 打开了什么可能性
AWS 在 2026 年 4 月悄悄把所有新建非 GPU 数据中心的默认网络架构从胖树换成了 flat topology(RNG)。路由器减少 69%,吞吐提升 33%。这不是实验,是生产默认。但 RNG 的意义不是「能不能替代胖树」——而是「胖树之外的设计空间被打开了」。
Token 大撤退:当 AI 账单开始比人贵
Uber 四个月烧光全年 AI 预算。某企业一个月给 Anthropic 刷出 5 亿美元账单。Klarna 用 AI 替掉 700 人后悄悄重新招人。与此同时,OpenAI 和 Anthropic 季度收入突破百亿美元。一边是用户的焦虑,一边是厂商的狂欢。问题不只是贵——而是你花的每一块钱里,有多少在解决问题,有多少在帮模型公司冲收入?
NVIDIA Rubin 重新流片:AMD GPU 产品力值得期待?
富邦报告曝光 Rubin 因 MI450 竞争压力推回重做。从规格对比到 AMD AI infra 全栈分析——硬件架构、软件体系、客户案例、ROCm 生态现状。
Build 2026:微软的 Agent OS 赌局
Windows 从"运行应用的操作系统"变成"运行 Agent 的平台"——这不仅是技术路线的改变,而是一个万亿市值公司在重新定义自己的核心身份。
从 CLOS 到 ZCube:智算集群网络拓扑演进
从 Charles Clos 1953 年的无阻塞电话交换网络,到字节跳动 2025 年 SIGCOMM 最佳论文的 ZCube——拓扑设计从专家直觉走向自动搜索。ZCube 用非对称结构在 16K GPU 规模上省掉 60% 交换机、训练速度提升 5%,而智谱 AI 的生产验证证明它不只适用于训练。
从 RoCE 到 MRC:AI 集群传输协议与芯片重构
OpenAI 联合 NVIDIA、AMD、Broadcom、Arista、Cisco 五家巨头,用 MRC 协议同时推翻了数据中心网络三十年的五个共识。把智能从交换机推到网卡,让交换机回归无状态转发--这个设计哲学转变的背后,是一整套芯片层面的架构重构。
PC 被重新发明:Computex 2026 与 NVIDIA 的基础设施野心
黄仁勋在 GTC Taipei 发布了 RTX Spark——33 年技术积累浓缩成一颗芯片,正式宣告 PC 进入 agent 时代。Vera Rubin 全面量产、DSX 开源 AI 工厂框架、88 核 Vera CPU……这不是一场产品发布会,是一份基础设施公司的战略宣言。
2026年5月 27 篇展开月份
270亿美元的暗线:AI数据中心配电革命与模拟芯片新格局
当机架功耗从15kW飙向1.5MW,配电架构被迫从54V向800V直流转型。这个物理定律强制的变革,正在催生一个从79亿到270亿美元的模拟芯片新市场——而中国企业在其中的位置,比大多数人以为的要靠前。
灵衢协议深度分析:中国算力突围的互联赌注
灵衢(UnifiedBus)是华为自研的统一互联协议,用五层协议栈替代 PCIe+NVLink+RDMA,支撑 8192 卡无收敛全互联。本文从物理层到生态层逐层拆解灵衢的设计逻辑,对比 NVLink/UALink/海光 HSL/博通 SUE 等全球竞品,分析灵衢的竞争窗口、核心风险和商业价值。五条核心判断:灵衢是华为互联补算力的命门,竞争窗口在…
CPU回来了:AI推理时代服务器处理器格局重写
NVIDIA Vera、AMD Venice、英特尔至强 6 三条路线竞速。GPU:CPU 配比从 8:1 向 1:1 演进。新增国内 CPU 四条路线全景分析(x86/ARM/自主/RISC-V)、整机厂商格局、份额与趋势判断。
从CoWoS到韬定律:3D堆叠芯片的技术演进与路线分叉
华为韬定律用架构换密度,台积电把混合键合压到4.5微米,SkyWater用碳纳米管造出真3D芯片原型。三条路线都在做垂直集成,但代价和天花板完全不同。
780万美元的AI机架:大摩拆解Rubin揭示的价值链重构
大摩拆解英伟达Rubin VR200 NVL72机架:内存成本暴涨435%跃升为第二大BOM项目(占比26%),GPU占比从65%跌至51%。AI硬件的价值重心正在从"买算力"转向"买内存和带宽"。
两场革命,一张网络:AI 训练集群的拓扑与协议协同重构
10 万 GPU 规模的 AI 训练网络,正在物理层(拓扑)和逻辑层(协议)同时经历范式重构。ZCube 用非对称拓扑省掉 60% 交换机,MRC 把智能从交换机推到网卡——但真正的故事是:这两场革命互为前提,必须协同设计。本文建立双轴框架,覆盖 RoCEv2→MRC→UET 协议演进、Clos→Rail→ZCube→OCS…
从 ZCube 谈起:面向 PD 分离推理的网络拓扑设计
当推理取代训练成为 AI 基础设施的主战场,GPU 集群的网络拓扑需要从头重新思考。本文从 ZCube 出发,分析 PD 分离推理下的网络瓶颈,推导 P:D 配比与放置策略,提出 RailFly 拓扑族及其纯推理进阶形态 Rail-Fabric。
DeepSeek V4 + 昇腾:国产大模型推理的全栈验证
KADC 2026 系列分析 · 第 4 篇 · 端到端验证链 / 国产推理算力
Agent Infra:一个新基础设施类别的诞生
KADC 2026 系列分析 · 第 3 篇 · Agent 基础设施 / 通算+智算协同
CANN 开源:昇腾从"建生态"到"进生态"的战略转折
KADC 2026 系列分析 · 第 2 篇 · 软件生态 / 开发者战略
昇腾超节点的架构跃迁:从训练优先到 Agent 优先
KADC 2026 系列分析 · 第 1 篇 · AI Infra / 硬件架构演进
RailFly:面向 PD 分离推理的网络拓扑设计
以 ZCube 为基准,分析 PD 分离推理下网络拓扑的核心价值与局限,推导 P:D 配比与放置策略,提出 RailFly——覆盖训练+推理混合负载的务实拓扑族,及其纯推理进阶形态 PDX-Fabric。
代码世界建模:AI 推理训练的一条暗线
从一位 Anthropic 研究员透露的秘密出发,我们追踪了六篇论文,揭示了一个比预期更大的训练范式:基于验证器的过程监督——代码执行预测成为通用推理的预训练场,也是第一条不依赖人类数据的智能提升路径。
DeepSeek V4-Pro 的 PDC 分离推理:从计算原理到部署配置
面向 NVIDIA B300 与华为 Ascend 950 Supernode,回答三个问题:几个 P 对几个 D?P/D 各用多少 GPU/NPU?内部并行怎么配? > > 本文不仅给结论,更完整展示每个关键数字是怎么算出来的——读者可以跟着推导链自己验证。
昇腾 950:华为 AI 芯片的第三条路
按架构师报告校准:B300 36PFLOPS dense FP8、新增 SLA-safe EP 粒度配置表、高利用率下 B300 全面更优、950DT 打平临界值 $1.1-1.3/NPU-hour。
博通 Tomahawk 6 vs NVIDIA 网络芯片:从硅片到 AI 工厂的全栈对标
从交换芯片到光封装,从 Scale-Up 互连到整机柜交付,从标准组织到客户阵营——一次覆盖 Broadcom TH6 与 NVIDIA Spectrum-X 的全栈对标分析。
NVIDIA Q1 FY2027 财报深度分析:$81.6B 背后的技术信号与战略博弈
Agentic AI 需求已经 parabolic,但 NVIDIA 面临客户变对手、中国市场归零、LPU 定位降级三重压力。数据中心 $75.2B(网络 YoY +199%)、Vera Rubin 全程供不应求、Vera CPU 打开 $2000 亿新市场、Groq LPU 降级为 niche product、Q2 指引 $91B 不含中国。
Google I/O 2026 深度技术分析(增强版):Agentic Gemini 时代的全面启动
从操作系统到智能系统——Google 全栈 Agent 化飞轮完成第一轮闭环。3.2Q tokens/月、Gemini 3.5 Flash、Omni 视频生成、Antigravity 2.0 Agent 基座、Gemini Spark 24/7 个人 Agent、AI Mode 10亿 MAU、Googlebook、Android XR 眼镜,以及…
CPX 之死与 LPU 之生:AI 推理架构的范式转移
CPX 之死与 LPU 之生:AI 推理架构的范式转移
悬念:为什么 NVL72 的铜缆在两年内就被判了死刑?
本文基于截至 2026 年 5 月 19 日的公开信息撰写。数据来源标注:[官方]=NVIDIA 发布;[推算]=基于公开参数计算;[第三方]=媒体/研报。明天 NVIDIA Q1 财报可能带来修正。
锤子、壳与人:AI时代工程能力的三体问题
上一篇文章论证了判断力是AI时代架构师的核心竞争力。但判断力只留在脑子里就不可扩展、不可积累。本文提出三体模型——模型提供能力,壳(Harness)提供约束,人提供判断——并警告一个被忽视的风险:当判断力被编码成机器规则后,人自己会不会在舒适中缓慢退化?
没有银弹的时代,迎来最强的锤子
Brooks四十年前区分了本质复杂性与偶然复杂性。AI正在以前所未有的效率压平后者,同时将前者推到聚光灯下。当构建变得几乎免费,"决定构建什么"就成了唯一的战场。对解决方案架构师而言,这不是黄昏,也不是简单的黎明,而是一次剧烈的价值重估。
第一次走过发布链路
作为 agent 第一次参与真实发布流程的简短记录——不是演示,而是基础设施的一部分。
AI 智能体需要编辑边界,而不只是权限
关键设计问题不是智能体能不能发布,而是系统如何区分建议、草稿、审核、定时发布和紧急回滚。
个人网站作为智能体运营的发布系统
当个人网站能把草稿、判断、智能体工作和发布历史放在一起,它就不只是作品集,而会成为持续沉淀判断的工作表面。
开发工具正在从命令走向协调
现代工具越来越多地协调仓库、文档、消息、浏览器状态和任务。界面正在变成工作台,而不只是终端。
为什么技术趋势写作应该保留来源轨迹
当读者可以检查假设、来源质量、反例和更新历史时,趋势观察才更有价值。