← 返回观点 思考

Build 2026:微软的 Agent OS 赌局

Windows 从"运行应用的操作系统"变成"运行 Agent 的平台"——这不仅是技术路线的改变,而是一个万亿市值公司在重新定义自己的核心身份。

2026-06-03思考53 分钟阅读

Windows 从"运行应用的操作系统"变成"运行 Agent 的平台"——这不仅是技术路线的改变,而是一个万亿市值公司在重新定义自己的核心身份。

2026 年 6 月 2-3 日,旧金山 Fort Mason Center。微软把 Build 从西雅图搬到旧金山——不是会址的随机选择,而是地理空间的宣示:微软正在 AI 产业的核心地带,跟 Google、OpenAI、Meta 抢夺开发者心智。

Satya Nadella 开场时说了一句话,整个 Build 都在围绕它展开:"Windows is the best platform for building agents."

注意,他没说"运行应用",没说"开发软件"——他说的是"building agents"。

这个用词的选择暴露了微软的赌注:未来开发者不只是写应用,而是写 Agent;不只是部署到服务器,而是部署到每个人的 PC 上。而微软要做的,是成为这个新世界的操作系统。

本文回答三个问题:

  1. 微软用哪些产品把 Windows 变成了 Agent OS?从底层运行时到 Office 套件,整个产品栈是怎么布局的?
  2. 微软在开发生态上做了什么——OpenClaw 原生入驻、Visual Studio 变成 Agent IDE,开发者工具链发生了什么变化?
  3. 这场赌局的胜算有多大?

一、产品布局:Agent OS 的五层架构

Build 2026 不是点状的 AI 功能发布。微软实际上在构建一个完整的垂直栈——从芯片到云,从操作系统到 Office 应用,每一层都围绕 Agent 重新设计。

这个栈可以分成六层:

Build 2026:微软 Agent OS 六层架构
Build 2026:微软 Agent OS 六层架构
产品 职责
硬件 RTX Spark PC / Dev Box / Solara + Maia 200 / Cobalt 200 端侧和云端 AI 算力载体
运行时 MXC + Windows AI Runtime + Windows 365 for Agents + Foundry Agent Service Agent 的安全沙箱、本地推理、云端托管执行环境
上下文 Microsoft IQ(Work/Fabric/Foundry/Web) 让 Agent 理解企业上下文和实时信息
云平台 Microsoft Foundry + Rayfin + HorizonDB Agent 的云端托管、编排、数据库
生产力 Office 365 Copilot + Agent 365 + Copilot Studio Agent 在生产力场景中执行任务,企业统一治理
协议 NLWeb + MCP 让 Agent 消费整个 Web 的结构化数据

1.1 硬件层:RTX Spark 和 Solara

微软在 Build 上展示了 Agent OS 的两种硬件形态。

Surface RTX Spark Dev Box 是开发者版本:NVIDIA RTX Spark 芯片(Arm 架构),1 PFLOPS AI 算力,128GB 统一内存。能本地跑 120B 参数 LLM 加 1M token 上下文,WSL2 原生 GPU 直通加 CUDA。

为什么做本地大模型 Dev Box 而不是让开发者用云端 GPU?两层原因:第一层是成本——开发者调试 Agent 时频繁调用 API 的 token 费用很高,本地推理可以吃掉这块成本。第二层是隐私——企业 Agent 调试涉及内部数据和代码,跑在本地比跑在云端更容易通过合规审查。

Project Solara 是概念设备,chip-to-cloud agent-first 平台。两个概念设备不是开发工具,而是愿景展示——Qualcomm CEO Cristiano Amon 上台畅想 Agent 专属设备。ASUS、Dell、HP、Lenovo、MSI 都在今年秋季推出 RTX Spark 设备。

Satya Nadella 和 NVIDIA CEO Jensen Huang 在 Build 2026 上同台
Satya Nadella 和 NVIDIA CEO Jensen Huang 在 Build 2026 上同台

微软在硬件层传递的信号是:Agent 需要的算力不是当前 PC 的水平——120B 参数、1M token 上下文,这需要专用硬件。 而 Arm 架构(RTX Spark 是 NVIDIA 首款 Arm 超级芯片)的能效优势,让本地大模型推理在功耗和散热上变得可行。

1.2 运行时层:MXC、本地推理和云 PC

Steven Bathiche 在 Build 2026 上展示 Project Solara
Steven Bathiche 在 Build 2026 上展示 Project Solara

这是 Agent OS 的核心层。三个产品分别解决不同场景的 Agent 执行问题。

Microsoft Execution Containers(MXC)

MXC 做的事情用一句话说:给 Agent 提供 OS 级的隔离沙箱。

MXC 不是 Docker,不是 WSL,不是传统虚拟机。它是一个专门为 Agent 运行时设计的 OS 级沙箱——Agent 在里面可以读写文件、调用 API、执行代码,但不能越界到宿主系统。Nadella 在台上现场演示了一个 Agent 试图删除用户文件,被 MXC 拦截。

当前 Agent 框架的安全模型基本是应用层的——工具调用权限、guardrail、prompt 限制,全是应用逻辑层面的检查。MXC 说的是:我不信任应用层面的检查,我把隔离做到 OS 内核里。

MXC 目前处于 Early Preview 阶段,SDK 已在 GitHub 上开源。但几个关键细节 Build 上没有展开:OS 级沙箱的性能开销是多少?隔离粒度怎么控制——是隔离整个 Agent 进程,还是可以隔离单个工具调用?这些是产品化阶段必须回答的工程问题。

Windows AI Runtime

Windows AI Runtime 扩展了本地推理的硬件覆盖:不再限 NPU,CPU 和 GPU 都能用。本地 SLM 支持更多设备类型。

这个变化的表面含义是"更多设备能用 AI 功能"。更深层的信息是:微软在把推理能力变成操作系统基础设施。 类比一下——2006 年 Windows Vista 把桌面搜索从第三方工具内置到操作系统,变成了 Windows Search。现在微软在做的是把 AI 推理从第三方应用内置到操作系统里。

Windows 365 for Agents

这是一个容易被忽略但非常重要的产品。Windows 365 for Agents 给 Agent 分配 Cloud PC——让 Agent 拥有一个完整的 Windows 桌面环境,可以像人一样操作应用、浏览器、文件、企业系统。

用官方文档的话说:"当 Agent 发现任务无法通过 API 完成时,它可以调用 Windows 365 for Agents 获得一台 Cloud PC,在完整的 Windows 会话中执行操作。"

这个设计的含义是:Agent 不再被限制在 API 可达的世界里。 遇到没有 API 的遗留系统(ERP、内部工具、老旧企业应用),Agent 可以像人一样打开界面操作。而且这些操作发生在企业边界内——Cloud PC 的安全策略、网络隔离、数据保护全部适用。

三层运行时合在一起:本地推理跑小任务(Windows AI Runtime),本地沙箱跑敏感任务(MXC),云端桌面跑复杂任务(Windows 365 for Agents)。 覆盖了 Agent 可能遇到的所有执行场景。

1.3 上下文层:Microsoft IQ

MXC 解决的是"Agent 能不能安全跑"的问题。Microsoft IQ 解决的是"Agent 能不能理解你的企业"。

微软把企业上下文拆成四层:

名称 覆盖范围
1 Work IQ 邮件、会议、文档、人脉关系——捕捉"工作是怎么发生的"
2 Fabric IQ 结构化业务数据语义层——统一数据、商业智能、本体论(ontologies)
3 Foundry IQ 跨知识源检索和规划——让 Agent 发现和复用知识
4 Web IQ 实时 Web 搜索,MCP 原生——给 Agent 加上实时全球信息

四层的工程野心是:让 Agent 不需要每次都从头理解你的企业。当前 Agent 的最大瓶颈不是模型能力,而是上下文。你给一个 Agent 任务,它不知道你的团队习惯用什么工具、项目文档在哪、最近开了什么会、谁是决策者。这些信息散落在邮件、Teams、SharePoint、数据库、Wiki 里。Agent 要么每次从零搜集,要么靠人工喂 prompt。

Microsoft IQ 的赌注是:如果操作系统层能把四层上下文变成 Agent 可消费的统一接口,Agent 的实用性会大幅提升。

但这里有一个根本性的工程问题: 四层上下文的数据质量和一致性怎么保证?邮件里说的"项目 A"和 Fabric 里标注的"Project A"是不是同一个东西?Work IQ 捕捉到的人脉关系和实际的组织架构是不是同步的?如果上下文本身是噪音,Agent 越聪明反而越危险。

微软展示了效果 demo,但没有讨论这个一致性问题。这可能是产品化阶段最难的工程挑战。

1.4 协议层:NLWeb

NLWeb(Natural Language Web)是 Build 上最有野心也最有争议的宣布。

核心思路:让任何网站响应自然语言查询,不需要搜索引擎做中间人。 构建在 MCP 之上,网站添加 NLWeb 支持后,Agent 可以直接向网站提问,获取结构化答案,而不是抓取 HTML 再解析。

这个协议的潜台词是:如果 Agent 可以直接消费网站内容,浏览器的存在意义就变了。

微软从 Build 2025 提出 NLWeb,Build 2026 开始实测。但几个关键问题仍然悬而未决:

  • 谁来付 NLWeb 的流量成本?Agent 的高频查询对网站来说是纯消耗
  • 隐私边界在哪?Agent 代表用户查询网站时,网站能追踪到什么?
  • 为什么网站要自愿接入一个可能削弱自己流量入口的协议?

微软的答案是"开放协议、社区驱动",但商业博弈不太可能靠善意解决。NLWeb 的命运取决于:微软能不能让足够多的大网站先接入,形成网络效应。


二、生产力层:Office 套件的 Agent 化

如果说前面四层是基础设施,那 Office 套件的 Agent 化就是微软把 Agent 送到每个用户面前的路径。这是 Agent OS 最关键的产品层——因为大多数企业用户不会关心 MXC 或 NLWeb,但他们每天都在用 Word、Excel、Outlook、Teams。

Office 套件的 Agent 化:四条产品线
Office 套件的 Agent 化:四条产品线

2.1 Copilot Agentic Mode:从"帮我写"到"帮我做"

2026 年 4 月 22 日,Copilot Agentic Mode 在 Word、Excel、PowerPoint 中正式 GA。这不是早期的"帮我起草邮件"——Agentic Mode 意味着 Copilot 可以在文档内执行多步骤、自主的操作,不需要逐步指令。

Word 里的变化最能说明问题。Copilot 不再只是文字生成器——它可以多轮迭代文档语气、从多个源文件合成提案、从长报告中提取行动项。更值得注意的是 Legal Agent:专门处理合同审查、红线标注和带修订跟踪的协商。Word 甚至加入了 Claude 模型选项(来自 Anthropic),与 OpenAI 模型并列——微软在 Office 里给了用户模型选择权。

Excel 里 Copilot 超越了公式建议。它可以识别趋势、生成公式、创建自动数据透视表,支持 Python 集成做高级分析。Plan Mode 先列出操作计划,等你确认后再动数据——这是从"AI 自动执行"到"AI 先规划后执行"的交互范式变化。

Teams 里 Copilot 做实时会议转录、行动项提取,还有一个新功能:Call Delegation——Copilot 代替你接听 Teams 来电,收集来电者信息,安排后续会议。

Outlook(Frontier Preview)走得更远:主动收件箱分类、优先级排序、日程调整,不需要用户触发。这是微软在试探"让 Agent 替你读邮件"的边界——也是最容易引发用户焦虑的功能。

2.2 Copilot Studio:从聊天机器人到 Agent 编排平台

Copilot Studio(前身是 Power Virtual Agents)在 Build 前后完成了质变:从低代码聊天机器人设计器,变成了企业级 Agent 编排平台。

核心变化是"中心引力"的转移。旧版 Copilot Studio 是 topic routing——用户输入匹配到预设主题,然后走对话树。新版是 generative orchestration——LLM 理解用户意图,检查 Agent 可用的知识、工具、主题和连接的 Agent,然后决定怎么处理。

5 月更新的 Workflow Designer 是这个变化的具象化:一个画布里同时放 AI 原生块(Agent、Prompt、知识检索)和传统自动化块(Power Automate 流程、条件分支、人工审批),用同一条管线编排。

这意味着企业可以用低代码方式构建完整的 Agent 工作流:Agent 做推理决策,Power Automate 做确定性执行,人工审批节点做把关。三者在同一个画布里连接。

2.3 Cowork Agent:把任务委托给 Agent

Cowork Agent 是 Build 上发布的新产品——一个可以用自然语言完整委托任务的 Agent。你不用逐步告诉它怎么做,只需说"帮我把这个季度的销售数据整理成演示文稿,发给团队",它自己规划执行。

Cowork Agent 的底层用的是 Microsoft IQ 四层上下文:它知道你的团队是谁(Work IQ)、销售数据在哪(Fabric IQ)、怎么检索相关文档(Foundry IQ)、最新市场信息是什么(Web IQ)。四层上下文在这里终于有了具体的产品形态。

2.4 Agent 365:企业治理层

当一家企业开始构建 5 个以上的自定义 Agent 时,治理问题就出现了:谁有权创建 Agent?Agent 能访问哪些数据?Agent 的操作日志在哪?出问题谁负责?

Agent 365 就是为解决这个问题设计的。它不是一个新的 Agent 产品,而是一个治理平面(governance plane):

  • Defender Agent SPM(Security Posture Management):Agent 的安全态势管理
  • Entra Conditional Access:Agent 的条件访问策略,跟企业身份体系集成
  • Purview Classifier:数据分类器,控制 Agent 能接触哪些敏感数据
  • 捆绑在 Microsoft 365 E7 许可证中

Agent 365 的定位是把 Agent 从"IT 部门的风险"变成"企业可控的基础设施"。这跟当年企业从"每个部门自己买 SaaS"到"IT 统一管理 SaaS"的演进路径一样——先是野蛮生长,然后是集中治理。

Windows 365 for Agents 也集成在 Agent 365 里。 当 Agent 需要完整的 Windows 桌面环境来执行任务时,它在 Agent 365 的治理框架下获得 Cloud PC,所有操作都在企业边界内。

2.5 定价:Agent 的商业模型

Copilot 的定价模型值得单独说。

Microsoft 365 Copilot 是 $30/用户/月的附加许可证(需要 E3/E5/Business Standard 或 Premium 作为基础)。这个价格在 2023 年推出时被广泛认为"太贵"——但现在微软把 Agentic Mode、Cowork Agent、Copilot Studio 基础功能全部打包进去,$30 变成了一个 Agent 平台的入场费,而不再是一个聊天助手的费用。

Copilot Studio 独立版 $200/月(25K credits),适合需要构建自定义 Agent 但不需要 M365 Copilot 的团队。

这个定价策略的潜台词是:微软在用 Office 的许可证体系来分发 Agent 能力。 12 亿 Office 用户的计费关系已经建立,Agent 不需要重新教育用户付费——它在既有账单上加了一行。


三、开发生态:OpenClaw 入驻和 Agent IDE

3.1 OpenClaw 原生入驻 Windows

Build 2026 上,微软做了一个在开源 AI 社区引发震动的宣布:OpenClaw 正式成为 Windows 的一等公民。

微软官方 Windows Developer Blog 的原文:

"OpenClaw runs natively on Windows leveraging MXC. You can easily install and use OpenClaw in Windows with its own companion app." "We are invested in continuing to make OpenClaw run securely on Windows."

Peter Steinberger(OpenClaw 创建者)本人也到了 Build 现场,展示了 OpenClaw 如何在 MXC 沙箱中运行。

这不是一个"兼容性支持"的声明。这是微软在说:OpenClaw 是 Windows Agent 生态的核心运行时之一。 它跟 NVIDIA 的 OpenShell 并列——OpenShell 也是基于 MXC 的开源 Agent 运行时,NVIDIA 和微软联合推进。

微软为什么要把一个开源 Agent 框架纳入 Windows 原生支持?三层原因:

第一层是生态覆盖。 OpenClaw 是目前增长最快的开源 Agent 框架之一。它有一批活跃的开发者和丰富的 Agent 工具生态。把 OpenClaw 纳入 Windows,等于把这些开发者直接拉进 Windows 平台。

第二层是安全叙事。 OpenClaw 在 MXC 沙箱里运行,微软可以说"即使是第三方开源 Agent 框架,在 Windows 上也是安全的"。这比"我们有自己的安全模型"有说服力得多。

第三层是开发者心智。 当开发者在选择 Agent 框架时,"原生支持 Windows + 有 MXC 沙箱 + 有 companion app"会成为 OpenClaw 的差异化优势。微软用平台能力为特定框架背书,这在操作系统历史上反复出现过——Windows 对 Node.js 的原生支持、对 WSL 的投入,都是类似的策略。

3.2 NVIDIA OpenShell

NVIDIA OpenShell 是另一个基于 MXC 的 Agent 运行时。NVIDIA 官方博客说得很清楚:

"Top agentic apps are looking to leverage MXC and OpenShell to strengthen their security in Windows, including the popular open source agents OpenClaw and Hermes Agent."

OpenShell + MXC 的组合给 Agent 提供了两层安全:MXC 负责 OS 级隔离,OpenShell 负责运行时安全策略。

OpenClaw 和 OpenShell 并列在 MXC 上的含义是:微软不是在押注单一 Agent 框架,而是在提供一个 Agent 运行时平台,让多个框架共享同一个安全底层。 这跟 Windows 同时支持 .NET 和 Java 的思路一致——平台不选边,但平台提供的能力会让框架更愿意留在平台上。

3.3 Visual Studio 2026:Agent IDE

Visual Studio 2026(v18)是自 VS 2022 以来最大的版本跳跃。但它的意义不在于"新 IDE",而在于 GitHub Copilot 从插件变成了 IDE 的核心

性能提升: UI 卡顿减少 50%,大型解决方案加载时间改善 40%。这些改进是必要的——VS 2022 在打开大型 C++ 工程时经常卡顿到分钟级别,开发者为此抱怨了三年。

但真正值得关注的是 Copilot 的深度集成:

Adaptive Paste——粘贴代码时 AI 自动适配项目风格和上下文。Copilot 会分析粘贴进来的代码和目标项目的命名规范、缩进风格、代码结构,然后自动转换。从 Stack Overflow 或 GitHub 复制代码粘贴到项目里,变量名会自动变成项目的风格。

Planning Mode——先让 Copilot 只读探索代码库,制定实现计划,再切换 Agent Mode 执行。这对 C++ 项目尤其重要——头文件依赖和构建系统复杂度远高于脚本语言,先规划后执行可以避免 Agent 改了一个头文件导致几百个文件重编译。

Cloud Agent——从 VS 直接启动云端 Agent session,自动创建 GitHub Issue 和 Pull Request。Copilot 的工作流从本地编辑器延伸到了整个 CI/CD 链路。

Agent Skills + MCP + Custom Agents: 三个可扩展机制让 Copilot 变成可定制的 Agent 平台:

  • Agent SkillsSKILL.md 文件):定义 Agent 的可复用技能。格式路径包括 .github/skills/.claude/skills/.agents/skills/——注意 .claude/skills/ 的存在,说明微软在主动兼容 Anthropic 的格式
  • Custom Agents.agent.md 文件):定义团队专属 Copilot Agent,执行代码审查、强制编码标准、理解代码库架构
  • MCP 支持:Copilot 通过 MCP 连接外部工具和知识源,统一管理 UI 和企业治理策略

VS 2026 支持 VS 2022 解决方案兼容、4000+ 扩展兼容、并排安装。

3.4 MSVC Build Tools:C++ 的大更新

C++ 开发者可能不会因为 Agent OS 激动,但 MSVC 的更新是实打实的工程投入。

C++23 完整支持——std::expectedstd::print、deducing this、多维 operator[] 等特性全部落地。MSVC 之前在 C++23 conformance 上落后于 Clang 和 GCC,v14.50 终于基本追平。

Sample Profile Guided Optimization (SPGO)——用硬件性能计数器采样,直接在 release 二进制上收集数据,不需要插桩。5-15% 运行时性能提升,不改代码,只加一步编译选项。对游戏引擎、量化交易、AI 推理引擎这些场景来说,这是"免费"的性能。

Copilot C++ 工具链:

  • @Modernize:自动升级项目到最新 MSVC 版本,修复编译错误和警告
  • @BuildPerfCpp:用 Build Insights 分析构建瓶颈,创建预编译头、优化 include 路径、并行构建设置
  • 上下文感知多文件重构:跟踪类继承层次和函数调用链
  • Debugger Agent:基于运行时行为验证 bug,不靠静态分析

416 个 C++ bug 修复。

3.5 .NET 10 + Blazor

.NET 10 是 LTS 版本,随 VS 2026 捆绑。

Blazor 正式成为 ASP.NET Core Web UI 的主要投资方向。 微软在 Build 上明确说了这句话——MVC 和 Razor Pages 进入长期维护模式。

Blazor 10 的关键改进:Kestrel 首次支持内存 trim(对高并发场景有实质意义)、Native AOT 对 Web API 模板默认支持 OpenAPI 3.1 文档生成、Passkey 支持。

.NET MCP 支持:SDK 内置 MCP server,Agent 可以直接调用 .NET 工具和服务。

3.6 Windows 开发者体验:系统性降低摩擦

几项变化值得注意:

  • Coreutils for Windows(GA):75+ 常用 Linux CLI 命令原生跑在 Windows 11 上,不需要 WSL。lsgrepcurl 开箱即用
  • WSL Containers(GA):Windows 11 内置 Linux 容器管理,不需要额外装 Docker Desktop
  • Intelligent Terminal:终端内置上下文感知 AI,理解当前目录、最近命令、环境变量
  • Windows Developer Configuration(WinGet 驱动):一条命令设置完整开发环境

微软在做的事情是:把 Windows 变成开箱即用的开发者工作站,而不是一个需要半天配置的环境。

3.7 Arm 生态:三管齐下

Satya Nadella 和 Qualcomm CEO Cristiano Amon 在 Build 2026 上展示 Arm 合作
Satya Nadella 和 Qualcomm CEO Cristiano Amon 在 Build 2026 上展示 Arm 合作
  • 硬件:RTX Spark 驱动的新一代 Arm PC,秋季由 ASUS、Dell、HP、Lenovo、MSI 推出
  • 工具链:VS 2026 Arm64 原生版本、MSVC Arm64 工具链、.NET Arm64 SDK
  • AI 辅助迁移:Copilot 能帮 port x86 应用到 Arm 原生 Windows

3.8 Rust:稳步推进

Build 2026 没有重量级 Rust 宣布,但基础设施层面在持续:windows-drivers-rs 驱动框架、windows crate 持续更新、find-msvc-tools 0.1.5 支持 VS 2026。微软对 Rust 的定位仍然是"系统级安全代码的第二语言"。


四、云战略:Foundry、Rayfin 和 Agent 供应链

Agent OS 的故事不只是 Windows 本地。微软同时在 Azure 上构建了一套完整的 Agent 云基础设施——Microsoft Foundry。如果说 MXC 是 Agent 在本地 PC 上的安全沙箱,那 Foundry Agent Service 就是 Agent 在云上的安全运行时。

4.1 Microsoft Foundry:11,000+ 模型的 Agent 托管平台

Microsoft Foundry 在 Build 2026 之前已经 GA,但 Build 上的一系列更新让它从一个"模型超市"变成了一个完整的 Agent 生命周期平台。

模型目录:11,000+ 基础模型、开源模型、推理模型、多模态模型、行业专用模型。Build 上新增了几个重量级型号:

  • GPT-5.5 GA(第二天正式上线)
  • Claude Opus 4.8(preview)
  • Fireworks AI(GA,第三方推理引擎)
  • MAI-Image-2 / MAI-Image-2e(微软自研图像生成)
  • NVIDIA Nemotron(企业级 Agentic AI 工作负载)

11,000+ 模型听起来像数字游戏,但背后的逻辑是:微软不做模型选边,它做模型的分发和治理平台。 你想用 OpenAI、Anthropic、Meta、Mistral、NVIDIA 还是微软自研——Foundry 都给你接入,但计费、安全策略、内容安全检查、合规审计全部在微软的控制面里。

Foundry Agent Service 是核心产品。6 月底 GA,提供:

  • Hypervisor 级隔离沙箱:每个 Agent 运行在独立的虚拟化环境中,不是容器级别的隔离——是虚拟机级别的。这比 MXC 的 OS 级沙箱更重,但也更安全
  • Per-agent Entra ID:每个 Agent 有独立的身份认证,接入企业 Entra 身份体系。Agent 不再共享一个服务账号
  • 源代码部署:通过 azd(Azure Developer CLI)直接部署 Agent 代码,类似部署 Web App 的体验
  • 内置内容安全:Content Safety API 自动检查 Agent 的输入输出
  • Voice Live + WebSocket:Agent 支持实时语音交互,通过 WebSocket 低延迟连接

Foundry Control Plane 是治理层。企业可以用它:

  • 发现和管理订阅中的所有 Agent
  • 统一设置安全策略和访问控制
  • 一键发布 Agent 到 Teams 和 Copilot
  • 连接企业 AI Gateway(preview)
  • 高可用和容灾配置

Microsoft Agent Framework 1.0 GA。这是微软自己的 Agent 开发框架,开源在 GitHub 上。跟 OpenClaw 的定位不同——Agent Framework 更偏"企业级 Agent 的 .NET 原生开发框架",而 OpenClaw 更偏"开源 Agent 运行时"。两者可以并行使用。

4.2 Rayfin:从 Prompt 到 Production Backend

Rayfin 是 Build 上发布的新产品,定位是Agent-first SDK——把 Agent 变后端服务。

传统后端开发:写 API → 部署 → 监控。Rayfin 的思路是:写 Agent 的行为描述 → Rayfin 自动生成后端服务 → 部署到 Foundry → 内置监控。

微软把 Rayfin 描述为"Agent 开发的 Express.js"。这个类比的意思是:Rayfin 不试图解决所有问题,而是提供一个最小化的、高效的 Agent 后端开发体验。

Rayfin 的实际价值取决于:它能不能让 Agent 后端开发变得像写 Express.js 一样简单。如果可以,它就是一个入口产品——开发者从 Rayfin 开始,然后自然地进入 Foundry 生态。

4.3 HorizonDB 和 AI 原生数据库

微软在 Build 上发布了一套面向 AI 应用的数据库产品线,统称 Microsoft Databases。其中最值得注意的是 HorizonDB——一个为 Agent 记忆和状态管理设计的新数据库。

Agent 需要两种记忆:短期记忆(当前会话上下文)和长期记忆(跨会话的知识积累)。当前大多数 Agent 框架用向量数据库做长期记忆,但向量数据库只能做语义检索,不能做结构化查询。HorizonDB 的定位是同时支持语义检索和结构化查询——Agent 可以"记住"上次会议的结论(语义),也可以"查询"过去 30 天处理过的所有审批(结构化)。

4.4 Foundry IQ + Fabric IQ:数据变成上下文

Foundry IQ 和 Fabric IQ 是 Microsoft IQ 上下文层在云端的具象化。

Fabric IQ 的架构分三层:

  1. Unified Data(底座):统一数据资产,打通数据孤岛
  2. Business Intelligence(中层):语义模型(semantic models),把原始数据变成业务术语
  3. Operational Intelligence(顶层):本体论(ontologies),定义实体之间的关系

这三层解决的核心问题是:Agent 查"上季度华东区销售额"时,不需要知道数据在哪个表的哪个字段里——Fabric IQ 把业务语义映射到数据源,Agent 只需要用自然语言提问。

Foundry IQ 做的是知识层:让 Agent 发现和复用已有的知识资产——之前别的 Agent 已经整理过的分析、已经建立的索引、已经验证过的数据清洗流程。

4.5 Agent 365 SDK GA

Agent 365 SDK 正式 GA,免费、框架无关。这意味着你可以用 OpenClaw、LangChain、微软 Agent Framework 或任何其他框架构建 Agent,然后用 Agent 365 SDK 接入微软的治理体系(Defender + Entra + Purview)。

Build 上还发布了 Local Agents Public Preview:Claude Code、Copilot CLI、OpenClaw 都可以在本地运行,同时接入 Agent 365 的云端治理。

4.6 云战略的整体图景

把这些产品放在一起,微软的云战略图景变得清晰:

产品 解决的问题
模型 Foundry 模型目录(11,000+) 模型选择、分发、计费
运行时 Foundry Agent Service Agent 的云端安全托管
开发 Agent Framework + Rayfin Agent 的开发和后端化
数据 HorizonDB + Fabric IQ Agent 的记忆和业务语义
知识 Foundry IQ 跨 Agent 的知识复用
治理 Foundry Control Plane + Agent 365 企业级安全和合规
分发 Teams + Copilot 一键发布 Agent 到达用户

这个栈的设计思路是:开发者只需要关注 Agent 的业务逻辑,其他所有东西——安全、身份、数据、部署、监控、合规——都由平台提供。

跟 AWS 的 Bedrock 相比,微软的优势在于端到端完整性:从 Office 桌面到 Azure 云,从 Windows 本地到 Cloud PC,全线打通。AWS 在 IaaS 层更强,但缺少 Office 这个面向用户的分发渠道。


五、AIDC 基础设施:自研芯片与数据中心

Agent OS 的运行离不开算力。微软在 Build 2026 上专门安排了一个 session "Silicon to Systems",展示 Azure 的 AI 基础设施栈——从芯片到机柜到数据中心。

5.1 Maia 200:推理专用的自研加速器

Maia 200 是微软自研 AI 芯片的第二代(2026 年 1 月发布),专门针对推理场景设计。核心规格:

  • TSMC 3nm 工艺
  • 原生 FP8/FP4 Tensor Core:针对低精度推理优化
  • 216GB HBM3e,7 TB/s 带宽
  • 272MB 片上 SRAM
  • 支持风冷和液冷部署,包括第二代液冷侧挂(sidecar)设计

Maia 200 的定位很明确:不是训练芯片,是推理芯片。 微软 EVP Scott Guthrie 在发布时说的是 "dramatically improve the economics of AI token generation"——改善 AI token 生成的经济学。

这个定位选择透露了微软对 AI 算力市场的判断:推理成本正在超过训练成本。 当 Copilot 推向 12 亿 Office 用户,当 Agent 开始持续运行,推理的 token 量会指数级增长。靠 NVIDIA GPU 跑推理,成本不可持续。自研推理加速器是必须的。

Build 2026 上展示的进展:

  • Maia 200 已在 Azure 多个区域部署
  • 同时支持风冷和液冷数据中心,液冷方案针对高密度机柜设计
  • 微软正在跟 Anthropic 讨论供应 Maia 200 芯片——这是微软第一次考虑把自研 AI 芯片卖给第三方。如果成交,Maia 就不只是 Azure 的内部芯片,而是 NVIDIA GPU 的竞争者
  • 微软还在 Build 上展示了 "Community-First AI Infrastructure" 计划:在建设数据中心时承诺社区利益,试图缓解地方对超大型数据中心的反对

5.2 Cobalt 200:Arm CPU 的第二代

Cobalt 是微软自研的 Arm 服务器 CPU。Cobalt 100 在 2023 年 Ignite 发布,Cobalt 200 是升级版。

Cobalt 的定位不是跑 AI 工作负载(那是 Maia 和 NVIDIA 的事),而是跑通用云工作负载——Web 服务器、微服务、数据库、Agent 编排层。Arm 架构的能效优势让 Cobalt 在这些场景下比 x86 更省电、更省成本。

Build 上微软展示了从 Cobalt 200 到 Maia 200 的完整服务器架构:Cobalt 200 做通用计算和编排,Maia 200 做 AI 推理,两者在同一台服务器里协同。这是微软 "silicon to service" 理念的具体体现——不是买芯片组装服务器,而是从芯片设计开始就考虑整个系统的协同。

5.3 数据中心扩张:单季 1 GW

微软 FY2026 Q2(2025 年 10-12 月)的数字说明了基础设施投入的规模:

  • 季度收入 813 亿美元,Microsoft Cloud 单季首次突破 500 亿美元(515 亿,同比 +26%)
  • 季度资本支出 376 亿美元,创历史新高,约三分之二用于 GPU 和 CPU 等短期资产
  • 单季度上线近 1 GW 数据中心容量

1 GW 是什么概念?一个典型的数据中心园区大约 50-100 MW。1 GW 等于一个季度上线了 10-20 个数据中心园区。

但这个扩张速度也带来了问题:Azure 的容量瓶颈延续到 2026 年,某些美国核心区域限制了新的订阅,优先保障现有客户和关键工作负载。微软在 Build 上没有回避这个问题——基础设施的增长速度正在追赶需求。

5.4 多供应商硅片策略

微软的 AI 芯片策略不是"自研替代 NVIDIA",而是多供应商并行

微软 AI 芯片策略:多供应商并行
微软 AI 芯片策略:多供应商并行

如果 Anthropic 采购 Maia 200 的交易最终落地,这个策略会升级为:微软不仅用自研芯片服务自己的云,还把自研芯片卖给第三方 AI 公司。 这会让微软从 NVIDIA 的客户变成 NVIDIA 的竞争对手——至少在推理芯片领域。


六、MAI 自研模型家族

Mustafa Suleyman 在 Build 2026 上发布 MAI 模型家族
Mustafa Suleyman 在 Build 2026 上发布 MAI 模型家族

Mustafa Suleyman 发布了 7 个新模型,统称 MAI(Microsoft AI)家族。

MAI-Thinking-1 是最值得关注的:35B 参数推理模型,256K 上下文窗口。微软声称盲测偏好超过 Claude Sonnet 4.6,编码匹配 Claude Opus 4.6。关键点是零蒸馏——用企业级干净数据训练,没有从 OpenAI 模型蒸馏。这是微软在刻意跟"蒸馏 OpenAI 模型"的争议做切割。

MAI-Code-1 是为 GitHub 优化的编码模型,已上线 VS Code。

MAI-Image-2.5 是文生图加图生图双模式模型。

Suleyman 在台上声称某新模型比 GPT-5.5 效率高 10 倍——但现场只有一个人鼓掌。

MAI 家族的战略意义:微软拥有 OpenAI 49% 的股权和独家云部署权,但它同时在建立自己的模型能力。两条线并行——GPT 系列作为高端模型通过 Azure 和 Copilot 分发,MAI 作为效率和成本优化的选择覆盖编码、推理、图像。分工类似 AWS 的 Anthropic + 自研 Titan 策略。


七、安全框架

三个 Agent 安全相关的开源项目同时发布:

  • MDASH:100+ Agent 组成的多模型安全系统,自动发现可利用漏洞
  • ASSERT:Agent 安全评估框架
  • Agent Control Specification:Agent 运行时治理标准

当前阶段更像"标准先行"。微软在告诉市场:我们不仅在做 Agent,还在定义 Agent 应该怎么被安全地管理。


八、量子计算:Majorana 2

Majorana 2 量子芯片
Majorana 2 量子芯片

Build 的结尾是一张量子芯片。Majorana 2:20 秒平均寿命,1 微秒操作时间,目标百万量子比特单芯片。

这跟 Agent OS 无关,但跟微软的长期技术叙事有关——同时布局经典计算(Windows/Azure)、AI 计算(Copilot/MAI)、量子计算(Majorana)。Build 上展示量子芯片是在说"我们不只押注 AI"。


九、这场赌局的胜算有多大?

回到开头的问题。微软在 Build 2026 上的所有宣布——五层产品栈、Office 套件 Agent 化、OpenClaw 入驻、Agent IDE——都指向同一个赌注:Agent 是下一代的应用形态,Windows 要成为运行 Agent 的默认平台。

看多的理由

1. 微软拥有 Agent 需要的全部基础设施。 操作系统(Windows)、云(Azure)、开发工具(VS/GitHub)、模型(MAI + OpenAI)、生产力(Office 365)、企业关系(M365/Entra/Defender/Purview)。没有第二家公司同时拥有这六层。

2. Office 是最强的分发渠道。 Copilot Agentic Mode 不需要用户下载新 App——它就在 Word、Excel、Teams 里,开箱即用。12 亿 Office 用户的计费关系已经建立,Agent 在既有账单上加了一行。这个分发渠道是 OpenAI、Anthropic、Google 都没有的。

3. Agent 365 的治理叙事切中了企业痛点。 当企业开始部署多个 Agent 时,治理和安全是最大的顾虑。Agent 365 把 Defender、Entra、Purview 三条产品线整合成一个治理平面,这个故事的完整性在市场上没有竞争对手。

4. OpenClaw 入驻是聪明的生态策略。 不自己造 Agent 框架,而是把增长最快的开源框架纳入平台。开发者用自己熟悉的工具,但跑在 Windows 的安全底层上。

看空的风险

1. MXC 的安全模型需要实战检验。 Windows 的安全历史并不完美——UAC 被绕过、内核漏洞、供应链攻击都是先例。OS 级沙箱的安全性取决于实现质量,不是概念设计。

2. Microsoft IQ 的上下文一致性是硬伤。 四层上下文的技术设计是合理的,但企业数据的一致性和质量是治理问题,不是技术问题。邮件里的"项目 A"和数据库里的"Project A"是不是同一个东西?这个不一致性会直接导致 Agent 的误判。

3. Office Agent 化的节奏风险。 Outlook 的主动收件箱分类、Teams 的 Call Delegation——这些功能在技术上是进步,但用户接受度是另一回事。"让 AI 替你读邮件"在隐私敏感的企业环境里可能遇到阻力。微软需要证明 Agent 不只是能做,而且是用户愿意让它做。

4. NLWeb 的商业博弈。 让大网站自愿接入一个可能削弱自己流量入口的协议,这个推动难度不低于让 Facebook 采纳 ActivityPub。

5. $30/月的定价门槛。 对大型企业来说 $30/用户/月不是问题,但对 SMB 和个人用户来说,这个价格仍然是 Copilot 普及的障碍。Google 的 Gemini for Workspace 在价格上更激进。

6. 竞争对手不会坐视。 Apple 在 WWDC 上几乎必然推出对应方案。Google 已经在推 Android 上的 Agent 运行时。OpenAI 和 Anthropic 在模型能力上仍然领先。微软没有独占权。

我的判断

微软的 Agent OS 赌局是一个方向正确、执行扎实、但结果不确定的大战略。

方向正确是因为:Agent 确实正在从实验性工具变成生产性基础设施。有人需要提供运行时、开发工具、安全框架、上下文层、治理平面。微软在这些层面同时投入,不是分散资源,而是在构建一个垂直整合的 Agent 平台。

执行扎实是因为:Build 2026 的宣布覆盖了从芯片到 Office 应用的全栈。五层产品栈不是点状发布,而是系统性的平台战略。OpenClaw 入驻和 Agent 365 治理层的加入说明微软在同时解决开发者工具和企业信任两个问题。

结果不确定是因为:微软在同时打六个战役——Agent 运行时(MXC)、Office Agent 化(Copilot)、开发者工具链(VS 2026)、自研模型(MAI)、Arm 生态迁移(RTX Spark)、Web 协议(NLWeb)。任何一个战役的失败都会拖累整体。而微软历史上同时打多个战役的成功率并不高——Windows Phone + Surface RT + Bing 的教训还在。

下一个观察节点:WWDC 2026。 Apple 很可能在 WWDC 上公布自己的 Agent 运行时和 AI 设备策略。如果 Apple 在端侧推理和隐私保护上做得更好,微软的"Windows 是最好的 Agent 平台"这个叙事会很快被挑战。


声明: 本文基于微软 Build 2026 官方发布、微软开发者博客、The Verge / Engadget / CNET / Thurrott / Directions on Microsoft / PCMag / Firstpost / WindowsForum / Context Studios 等多家媒体报道、NVIDIA 开发者博客、r/cpp 和 Reddit 社区讨论、以及 GitHub 公开仓库信息进行交叉验证后撰写。不构成投资建议。文中数据截至 2026 年 6 月 3 日。