AI Agent 正在重演智能手机革命¶
视频核心论点:2007 年 iPhone 最初被当成"更漂亮的手机",直到 App Store 出现,大家才意识到手机真正的价值不再是硬件,而是软件分发入口。AI Agent 正在经历同样的过程——今天的 Agent 框架和芯片只是"硬件",真正的变革在于 Agent 生态、互操作协议和软件消费方式的范式转换。
目录¶
- #核心类比:iPhone 时刻重演
- #AI Agent 对 SaaS 的冲击
- #A2A 协议:Agent 的 App Store 底座
- #RTX Spark:Agent 时代的硬件基础设施
- #Copilot Studio:企业级 Agent 平台
- #判断与展望
核心类比:iPhone 时刻重演¶
两个时代的映射¶
2007 年 iPhone 时代 → 2025-2026 AI Agent 时代
─────────────────────────────────────────────────────────────────
iPhone 硬件(多触屏手机) → Agent 框架 + 硬件(GPU/NPU)
App Store(软件分发入口) → Agent Registry / A2A(Agent 互操作)
原生 App(独立功能单元) → 垂直 Agent(专门任务的智能体)
App 生态(百万级开发者) → Agent 生态(企业 + 开源构建者)
用户:点击操作 → 用户:自然语言指令
UI 即产品 → Agent 即产品(无 UI,纯结果导向)
关键洞察¶
- 硬件先行,生态后来:iPhone 2007 年发布,App Store 2008 年上线。同理,今天的 LLM 和 Agent 框架是"硬件",Agent 生态和互操作标准才是决定胜负的关键
- 分发范式的转移:App Store 把"去软件商店下载"变成了"随时随地获取";Agent 时代把"打开 App 操作"变成"直接告诉 Agent 你要什么"
- 开发者经济的重塑:App Store 创造了移动开发者经济;Agent 时代将创造"Agent 构建者"经济
AI Agent 对 SaaS 的冲击¶
核心机制:工作流租金坍缩¶
传统 SaaS 的商业模式建立在人类通过 UI 操作工作流这一假设上:
传统 SaaS 价值链:
用户登录 → 通过 UI 操作 → 遵循预设工作流 → 产出结果
↑
收费点:按席位(per-seat)或按使用量
AI Agent 重塑后:
Agent 直接调用 API → 跨系统编排任务 → 自动产出结果
↑
UI 被绕过,席位计费模型失效
SaaS 受冲击程度对比表¶
| SaaS 类型 | 核心价值来源 | 受冲击程度 | 原因 |
|---|---|---|---|
| 工作流协调工具(项目管理、CRM) | UI 便利性 + 流程编排 | 🔴 高危 | Agent 可直接 API 编排,无需人类操作 UI |
| BI/报表工具 | 数据可视化 + 分析 | 🔴 高危 | Agent 自行查询数据、生成报告 |
| 文档自动化 | 模板 + 流程驱动 | 🟡 中等 | 部分场景 Agent 可替代,合规性需求保留 |
| 客服工单系统 | 路由 + 跟踪 + SLA | 🟡 中等 | Agent 可处理常见问题,复杂场景仍需人工 |
| 源数据系统(ERP/财务核心) | 数据权威性 + 审计 | 🟢 防御性强 | 数据真实性不可替代,Agent 反而依赖它 |
$2 万亿市场重定价¶
2026 年 2 月,S&P 500 软件与服务指数在 6 个交易日内蒸发了 $8300 亿,原因是 Anthropic 发布了高级 Agent 插件能力,市场开始对传统 SaaS 进行结构性重定价。
三个 CTO 必须问的问题:
- ✅ "非人类实体(Agent)能否轻松执行这个工具的核心功能?"
- ✅ "这个工具是否提供了自主操作所需的护栏?"
- ✅ "供应商拥有独特数据,还是只是在出租一个可以自动化的流程?"
判断决策树:你的 SaaS 是否安全?¶
你的产品主要价值是:
├─ UI 便利性(让人类更容易做某事)
│ → 🔴 高危:Agent 不关心易用性,它关心数据访问和执行权限
│
├─ 流程编排(把数据从 A 搬到 B)
│ → 🔴 高危:Agent 擅长跨应用编排
│
└─ 数据权威性(拥有不可替代的真实数据)
→ 🟢 防御性强:Agent 反而需要这些系统作为数据源
A2A 协议:Agent 的 App Store 底座¶
什么是 A2A?¶
Agent-to-Agent (A2A) 是 Google 于 2025 年 4 月发布的开放协议,2025 年后期移交 Linux Foundation 管理。它解决了 AI Agent 之间的互操作性问题——让不同框架、不同厂商构建的 Agent 能互相通信和协作。
类比:如果 MCP(Model Context Protocol)是 Agent 连接工具的 USB 接口,那么 A2A 就是 Agent 之间通信的网络协议(类似 TCP/IP)。
MCP vs A2A¶
| 维度 | MCP(Anthropic, 2024) | A2A(Google, 2025) |
|---|---|---|
| 目标 | Agent ↔ 工具/API/数据库 | Agent ↔ Agent |
| 类比 | USB 接口 | TCP/IP 网络协议 |
| 角色 | 工具调用层 | 通信协作层 |
| 互补关系 | Agent 通过 MCP 访问数据 | Agent 通过 A2A 协调任务 |
A2A 核心架构¶
Client Agent Remote Agent
│ │
│ 1. Discovery(发现) │
│ ──→ 获取 Agent Card(JSON) ──→│
│ │
│ 2. Authentication(认证) │
│ ──→ OAuth/API Key / OpenID ──→│
│ │
│ 3. Communication(通信) │
│ ──→ Task(JSON-RPC over HTTPS)│
│ ←── Message + Artifact ───────│
│ │
│ 4. Long-running(长时间任务) │
│ ──→ Webhook 回调 + SSE 流式 ──→│
四大核心能力¶
| 能力 | 说明 | 类比 |
|---|---|---|
| 能力发现 | Agent 通过 Agent Card(JSON 元数据)互相发现 | App Store 搜索 |
| 任务管理 | 定义任务生命周期:submitted → working → completed | 订单跟踪 |
| 协作通信 | 交换消息、上下文、制品 | 聊天/协作 |
| UI 协商 | 协商展示能力(iframe、视频、表单) | 响应式设计适配 |
生态现状¶
- 发布时 50+ 合作伙伴:Salesforce、SAP、ServiceNow、LangChain、MongoDB 等
- 2026 年已扩展到 150+ 组织
- 已进入主要云平台生产环境
RTX Spark:Agent 时代的硬件基础设施¶
概述¶
RTX Spark 是 NVIDIA 于 2026 年 5 月(Computex Taipei)发布的超级芯片,专为 个人 AI Agent 设计的 Windows PC 硬件平台。Jensen Huang 的定位:"四十年来你启动 App、点击、打字。有了 RTX Spark,你只需提问——PC 完成工作。"
硬件规格¶
| 组件 | 规格 |
|---|---|
| GPU | NVIDIA Blackwell RTX,6,144 CUDA 核心 |
| AI 性能 | 最高 1 PFLOPS(千万亿次浮点运算) |
| 内存 | 最高 128GB 统一内存 |
| CPU | 20 核 NVIDIA Grace(与 MediaTek 合作设计) |
| 互连 | NVLink-C2C 芯片间互连 |
| AI 精度 | FP4(第 5 代 Tensor Cores) |
Agent 能力¶
- 本地运行 120B 参数 LLM,支持 100 万 token 上下文
- 跨 Windows 应用执行任务
- 语义搜索本地文件
- 代码生成(插件和 App)
- 图像/视频生成
安全架构¶
┌──────────────────────────────────────────────┐
│ Windows 安全原语 │
│ 身份认证 / 沙箱隔离 / 策略管控 / 端到端安全 │
├──────────────────────────────────────────────┤
│ NVIDIA OpenShell Runtime │
│ Agent 行为策略 / 智能查询路由 / 隐私信息脱敏 │
├──────────────────────────────────────────────┤
│ RTX Spark 硬件 │
│ Blackwell GPU + Grace CPU + 128GB UMA │
└──────────────────────────────────────────────┘
类比理解¶
智能手机时代: Agent PC 时代:
iPhone + iOS App 生态 → RTX Spark + Windows Agent 生态
ARM 芯片(性能基准) → Blackwell + Grace(1 PFLOPS)
App Store 分发 App → A2A 分发 Agent
手机端运行 App → 本地运行 120B LLM
Copilot Studio:企业级 Agent 平台¶
概述¶
Microsoft Copilot Studio 是微软的低代码 AI Agent 构建平台,允许企业在 Microsoft 365 生态内创建自定义 Agent。已集成 A2A 协议,支持与 Google Cloud 等外部 Agent 互操作。
核心定位¶
Copilot Studio 的角色:
┌─────────────────────────────────────────────────┐
│ 企业员工 │
│ ↓ 自然语言指令 │
│ Copilot Studio(Agent 编排层) │
│ ↓ A2A 协议 │
│ ┌──────────┐ ┌──────────┐ ┌──────────┐ │
│ │内部 Agent │ │Google │ │第三方 │ │
│ │(M365) │ │Cloud │ │Agent │ │
│ └──────────┘ └──────────┘ └──────────┘ │
└─────────────────────────────────────────────────┘
最佳实践¶
- ✅ 用 Copilot Studio 构建企业内部 Agent,连接 M365 数据源
- ✅ 通过 A2A 协议与外部 Agent 互操作,避免供应商锁定
- ❌ 不要把 Copilot Studio 当成唯一的 Agent 运行时——它是编排层,不是执行引擎
判断与展望¶
Agent 时代的关键判断¶
今天的 Agent 阶段判断:
2025-2026:协议基础设施年(A2A、MCP 成熟)
2026-2027:硬件普及年(RTX Spark 等设备上市)
2027-2028:生态爆发年(Agent Registry、Agent Store)
2028+: "App Store 时刻"(Agent 分发成为主流)
现在处于什么位置?
→ 大约在 2007 年底到 2008 年初
→ 硬件和协议已有,生态尚未爆发
给开发者/企业的建议¶
- ✅ 现在开始构建 Agent:A2A 协议已稳定,RTX Spark 硬件已在路上
- ✅ 数据就是护城河:拥有独特数据的系统在 Agent 时代最有价值
- ✅ 拥抱互操作协议:A2A + MCP 是事实标准,不要自立一套
- ❌ 不要把赌注押在 UI 体验上——Agent 不需要漂亮的界面
- ❌ 不要忽视治理和安全——Agent 自主操作需要新的权限管控模型
参考资料¶
- Google A2A 协议官方公告
- IBM: What is A2A protocol
- NVIDIA RTX Spark 官方新闻
- AI Agents vs SaaS: The $2 Trillion Question
- A2A GitHub 仓库
相关笔记¶
- [[AI Agent 相关笔记]]