Skip to content

AI Agent 正在重演智能手机革命

视频核心论点:2007 年 iPhone 最初被当成"更漂亮的手机",直到 App Store 出现,大家才意识到手机真正的价值不再是硬件,而是软件分发入口。AI Agent 正在经历同样的过程——今天的 Agent 框架和芯片只是"硬件",真正的变革在于 Agent 生态、互操作协议和软件消费方式的范式转换。

目录


核心类比:iPhone 时刻重演

两个时代的映射

2007 年 iPhone 时代                →    2025-2026 AI Agent 时代
─────────────────────────────────────────────────────────────────
iPhone 硬件(多触屏手机)           →    Agent 框架 + 硬件(GPU/NPU)
App Store(软件分发入口)           →    Agent Registry / A2A(Agent 互操作)
原生 App(独立功能单元)             →    垂直 Agent(专门任务的智能体)
App 生态(百万级开发者)             →    Agent 生态(企业 + 开源构建者)
用户:点击操作                      →    用户:自然语言指令
UI 即产品                          →    Agent 即产品(无 UI,纯结果导向)

关键洞察

  • 硬件先行,生态后来:iPhone 2007 年发布,App Store 2008 年上线。同理,今天的 LLM 和 Agent 框架是"硬件",Agent 生态和互操作标准才是决定胜负的关键
  • 分发范式的转移:App Store 把"去软件商店下载"变成了"随时随地获取";Agent 时代把"打开 App 操作"变成"直接告诉 Agent 你要什么"
  • 开发者经济的重塑:App Store 创造了移动开发者经济;Agent 时代将创造"Agent 构建者"经济

AI Agent 对 SaaS 的冲击

核心机制:工作流租金坍缩

传统 SaaS 的商业模式建立在人类通过 UI 操作工作流这一假设上:

传统 SaaS 价值链:
  用户登录 → 通过 UI 操作 → 遵循预设工作流 → 产出结果
                    ↑
              收费点:按席位(per-seat)或按使用量

AI Agent 重塑后:
  Agent 直接调用 API → 跨系统编排任务 → 自动产出结果
                    ↑
              UI 被绕过,席位计费模型失效

SaaS 受冲击程度对比表

SaaS 类型 核心价值来源 受冲击程度 原因
工作流协调工具(项目管理、CRM) UI 便利性 + 流程编排 🔴 高危 Agent 可直接 API 编排,无需人类操作 UI
BI/报表工具 数据可视化 + 分析 🔴 高危 Agent 自行查询数据、生成报告
文档自动化 模板 + 流程驱动 🟡 中等 部分场景 Agent 可替代,合规性需求保留
客服工单系统 路由 + 跟踪 + SLA 🟡 中等 Agent 可处理常见问题,复杂场景仍需人工
源数据系统(ERP/财务核心) 数据权威性 + 审计 🟢 防御性强 数据真实性不可替代,Agent 反而依赖它

$2 万亿市场重定价

2026 年 2 月,S&P 500 软件与服务指数在 6 个交易日内蒸发了 $8300 亿,原因是 Anthropic 发布了高级 Agent 插件能力,市场开始对传统 SaaS 进行结构性重定价。

三个 CTO 必须问的问题

  • ✅ "非人类实体(Agent)能否轻松执行这个工具的核心功能?"
  • ✅ "这个工具是否提供了自主操作所需的护栏?"
  • ✅ "供应商拥有独特数据,还是只是在出租一个可以自动化的流程?"

判断决策树:你的 SaaS 是否安全?

你的产品主要价值是:
  ├─ UI 便利性(让人类更容易做某事)
  │    → 🔴 高危:Agent 不关心易用性,它关心数据访问和执行权限
  │
  ├─ 流程编排(把数据从 A 搬到 B)
  │    → 🔴 高危:Agent 擅长跨应用编排
  │
  └─ 数据权威性(拥有不可替代的真实数据)
       → 🟢 防御性强:Agent 反而需要这些系统作为数据源

A2A 协议:Agent 的 App Store 底座

什么是 A2A?

Agent-to-Agent (A2A) 是 Google 于 2025 年 4 月发布的开放协议,2025 年后期移交 Linux Foundation 管理。它解决了 AI Agent 之间的互操作性问题——让不同框架、不同厂商构建的 Agent 能互相通信和协作。

类比:如果 MCP(Model Context Protocol)是 Agent 连接工具的 USB 接口,那么 A2A 就是 Agent 之间通信的网络协议(类似 TCP/IP)。

MCP vs A2A

维度 MCP(Anthropic, 2024) A2A(Google, 2025)
目标 Agent ↔ 工具/API/数据库 Agent ↔ Agent
类比 USB 接口 TCP/IP 网络协议
角色 工具调用层 通信协作层
互补关系 Agent 通过 MCP 访问数据 Agent 通过 A2A 协调任务

A2A 核心架构

Client Agent                     Remote Agent
    │                                │
    │  1. Discovery(发现)          │
    │  ──→ 获取 Agent Card(JSON) ──→│
    │                                │
    │  2. Authentication(认证)     │
    │  ──→ OAuth/API Key / OpenID ──→│
    │                                │
    │  3. Communication(通信)        │
    │  ──→ Task(JSON-RPC over HTTPS)│
    │  ←── Message + Artifact ───────│
    │                                │
    │  4. Long-running(长时间任务)   │
    │  ──→ Webhook 回调 + SSE 流式 ──→│

四大核心能力

能力 说明 类比
能力发现 Agent 通过 Agent Card(JSON 元数据)互相发现 App Store 搜索
任务管理 定义任务生命周期:submitted → working → completed 订单跟踪
协作通信 交换消息、上下文、制品 聊天/协作
UI 协商 协商展示能力(iframe、视频、表单) 响应式设计适配

生态现状

  • 发布时 50+ 合作伙伴:Salesforce、SAP、ServiceNow、LangChain、MongoDB 等
  • 2026 年已扩展到 150+ 组织
  • 已进入主要云平台生产环境

RTX Spark:Agent 时代的硬件基础设施

概述

RTX Spark 是 NVIDIA 于 2026 年 5 月(Computex Taipei)发布的超级芯片,专为 个人 AI Agent 设计的 Windows PC 硬件平台。Jensen Huang 的定位:"四十年来你启动 App、点击、打字。有了 RTX Spark,你只需提问——PC 完成工作。"

硬件规格

组件 规格
GPU NVIDIA Blackwell RTX,6,144 CUDA 核心
AI 性能 最高 1 PFLOPS(千万亿次浮点运算)
内存 最高 128GB 统一内存
CPU 20 核 NVIDIA Grace(与 MediaTek 合作设计)
互连 NVLink-C2C 芯片间互连
AI 精度 FP4(第 5 代 Tensor Cores)

Agent 能力

  • 本地运行 120B 参数 LLM,支持 100 万 token 上下文
  • 跨 Windows 应用执行任务
  • 语义搜索本地文件
  • 代码生成(插件和 App)
  • 图像/视频生成

安全架构

┌──────────────────────────────────────────────┐
│              Windows 安全原语                   │
│  身份认证 / 沙箱隔离 / 策略管控 / 端到端安全     │
├──────────────────────────────────────────────┤
│           NVIDIA OpenShell Runtime            │
│  Agent 行为策略 / 智能查询路由 / 隐私信息脱敏     │
├──────────────────────────────────────────────┤
│              RTX Spark 硬件                     │
│  Blackwell GPU + Grace CPU + 128GB UMA         │
└──────────────────────────────────────────────┘

类比理解

智能手机时代:                  Agent PC 时代:
iPhone + iOS App 生态      →    RTX Spark + Windows Agent 生态
ARM 芯片(性能基准)        →    Blackwell + Grace(1 PFLOPS)
App Store 分发 App          →    A2A 分发 Agent
手机端运行 App              →    本地运行 120B LLM

Copilot Studio:企业级 Agent 平台

概述

Microsoft Copilot Studio 是微软的低代码 AI Agent 构建平台,允许企业在 Microsoft 365 生态内创建自定义 Agent。已集成 A2A 协议,支持与 Google Cloud 等外部 Agent 互操作。

核心定位

Copilot Studio 的角色:
┌─────────────────────────────────────────────────┐
│  企业员工                                        │
│    ↓ 自然语言指令                                │
│  Copilot Studio(Agent 编排层)                   │
│    ↓ A2A 协议                                    │
│  ┌──────────┐  ┌──────────┐  ┌──────────┐        │
│  │内部 Agent │  │Google    │  │第三方    │        │
│  │(M365)    │  │Cloud     │  │Agent     │        │
│  └──────────┘  └──────────┘  └──────────┘        │
└─────────────────────────────────────────────────┘

最佳实践

  • ✅ 用 Copilot Studio 构建企业内部 Agent,连接 M365 数据源
  • ✅ 通过 A2A 协议与外部 Agent 互操作,避免供应商锁定
  • ❌ 不要把 Copilot Studio 当成唯一的 Agent 运行时——它是编排层,不是执行引擎

判断与展望

Agent 时代的关键判断

今天的 Agent 阶段判断:
  2025-2026:协议基础设施年(A2A、MCP 成熟)
  2026-2027:硬件普及年(RTX Spark 等设备上市)
  2027-2028:生态爆发年(Agent Registry、Agent Store)
  2028+:    "App Store 时刻"(Agent 分发成为主流)

现在处于什么位置?
  → 大约在 2007 年底到 2008 年初
  → 硬件和协议已有,生态尚未爆发

给开发者/企业的建议

  • 现在开始构建 Agent:A2A 协议已稳定,RTX Spark 硬件已在路上
  • 数据就是护城河:拥有独特数据的系统在 Agent 时代最有价值
  • 拥抱互操作协议:A2A + MCP 是事实标准,不要自立一套
  • ❌ 不要把赌注押在 UI 体验上——Agent 不需要漂亮的界面
  • ❌ 不要忽视治理和安全——Agent 自主操作需要新的权限管控模型

参考资料

相关笔记

  • [[AI Agent 相关笔记]]