多模型混合 Coding Agent 工作流 - Claude 规划 + Gemini 设计 UI¶

Cole Medin 演示了一个混合 Anthropic Claude Opus 4.8 和 Google Gemini 3.5 Flash 的 AI 编码工作流。核心理念：每个步骤用最擅长的模型，通过 handoff 文档串联，实现单次执行构建完整全栈应用。

背景：两款新模型各自的优势¶

2026 年 5 月，两大厂商密集发布新模型：

模型	发布日期	核心优势	弱点
Gemini 3.5 Flash	2026-05-19 (Google I/O)	UI 生成质量极高，速度快，价格极低 ($1.50/M input)	页面文案容易幻觉，推理能力弱于 Opus
Claude Opus 4.8	2026-05-28	推理能力最强，适合规划/集成/复杂工程	前端 UI 生成本身不如 Gemini 美观

Gemini 3.5 Flash 一次生成的 UI 质量已明显优于 Claude Code、Lovable 等工具的默认输出。但 Cole Medin 发现：UI 好看但内容（页面文案、数据）经常是幻觉编造的。

核心设计思想¶

为什么要混合 Provider？¶

┌─────────────────────────────────────────────────────┐
│              混合 Provider 工作流                      │
├──────────────┬──────────────┬───────────────────────┤
│   Sonnet     │   Opus 4.8   │  Gemini 3.5 Flash     │
│  (探索/验证)  │ (规划/集成/修复)│   (UI 设计)            │
│   便宜快速    │   推理最强    │   美观 + 极便宜         │
└──────┬───────┴──────┬───────┴───────────┬───────────┘
       │              │                   │
       ▼              ▼                   ▼
  context.md      plan.md            UI 代码
       │              │                   │
       └──────┬───────┘                   │
              ▼                           │
         plan.md (Section A) ──────────────┘
              │
              ▼
         集成 → 验证 → 修复 → 部署 → 冒烟测试

两个设计理由：

技术限制：无法在单个对话窗口内切换 provider（Claude Code 不能中途切到 Gemini）
单一职责：即使是最强的 Opus，同时做探索+规划+UI+集成也会崩溃。每步聚焦一个任务 = 最佳结果

Handoff 文档机制¶

每个步骤是独立的 coding agent session，步骤间通过 Markdown handoff 文档通信：

Step 1 (Sonnet) ──→ context.md ──→ Step 2 (Opus)
                                    │
                                    ▼
                                plan.md ──→ Step 3 (Gemini)
                                                │
                                                ▼
                                            ui-summary.md ──→ Step 4+ (Opus)

每步输出一个 markdown 文档，下一步读取后执行
大量 prompt/context engineering 确保文档传递有效
优点：可在任意步骤插入人工验证

工作流步骤详解¶

Step 1: Exploration（Sonnet）¶

输入: spec.md（规格文档）输出: context.md 工具: Claude Code + /model sonnet

探索步骤不需要强推理，用 Sonnet 节省 token 并加速。输出包含： - 仓库状态（greenfield 或已有模板） - 框架推荐 - 品牌素材 - 环境变量需求 - 数据层概况

💡 spec.md 是整个工作流的入口。推荐为完整应用编写详细规格文档。

Step 2: Planning（Opus 4.8）¶

输入: context.md 输出: plan.md 工具: Claude Code + /model opus

plan.md 是三段式规格文档：

Section	内容	说明
A	Site Content & Intent	语音/语调、页面文案、信息结构
B	Integration Scope	后端 API、数据库模型、认证
C	Deployment Plan	部署平台、配置

⚠️ 关键设计：Section A 中不要描述 UI 结构（如"用网格布局"或"两列设计"）。让 Gemini 自主决定 UI 怎么做。Cole Medin 测试发现：当 Opus 在 plan 中规定 UI 结构后，Gemini 的输出质量显著下降 — 这证明了 Gemini 确实更擅长前端设计。

Step 3: Design（Gemini 3.5 Flash）¶

输入: plan.md（仅读取 Section A）输出: UI 代码 + ui-summary.md 工具: Pi (OpenRouter) 或 Google Antigravity

Gemini 只负责 UI 层。通过 OpenRouter 配置 Pi 使用 Gemini 3.5 Flash：

# Pi 中切换模型
/model gemini-3.5-flash

# 调用 design skill
/frontend-mix-design path/to/plan.md

即使是不支持 skill 的 agent，也可以直接让它读取 skill 文件内容并执行指令。

Step 4-8: 后续步骤（Opus/Sonnet 混合）¶

所有后续步骤重复同样的 handoff 模式：

步骤	模型	任务	输出
4. Integrations	Opus	后端 API、数据库、认证	集成代码
5. Validation	Sonnet	单元测试、lint 检查	测试报告
6. Fix	Opus	修复 Validation 发现的问题	修复代码
7. Deploy	Opus	自动部署（Vercel/DigitalOcean 等）	部署 URL
8. Smoke Test	Agent Browser	浏览器自动化验证网站功能	测试结果

工具链概览¶

工具	角色	说明
Claude Code	Anthropic 的 CLI coding agent	支持 `/model` 切换模型，支持 skill
Pi	支持多 provider 的 CLI agent	通过 OpenRouter 接入 Gemini
Google Antigravity	Google 官方 Gemini coding agent	原生支持 Gemini 3.5 Flash
Archon	开源 workflow engine（Cole Medin 作品）	用 YAML 定义多步骤工作流，自动编排所有 skill
OpenRouter	多模型 API 路由	统一接入 Anthropic / Google / 其他模型

Archon：一键执行整个工作流¶

Archon 将上述所有 skill 打包为一个 YAML workflow，agent 自动按序执行所有步骤：

# Archon workflow 示例（概念）
steps:
  - skill: frontend-mix-explore
    model: sonnet
  - skill: frontend-mix-plan
    model: opus
  - skill: frontend-mix-design
    model: gemini-3.5-flash
    provider: openrouter
  - skill: frontend-mix-integrate
    model: opus
  # ... 后续步骤

GitHub: coleam00/archon — 22K+ stars

最佳实践总结¶

✅ 每步一个模型，单一职责 — 不要让一个模型同时做多件事 ✅ Handoff 文档是核心 — 投入 prompt engineering 确保 step 间通信有效 ✅ 规划中不规定 UI 结构 — 让 Gemini 发挥前端设计优势 ✅ 探索/验证用便宜模型 — Sonnet 足够，省 token ✅ 支持任意步骤人工验证 — handoff 文档让你可以在任意节点介入检查 ✅ 实验性灵活 — 几分钟就能替换某步的模型/provider，找到最佳组合

❌ 不要在一个 session 内让 Opus 处理整个全栈应用 — 非平凡应用必崩 ❌ 不要在 plan 中规定 UI 布局细节 — 会压制 Gemini 的设计优势 ❌ 不要跳过 handoff 文档直接拼接 prompt — 文档格式经过精心 engineering

适用范围¶

✅ PoC（概念验证）
✅ MVP（最小可行产品）
✅ 非平凡全栈应用的单次构建
❌ 非常复杂的全栈应用（需要多轮迭代）
❌ 需要持续维护和迭代的长期项目

参考资料¶

Claude Plans, Gemini Designs: The Workflow to Build Beautiful Full-Stack Apps — 本笔记来源视频
Claude Opus 4.8 发布公告 — Anthropic 官方
Gemini 3.5 Flash 发布 — Google 官方
Archon 官网 — Cole Medin 的开源 workflow engine
Cole Medin GitHub