Cursor 2026 春季开发者习惯报告¶

Cursor 发布的首份基于真实产品遥测数据（非问卷调查）的开发者习惯报告，覆盖 Agent 用量、Token 消耗、AI Diff 接受率、PR 合并活跃度五大维度，揭示了 AI 编码正在从个人效率工具转变为软件交付基础设施。

目录¶

#1. 开发者加速：产出翻倍
#2. 智能经济学：模型成本差 9 倍
#3. 强用户鸿沟：P99 产出是中位数 46 倍
#4. 上下文崛起：缓存读取占 90%
#5. 自动化转向：5 倍无人工审核代码
#6. 治理启示

1. 开发者加速：产出翻倍¶

核心数据（2025.01 → 2026.05）¶

指标	起始	现在	变化
每人每周新增代码行	3.6K	8.6K	~2.4x
每 PR 新增行数 (p75)	125.86	345.02	~2.5x
"巨型 PR" 比例 (>=1K 行)	8%	13.8%	+72.5%
每次会话工具调用数	113.63	145.08	+30%（两个月内）
AI 生成代码存活率 (60min)	76.6%	80.6%	+4pp

要点¶

不只是量的翻倍，PR 变得更大、Agent 会话更深、AI 代码存活率更高
"巨型 PR" 在 2026 年 1 月激增——开发者集中测试最新的 Agent/模型改进
Agent 执行越来越复杂的任务：读写文件、搜索代码、运行 shell 命令、浏览网页

产出分层趋势¶

代码行/开发者/周
2025.01:  P50(中位数) 176   P90  2.5K
2026.05:  P50(中位数) 712   P90  8.8K
           ↑ 4x             ↑ 3.5x

2. 智能经济学：模型成本差 9 倍¶

同一工作流因模型选择不同，成本可差 9 倍。

每次 Agent 请求成本（USD）¶

模型	成本/请求	成本/被接受行
Opus 4.7	$1.57	1.10c
Opus 4.6	$0.86	1.19c
GPT 5.5	$0.81	1.09c
GPT 5.4	$0.46	0.54c
Sonnet 4.6	$0.44	0.54c
GPT 5.3 Codex	$0.30	0.56c
Composer 2.5	$0.18	0.18c

成本-质量前沿（CursorBench 3.1）¶

质量分数
  65 |                  ● Opus 4.7 max ($11.02)
     |              ● GPT 5.5 extra ($4.37)
  63 |          ● Composer 2.5 ($0.55)  ← 性价比之王
     |      ● GPT 5.5 high ($3.59)
  60 |
  50 |              ● Gemini 3.5 Flash ($1.94)
  30 |    ● Kimi 2.5 ($0.87)
     +---+---+---+---+---+---+---+---+---+---→
         $0.5   $2    $4    $6    $8   $10    成本/任务

关键洞察¶

Composer 2.5 以约 1/20 的成本达到接近顶级的质量——正在重新定义成本-质量前沿
昂贵模型部分通过产出更多被接受代码来补偿——差距从 9x 缩小到 7x

选型决策树¶

选 Composer 2.5 如果：
  ✅ 大批量日常编码（性价比最优）
  ✅ 团队成本敏感
  ✅ 质量要求不需要极致

选 Opus 4.7/GPT 5.5 如果：
  ✅ 复杂架构决策
  ✅ 质量要求极高
  ❌ 大批量任务（成本失控）

3. 强用户鸿沟：P99 产出是中位数 46 倍¶

产出不平等¶

对比	AI 代码行/天	合并 PR/周
P99 vs P50	46x	15x
P90 vs P50	10x	4x

Gini 系数（越高 = 越集中于少数用户）¶

AI 代码行  0.77  ████████████████████░░░  高度集中
AI 消费    0.75  ████████████████████░░░
Token 用量 0.72  █████████████████░░░░░

要点¶

绝对差距在持续扩大——Top 1% 正在以更快的速度拉大距离
这不是"AI 不行"的问题，而是使用方式的差异
视频标题的"只有 1% 工程师做到了"即来源于此

4. 上下文崛起：缓存读取占 90%¶

Agent 工作正从"每次从零开始读代码"转向"大量复用已有上下文"。

Token 组成变化（2026.01 → 2026.05）¶

指标	起始	现在
输入/输出 Token 比率	4.52x	11.41x
输入占比（非缓存）	81.9%	91.9%
输入成本占比	47.5%	69.5%

总 Token 构成（2026.05）¶

缓存读取    ~90%  ████████████████████████████████████████░░░░
缓存写入    ~2.5% ██
非缓存输入   ~7%  ████
输出        ~0.6% █

要点¶

Agent 代码生成前需要"读懂"更多代码库上下文，但更多上下文 ≠ 更好合规
缓存读取 Token 占绝对主导（~90%），说明 Agent 的核心模式是反复读取同一代码库
输入成本占总成本近 70%——优化上下文检索是降本关键

5. 自动化转向：5 倍无人工审核代码¶

AI 正从"助手"进化为"自动化基础设施"。

无人工 Diff 审核直接提交比例¶

时间	比例
2026.01	7%
2026.02	31.3%
2026.05	~36-38%

半年内从 7% 到 36%，5 倍增长。 开发者越来越信任 Agent 完成端到端工作流。

最佳实践¶

✅ 对低风险变更（测试、文档、配置）可以自动接受
❌ 对核心业务逻辑和架构决策仍需人工审核
⚠️ 36% 无审核代码意味着治理必须前移到生成之前

6. 治理启示¶

"风险单位缩放速度 > 审核单位缩放速度"

核心论点¶

传统流程：写代码 → PR Review → 合并
                    ↑ 治理在这里（已经太晚了）

当前现实：
  PR p75 = 345 行（去年 126 行）
  巨型 PR = 13.8%（1000+ 行）
  36% 代码跳过 Diff 审核直接提交
         ↓
  架构决策在 Agent 会话中做出，不在 Review 帖子里
  Review 变成了审计（Audit），不再是把关（Gate）

六个治理面¶

1. 代码生成前 → 向 Agent 注入约束
2. 工具执行前 → Agent 操作系统，不只是提文本
3. 提交前     → 36% 跳过人工审核，必须自动化守门
4. PR 前      → 巨型 PR 应该天生合规
5. CI 中      → 确定性兜底
6. 跨产物     → 配置、基础设施、Schema、迁移——不只是源码

关键区分¶

	上下文（Context）	治理（Governance）
本质	概率性输入 → 生成步骤	确定性检查 → 输出合规
类比	RAG 检索"存在什么"	规则引擎"什么不能上线"
效果	Agent 读得更多 ≠ 遵守更多	机器可读、模型无关的执行

Cursor 2026 春季开发者习惯报告¶

目录¶

1. 开发者加速：产出翻倍¶

核心数据（2025.01 → 2026.05）¶

要点¶

产出分层趋势¶

2. 智能经济学：模型成本差 9 倍¶

每次 Agent 请求成本（USD）¶

成本-质量前沿（CursorBench 3.1）¶

关键洞察¶

选型决策树¶

3. 强用户鸿沟：P99 产出是中位数 46 倍¶

产出不平等¶

Gini 系数（越高 = 越集中于少数用户）¶

要点¶

4. 上下文崛起：缓存读取占 90%¶

Token 组成变化（2026.01 → 2026.05）¶

总 Token 构成（2026.05）¶

要点¶

5. 自动化转向：5 倍无人工审核代码¶

无人工 Diff 审核直接提交比例¶

最佳实践¶

6. 治理启示¶

核心论点¶

六个治理面¶

关键区分¶

参考资料¶

相关笔记¶