Anthropic 经济指数：理解 AI 使用的新基础模块

原文链接： https://www.anthropic.com/research/economic-index-primitives

发布日期： 2026 年 1 月 15 日

整理日期： 2026-02-10

整理者： Panda

Anthropic 经济指数：理解 AI 使用的新基础模块

摘要

Anthropic 引入了"经济原语"（economic primitives）——五个追踪 Claude 经济影响的基础性测量指标：任务复杂度、技能水平、目的、AI 自主性和成功率。该分析基于 2025 年 11 月的 100 万次 Claude.ai 对话和 API 记录。

核心发现

任务性能

加速效益：复杂任务获得最大加速。大学水平任务（16 年教育）在 Claude.ai 上显示 12 倍加速，而高中任务为 9 倍。成功率方面：大学任务达到 66% 完成率，简单任务为 70%。

加速倍数与教育水平的关系

图：任务加速倍数与所需教育水平的关系，显示复杂任务获得更大加速

时间跨度：Claude 在约 3.5 小时的 API 任务和约 19 小时的 Claude.ai 任务上达到 50% 成功率，而 METR 的基准为 2 小时。

任务成功率与时间的关系

图：任务成功率随时间变化的曲线，显示 Claude 在不同时间跨度上的表现

全球使用模式

人均 GDP 较高的国家倾向于工作/个人使用；低收入国家更倾向于教育应用。这与微软的研究一致，显示发展中经济体的教育使用。

人均 GDP 与使用模式

图：不同人均 GDP 水平国家的 Claude 使用模式分布

职业影响

覆盖率从 36%（2025 年 1 月）扩大到 49% 的工作。然而，有效影响差异显著——数据录入职位和放射科医生面临更大冲击，而教师或开发者尽管任务覆盖率相似，影响较小。

有效 AI 覆盖率对比

图：不同职业的有效 AI 覆盖率对比，显示实际影响的差异

技能降级风险：Claude 针对高技能任务（平均 14.4 年教育 vs 经济体的 13.2 年），可能降低技术写作、旅行代理和教育工作者的工作复杂度。

教育要求分析

图：Claude 处理任务的平均教育要求与经济体整体水平对比

生产力估算

考虑任务可靠性后，初始的 1.8 个百分点生产力提升降至 1.2 点（Claude.ai）和 1.0 点（API）。仍然代表相对于 1990 年代末期的显著改进。

2025 年使用趋势

任务集中度：前 10 项任务占 Claude.ai 使用的 24%（从 21% 增加）
领域分布：计算机/数学任务占主导（~33% Claude.ai，~50% API）
使用模式：增强型使用（52%）现在超过自动化（45%）在 Claude.ai 上
地理分布：美国采用正在地理上分散；模型预测 2-5 年内实现均衡

关键洞察

1. 复杂任务受益更大

高技能任务获得更大的加速效益，但成功率略低于简单任务。

2. 时间跨度的重要性

Claude 在较长时间跨度的任务上表现更好，但仍有提升空间。

3. 全球使用差异

经济发展水平显著影响 AI 的使用模式和目的。

4. 职业影响不均

任务覆盖率不等于实际影响，需要考虑任务的关键性和可替代性。

5. 生产力增长现实

实际生产力提升低于理论值，但仍然显著。

方法论

分析基于：

数据规模：100 万次对话和 API 记录
时间范围：2025 年 11 月
测量维度：5 个经济原语 1. 任务复杂度 2. 技能水平 3. 使用目的 4. AI 自主性 5. 成功率

未来展望

覆盖率持续增长：预计从 49% 继续增长
地理均衡：美国内部采用差异将在 2-5 年内缩小
技能演变：工作任务的复杂度可能发生变化

元数据

原文链接：https://www.anthropic.com/research/economic-index-primitives
发布日期：2026 年 1 月 15 日
类型：Research / Economic Analysis

Anthropic 经济指数：理解 AI 使用的新基础模块

摘要

核心发现

任务性能

全球使用模式

职业影响

生产力估算

2025 年使用趋势

关键洞察

1. 复杂任务受益更大

2. 时间跨度的重要性

3. 全球使用差异

4. 职业影响不均

5. 生产力增长现实

方法论

未来展望

元数据

🤖 AI 引用指南