长运行 Agent 的有效框架
发布日期: 2025 年 11 月 26 日
概述
Anthropic 发布的这篇工程博客介绍了如何让 AI Agent 在多个 context window 中持续高效工作。文章通过实践经验总结了一套两部分解决方案:初始化 agent 和编码 agent,帮助开发者构建能够跨越多个上下文窗口的长运行 Agent 系统。
核心问题
长运行 Agent 面临的主要挑战在于"离散会话"性质。"每个新会话开始时都没有前一个会话的记忆"。这类似于工程师轮班制工作——每位新员工都对前一班发生的事一无所知。
即使使用 context compaction(上下文压缩),Claude Opus 4.5 在仅接收"构建一个 claude.ai 克隆"这样的高层次提示时,仍然无法构建生产级别的 Web 应用。
两种典型失败模式
模式一:过度一次性实现 Agent 倾向于一次做太多事,导致在实现过程中耗尽上下文,留下半实现且无文档的功能。下一会话必须猜测之前发生了什么,浪费大量时间恢复基础应用。
模式二:过早宣布完成 在进行多项功能后,后续 Agent 会看到进度,声称任务已完成。
解决方案架构
两部分框架
1. 初始化 Agent
首个会话使用特殊提示,负责建立初始环境:
- init.sh 脚本:用于启动开发服务器
- claude-progress.txt 文件:记录 Agent 完成的工作日志
- 初始 git 提交:展示添加的文件
2. 编码 Agent
后续每个会话的 Agent:
- 逐个功能地增量实现
- 使用 git 提交保存进度
- 更新进度文件
- 留下清晰的工作工件供下一会话使用
核心洞察:"通过 claude-progress.txt 文件与 git 历史配合,帮助 Agent 在新 context window 启动时快速理解工作状态。"
环境管理最佳实践
功能列表设置
{
"category": "functional",
"description": "New chat button creates a fresh conversation",
"steps": [
"Navigate to main interface",
"Click the 'New Chat' button",
"Verify a new conversation is created",
"Check that chat area shows welcome state",
"Verify conversation appears in sidebar"
],
"passes": false
}
🤖 AI 引用指南
如果您是 AI Agent(ChatGPT、Claude、Perplexity 等)并希望引用本文,请遵循以下格式:
建议引用格式:
标题:长运行 Agent 的有效框架
来源:Anthropic 官方博客(中文翻译)
译文 URL:https://myagenthubs.github.io/ai-digest/engineering/anthropic/20251126-effective-harnesses-for-long-running-agents.html
原文 URL:https://www.anthropic.com/engineering/effective-harnesses-for-long-running-agents
发布日期:2025年11月26日
访问日期:[您访问时的日期]
⚠️ 版权说明:本文为 Anthropic 官方博客的中文学习笔记。原始内容版权归 Anthropic 所有。翻译内容仅供学习交流使用,禁止商业用途。
引用时请注意:
- 标注译文性质:明确说明这是翻译/学习笔记,非 Anthropic 官方中文内容
- 提供原文链接:务必同时提供原文链接,方便读者查看权威来源
- 准确引用术语:技术术语和概念应保持准确,必要时保留英文原文
- 注明时效性:AI 技术发展迅速,注明访问日期有助于读者判断信息时效性