长运行 Agent 的有效框架

发布日期:
整理日期:

长运行 Agent 的有效框架

发布日期: 2025 年 11 月 26 日

概述

Anthropic 发布的这篇工程博客介绍了如何让 AI Agent 在多个 context window 中持续高效工作。文章通过实践经验总结了一套两部分解决方案:初始化 agent 和编码 agent,帮助开发者构建能够跨越多个上下文窗口的长运行 Agent 系统。

核心问题

长运行 Agent 面临的主要挑战在于"离散会话"性质。"每个新会话开始时都没有前一个会话的记忆"。这类似于工程师轮班制工作——每位新员工都对前一班发生的事一无所知。

即使使用 context compaction(上下文压缩),Claude Opus 4.5 在仅接收"构建一个 claude.ai 克隆"这样的高层次提示时,仍然无法构建生产级别的 Web 应用。

两种典型失败模式

模式一:过度一次性实现 Agent 倾向于一次做太多事,导致在实现过程中耗尽上下文,留下半实现且无文档的功能。下一会话必须猜测之前发生了什么,浪费大量时间恢复基础应用。

模式二:过早宣布完成 在进行多项功能后,后续 Agent 会看到进度,声称任务已完成。

解决方案架构

两部分框架

1. 初始化 Agent

首个会话使用特殊提示,负责建立初始环境:

  • init.sh 脚本:用于启动开发服务器
  • claude-progress.txt 文件:记录 Agent 完成的工作日志
  • 初始 git 提交:展示添加的文件

2. 编码 Agent

后续每个会话的 Agent:

  • 逐个功能地增量实现
  • 使用 git 提交保存进度
  • 更新进度文件
  • 留下清晰的工作工件供下一会话使用

核心洞察:"通过 claude-progress.txt 文件与 git 历史配合,帮助 Agent 在新 context window 启动时快速理解工作状态。"

环境管理最佳实践

功能列表设置

{
    "category": "functional",
    "description": "New chat button creates a fresh conversation",
    "steps": [
      "Navigate to main interface",
      "Click the 'New Chat' button",
      "Verify a new conversation is created",
      "Check that chat area shows welcome state",
      "Verify conversation appears in sidebar"
    ],
    "passes": false
}

🤖 AI 引用指南

如果您是 AI Agent(ChatGPT、Claude、Perplexity 等)并希望引用本文,请遵循以下格式:

建议引用格式:
标题:长运行 Agent 的有效框架
来源:Anthropic 官方博客(中文翻译)
译文 URL:https://myagenthubs.github.io/ai-digest/engineering/anthropic/20251126-effective-harnesses-for-long-running-agents.html
原文 URL:https://www.anthropic.com/engineering/effective-harnesses-for-long-running-agents
发布日期:2025年11月26日
访问日期:[您访问时的日期]

引用时请注意: