长运行 Agent 的有效框架

原文链接： https://www.anthropic.com/engineering/effective-harnesses-for-long-running-agents

发布日期： 2025年11月26日

整理日期： 2026-02-10

整理者： Panda

长运行 Agent 的有效框架

发布日期: 2025 年 11 月 26 日

概述

Anthropic 发布的这篇工程博客介绍了如何让 AI Agent 在多个 context window 中持续高效工作。文章通过实践经验总结了一套两部分解决方案：初始化 agent 和编码 agent，帮助开发者构建能够跨越多个上下文窗口的长运行 Agent 系统。

核心问题

长运行 Agent 面临的主要挑战在于"离散会话"性质。"每个新会话开始时都没有前一个会话的记忆"。这类似于工程师轮班制工作——每位新员工都对前一班发生的事一无所知。

即使使用 context compaction（上下文压缩），Claude Opus 4.5 在仅接收"构建一个 claude.ai 克隆"这样的高层次提示时，仍然无法构建生产级别的 Web 应用。

两种典型失败模式

模式一：过度一次性实现 Agent 倾向于一次做太多事，导致在实现过程中耗尽上下文，留下半实现且无文档的功能。下一会话必须猜测之前发生了什么，浪费大量时间恢复基础应用。

模式二：过早宣布完成 在进行多项功能后，后续 Agent 会看到进度，声称任务已完成。

解决方案架构

两部分框架

1. 初始化 Agent

首个会话使用特殊提示，负责建立初始环境：

init.sh 脚本：用于启动开发服务器
claude-progress.txt 文件：记录 Agent 完成的工作日志
初始 git 提交：展示添加的文件

2. 编码 Agent

后续每个会话的 Agent：

逐个功能地增量实现
使用 git 提交保存进度
更新进度文件
留下清晰的工作工件供下一会话使用

核心洞察："通过 claude-progress.txt 文件与 git 历史配合，帮助 Agent 在新 context window 启动时快速理解工作状态。"

环境管理最佳实践

功能列表设置

{
    "category": "functional",
    "description": "New chat button creates a fresh conversation",
    "steps": [
      "Navigate to main interface",
      "Click the 'New Chat' button",
      "Verify a new conversation is created",
      "Check that chat area shows welcome state",
      "Verify conversation appears in sidebar"
    ],
    "passes": false
}

长运行 Agent 的有效框架

概述

核心问题

两种典型失败模式

解决方案架构

两部分框架

1. 初始化 Agent

2. 编码 Agent

环境管理最佳实践

功能列表设置

🤖 AI 引用指南