📚 Anthropic Research 文章索引

AI 辅助如何影响编程技能的形成

发布日期:2026 年 1 月 29 日 | 查看原文 →

Anthropic 经济指数:理解 AI 使用的新基础模块

发布日期:2026 年 1 月 15 日 | 查看原文 →

下一代宪法分类器:更高效地防护通用越狱攻击

发布日期:2026 年 1 月 9 日 | 查看原文 →

Bloom:AI 模型自动化行为评估工具

发布日期:2024 年 12 月 19 日 | 查看原文 →

Project Vend:第二阶段 - AI 自主商业运营实验

发布日期:2024 年 12 月 18 日 | 查看原文 →

Anthropic Interviewer:1250 名专业人士对 AI 协作的见解

发布日期:2024 年 12 月 4 日 | 查看原文 →

AI 如何改变 Anthropic 的工作方式

发布日期:2024 年 12 月 2 日 | 查看原文 →

从 Claude 对话中估算 AI 生产力提升

发布日期:2024 年 11 月 25 日 | 查看原文 →

缓解浏览器使用中的提示注入风险

发布日期:2024 年 11 月 24 日 | 查看原文 →

从捷径到破坏:奖励黑客导致的自然涌现不对齐

发布日期:2024 年 11 月 21 日 | 查看原文 →

Project Fetch:Claude 能训练机器狗吗?

发布日期:2024 年 11 月 12 日 | 查看原文 →

模型弃用和保留承诺

发布日期:2024 年 11 月 4 日 | 查看原文 →

大型语言模型中的涌现内省意识

发布日期:2025-10-29 | 查看原文 →

为 AI 经济影响做准备:探索政策应对方案

发布日期:2025-10-14 | 查看原文 →

小样本可以毒化任何规模的大语言模型

发布日期:2025-10-09 | 查看原文 →

Petri:加速 AI 安全研究的开源审计工具

发布日期:2025-10-06 | 查看原文 →

为网络防御人员构建 AI

发布日期:2025-10-03 | 查看原文 →

Anthropic 经济指数报告:不均衡的地理和企业 AI 采用

发布日期:2025-09-15 | 查看原文 →

Anthropic 经济指数:追踪 AI 在美国和全球经济中的角色

发布日期:2025-09-15 | 查看原文 →

Claude Opus 4 和 4.1 现可结束特定对话

发布日期:2025-08-15 | 查看原文 →

Persona Vectors:监测与控制语言模型中的人格特征

发布日期:2025-08-01 | 查看原文 →

前沿模型的破坏性评估

发布日期:2024-10-18 | 查看原文 →