📚 Anthropic Research 文章索引
AI 辅助如何影响编程技能的形成
发布日期:2026 年 1 月 29 日 |
查看原文 →
Anthropic 经济指数:理解 AI 使用的新基础模块
发布日期:2026 年 1 月 15 日 |
查看原文 →
下一代宪法分类器:更高效地防护通用越狱攻击
发布日期:2026 年 1 月 9 日 |
查看原文 →
Bloom:AI 模型自动化行为评估工具
发布日期:2024 年 12 月 19 日 |
查看原文 →
Project Vend:第二阶段 - AI 自主商业运营实验
发布日期:2024 年 12 月 18 日 |
查看原文 →
Anthropic Interviewer:1250 名专业人士对 AI 协作的见解
发布日期:2024 年 12 月 4 日 |
查看原文 →
AI 如何改变 Anthropic 的工作方式
发布日期:2024 年 12 月 2 日 |
查看原文 →
从 Claude 对话中估算 AI 生产力提升
发布日期:2024 年 11 月 25 日 |
查看原文 →
缓解浏览器使用中的提示注入风险
发布日期:2024 年 11 月 24 日 |
查看原文 →
从捷径到破坏:奖励黑客导致的自然涌现不对齐
发布日期:2024 年 11 月 21 日 |
查看原文 →
Project Fetch:Claude 能训练机器狗吗?
发布日期:2024 年 11 月 12 日 |
查看原文 →
模型弃用和保留承诺
发布日期:2024 年 11 月 4 日 |
查看原文 →
大型语言模型中的涌现内省意识
发布日期:2025-10-29 |
查看原文 →
为 AI 经济影响做准备:探索政策应对方案
发布日期:2025-10-14 |
查看原文 →
小样本可以毒化任何规模的大语言模型
发布日期:2025-10-09 |
查看原文 →
Petri:加速 AI 安全研究的开源审计工具
发布日期:2025-10-06 |
查看原文 →
为网络防御人员构建 AI
发布日期:2025-10-03 |
查看原文 →
Anthropic 经济指数报告:不均衡的地理和企业 AI 采用
发布日期:2025-09-15 |
查看原文 →
Anthropic 经济指数:追踪 AI 在美国和全球经济中的角色
发布日期:2025-09-15 |
查看原文 →
Claude Opus 4 和 4.1 现可结束特定对话
发布日期:2025-08-15 |
查看原文 →
Persona Vectors:监测与控制语言模型中的人格特征
发布日期:2025-08-01 |
查看原文 →
前沿模型的破坏性评估
发布日期:2024-10-18 |
查看原文 →