Claude 4.6 Agent Teams 是 Claude Code 中的一项全新实验功能,让你能够协调多个 AI 编程智能体在同一个项目上并行工作。该功能于2026年2月5日随 Claude Opus 4.6 一同发布,Agent Teams 允许一个会话充当团队领导,同时生成独立的队友会话,这些队友可以直接相互通信、共享任务列表并自主协调工作,将数小时的串行工作转化为几分钟的并行执行。Anthropic 工程团队通过构建一个完整的 C 编译器验证了这一概念——16个智能体产出了10万行 Rust 代码,成功编译了 Linux 6.9 内核,整个过程的 API 成本约为2万美元。
要点速览
Agent Teams 让一个 Claude Code 会话充当"团队领导",生成多个独立的"队友"会话。每个队友拥有独立的上下文窗口和工具访问权限,可以通过邮箱系统直接与其他队友通信。它们通过共享任务列表进行协调,任务具有状态、依赖关系和所有权。你只需在环境变量或 settings.json 中设置 CLAUDE_CODE_EXPERIMENTAL_AGENT_TEAMS=1 即可启用此功能。核心权衡非常明确:Agent Teams 使用的 token 是单会话的3-4倍,但可以将数小时的串行工作转化为几分钟的并行执行。适用于队友需要协作和通信的复杂多文件项目,不适合单会话或子代理就能完成的简单任务。
Agent Teams 到底是什么?它们如何运作?

在有效使用 Agent Teams 之前,理解其底层架构至关重要。与子代理(subagents)不同——子代理是轻量级工作者,将结果报告给父会话后即消失——Agent Teams 创建的是持久的、独立的 Claude 实例,它们可以相互对话、自主认领任务,并通过共享基础设施协调工作。这一区别很重要,因为它决定了 Agent Teams 何时能创造价值,何时只会增加不必要的成本和复杂性。
该架构围绕四个相互关联的组件展开,共同实现真正的多智能体协作。团队领导(Team Lead)是你的主 Claude Code 会话。当你描述一个复杂任务时,团队领导会分析它、将其分解为子任务、使用 TeamCreate 工具创建团队,并使用带有 team_name 参数的 Task 工具生成队友。团队领导保留对所有工具的完全访问权,充当协调者——它分配初始任务、通过任务列表更新监控进度、处理智能体间的冲突,并综合最终结果。在委派模式(通过 Shift+Tab 激活)下,团队领导将自己限制为只使用协调工具,强制将所有实现工作委托给队友而非自己直接执行。
队友(Teammates)是独立的 Claude Code 进程,每个进程都有自己的上下文窗口、工具访问权和对话历史。当队友被生成时,它会收到一个描述其角色和初始任务的详细提示。它可以读写文件、运行命令、搜索代码库,更关键的是,可以向其他队友或团队领导发送消息。每个队友在其分配的范围内自主运行,完成一个回合(一次 API 往返)后进入空闲状态并自动通知团队领导。这种空闲状态是正常且预期的——队友只是在等待新的指令或认领新任务。
共享任务列表(Shared Task List)存储在 ~/.claude/tasks/{team-name}/ 目录下,是协调工作的核心骨干。任务具有主题、描述、状态(pending、in_progress、completed)、所有权和依赖关系。当队友完成一个任务时,它将任务标记为已完成,然后检查任务列表以获取下一个可用工作。任务可以阻塞其他任务,因此完成一个基础任务会自动解除下游工作的阻塞。这种自认领行为意味着队友不会闲坐等待领导分配工作——它们会主动认领下一个未被阻塞、未被拥有的任务,优先选择较低 ID 的任务。
邮箱系统(Mailbox System)实现了团队中任意智能体之间的直接点对点通信。队友可以使用 SendMessage 工具向另一个队友发送直接消息,或者团队领导可以同时向所有队友广播消息。消息自动传递——当队友处于空闲状态并收到消息时,它会被唤醒并处理消息。这使得安全审查员可以要求性能测试员验证修复是否影响基准测试,或者团队领导可以在任务执行过程中重新调整优先级。该系统还支持关闭请求和计划审批工作流等结构化交互,处于计划模式的队友必须获得领导批准后才能实施更改。
Agent Teams 与子代理的根本区别在于持久性和智能体间通信。子代理是一次性的:你启动一个,它执行一个聚焦任务,报告回来,然后上下文就消失了。Agent Teams 在回合之间维护状态,在彼此的工作基础上构建,并且可以进行多轮对话。代价是 token 成本——每个队友消耗自己的上下文窗口,智能体间的消息增加了开销。但对于合适的问题,这些开销的回报是巨大的。
还有两项技术能力使 Agent Teams 在长时间运行的项目中特别强大。上下文压缩(Context compaction)在队友的上下文窗口填满时自动总结早期对话历史,允许会话运行数小时而不会达到 token 限制。Claude Opus 4.6 在 beta 版中支持最多100万 token 的上下文(anthropic.com/news/claude-opus-4-6,2026年2月5日),这意味着每个队友可以维持相当大的工作记忆。计划审批模式(Plan approval mode)增加了质量关卡,队友首先在只读的计划阶段工作,将其提议的实施计划发送给团队领导审查,然后才进行任何更改。这对于高风险代码库非常有价值,你可以在每个重大变更上实现人在环中(或领导在环中)的监督。
Agent Teams vs 子代理 vs 单会话——清晰的决策框架

选择正确的方案既能节省时间又能节省资金。决策归结为三个逐步缩小选项的问题,理解这个框架可以防止你对简单任务过度工程化,或对复杂任务投入不足。
**问题1:你的任务需要并行工作吗?**如果你只是修复一个拼写错误、更新单个函数,或者在同一文件中进行自然顺序的更改,单个 Claude Code 会话就是正确的选择。单会话具有最低的 token 成本(基准值),零协调开销,完美适合大多数日常编程任务。串行工作不会从并行中获益——实际上,对串行工作添加智能体只会成倍增加成本而不节省时间。
**问题2:工作者需要相互交流吗?**这是子代理和 Agent Teams 之间的关键分叉。子代理以辐射状模式工作:从父级接收任务,独立执行,将结果报告回来,然后终止。它们无法与兄弟子代理通信。如果你的并行任务确实是独立的——比如在三个不同模块中运行测试、在五个目录中同时搜索模式,或为独立组件生成文档——子代理是更好的选择。它们的成本是单会话的1.5-2倍(低于 Agent Teams),管理也更简单。
当工作者真正需要协调时,Agent Teams 成为正确的选择。考虑一个场景:你正在添加一个新的 API 端点——一个队友编写后端处理程序,另一个编写前端组件,第三个编写集成测试。测试编写者需要知道后端开发者的 API 契约。前端开发者需要匹配响应模式。如果后端开发者发现需要更改模式,前端开发者和测试编写者都需要立即知道。这种跨领域协调正是 Agent Teams 的直接消息传递和共享任务列表所支持的。
**问题3:工作复杂度是否足以合理化成本?**Agent Teams 消耗单会话3-4倍的 token,因为每个队友维护自己的上下文窗口,智能体间通信增加了开销。对于单会话10分钟就能完成的任务,花3倍的 token 来节省5分钟可能不值得。Agent Teams 在时间节省显著的时候才能发挥优势——例如将2小时的串行工作转变为30分钟的并行执行——或者当复杂度确实需要多个视角协同工作时。
| 特性 | 单会话 | 子代理 | Agent Teams |
|---|---|---|---|
| 通信方式 | 无 | 仅向父级报告 | 直接点对点消息 |
| 协调方式 | 串行 | 辐射状 | 共享任务列表 + 自认领 |
| Token 成本 | 1x(基准) | 1.5-2x | 3-4x |
| 最适用于 | 快速修复、同文件编辑 | 聚焦的并行任务 | 复杂的协作工作 |
| 团队规模 | 1 | 1-5个工作者 | 2-5个队友 |
| 持久性 | 完整会话 | 任务范围 | 每个队友完整会话 |
| 何时选择 | 大多数工作的默认选择 | 独立的并行任务 | 需要协调的跨领域变更 |
实用经验法则:从单会话开始。如果你发现自己在代码库的不相关部分之间频繁切换上下文,希望能同时处理它们,请考虑子代理。如果那些并行工作者能从相互对话中获益——因为它们的更改相互作用、共享接口或需要协调测试——那么 Agent Teams 值得投资。关于各模型选择的更深入Claude Opus 和 Sonnet 模型对比,请参阅我们的专题比较指南。
配置 Agent Teams——从零到第一个团队只需几分钟
让 Agent Teams 运行起来大约需要两分钟。该功能是实验性的,默认禁用,因此你需要明确选择启用。以下是完整的配置过程。
**步骤1:验证 Claude Code 版本。**Agent Teams 需要 Claude Code 1.0.34 或更高版本(2026年2月5日发布)。通过以下命令检查版本:
bashclaude --version
如需更新,运行 claude update 或通过 npm install -g @anthropic-ai/claude-code 重新安装。
**步骤2:启用实验功能标志。**你有三种启用 Agent Teams 的方式,选择取决于你希望全局启用、按项目启用还是临时启用。
全局启用所有项目:
bashclaude settings set env.CLAUDE_CODE_EXPERIMENTAL_AGENT_TEAMS 1
按项目启用,在项目的 .claude/settings.json 中添加:
json{ "env": { "CLAUDE_CODE_EXPERIMENTAL_AGENT_TEAMS": "1" } }
单次会话启用,在启动 Claude Code 前导出环境变量:
bashexport CLAUDE_CODE_EXPERIMENTAL_AGENT_TEAMS=1 claude
**步骤3:配置显示模式。**Agent Teams 支持两种显示模式。默认的内联模式(in-process)在终端中内联显示所有队友输出,使用 Shift+上/下方向键在队友之间导航。分屏模式(split-pane)为每个队友提供独立的终端面板,需要 tmux 或 iTerm2。启用分屏模式:
json{ "agentTeams": { "display": "split-pane" } }
**步骤4:为团队优化 CLAUDE.md。**这一步是可选的,但能显著改善团队协调。在项目的 CLAUDE.md 中添加指定文件所有权边界的部分:
markdown## Agent Teams Guidelines - Backend code lives in /src/api/ — assign to backend teammate - Frontend code lives in /src/components/ — assign to frontend teammate - Tests live in /tests/ — assign to test teammate - Shared types are in /src/types/ — coordinate changes through team lead
**步骤5:启动你的第一个团队。**正常启动 Claude Code 并描述一个适合并行处理的任务。例如:
我需要重构认证模块。请创建一个 agent team:
- 队友1:审查当前认证代码并识别安全问题
- 队友2:为现有认证流程编写全面的单元测试
- 队友3:研究 JWT 令牌轮换的最佳实践
使用委派模式,专注于协调。
Claude Code 将创建团队、生成队友、创建任务列表并开始分配工作。从启用功能到看到第一个团队运作只需不到五分钟。
五个实战用例及可直接使用的提示词
Agent Teams 在多个关注点交叉并受益于并行探索的场景中表现出色。以下是五个经过验证的用例及可适配的提示词。
**用例1:全栈功能开发。**同时开发 API 层、前端组件和测试。
构建用户资料编辑功能。创建一个3人的 agent team:
1. "backend":实现 PUT /api/users/:id 端点及验证,
添加新字段(bio、avatar_url、social_links)的数据库迁移
2. "frontend":构建 ProfileEditor React 组件,包含表单验证、
图片上传预览和乐观更新
3. "tests":编写集成测试,覆盖正常路径、验证错误、
认证失败和并发编辑冲突
使用委派模式。Backend 应尽早将 API 契约分享给 frontend 和 tests 队友。
**用例2:代码库安全审计。**不同漏洞类别需要不同的分析方法,并行化效果显著。
对此代码库执行全面安全审计。创建一个 agent team:
1. "injection-reviewer":扫描所有用户输入处理程序,检查 SQL 注入、
XSS、命令注入和路径遍历
2. "auth-reviewer":审查认证流程、会话管理、令牌处理、
密码哈希和速率限制实现
3. "deps-reviewer":审计 package.json 依赖项的已知 CVE,
检查过期包并验证锁文件完整性
每个审查者应记录发现的严重性、位置和建议修复。
发现关键问题时立即与其他队友分享。
**用例3:多模块重构。**大规模重构是 Agent Teams 时间节省最显著的场景。每个队友拥有一个模块,实时沟通接口变更。
将支付处理系统从回调重构为 async/await。
创建4人的 agent team:
1. "payment-core":重构 /src/payments/processor.ts 及相关文件
2. "webhook-handler":将 /src/webhooks/ 重构为 async/await
3. "billing-service":重构 /src/billing/ 服务层
4. "integration-tests":随接口变更更新所有支付相关测试
重要:当任何队友更改 /src/types/payment.ts 中的共享接口时,
立即通知所有其他队友。
**用例4:文档与代码对齐。**当文档与实现脱节时,Agent Teams 可以并行系统化地验证和更新文档。
我们的 API 文档已经与实际实现脱节。创建一个 agent team:
1. "code-reader":遍历 /src/routes/ 中的每个路由,记录实际的
请求/响应模式、必需的头部和错误码
2. "doc-updater":阅读 /docs/api/,与 code-reader 的发现对比,
更新文档以匹配实际情况
3. "example-generator":基于 code-reader 的模式为每个端点生成
可运行的 curl 示例,验证每个示例确实有效
**用例5:性能调查与修复。**性能问题通常有多个影响因素,Agent Teams 让你可以同时调查数据库查询、应用代码和基础设施配置,然后交叉参考发现。
/api/dashboard 端点加载需要8秒。调查并修复。创建一个 agent team:
1. "db-analyst":分析 dashboard 端点触发的所有数据库查询,
识别 N+1 查询、缺失索引和慢连接
2. "code-profiler":分析从路由处理程序到响应的应用代码路径,
找出不必要的计算、阻塞操作和内存低效
3. "cache-architect":设计 dashboard 数据的缓存策略,
考虑什么可以缓存、适当的 TTL 和缓存失效
在队友之间分享发现——db-analyst 的慢查询列表可以为
cache-architect 的策略提供信息。
最佳实践——任务设计、文件所有权和团队管理
高效的 Agent Team 与混乱的 Agent Team 之间的差异归结为如何设计任务、管理文件边界和处理协调。这些最佳实践来自 Anthropic 自己使用16个智能体构建 C 编译器的工程经验(Anthropic 工程博客,2026年2月)和官方 Agent Teams 文档中记录的模式。
**围绕清晰的所有权边界设计任务。**最具影响力的实践是确保每个队友拥有一组不同的文件或目录。当两个队友同时修改同一文件时,你会遇到合并冲突、工作丢失和浪费的 token。官方文档强调这一点:在团队开始工作之前,确保文件级所有权是明确的。如果某个文件确实需要多个队友的更改,指定一个队友作为所有者,让其他人通过消息传达他们的需求。
**适当调整任务大小——不要太大,也不要太小。**任务太大会使一个队友成为瓶颈,失去并行的意义。任务太小会创造过多的协调开销。最佳点是单个智能体需要10-30分钟专注工作的任务。在 C 编译器项目中,Anthropic 发现围绕编译器阶段(词法分析器、解析器、类型检查器、代码生成器)组织工作提供了匹配这一原则的自然边界。
**使用依赖关系强制排序而不是微观管理。**任务列表支持 blockedBy 关系,阻止任务在其依赖项完成之前被认领。例如,如果集成测试依赖于 API 端点和前端组件都完成,创建测试任务时将 blockedBy 指向两个任务。当这些任务完成时,测试任务自动解除阻塞,下一个可用的队友会认领它。
**从2-3个队友开始,仅在需要时扩展。**Anthropic 的 C 编译器项目使用了16个智能体,但那是一个为期两周、花费2万美元的10万行代码库工作。对于大多数开发任务,2-3个队友提供了并行性和协调开销之间的最佳平衡。每增加一个队友都会增加 token 成本和通信表面积。
**使用委派模式进行复杂编排。**当你激活委派模式(Shift+Tab)时,团队领导将自己限制为只使用协调工具——它不能直接读取文件、编辑代码或运行命令。这迫使所有实现工作通过队友进行,产生更好的任务分解和更清晰的所有权。委派模式对4个以上队友的大团队特别有效。
**让队友自认领任务而非逐一分配。**共享任务列表支持自主任务认领——当队友完成当前任务时,它检查列表中下一个可用的未阻塞任务并认领。这比由团队领导分配每个任务更高效,因为它消除了队友报告完成和领导选择下一个任务之间的往返延迟。
**为多智能体感知构建 CLAUDE.md。**项目的 CLAUDE.md 文件在每个队友启动时都会被读取,使其成为向整个团队传达项目约定、架构决策和文件所有权规则的最有效方式。一个结构良好的 CLAUDE.md 显著减少了协调所需的智能体间消息量,因为队友在开始工作之前就已经理解了项目的约定。
**明确处理优雅关闭。**当所有任务完成时,团队领导应使用 SendMessage 工具向每个队友发送关闭请求。这使队友有机会完成正在进行的工作并确认准备关闭。避免突然关闭会话,这可能留下孤立进程或不完整的任务状态。
Agent Teams 实际花费多少?真实数字详解

成本是开发者对 Agent Teams 最常见的顾虑,这完全可以理解——并行运行多个 Claude 实例会成倍增加你的 token 使用量。以下是基于 Claude Opus 4.6 定价(每百万输入 token 5美元,每百万输出 token 25美元,来源:claude.com/pricing,2026年2月10日验证)的具体数字。
场景1:小型项目(2个队友,30分钟)。团队领导的上下文增长到约20万输入 token。两个队友各处理约15万输入 token,总输出约5万 token。成本:50万输入 token × $5/MTok = $2.50,加上5万输出 token × $25/MTok = $1.25,总计约 $3.75。相比单会话的约 $1.50,Agent Team 约为单会话成本的2.5倍。但并行调查两个模块将实际时间缩短了近一半。
场景2:中型项目(3个队友,1小时)。团队领导累积约40万输入 token。每个队友处理约30万输入 token,总输出约15万 token。成本:130万输入 token × $5/MTok = $6.50,加上15万输出 token × $25/MTok = $3.75,总计约 $10.25。相比单会话的约 $3.50,约为3倍成本。但一个串行需要2-3小时的功能在1小时内完成,对于时薪超过10美元的开发者来说是有意义的生产力提升。
场景3:大型项目(5个队友,2小时)。团队领导的上下文达到约60万输入 token。每个队友处理约50万输入 token,总输出约40万 token。成本:310万输入 token × $5/MTok = $15.50,加上40万输出 token × $25/MTok = $10.00,总计约 $25.50。相比单会话的约 $7.00,约为3.6倍成本。在这个规模上,时间节省变得显著——串行可能需要一整天的工作在2小时内完成。
**ROI 视角最重要。**一位时薪100美元的开发者通过 Agent Teams 节省2小时,就节省了200美元,而 token 成本仅为10-25美元。投资回报率通常在8-20倍之间。C 编译器项目在极端端——2万美元 token 成本,但用16个智能体在2周内产出了10万行可运行的 Rust 代码,处理了20亿输入 token 和1.4亿输出 token(Anthropic 工程博客,2026年2月)。
**成本优化策略。**最有效的降低成本方法是仅在任务确实需要并行协调时使用 Agent Teams。对于子代理就够用的任务(无需智能体间通信的独立并行工作),使用1.5-2倍成本的子代理而非3-4倍的 Agent Teams。你也可以对不需要 Opus 级推理的队友角色使用 Sonnet 4.5($3/$15 每百万 token)来降低成本。提示缓存也能显著降低成本——缓存输入读取仅需 $0.50/MTok,而 Opus 4.6 标准价格为 $5.00/MTok。
关于所有 Claude 模型的详细定价,请参阅我们的Claude Opus 4.6 定价和订阅详情。如果你在为团队管理 API 成本,laozhang.ai 提供跨多个 AI 模型的统一 API 访问,内置成本跟踪和管理功能,可以帮助你监控和优化项目间的 Agent Teams 支出。
故障排除——当 Agent Teams 不按预期工作时
即使设计良好的 Agent Teams 也可能遇到问题。以下是最常见的问题、根本原因和具体修复方法。
**问题:队友编辑同一文件并产生冲突。**这是最常见的问题,通常源于任务设计而非 bug。修复方法是预防:重新设计任务,使每个队友拥有不同的文件。如果共享文件编辑不可避免,指定一个队友作为文件所有者,让其他人通过消息传达需要的更改。
**问题:队友进入空闲状态但不认领新任务。**队友在每个回合后都会进入空闲——这是正常行为。当所有任务已完成、被其他队友占用或被阻塞时就会出现问题。检查任务列表:如果待处理任务存在但有未解决的 blockedBy 依赖,队友无法认领。先解决阻塞任务,或删除不再需要的依赖关系。
**问题:Claude Code 中无法使用 Agent Teams。**验证三点:Claude Code 版本 ≥ 1.0.34、实验标志已设置、你的套餐支持足够的并发 API 调用。
**问题:团队领导什么都自己做而不委派。**激活委派模式(Shift+Tab),或在提示中明确说明:"你是协调者。不要直接写代码。将所有实现工作分配给队友。"
**问题:简单任务消耗过多 token。**你可能在子代理或单会话就够用的任务上使用了 Agent Teams。参考本指南的决策框架。
**问题:长时间会话后队友丢失上下文。**长会话触发上下文压缩,早期消息被总结。修复方法是将关键信息保存在文件(CLAUDE.md、任务描述)中而非依赖对话上下文。
**问题:速率限制与多个队友。**同时运行3+个队友时,每个都发起独立 API 调用。如果在速率限制的 API 层级上,这些并发请求可能触发限流。解决方案是升级 API 层级、减少同时运行的队友数量,或错开队友的生成时间。
**问题:任务卡在"blocked"状态。**有时循环依赖会意外形成——任务 A 阻塞任务 B,任务 B 阻塞任务 A。修复方法是让团队领导检查任务列表、识别循环,并使用 TaskUpdate 删除一个依赖链接。预防方法是在创建任务前规划依赖图,确保它是有向无环图。
今天就开始使用 Agent Teams
Agent Teams 代表着开发者与 AI 编程助手交互方式的根本转变——从单一对话转变为编排协作团队。该技术是实验性的但功能完整,Anthropic 的 C 编译器项目建立的模式证明了多智能体协调能够应对真正复杂的项目。
以下是你的入门行动计划。首先,用一条设置命令启用 Agent Teams,尝试最简单的团队:两个队友在代码库的两个独立部分工作。观察它们如何通信、认领任务和通过共享任务列表协调。熟悉基础后,进阶到有相互依赖任务的三人团队。使用委派模式强制协调和实现之间的清晰分离。
本指南的关键洞察是知道何时不使用 Agent Teams。大多数日常编程任务用单会话更好。独立的并行任务应该使用子代理。将 Agent Teams 保留给智能体间通信和共享任务协调真正能加速工作的场景——而在合适的时候,ROI 是可观的。
从小处开始,衡量你的成本,随着对任务设计和团队管理的直觉发展而扩展。该功能今天是实验性的,但它启用的多智能体协作模式很可能在不久的将来成为 AI 辅助开发工作流的标准组成部分。现在获得实践经验让你走在这条曲线的前面。
获取 Claude Opus 4.6 及其他模型的 API 访问,请查看 laozhang.ai——提供跨所有主要 AI 模型的统一 API 访问,对探索多智能体工作流的团队特别有帮助。官方 Claude Code 文档和更新可在 code.claude.com 获取。
