本文首发于同名公众号你有没有这种感觉找一个AI帮忙做事它能做但它做的所有事都带着同一种味道。让它写文案是那种AI写的文案味道。让它做分析是那种AI做的分析味道。让它出创意还是那种AI出的创意味道。为什么因为一个Agent的能力是有边界的。一个Agent再强也有不擅长的领域。一个Agent再聪明一次也只能专注做一件事。一个Agent的上下文再长也是有限的。解决这些问题的方法是让多个Agent协作。就像一个公司不是靠一个人运转而是靠一个团队。每个岗位的人各司其职有人负责决策有人负责执行有人负责审核最终才能把事情做好。先说个真实的例子我之前想让一个Agent帮我做产品分析。我以为它能搞定——查数据、做竞品对比、生成报告一条龙服务。结果呢它确实能做但它做出来的分析报告专业度一般。数据查得不够深竞品对比浮于表面结论也是泛泛而谈。问题出在哪问题在于让一个Agent同时扮演数据分析师和行业专家和报告写手太为难它了。数据分析师需要知道去哪里查数据、怎么清洗数据、分析数据的标准是什么。行业专家需要了解行业格局、竞争态势、发展趋势。报告写手需要懂得怎么组织结构、怎么突出重点、怎么让结论有说服力。一个Agent同时具备这三种能力能做到但每种能力都做不到顶尖。后来我换了个思路。让三个Agent各司其职一个专门负责数据检索和清洗一个专门负责行业分析一个专门负责报告撰写和润色。结果完全不一样。每个Agent都在自己擅长的领域深耕最终产出的质量远超单Agent的效果。这就是Multi-Agent的价值让专业的人做专业的事。为什么需要Multi-Agent先看单Agent的三个核心问题。第一个问题专业能力有限。让一个Agent同时做这些事写代码、做设计、写文案、分析数据。它能做但每样都做不到最好。大模型的能力是通用的不是专用的。你可以让它写代码它能写但写不过专业程序员。你可以让它做设计它能做但做不过专业设计师。你可以让它写文案它能写但写出来的总有那种AI味。为什么因为每件事都需要深入学习和大量练习才能做好。大模型再强也不可能在所有领域都达到专家水平。Multi-Agent的解法是不要求一个Agent什么都会只要求每个Agent专精一件事。写代码的Agent就专精写代码做设计的Agent就专精做设计它们之间不需要互相替代只需要互相配合。第二个问题上下文窗口有限。上下文窗口就像人的短期记忆太多了记不住。一个复杂的任务可能需要处理几万字的上下文。单Agent处理长上下文的时候会遇到一个尴尬的情况信息太多放不下早期的关键信息被挤出去了。就像你在打电话对方说了太多内容你记不住前面的只能记住最近的几句。Multi-Agent的解法是把长任务拆分每个Agent只处理自己那部分。一个Agent处理第一步产出结果后交给下一个Agent继续处理。信息在Agent之间传递每次只传递关键结果不用把全部上下文都塞进去。第三个问题效率瓶颈。有些任务之间没有依赖可以并行执行。但单Agent只能串行一件事做完再做下一件。比如查资料、写代码、做测试、写文档。这四件事后三件都依赖查资料的结果但代码、测试、文档之间其实没有依赖。如果只有一个Agent它只能先查资料然后依次写代码、测试、写文档三个任务串行执行。如果有多个Agent查完资料之后代码、测试、文档可以同时进行效率提升明显。Multi-Agent的解法是让能并行的任务并行执行。查资料的是一个Agent写代码的是一个Agent做测试的是一个Agent写文档的是一个Agent。大家同时开工互不等待。Multi-Agent的协作模式Multi-Agent系统有三种主流协作模式层级模式、协作模式、竞争模式。模式一层级模式。层级模式就像一个传统公司有一个老板在顶层负责统筹下面有多个专家负责执行具体任务。老板Agent的职责是理解用户需求、拆解任务、分配给专家、汇总专家结果。它的核心能力是决策——这件事分几步每步交给谁交给专家的指令怎么写专家的结果合不合格。专家Agent的职责是执行被分配的任务。代码专家Agent只管写代码设计专家Agent只管做设计测试专家Agent只管做测试。它的核心能力是执行——把交给我的任务做到最好。层级模式的优势是结构清晰、职责明确。用户只需要跟老板Agent对话不用操心具体的执行细节。老板Agent会把任务拆解清楚分配给合适的专家最后把结果汇总给用户。层级模式的劣势是过度依赖老板Agent。如果老板Agent拆解任务的能力不行整个系统的效果就会打折扣。另外老板Agent和专家Agent之间需要良好的通信机制否则任务分配和结果汇总都会出问题。模式二协作模式。协作模式没有明确的老板多个Agent地位平等共同协作完成任务。这种模式就像一个项目组大家都是同事遇到问题一起讨论产出大家一起负责。没有一个人是绝对主导但需要有一个人或一个机制来做最终的协调。比如分析一家公司是否值得投资这件事。财务分析师Agent负责看财务报表、现金流、盈利能力。行业分析师Agent负责看市场地位、竞争格局、行业趋势。风险分析师Agent负责看潜在风险、政策风险、市场风险。三个Agent各自分析但分析过程中会互相讨论补充。财务分析师发现某个数据异常可能会问行业分析师这个异常在行业中是否常见。行业分析师发现市场趋势变化可能会问风险分析师这对公司意味着什么。最终三个Agent的分析汇总成一份完整的投资分析报告。每部分都是专业分析整体是协作成果。协作模式的优势是充分发挥每个Agent的专业能力分析质量高。劣势是Agent之间的通信和协调比较复杂需要设计良好的消息传递机制。模式三竞争模式。竞争模式是多个Agent各自独立完成任务然后比较结果选最优。这种模式适合开放性问题——没有唯一正确答案需要多方案比较。比如给一个品牌起名字。一个走科技感路线的Agent想出了星辰、“曙光”、“凌霄”。一个走温暖感路线的Agent想出了归途、“暖阳”、“知还”。一个走国际感路线的Agent想出了Wedo、“Cloudi”、“Nexa”。三个Agent各自产出方案然后有一个评估机制来比较这些方案。好不好记有没有歧义域名能不能注册商标能不能过。综合评估之后推荐最优的两到三个给用户。竞争模式的优势是能探索多种可能性避免单一视角的局限。劣势是资源消耗大每个Agent都要独立完成任务然后再比较。Agent之间怎么通信Multi-Agent系统里Agent之间需要说话。没有通信机制Agent就是各自为战的孤岛协作无从谈起。有几种常见的通信方式。第一种共享内存。所有Agent读写同一个黑板或消息队列。就像办公室的白板谁都可以写谁都可以看。Agent A把分析结果写到共享内存里Agent B去读。Agent C也去读。它不需要知道是谁写的只关心内容是什么。这种方式的优点是简单直接Agent之间不需要知道彼此的存在。缺点是没有明确的通信目标Agent需要自己去判断什么时候该写、什么时候该读、该读什么。第二种点对点通信。Agent A直接给Agent B发消息就像发私信。Agent B收到消息后处理完再回复Agent A。这种方式的优点是通信明确A明确知道B会收到、B明确知道A在问什么。缺点是Agent多了之后点对点的连接数会爆炸。三个Agent之间有3条连接五个Agent之间有10条连接维护成本很高。第三种广播。Agent A发消息所有Agent都能收到。就像群里发了一条消息群里的每个人都能看到。这种方式的优点是信息传播广所有Agent都能获得同样信息。缺点是Agent需要自己判断这条消息跟自身有没有关系没有关系就要忽略处理起来有额外开销。第四种分层通信。老板Agent给专家Agent发指令专家Agent汇报结果。上下级之间通信不跨级。这种通信方式和层级模式配合最好。老板Agent不需要知道专家Agent之间怎么通信专家Agent也不需要知道其他专家Agent的存在大家各司其职通过上下级关系传递信息。Multi-Agent的协调机制光有通信方式还不够还需要协调机制来解决三个核心问题谁先做、怎么配合、出了问题怎么办。第一个问题谁先做。多个Agent同时开工如果没有协调可能会出现混乱。数据库写冲突、文件覆盖、结果不一致——这些问题都可能发生。协调的方式有两种。一种是中心协调由老板Agent或者专门的协调Agent来决定任务分配和执行顺序。另一种是分布式协调Agent之间通过某种协议来协商谁做什么、什么时候做。实际开发中中心协调用得更多因为简单可靠。分布式协调更灵活但实现复杂度也更高。第二个问题怎么配合。任务之间往往有依赖关系。写代码依赖需求分析测试依赖代码完成部署依赖测试通过。这些依赖关系需要理清楚才能确定任务的执行顺序。协调的方式是把任务和依赖关系显式表达出来。每个任务有明确的输入和输出上游任务的输出是下游任务的输入。系统根据依赖关系自动确定执行顺序不需要人工干预。第三个问题出了问题怎么办。Agent执行任务可能失败。工具调用超时、API返回错误、结果不符合预期——这些情况都可能发生。协调的方式是设计回退机制。一个Agent执行失败不一定需要整个系统停下来。可以让其他Agent继续执行出错的Agent的任务或者换一个Agent重试或者把错误信息反馈给用户让用户决定怎么处理。Multi-Agent的挑战说了这么多Multi-Agent的好处也要说说它的挑战。挑战一协调成本。Agent多了谁先做谁后做、怎么配合、谁来统筹——这些都是需要解决的问题。协调机制本身也需要开发和维护。如果协调机制设计得不好Multi-Agent系统的效果可能还不如单Agent。实际经验是Multi-Agent系统适合任务可以清晰拆分、每个子任务相对独立的场景。如果任务之间依赖太紧密拆不开那Multi-Agent的优势就不明显反而增加了协调成本。挑战二信息传递损耗。Agent A说的话Agent B听到可能理解有偏差。一层层传下去可能面目全非。这和人类团队协作的问题一样。甲给乙传达指令乙理解的和甲想说的可能有出入。乙再传达给丙丙理解的又可能有偏差。解决方案是让信息传递更明确。Agent之间的通信要有清晰的格式不要让Agent自己去猜测对方的意思。另外重要信息最好直接传递不要经过太多中间环节。挑战三质量控制。每个Agent产出参差不齐怎么保证整体质量解决方案是设计审核机制。每个子任务完成后由审核Agent或者老板Agent来检查质量不合格的打回重做。另外给Agent明确的输出标准和质量要求减少产出的不确定性。挑战四资源消耗。一个Agent调用一次就要消耗一次算力。多个Agent并行资源消耗成倍增加。这意味着Multi-Agent系统只适合高价值任务。如果一个任务本身价值不高用Multi-Agent可能得不偿失。我的观点Multi-Agent代表了AI应用的下一阶段。单Agent是一个人干活能做的事有限。一个Agent再强也有能力边界也有上下文限制也有效率瓶颈。Multi-Agent是一群人协作能做的事大大扩展。每个Agent专精一件事通过协作完成复杂任务。专业度更高、效率更高、能处理的问题更复杂。但Multi-Agent也带来了新问题。怎么设计Agent的职责怎么协调Agent的工作怎么保证协作的质量怎么控制协作的成本。这些问题没有标准答案需要根据具体场景来设计。我的判断是Multi-Agent的价值在于把复杂任务拆分成多个简单任务。如果一个任务本身拆不开硬要用Multi-Agent反而增加复杂度。找到那个恰好可以拆分的粒度是设计Multi-Agent系统的关键。未来最好的AI产品可能不是最聪明的单Agent而是最会协作的Agent团队。就像一个公司最大的竞争力不是某个人多牛而是整个团队配合得多好。下期预告讲了这么多理论和框架来点实战。下一个问题很关键Agent的知识从哪来大模型的知识有截止日期专业领域的知识不足遇到不知道的事怎么办下一期我们来看RAG Agent是怎么结合的让Agent不只是能说更是知道自己在说什么。完整版合集、面试题库、项目实战全网同名【图解 AI 系列】
多个Agent如何协作:Multi-Agent系统详解
发布时间:2026/5/23 1:08:38
本文首发于同名公众号你有没有这种感觉找一个AI帮忙做事它能做但它做的所有事都带着同一种味道。让它写文案是那种AI写的文案味道。让它做分析是那种AI做的分析味道。让它出创意还是那种AI出的创意味道。为什么因为一个Agent的能力是有边界的。一个Agent再强也有不擅长的领域。一个Agent再聪明一次也只能专注做一件事。一个Agent的上下文再长也是有限的。解决这些问题的方法是让多个Agent协作。就像一个公司不是靠一个人运转而是靠一个团队。每个岗位的人各司其职有人负责决策有人负责执行有人负责审核最终才能把事情做好。先说个真实的例子我之前想让一个Agent帮我做产品分析。我以为它能搞定——查数据、做竞品对比、生成报告一条龙服务。结果呢它确实能做但它做出来的分析报告专业度一般。数据查得不够深竞品对比浮于表面结论也是泛泛而谈。问题出在哪问题在于让一个Agent同时扮演数据分析师和行业专家和报告写手太为难它了。数据分析师需要知道去哪里查数据、怎么清洗数据、分析数据的标准是什么。行业专家需要了解行业格局、竞争态势、发展趋势。报告写手需要懂得怎么组织结构、怎么突出重点、怎么让结论有说服力。一个Agent同时具备这三种能力能做到但每种能力都做不到顶尖。后来我换了个思路。让三个Agent各司其职一个专门负责数据检索和清洗一个专门负责行业分析一个专门负责报告撰写和润色。结果完全不一样。每个Agent都在自己擅长的领域深耕最终产出的质量远超单Agent的效果。这就是Multi-Agent的价值让专业的人做专业的事。为什么需要Multi-Agent先看单Agent的三个核心问题。第一个问题专业能力有限。让一个Agent同时做这些事写代码、做设计、写文案、分析数据。它能做但每样都做不到最好。大模型的能力是通用的不是专用的。你可以让它写代码它能写但写不过专业程序员。你可以让它做设计它能做但做不过专业设计师。你可以让它写文案它能写但写出来的总有那种AI味。为什么因为每件事都需要深入学习和大量练习才能做好。大模型再强也不可能在所有领域都达到专家水平。Multi-Agent的解法是不要求一个Agent什么都会只要求每个Agent专精一件事。写代码的Agent就专精写代码做设计的Agent就专精做设计它们之间不需要互相替代只需要互相配合。第二个问题上下文窗口有限。上下文窗口就像人的短期记忆太多了记不住。一个复杂的任务可能需要处理几万字的上下文。单Agent处理长上下文的时候会遇到一个尴尬的情况信息太多放不下早期的关键信息被挤出去了。就像你在打电话对方说了太多内容你记不住前面的只能记住最近的几句。Multi-Agent的解法是把长任务拆分每个Agent只处理自己那部分。一个Agent处理第一步产出结果后交给下一个Agent继续处理。信息在Agent之间传递每次只传递关键结果不用把全部上下文都塞进去。第三个问题效率瓶颈。有些任务之间没有依赖可以并行执行。但单Agent只能串行一件事做完再做下一件。比如查资料、写代码、做测试、写文档。这四件事后三件都依赖查资料的结果但代码、测试、文档之间其实没有依赖。如果只有一个Agent它只能先查资料然后依次写代码、测试、写文档三个任务串行执行。如果有多个Agent查完资料之后代码、测试、文档可以同时进行效率提升明显。Multi-Agent的解法是让能并行的任务并行执行。查资料的是一个Agent写代码的是一个Agent做测试的是一个Agent写文档的是一个Agent。大家同时开工互不等待。Multi-Agent的协作模式Multi-Agent系统有三种主流协作模式层级模式、协作模式、竞争模式。模式一层级模式。层级模式就像一个传统公司有一个老板在顶层负责统筹下面有多个专家负责执行具体任务。老板Agent的职责是理解用户需求、拆解任务、分配给专家、汇总专家结果。它的核心能力是决策——这件事分几步每步交给谁交给专家的指令怎么写专家的结果合不合格。专家Agent的职责是执行被分配的任务。代码专家Agent只管写代码设计专家Agent只管做设计测试专家Agent只管做测试。它的核心能力是执行——把交给我的任务做到最好。层级模式的优势是结构清晰、职责明确。用户只需要跟老板Agent对话不用操心具体的执行细节。老板Agent会把任务拆解清楚分配给合适的专家最后把结果汇总给用户。层级模式的劣势是过度依赖老板Agent。如果老板Agent拆解任务的能力不行整个系统的效果就会打折扣。另外老板Agent和专家Agent之间需要良好的通信机制否则任务分配和结果汇总都会出问题。模式二协作模式。协作模式没有明确的老板多个Agent地位平等共同协作完成任务。这种模式就像一个项目组大家都是同事遇到问题一起讨论产出大家一起负责。没有一个人是绝对主导但需要有一个人或一个机制来做最终的协调。比如分析一家公司是否值得投资这件事。财务分析师Agent负责看财务报表、现金流、盈利能力。行业分析师Agent负责看市场地位、竞争格局、行业趋势。风险分析师Agent负责看潜在风险、政策风险、市场风险。三个Agent各自分析但分析过程中会互相讨论补充。财务分析师发现某个数据异常可能会问行业分析师这个异常在行业中是否常见。行业分析师发现市场趋势变化可能会问风险分析师这对公司意味着什么。最终三个Agent的分析汇总成一份完整的投资分析报告。每部分都是专业分析整体是协作成果。协作模式的优势是充分发挥每个Agent的专业能力分析质量高。劣势是Agent之间的通信和协调比较复杂需要设计良好的消息传递机制。模式三竞争模式。竞争模式是多个Agent各自独立完成任务然后比较结果选最优。这种模式适合开放性问题——没有唯一正确答案需要多方案比较。比如给一个品牌起名字。一个走科技感路线的Agent想出了星辰、“曙光”、“凌霄”。一个走温暖感路线的Agent想出了归途、“暖阳”、“知还”。一个走国际感路线的Agent想出了Wedo、“Cloudi”、“Nexa”。三个Agent各自产出方案然后有一个评估机制来比较这些方案。好不好记有没有歧义域名能不能注册商标能不能过。综合评估之后推荐最优的两到三个给用户。竞争模式的优势是能探索多种可能性避免单一视角的局限。劣势是资源消耗大每个Agent都要独立完成任务然后再比较。Agent之间怎么通信Multi-Agent系统里Agent之间需要说话。没有通信机制Agent就是各自为战的孤岛协作无从谈起。有几种常见的通信方式。第一种共享内存。所有Agent读写同一个黑板或消息队列。就像办公室的白板谁都可以写谁都可以看。Agent A把分析结果写到共享内存里Agent B去读。Agent C也去读。它不需要知道是谁写的只关心内容是什么。这种方式的优点是简单直接Agent之间不需要知道彼此的存在。缺点是没有明确的通信目标Agent需要自己去判断什么时候该写、什么时候该读、该读什么。第二种点对点通信。Agent A直接给Agent B发消息就像发私信。Agent B收到消息后处理完再回复Agent A。这种方式的优点是通信明确A明确知道B会收到、B明确知道A在问什么。缺点是Agent多了之后点对点的连接数会爆炸。三个Agent之间有3条连接五个Agent之间有10条连接维护成本很高。第三种广播。Agent A发消息所有Agent都能收到。就像群里发了一条消息群里的每个人都能看到。这种方式的优点是信息传播广所有Agent都能获得同样信息。缺点是Agent需要自己判断这条消息跟自身有没有关系没有关系就要忽略处理起来有额外开销。第四种分层通信。老板Agent给专家Agent发指令专家Agent汇报结果。上下级之间通信不跨级。这种通信方式和层级模式配合最好。老板Agent不需要知道专家Agent之间怎么通信专家Agent也不需要知道其他专家Agent的存在大家各司其职通过上下级关系传递信息。Multi-Agent的协调机制光有通信方式还不够还需要协调机制来解决三个核心问题谁先做、怎么配合、出了问题怎么办。第一个问题谁先做。多个Agent同时开工如果没有协调可能会出现混乱。数据库写冲突、文件覆盖、结果不一致——这些问题都可能发生。协调的方式有两种。一种是中心协调由老板Agent或者专门的协调Agent来决定任务分配和执行顺序。另一种是分布式协调Agent之间通过某种协议来协商谁做什么、什么时候做。实际开发中中心协调用得更多因为简单可靠。分布式协调更灵活但实现复杂度也更高。第二个问题怎么配合。任务之间往往有依赖关系。写代码依赖需求分析测试依赖代码完成部署依赖测试通过。这些依赖关系需要理清楚才能确定任务的执行顺序。协调的方式是把任务和依赖关系显式表达出来。每个任务有明确的输入和输出上游任务的输出是下游任务的输入。系统根据依赖关系自动确定执行顺序不需要人工干预。第三个问题出了问题怎么办。Agent执行任务可能失败。工具调用超时、API返回错误、结果不符合预期——这些情况都可能发生。协调的方式是设计回退机制。一个Agent执行失败不一定需要整个系统停下来。可以让其他Agent继续执行出错的Agent的任务或者换一个Agent重试或者把错误信息反馈给用户让用户决定怎么处理。Multi-Agent的挑战说了这么多Multi-Agent的好处也要说说它的挑战。挑战一协调成本。Agent多了谁先做谁后做、怎么配合、谁来统筹——这些都是需要解决的问题。协调机制本身也需要开发和维护。如果协调机制设计得不好Multi-Agent系统的效果可能还不如单Agent。实际经验是Multi-Agent系统适合任务可以清晰拆分、每个子任务相对独立的场景。如果任务之间依赖太紧密拆不开那Multi-Agent的优势就不明显反而增加了协调成本。挑战二信息传递损耗。Agent A说的话Agent B听到可能理解有偏差。一层层传下去可能面目全非。这和人类团队协作的问题一样。甲给乙传达指令乙理解的和甲想说的可能有出入。乙再传达给丙丙理解的又可能有偏差。解决方案是让信息传递更明确。Agent之间的通信要有清晰的格式不要让Agent自己去猜测对方的意思。另外重要信息最好直接传递不要经过太多中间环节。挑战三质量控制。每个Agent产出参差不齐怎么保证整体质量解决方案是设计审核机制。每个子任务完成后由审核Agent或者老板Agent来检查质量不合格的打回重做。另外给Agent明确的输出标准和质量要求减少产出的不确定性。挑战四资源消耗。一个Agent调用一次就要消耗一次算力。多个Agent并行资源消耗成倍增加。这意味着Multi-Agent系统只适合高价值任务。如果一个任务本身价值不高用Multi-Agent可能得不偿失。我的观点Multi-Agent代表了AI应用的下一阶段。单Agent是一个人干活能做的事有限。一个Agent再强也有能力边界也有上下文限制也有效率瓶颈。Multi-Agent是一群人协作能做的事大大扩展。每个Agent专精一件事通过协作完成复杂任务。专业度更高、效率更高、能处理的问题更复杂。但Multi-Agent也带来了新问题。怎么设计Agent的职责怎么协调Agent的工作怎么保证协作的质量怎么控制协作的成本。这些问题没有标准答案需要根据具体场景来设计。我的判断是Multi-Agent的价值在于把复杂任务拆分成多个简单任务。如果一个任务本身拆不开硬要用Multi-Agent反而增加复杂度。找到那个恰好可以拆分的粒度是设计Multi-Agent系统的关键。未来最好的AI产品可能不是最聪明的单Agent而是最会协作的Agent团队。就像一个公司最大的竞争力不是某个人多牛而是整个团队配合得多好。下期预告讲了这么多理论和框架来点实战。下一个问题很关键Agent的知识从哪来大模型的知识有截止日期专业领域的知识不足遇到不知道的事怎么办下一期我们来看RAG Agent是怎么结合的让Agent不只是能说更是知道自己在说什么。完整版合集、面试题库、项目实战全网同名【图解 AI 系列】