
AI 智能体(Agent)、Agentic AI、Agentic 架构、Agentic 工作流……这些术语屡见不鲜。但它们究竟是什么?本文将深入探讨 AI 智能体的核心概念,重点阐述 Agentic AI 的一项关键技术: 智能体工作流 (Agentic Workflows) 。
智能体本身能力有限,需要为其设定角色、目标和结构,才能发挥作用。这正是工作流的意义所在。
理解 Agentic 工作流可以让你理解 AI 智能体如何运作以及为什么这样运作。为了帮助你理解,我们将介绍 AI 智能体的关键组件,给出 Agentic 工作流的简洁定义,解释是什么让工作流具有 Agentic 特性,详细说明 Agentic 工作流中的关键循环模式,并通过实际用例对使用 Agentic 工作流的优点和挑战进行客观概述。
什么是 AI 智能体?
AI 智能体 是结合了大型语言模型(LLM)进行推理和决策,并利用工具与现实世界进行交互的系统,使它们能够在有限的人工干预下完成复杂的任务。 为了更好地理解 AI 智能体如何融入 Agentic 工作流,接下来我们将探讨 AI 智能体的核心组件。
AI 智能体的组件
尽管 AI 智能体被设计用于半自主决策,但它们需要依赖一个更全面的组件框架才能正常运行。该框架包括三个主要部分:
* 使智能体能够有效推理的 LLM;
* 帮助智能体完成任务的工具;
* 允许智能体从过去经验中学习并持续改进的记忆模块。

推理(Reasoning)
AI 智能体的一大优势是它们的迭代推理能力,允许智能体在整个问题解决过程中主动“思考”。AI 智能体的推理能力源于其底层 LLM,主要体现在两个方面:规划(planning)和反思(reflecting)。
* 在规划阶段,智能体执行任务分解,即将更复杂的问题分解为更小的、可操作的步骤的过程。这种技术使智能体能够系统地处理任务,并针对不同的任务使用不同的工具。它还允许查询分解,其中复杂的查询被分解为更简单的查询,从而提高 LLM 响应的准确性和可靠性。
* 智能体还通过反思自身行动的结果来进行推理,根据从外部来源获取的数据和结果来评估并迭代调整行动计划。
工具(Tools)
LLM 的知识是静态的,仅限于训练期间学习到的信息,这意味着它们无法获取训练数据之外的知识。为了将其能力扩展到原始数据集之外,智能体可以利用外部工具,如网络搜索引擎、API、数据库和计算框架。这意味着智能体可以访问实时外部数据, 以此指导决策, 并完成需要与其他应用程序交互的任务。
工具通常与权限关联,例如查询 API、发送消息或访问特定文档或数据库的能力。下表概述了 AI 智能体的一些常用工具及其执行的任务。
| 工具 | 任务 |
| -------- | ---------------------------------- |
| 互联网搜索 | 获取并总结实时信息。 |
| 向量搜索 | 检索和总结外部数据。 |
| 代码解释器 | 迭代运行智能体生成的代码。 |
| API | 检索实时信息并使用外部服务和应用程序执行任务。 |
当 LLM 选择一个工具来帮助完成任务时,会触发函数调用(function calling),将其功能扩展到简单的文本生成之外,实现与现实世界的交互。
选择使用哪个工具可以由最终用户预先确定,也可以由智能体决定。让智能体动态选择工具对于解决复杂任务很有帮助。但对于更简单的工作流,预定义工具通常更有效,动态选择反而会增加不必要的复杂性。
记忆(Memory)
智能体工作流与纯粹由 LLM 驱动的工作流的区别在于,前者能够从过去的经验中学习并记住行动的上下文。记忆是一个关键组件,能够在多个用户交互和会话中捕获并存储上下文和反馈信息。智能体有两种主要类型的记忆:短期记忆和长期记忆。
短期记忆(Short-term memory) :存储即时信息,如对话历史记录,这有助于智能体确定下一步如何完成其总体目标。
长期记忆(Long-term memory) :存储随着时间的推移,在多个会话中积累的信息和知识,从而实现智能体的个性化并随着时间的推移提高性能。
什么是 Agentic 工作流?
一般来说,工作流是为了实现特定任务或目标而设计的一系列连接步骤。最简单的工作流类型是确定性的,它们遵循预定义的步骤序列,无法适应新信息或变化的环境。例如,自动化的费用审批工作流可能如下所示:“如果费用被标记为‘餐饮’且低于 30 美元,则自动批准。”
然而,一些工作流会利用 LLM 或其他机器学习模型和技术,这类工作流通常被称为 AI 工作流,它们可以是 Agentic 的,也可以是非 Agentic 的。在非 Agentic 工作流中,LLM 会收到一条指令并生成一个输出。例如,文本摘要工作流将较长的文本段落作为输入,提示 LLM 对其进行摘要,然后简单地返回摘要。工作流使用 LLM 并不一定意味着它是 Agentic 的。
Agentic 工作流是由一个或多个智能体根据情况动态执行的一系列相互关联的步骤,旨在实现特定任务或目标。智能体由其用户授予权限,这使它们具有有限程度的自主权来收集数据、执行任务和做出将在现实世界中执行的决策。Agentic 工作流还充分利用了 AI 智能体的核心组件(包括推理能力、工具使用能力和持久记忆),从而将传统工作流转变为响应式、自适应和自我进化的流程。

是什么让工作流具有 Agentic 特性?
当 AI 工作流由一个或多个智能体指导并塑造任务进展时,它就具备了 Agentic 特性。将智能体添加到现有的非Agentic 工作流中,可以创建一种兼具结构化工作流的可靠性、可预测性与 LLM 的智能、适应性的混合方法。Agentic 工作流的关键能力包括:
- 制定计划。 Agentic 工作流从规划开始。LLM 用于通过任务分解将复杂的任务分解为更小的子任务,然后确定最佳执行路径。
- 使用工具执行操作。 Agentic 工作流使用一组预定义的工具和权限来完成任务并执行其生成的计划。
- 反思和迭代。 智能体可以评估每个步骤的结果,根据需要调整计划,并循环返回,直到结果令人满意。
我们需要区分三种工作流:传统的非 AI 工作流、非智能体 AI 工作流和智能体工作流。传统的、基于规则的工作流和 AI 工作流之间的区别在于使用预定义的步骤与使用 AI 模型来完成任务。其次,非 Agentic 和 Agentic AI 工作流的区别在于前者使用静态 AI 模型,而后者使用动态 AI 智能体,这使得Agentic 工作流更具适应性和动态性。
Agentic 架构和工作流的区别
虽然“Agentic 架构”和“Agentic 工作流”这两个术语经常被互换使用,但它们之间存在重要的区别。
* Agentic 工作流 :是智能体为实现特定目标而采取的一系列步骤。这些步骤可能包括:使用 LLM 创建计划、将任务分解为子任务、使用互联网搜索等工具完成任务、使用 LLM 反思任务结果并调整总体计划。
* Agentic 架构 :是用于实现给定任务的技术框架和整体系统设计(包括智能体的选择、工具的集成、记忆系统的设计等)。智能体架构多种多样且富有创造性,但始终包含至少一个具有决策和推理能力的智能体、智能体可用于实现目标的工具,以及短期和长期记忆系统。
Agentic 工作流中的模式
回想一下,智能体工作流是为完成特定任务(也称为最终目标)而采取的结构化系列步骤。因此,当我们谈论Agentic 工作流时,实际上是在讨论那些使智能体能够实现其最终目标的特定行为模式。正如我们之前提到的,AI 智能体的核心组件在智能体工作流模式中起着关键作用。智能体的推理能力为规划和反思模式提供了支持,而其利用工具与环境交互的能力则是工具使用模式的基础。
规划模式(Planning Pattern)
规划设计模式允许智能体自主地将更复杂的任务分解为一系列更小、更简单的任务,这一过程被称为任务分解。 任务分解会带来更好的结果,因为它减少了 LLM 的认知负荷,提高了推理能力,并最大限度地减少了幻觉和其他不准确之处。
当实现最终目标的方法不明确,且需要较强的问题解决适应性时,规划尤其有效。例如,一个负责修复软件错误的 AI 智能体,可能会使用规划模式将任务分解为以下子任务:阅读错误报告、定位相关代码段、列出潜在原因,最后选择特定的调试策略。如果第一次尝试修复错误不起作用,智能体可以在执行后读取错误消息并调整其策略。
虽然规划可以帮助智能体更好地处理更复杂的任务,但它也可能导致比更确定的工作流更不可预测的结果。因此,最好仅将规划模式用于需要深入问题解决和多跳推理的任务。

工具使用模式(Tool Use Pattern)
生成式 LLM 的一个重要限制是它们依赖于预先存在的训练数据,这意味着它们无法检索实时信息或验证超出它们之前学习内容的事实。因此,当它们不知道答案时,它们可能会生成不符合事实的响应,或在不确定时进行“猜测”。检索增强生成 (RAG) 通过向 LLM 提供相关的实时外部数据来帮助缓解此限制,从而实现更准确和更符合上下文的响应。
然而,工具使用模式超越了简单的 RAG,它允许 LLM 与现实世界进行动态交互,而不仅仅是从中检索数据。在 Agentic 工作流中,工具使用模式允许智能体与外部资源、应用程序、实时数据或其他计算资源进行交互来扩展智能体的功能。
常用工具包括 API、信息检索(例如向量搜索)、Web 浏览器、机器学习模型和代码解释器。这些工具用于执行特定任务,例如搜索 Web、从外部数据库检索数据,或读取、发送电子邮件,以帮助智能体实现其目标。

反思模式(Reflection Pattern)
反思是一种强大的 Agentic 设计模式,实现起来相对简单,并且可以显着提高 Agentic 工作流的效果。反思模式是一种自我反馈机制,其中智能体在最终确定响应或采取进一步行动之前,迭代评估其输出或决策的质量。然后,这些评估结果被用来改进智能体的方法、纠正错误,并提升未来的响应或决策质量。
当任务较为复杂,智能体不太可能一次性成功时(例如编写代码),反思就显得尤为重要。在这种情况下,智能体可能会生成代码片段,在沙盒或执行环境中运行,并将错误迭代地反馈给 LLM,指示其改进代码,直至代码成功执行。
反思的强大之处在于,智能体能够评估自身输出,并将这些评估结果动态地整合到工作流中,无需人工直接反馈即可实现持续改进。这些反思可以编码在智能体的记忆中,从而在当前用户会话期间实现更有效的问题解决,并通过适应用户偏好来实现个性化。
Agentic 工作流用例
基础的设计模式(如规划和工具使用)可以进行创造性的组合,从而有效地利用 Agentic AI 在不同领域执行各种任务。除了组合设计模式之外,还可以为 AI 智能体提供不同的工具组合,甚至可以赋予它们根据需求动态选择工具的能力。它们还可以与人类反馈循环集成,并被赋予不同级别的自主权和决策权。
这些多样化的配置允许 Agentic 工作流针对跨行业的各种任务进行定制。。为了证明这一点,我们概述了两个特别强大的用例:Agentic RAG 和Agentic 研究助理。
Agentic RAG
检索增强生成 (RAG)是一种框架,通过向 LLM 提供从外部数据源检索的相关数据,来增强其知识储备。 Agentic RAG 可以将一个或多个智能体集成到 RAG 流程中。
在规划阶段,智能体可以通过查询分解将复杂的查询分解为更小的子查询,或者确定是否需要向用户询问更多信息才能完成请求。
AI 智能体还可以用于在将检索到的数据和响应传递给用户之前评估其相关性和准确性。如果响应不令人满意,智能体可以重新构造查询、重新进行查询分解,甚至可以制定新的查询计划。

Agentic 研究助理
Agentic 研究助理(也被一些 AI 公司称为“深度研究”)通过搜索网络和各种外部数据,生成关于复杂主题的深入报告和详细见解。它们利用 Agentic RAG 从网络和其他外部来源检索信息以响应用户查询。然而,这些助理与传统 RAG 的区别在于,它们能够综合和分析信息,而不仅仅是从外部来源检索相关数据来增强 LLM 的输出。
这种独特的能力源于以下几个特征:
* 首先,Agentic 研究助理通常使用专门针对网络浏览、任务分解和动态规划进行微调的 LLM。
* 其次,这些工作流中的智能体会积极寻求用户指导,通过请求补充信息或澄清内容,来更好地理解最终目标。
* 这些智能体能够根据检索到的信息调整计划并改变方向。这意味着它们可以在综合新信息时探索新的、有趣的角度,并连续查询多个数据源,直至获得必要的数据。
因此,Agentic 研究助理能够获得更深入的见解、识别长期趋势,并就特定主题编写完整报告,而不仅仅是检索现有知识。OpenAI、Perplexity 和 Google 都已经公开发布了各自的深度研究工具或服务。
Agentic 编码助理
Agentic 编码助理可以在最少的人工干预下生成、重构、改进和调试代码。非 Agentic 编码助理(如 GitHub Copilot 的初版)由经过微调以生成代码的生成式 LLM 提供支持,但其功能仅限于生成代码。
编码助理的 Agentic 特性体现在它能够通过执行生成的代码,并根据执行结果、错误或反馈进行迭代改进,从而实现与环境的交互。还可以被授予权限,通过创建提交和 PR 来对现有代码库进行更改,例如 Anthropic 的 Claude Code 智能体,这是自动化软件开发过程中的重要一步。
Agentic 编码助理还可以用于建议终端命令和其他代码更改和添加,并在执行之前等待明确的人工批准,例如 Cursor ,允许人类完全控制智能体。此外,Agentic 编码助理还能将错误记录到长期记忆中,从错误中学习,从而不断提升智能水平。
Agentic 工作流的优点和局限性
AI 智能体已经迅速从机器学习社区扩展到更广泛的应用领域。鉴于围绕 Agentic AI 的各种热议、期待和展望,我们有必要区分炒作与现实,了解其真正的能力和局限性。在本节中,我们将对 Agentic 工作流的优点、挑战和局限性进行客观的分析。
Agentic 工作流的优点
Agentic 工作流超越了传统自动化,它使 AI 智能体能够进行规划、调整并不断改进。与遵循固定规则的确定性工作流不同,Agentic 工作流可以动态响应复杂情况,通过反馈改进方法,并进行扩展以处理更高级的任务。这种适应性使得它们在需要灵活性、学习能力和决策能力的场景中特别有价值。
让我们更详细地了解 Agentic 工作流的优点:
- 灵活性、适应性和可定制
静态的、确定性的工作流难以适应不断变化的情况和突发问题。另一方面,Agentic 工作流提供了根据任务难度进行调整和演变的灵活性,确保它们始终保持相关性并提供最佳解决方案。它们还可以通过组合不同的模式进行定制,从而实现模块化设计。这种设计允许随着需求和复杂性的增长进行迭代升级。
- 改进了对复杂任务的执行效果。
通过将复杂的任务分解为更小的、可管理的步骤(即任务分解和规划),Agentic 工作流的性能明显优于确定性的零样本方法。
- 自我纠正和持续学习。
通过利用短期和长期记忆,它们可以从过去的经验中学习,从而在每次迭代中变得更有效、更个性化。
- 效率与可扩展性。 Agentic 工作流可以高精度地自动执行重复性任务(前提是构建正确),从而减少特定场景下的人工工作量和运营成本。
Agentic 工作流的挑战和局限性
尽管 AI 智能体具有诸多优点和创新特性,但也面临着一系列挑战和局限性。由于其概率性质,AI 智能体会增加工作流的复杂性。智能体能用于自动化流程,并不意味着一定要使用它们。以下是一些最显著的挑战和局限性:
- 对于简单任务而言,复杂性过高。
当用于简单的流程(如表单输入或基本数据提取)时,AI 智能体可能会增加不必要的开销。在确定性、基于规则的自动化足够的情况下,引入智能体可能会导致效率低下、额外费用,甚至可能降低性能。
- 自主性增加可能导致可靠性降低。
随着智能体在工作流中获得更多的决策权,其概率特性可能会导致输出结果的可靠性降低,控制难度增加。
- 伦理和实践层面的考量。
并非所有决策都应委托给 AI 系统。在高风险或敏感领域使用智能体时,需要仔细监督,防止出现意外后果。
鉴于上述局限性,建议仔细考虑在特定工作流中使用智能体是否确有必要。一些可以帮助确定这一点的问题包括:
- 任务是否复杂到需要自适应决策,或者确定性方法是否足够?
- 更简单的 AI 辅助工具(例如没有智能体的 RAG)能否达到相同的结果?
- 工作流是否涉及不确定性、变化的条件或多步推理,智能体可以更有效地处理这些情况?
- 授予智能体自主权有哪些风险,这些风险能否得到缓解?
总结
Agentic 工作流代表了AI应用的新范式,可以帮助自动完成那些需要决策和推理的复杂任务。本文回顾了 AI 智能体的核心组件(包括记忆、工具和推理能力),以及这些组件如何为智能体工作流做出贡献。此外,我们还讨论了常见的智能体工作流模式(如规划、工具使用和反思),并介绍了这些模式如何组合以创建动态工作流。最后,我们探讨了Agentic 工作流的优势及其局限性和挑战。
AI 智能体背后的技术在不断发展,我们对它的理解也在不断进步。未来,随着LLM技术的不断进步和智能体框架的成熟,可以预见Agentic工作流将在更多领域发挥作用。
参考链接: https://weaviate.io/blog/what-are-agentic-workflows