21种AI智能体(Agent)设计模式学习教程
文章目录
一、引言:从 LLM 到智能体 AI
1.1 AI 范式的四阶段演变
短短两年间,AI 应用范式经历了从"问答工具"到"自主系统"的跃迁:
LLM → RAG → 单体 Agent → 智能体 AI
(语言生成) (知识增强) (工具调用) (多智能体协作)
| 阶段 | 代表能力 | 局限 |
|---|---|---|
| LLM | 文本理解与生成 | 无法访问实时/私有数据 |
| RAG | 检索 + 生成 | 流程固定,无主动决策 |
| 单体 Agent | 工具调用、推理 | 单点能力,复杂任务受限 |
| 智能体 AI | 多 Agent 协作 | 系统复杂、协议依赖强 |
1.2 智能体(Agent)的概念
智能体是一种以 LLM 为推理核心、能感知环境、规划任务、调用工具、执行行动的自主系统。它具备四大核心特性:
| 特性 | 含义 |
|---|---|
| 自主性(Autonomy) | 无需持续人工干预即可行动 |
| 主动性(Proactivity) | 能主动采取行动实现目标 |
| 响应性(Reactivity) | 能感知并应对环境变化 |
| 目标导向(Goal-oriented) | 始终围绕既定目标推进 |
1.3 智能体执行任务的五步循环
获取目标 → 扫描环境 → 制定计划 → 执行行动 → 学习与优化
↑__________________________________________|
1.4 智能体能力等级
| 等级 | 能力 | 比喻 |
|---|---|---|
| L0:核心推理引擎 | 仅依靠 LLM 预训练知识响应 | 闭门思考者 |
| L1:连接型问题解决者 | 能调用搜索、RAG、工具 | 配备办公设备 |
| L2:战略型问题解决者 | 主动规划、上下文工程、自我优化 | 资深专家 |
| L3:协作型多智能体系统 | 多个专家 Agent 协同工作 | 跨职能团队 |
1.5 智能体未来的五个假设
- 通才智能体出现:从狭隘专家走向通用型选手
- 深度个性化与主动目标发现:从被动执行到主动预测
- 具身化:与机器人结合,进入物理世界
- 智能体驱动经济:成为新型经济参与者
- 目标驱动的变形多智能体系统:用户声明结果,系统自动达成
二、21 种模式关系图谱
2.1 总览表
| 编号 | 模式 | 解决的核心问题 | 关键依赖 |
|---|---|---|---|
| 1 | 提示链 | 复杂任务分解 | 上下文工程 |
| 2 | 路由 | 动态决策路径 | 分类器/LLM 判断 |
| 3 | 并行化 | 降低延迟 | 异步框架 |
| 4 | 反思 | 提升输出质量 | LLM 自我评判 |
| 5 | 工具使用 | 突破知识边界 | Function Calling |
| 6 | 规划 | 多步任务编排 | LLM 推理 |
| 7 | 多智能体 | 复杂跨域问题 | A2A、记忆 |
| 8 | 记忆管理 | 跨会话连续性 | 向量库 |
| 9 | 学习与适应 | 持续进化 | 反馈数据 |
| 10 | MCP | 工具生态打通 | 协议规范 |
| 11 | 目标与监控 | 目标对齐 | 指标体系 |
| 12 | 异常处理 | 系统弹性 | 监控、回退 |
| 13 | 人在回路 | 高风险把关 | UI/审批流 |
| 14 | RAG | 知识时效与私有化 | 向量库、Embedding |
| 15 | A2A | Agent 间互通 | 协议规范 |
| 16 | 资源感知 | 成本与延迟优化 | 监控、调度 |
| 17 | 推理技术 | 复杂推理质量 | CoT/ToT/ReAct |
| 18 | 护栏与安全 | 风险防控 | 多层过滤 |
| 19 | 评估与监控 | 持续改进 | 指标、评测集 |
| 20 | 优先级排序 | 资源与精力聚焦 | 评分体系 |
| 21 | 探索与发现 | 未知问题处理 | 多 Agent、生成式 |
2.2 核心能力维度归纳
[执行能力] 提示链、路由、并行化、规划
+
[环境交互] 工具使用、MCP、RAG
+
[质量保障] 反思、推理技术、学习与适应
+
[状态管理] 记忆管理、目标监控、优先级
+
[多体协作] 多智能体、A2A
+
[可靠性] 异常处理、人在回路、护栏、评估
+
[高阶] 资源感知、探索与发现
三、21 种设计模式详解
21 种模式是模块化的工具箱,单个模式各司其职,组合使用方能发挥真正威力。
每个模式按统一结构介绍:核心原理 → 价值 → 关键技术 → 适用场景。
A 组:执行与任务编排
模式 1:提示链(Prompt Chaining)
核心原理
将复杂问题拆解为一系列子问题,每个子问题用专门的提示处理,前一步输出作为下一步输入,形成链式依赖。又称 Pipeline 模式。
[Step1 Prompt] → 输出A → [Step2 Prompt(含A)] → 输出B → [Step3 Prompt(含B)] → 最终结果
价值
- 单一复杂提示容易丢失指令、累积错误、超出上下文
- 拆解后每步聚焦单一目标,认知负担低、可调试
关键技术
- 各步骤约定结构化输出(JSON / XML),保障数据完整性
- 配合上下文工程:系统性地为每一步构建完整信息环境
适用场景
文档摘要 → 翻译 → 风格调整;问题分类 → 信息抽取 → 结果生成。
模式 2:路由(Routing)
核心原理
根据输入或环境状态,将控制流动态导向不同的子流程、工具或子智能体,实现条件化执行。
┌── 如果是数据库问题 → SQL Agent
用户输入 →[Router]── 如果是订单问题 → Order Agent
└── 如果是闲聊 → Chat Agent
价值
让智能体从固定执行路径变为动态、上下文感知的系统,是处理真实任务多样性的基础。
关键技术
- 基于 LLM 路由(提示判断)
- 基于 Embedding 相似度路由
- 基于规则 / 关键词路由
- 基于训练好的分类器路由
适用场景
多技能客服系统、Agent 网关、混合工具调度。
模式 3:并行化(Parallelization)
核心原理
识别流程中彼此无依赖的子任务,同时执行而非串行处理,显著降低端到端延迟。
┌─→ 子任务A ─┐
任务 ──┼─→ 子任务B ─┼─→ 汇总
└─→ 子任务C ─┘
价值
尤其在涉及外部 API、数据库等"等待型"操作时,可成倍提升吞吐与响应速度。
关键技术
- 异步框架(asyncio / CompletableFuture)
- 分支-汇聚(Fan-out / Fan-in)模式
- 多 Worker Agent 并行执行 + 主 Agent 聚合
适用场景
多源信息聚合、批量评测、并行调用多个工具。
代价提醒:并发提升效率的同时,会增加调试与日志的复杂度。
模式 6:规划(Planning)
核心原理
让智能体前瞻性思考,将高层目标拆解为可执行的、有顺序的步骤集合,再逐步执行。
高层目标 → [Planner] → [Step1, Step2, Step3, ...] → 逐步执行 / 动态修正
价值
让智能体从"反应式"升级为"目标导向、战略型",是处理多步骤任务的基础。
关键技术
- LLM 自动分解:现代大模型已具备"目标→步骤"的内生能力
- 经典规划算法:HTN、PDDL(适用于强约束领域)
- ReWOO 等"先规划再执行"模式
适用场景
项目自动化、自主调研、复杂工作流执行。
B 组:与外部世界交互
模式 5:工具使用(Tool Use)
核心原理
通过 Function Calling 机制让 LLM 调用外部 API、数据库、代码执行器等,突破训练数据的限制。
[LLM 决策] → 生成结构化调用请求 → [工具执行] → 观察结果 → [LLM 处理]
价值
- 访问最新信息(搜索)
- 执行精确计算(计算器、代码)
- 操作私有数据(数据库)
- 触发现实动作(发邮件、下单)
关键技术
- 工具的清晰描述(名称、参数、返回示例)
- LLM 决策时机的提示设计
- 安全沙箱(针对代码执行)
适用场景
几乎所有生产级智能体的标配。
模式 10:模型上下文协议(MCP)
核心原理
Anthropic 于 2024 年 11 月推出的开放协议,为 LLM 与外部资源的连接提供标准化接口——AI 世界的"USB"。
LLM 应用 (Client) ←─MCP 协议─→ GitHub Server / DB Server / 文件 Server / ...
价值
| 维度 | 传统集成 | MCP |
|---|---|---|
| 集成成本 | 每个 LLM × 每个工具 | 一次开发,多端复用 |
| 生态 | 各家闭环 | 跨厂商通用 |
关键技术
- 客户端-服务器架构
- 服务器暴露 Resources(数据)、Prompts(模板)、Tools(功能)
- API 契约设计是关键——简单包装传统 API 智能体可能不会用
适用场景
Cursor、Claude Desktop、企业内部 AI 平台快速接入工具生态。
模式 14:知识检索(RAG)
核心原理
检索(Retrieval)+ 增强(Augmented)+ 生成(Generation)——查询知识库,把相关片段塞进提示,再让 LLM 生成答案。
用户问题 → [检索] → 相关文档片段 → [拼接进提示] → [LLM 生成] → 答案 + 引用
价值
- 突破训练数据的时效与范围限制
- 减少幻觉,提供可溯源答案
- 支持企业私有知识接入
关键技术
- 嵌入(Embedding)+ 文本相似度
- 文档分块(Chunking)
- 向量数据库(Milvus / Qdrant / Chroma)
- 进阶:Graph RAG、Agentic RAG(让 Agent 主动评估、改写 query、多源检索)
适用场景
企业知识助手、客服 FAQ、研究助手。
Agentic RAG 是从"被动数据管道"到"主动问题解决"的跃迁——Agent 可评估来源、调和冲突、决定是否再次检索。
C 组:质量与自我提升
模式 4:反思(Reflection)
核心原理
智能体对自身输出进行评估、批判并迭代优化,是一种自我纠错机制。常见架构:Generator + Critic。
[Generator] → 草稿 → [Critic] → 批判意见 → [Generator] → 改进版 → ...
价值
为智能体增加元认知层,显著提升输出质量与指令遵循度。
关键技术
- 单 Agent 自我反思 vs 双 Agent(生产者/批评者)
- 状态管理:保存历次草稿与反馈
- 终止条件:达到质量阈值或最大轮次
适用场景
代码生成、文案润色、医疗/法律等高准确率场景。
详见
doc/ai6.md的"模式四:自我反思"。
模式 9:学习与适应(Learning and Adaptation)
核心原理
智能体通过经验不断改变思维、行为或知识,从执行指令进化为持续优化。
关键技术
| 学习方式 | 说明 |
|---|---|
| 强化学习(PPO) | 通过环境奖励信号优化决策策略 |
| 直接偏好优化(DPO) | 比 PPO 更直接的人类偏好对齐方法 |
| 监督 / 无监督学习 | 经典 ML 范式 |
| 少样本 / 零样本 | 通过 Prompt 示例快速适应 |
| 在线学习 | 部署后基于真实流量持续更新 |
| 基于记忆的学习 | 把过往经验存入记忆库供检索复用 |
适用场景
个性化助手、动态环境中的自主系统、长期运行的客服 Agent。
模式 17:推理技术(Reasoning Techniques)
核心原理
显式化智能体的"思考过程"——在推理阶段分配更多计算,让模型拆解问题、考虑中间步骤。
关键技术清单
| 技术 | 全称 | 特点 |
|---|---|---|
| CoT | Chain-of-Thought | 让模型分步推理(“Let’s think step by step”) |
| ToT | Tree-of-Thoughts | 树状探索多种路径 |
| ReAct | Reason + Act | 推理与行动交替 |
| Self-Correction | 自我纠错 | 检测错误并修正 |
| RLVR | 可验证奖励强化学习 | 用可验证奖励优化推理 |
| CoD | Chain-of-Debate | 多 Agent 辩论 |
| GoD | Graph-of-Debate | 图结构辩论 |
| MASS | Multi-Agent System Search | 自动优化多 Agent 提示与结构 |
推理扩展定律:性能不仅取决于模型大小,更取决于"思考时间"(推理算力)。
适用场景
复杂推理、数学题、多步规划、深度研究。
D 组:状态与目标
模式 8:记忆管理(Memory Management)
核心原理
让智能体保留并利用过去的交互、观察和经验。
关键技术
| 类型 | 含义 | 实现 |
|---|---|---|
| 短期记忆 | 当前对话上下文 | 上下文窗口、滑动窗口 |
| 长期-语义 | 记住事实 | 向量库 |
| 长期-情景 | 记住经历 | 事件日志 + 检索 |
| 长期-程序 | 记住规则、技能 | 提示模板、工作流 |
适用场景
个性化助手、长期对话、多轮任务。
模式 11:目标设定与监控(Goal Setting and Monitoring)
核心原理
为智能体设定明确目标,并赋予追踪进度、判断是否达成的能力。让智能体从"被动响应"变为"主动目标驱动"。
关键技术
- SMART 原则:具体、可衡量、可达成、相关、有时限
- 目标 → 子目标 → 任务的层级分解
- 自我检查清单(如代码 Agent 的 QA Checklist)
- 进度监控 + 偏离纠正
适用场景
长任务执行、复杂工作流、自主代理。
模式 20:优先级排序(Prioritization)
核心原理
当面对多任务、多目标、有限资源时,根据紧急性、重要性、依赖关系等标准排序,确保智能体专注于最关键事项。
关键要素
- 标准定义:紧急性、重要性、依赖、资源成本、用户偏好
- 任务评估:规则 / 评分 / LLM 推理打分
- 调度逻辑:队列、规划组件
- 动态调整:随环境变化重排
适用场景
任务管理 Agent、多项目协调、资源受限系统。
E 组:协作与通信
模式 7:多智能体协作(Multi-Agent Collaboration)
核心原理
将系统拆分为多个专精不同领域的智能体协作团队,通过任务分解和分工解决复杂问题。
协作模式
| 模式 | 描述 |
|---|---|
| 顺序交接 | A → B → C 流水线 |
| 并行处理 | 多 Agent 同时工作 |
| 辩论与共识 | 多 Agent 互相反驳达成共识 |
| 层级(监督者) | 主管分发任务、下属汇报 |
| 专家团队 | 不同角色组成虚拟公司 |
| 批评-审查者 | 一个生成、一个审查 |
通信拓扑
单 Agent / 网络型 / 监督者 / 工具型监督者 / 层级型 / 定制型。
适用场景
跨领域研究、复杂软件开发、综合决策支持。
模式 15:智能体间通信(A2A)
核心原理
Google 于 2025 年 4 月提出的 Agent-to-Agent 协议,让不同框架(LangGraph、CrewAI、ADK 等)构建的智能体能跨边界协作。
A2A vs MCP
| 协议 | 解决的问题 |
|---|---|
| MCP | Agent ↔ 外部工具/数据 |
| A2A | Agent ↔ Agent |
关键概念
- Agent Card:Agent 的数字身份名片
- Agent 发现:客户端通过多种方式发现 AgentCard
- 任务:异步任务驱动的通信单元
- 交互机制:同步请求/响应、异步轮询、SSE 流式、推送通知
- 安全性:双向 TLS、身份认证、审计日志
国内对应协议:ACP(Agent Communication Protocol,2025-05)。
适用场景
跨厂商 Agent 协作、Agent 市场、企业级 Agent 编排。
F 组:可靠性与安全
模式 12:异常处理与恢复(Exception Handling and Recovery)
核心原理
让智能体面对错误、突发状况、外部服务故障时,依然能保持稳定运行。
关键技术
- 预防:超时设置、参数校验、限流
- 检测:监控、健康检查、异常感知
- 应对:重试、备用方案、优雅降级、人工升级
- 恢复:状态回滚、自我修复、错误日志
适用场景
任何生产级智能体——尤其涉及外部依赖(数据库、API、模型服务)。
模式 13:人在回路(HITL,Human-in-the-Loop)
核心原理
将人类的判断、创造、伦理把关与 AI 的速度、规模相结合。
关键场景
| 角色 | 含义 |
|---|---|
| 验证者/审查员 | 人工把关 AI 输出 |
| 实时指导者 | 在线纠正 AI 行为 |
| 协作伙伴 | 与 AI 共享界面解决问题 |
| 反馈提供者 | 喂给 RLHF 训练流程 |
| 升级接收者 | Agent 超出能力时接管 |
适用场景
医疗诊断、金融审批、法律合规、自动驾驶接管。
模式 18:护栏与安全(Guardrails / Safety Patterns)
核心原理
多层防御机制,确保智能体安全、合规、不偏离预期。
关键技术清单
- 输入护栏:清洗、注入检测、敏感话题拦截
- 输出护栏:过滤、事实校验、PII 脱敏
- 行为约束:工具白名单、权限分级
- 外部审核:调用第三方内容审核 API
- 小模型预筛:成本低,作为快速防线
- 人在回路兜底:高风险操作必须人工确认
适用场景
所有面向用户的智能体,尤其是开放式对话产品。
模式 19:评估与监控(Evaluation and Monitoring)
核心原理
持续测量智能体的有效性、效率、合规性,建立反馈闭环。
关键指标
| 类别 | 指标 |
|---|---|
| 效果 | 任务成功率、准确率、相关性 |
| 体验 | 端到端延迟、满意度(NPS/CSAT) |
| 成本 | Token 用量、API 费用、算力开销 |
| 质量 | LLM-as-a-Judge 评分 |
| 过程 | 智能体轨迹评估、工具调用合理性 |
| 多 Agent | 协作效率、消息复杂度 |
关键技术
- 离线评测集(Golden Dataset)
- 在线 A/B 测试
- LLM 作为评审员(LLM-as-a-Judge)
- 可观测平台(Langfuse / LangSmith / Phoenix)
适用场景
所有生产级智能体的运营标配。
G 组:高阶能力
模式 16:资源感知优化(Resource-Aware Optimization)
核心原理
让智能体在运行中动态监控并管理计算、时间、财务资源,依据预算和实时约束做模型/路径决策。
关键技术
- 动态模型切换:简单任务用小模型、复杂用大模型
- 自适应工具选择:在工具中权衡精度/成本
- 上下文裁剪与摘要:控制输入 Token
- 主动资源预测:提前估算成本
- 成本敏感探索:限制试错次数
- 能效部署:选择最低能耗的算力
- 并行/分布式感知:动态决定是否横向扩展
- 学习型资源分配:用 RL 学习最佳分配策略
- 优雅降级与回退:超预算时返回粗略答案
适用场景
大规模部署、多租户 SaaS、对成本极敏感的产品。
模式 21:探索与发现(Exploration and Discovery)
核心原理
让智能体主动寻找新信息、发现新可能、识别"未知的未知",而非仅在已知解空间内优化。
架构示例(AI Co-Scientist 联合科学家)
主管 Agent ─┬─ 生成 Agent (提出假设)
├─ 反思 Agent (批判方案)
├─ 排序 Agent (评估优先级)
├─ 进化 Agent (变异优化)
├─ 邻近 Agent (探索相邻空间)
└─ 元评审 Agent (整体审查)
适用场景
科研助手(自动文献综述、假设生成、实验设计)、新材料发现、新药研发、未知问题探索。
四、模式组合:构建复杂系统
智能体设计的真正威力在于模式组合,而非单一模式孤立使用。
4.1 自主 AI 研究助手
目标:用户提出"分析量子计算对网络安全的影响",自动产出研究报告。
[用户] 输入研究目标
↓
[Planner Agent] ─── Planning 模式 ─── 拆解为:
1. 研究量子计算基础
2. 调研常见加密算法
3. 查找专家分析
4. 综合成报告
↓
[Researcher Agent] ─── Tool Use + RAG ─── 调用搜索/学术 API
↓
[Writer Agent] ─── Multi-Agent + Memory ── 综合素材成稿
↓
[Critic Agent] ─── Reflection ── 审查逻辑、事实、表达
↓
[Writer Agent] ─── Self-Correction ── 优化稿件
↓
[人工审核] ─── HITL ── 最终把关
↓
最终报告
用到的模式:Planning、Tool Use、RAG、Multi-Agent、Memory、Reflection、HITL(共 7 种)。
4.2 三个常用组合套餐
| 场景 | 模式组合 |
|---|---|
| 智能客服 | 路由 + 工具使用 + RAG + 记忆 + 护栏 + 评估 |
| 研究助手 | 规划 + RAG + 多智能体 + 反思 + 记忆 |
| 代码生成助手 | 规划 + 工具使用(代码执行)+ 反思 + 推理(CoT)+ 评估 |
4.3 典型双模式组合速查
| 组合 | 价值 |
|---|---|
| 路由 + 工具使用 | 多技能 Agent 的标准骨架 |
| 规划 + 反思 | 提升复杂任务交付质量 |
| RAG + Agentic RAG | 静态检索升级为动态检索 |
| 多智能体 + A2A | 跨框架 Agent 协作 |
| MCP + 工具使用 | 即插即用的工具生态 |
| 护栏 + 人在回路 | 高风险场景双保险 |
五、参考资料
5.1 主流开源项目
| 项目 | 用途 | 链接 |
|---|---|---|
| LangChain / LangGraph | 编排框架 | https://github.com/langchain-ai |
| LangChain4j | Java 智能体框架(本项目使用) | https://github.com/langchain4j/langchain4j |
| AutoGen | 多 Agent 对话 | https://github.com/microsoft/autogen |
| CrewAI | 角色化多 Agent | https://github.com/crewAIInc/crewAI |
| MetaGPT | 模拟软件公司 | https://github.com/geekan/MetaGPT |
| LlamaIndex | RAG + Agent | https://github.com/run-llama/llama_index |
| Langfuse | 可观测平台 | https://github.com/langfuse/langfuse |
结语
21 种设计模式不是要全部使用,而是构成一个模块化工具箱。真正的工程艺术,在于:
- 理解每个模式的本质问题(它解决什么)
- 从最少模式开始(先解决问题,再追加能力)
- 掌握模式组合(叠加产生质变)
- 建立评估体系(让选择有据可依)
智能体的终点,不是模型有多大,而是系统有多稳。
用对模式,让 LLM 的智能真正落到产品里。
更多推荐
所有评论(0)