文章目录


一、引言:从 LLM 到智能体 AI

1.1 AI 范式的四阶段演变

短短两年间,AI 应用范式经历了从"问答工具"到"自主系统"的跃迁:

LLM        →     RAG         →   单体 Agent    →   智能体 AI
(语言生成)     (知识增强)        (工具调用)       (多智能体协作)
阶段 代表能力 局限
LLM 文本理解与生成 无法访问实时/私有数据
RAG 检索 + 生成 流程固定,无主动决策
单体 Agent 工具调用、推理 单点能力,复杂任务受限
智能体 AI 多 Agent 协作 系统复杂、协议依赖强

1.2 智能体(Agent)的概念

智能体是一种以 LLM 为推理核心、能感知环境、规划任务、调用工具、执行行动的自主系统。它具备四大核心特性:

特性 含义
自主性(Autonomy) 无需持续人工干预即可行动
主动性(Proactivity) 能主动采取行动实现目标
响应性(Reactivity) 能感知并应对环境变化
目标导向(Goal-oriented) 始终围绕既定目标推进

1.3 智能体执行任务的五步循环

获取目标 → 扫描环境 → 制定计划 → 执行行动 → 学习与优化
   ↑__________________________________________|

1.4 智能体能力等级

等级 能力 比喻
L0:核心推理引擎 仅依靠 LLM 预训练知识响应 闭门思考者
L1:连接型问题解决者 能调用搜索、RAG、工具 配备办公设备
L2:战略型问题解决者 主动规划、上下文工程、自我优化 资深专家
L3:协作型多智能体系统 多个专家 Agent 协同工作 跨职能团队

1.5 智能体未来的五个假设

  1. 通才智能体出现:从狭隘专家走向通用型选手
  2. 深度个性化与主动目标发现:从被动执行到主动预测
  3. 具身化:与机器人结合,进入物理世界
  4. 智能体驱动经济:成为新型经济参与者
  5. 目标驱动的变形多智能体系统:用户声明结果,系统自动达成

二、21 种模式关系图谱

2.1 总览表

编号 模式 解决的核心问题 关键依赖
1 提示链 复杂任务分解 上下文工程
2 路由 动态决策路径 分类器/LLM 判断
3 并行化 降低延迟 异步框架
4 反思 提升输出质量 LLM 自我评判
5 工具使用 突破知识边界 Function Calling
6 规划 多步任务编排 LLM 推理
7 多智能体 复杂跨域问题 A2A、记忆
8 记忆管理 跨会话连续性 向量库
9 学习与适应 持续进化 反馈数据
10 MCP 工具生态打通 协议规范
11 目标与监控 目标对齐 指标体系
12 异常处理 系统弹性 监控、回退
13 人在回路 高风险把关 UI/审批流
14 RAG 知识时效与私有化 向量库、Embedding
15 A2A Agent 间互通 协议规范
16 资源感知 成本与延迟优化 监控、调度
17 推理技术 复杂推理质量 CoT/ToT/ReAct
18 护栏与安全 风险防控 多层过滤
19 评估与监控 持续改进 指标、评测集
20 优先级排序 资源与精力聚焦 评分体系
21 探索与发现 未知问题处理 多 Agent、生成式

2.2 核心能力维度归纳

[执行能力]   提示链、路由、并行化、规划
   +
[环境交互]   工具使用、MCP、RAG
   +
[质量保障]   反思、推理技术、学习与适应
   +
[状态管理]   记忆管理、目标监控、优先级
   +
[多体协作]   多智能体、A2A
   +
[可靠性]    异常处理、人在回路、护栏、评估
   +
[高阶]      资源感知、探索与发现

三、21 种设计模式详解

21 种模式是模块化的工具箱,单个模式各司其职,组合使用方能发挥真正威力。
每个模式按统一结构介绍:核心原理 → 价值 → 关键技术 → 适用场景。


A 组:执行与任务编排

模式 1:提示链(Prompt Chaining)

核心原理
将复杂问题拆解为一系列子问题,每个子问题用专门的提示处理,前一步输出作为下一步输入,形成链式依赖。又称 Pipeline 模式。

[Step1 Prompt] → 输出A → [Step2 Prompt(含A)] → 输出B → [Step3 Prompt(含B)] → 最终结果

价值

  • 单一复杂提示容易丢失指令、累积错误、超出上下文
  • 拆解后每步聚焦单一目标,认知负担低、可调试

关键技术

  • 各步骤约定结构化输出(JSON / XML),保障数据完整性
  • 配合上下文工程:系统性地为每一步构建完整信息环境

适用场景
文档摘要 → 翻译 → 风格调整;问题分类 → 信息抽取 → 结果生成。


模式 2:路由(Routing)

核心原理
根据输入或环境状态,将控制流动态导向不同的子流程、工具或子智能体,实现条件化执行。

            ┌── 如果是数据库问题 → SQL Agent
用户输入 →[Router]── 如果是订单问题 → Order Agent
            └── 如果是闲聊       → Chat Agent

价值
让智能体从固定执行路径变为动态、上下文感知的系统,是处理真实任务多样性的基础。

关键技术

  • 基于 LLM 路由(提示判断)
  • 基于 Embedding 相似度路由
  • 基于规则 / 关键词路由
  • 基于训练好的分类器路由

适用场景
多技能客服系统、Agent 网关、混合工具调度。


模式 3:并行化(Parallelization)

核心原理
识别流程中彼此无依赖的子任务,同时执行而非串行处理,显著降低端到端延迟。

       ┌─→ 子任务A ─┐
任务 ──┼─→ 子任务B ─┼─→ 汇总
       └─→ 子任务C ─┘

价值
尤其在涉及外部 API、数据库等"等待型"操作时,可成倍提升吞吐与响应速度。

关键技术

  • 异步框架(asyncio / CompletableFuture)
  • 分支-汇聚(Fan-out / Fan-in)模式
  • 多 Worker Agent 并行执行 + 主 Agent 聚合

适用场景
多源信息聚合、批量评测、并行调用多个工具。

代价提醒:并发提升效率的同时,会增加调试与日志的复杂度。


模式 6:规划(Planning)

核心原理
让智能体前瞻性思考,将高层目标拆解为可执行的、有顺序的步骤集合,再逐步执行。

高层目标 → [Planner] → [Step1, Step2, Step3, ...] → 逐步执行 / 动态修正

价值
让智能体从"反应式"升级为"目标导向、战略型",是处理多步骤任务的基础。

关键技术

  • LLM 自动分解:现代大模型已具备"目标→步骤"的内生能力
  • 经典规划算法:HTN、PDDL(适用于强约束领域)
  • ReWOO 等"先规划再执行"模式

适用场景
项目自动化、自主调研、复杂工作流执行。


B 组:与外部世界交互

模式 5:工具使用(Tool Use)

核心原理
通过 Function Calling 机制让 LLM 调用外部 API、数据库、代码执行器等,突破训练数据的限制。

[LLM 决策] → 生成结构化调用请求 → [工具执行] → 观察结果 → [LLM 处理]

价值

  • 访问最新信息(搜索)
  • 执行精确计算(计算器、代码)
  • 操作私有数据(数据库)
  • 触发现实动作(发邮件、下单)

关键技术

  • 工具的清晰描述(名称、参数、返回示例)
  • LLM 决策时机的提示设计
  • 安全沙箱(针对代码执行)

适用场景
几乎所有生产级智能体的标配。


模式 10:模型上下文协议(MCP)

核心原理
Anthropic 于 2024 年 11 月推出的开放协议,为 LLM 与外部资源的连接提供标准化接口——AI 世界的"USB"。

LLM 应用 (Client)  ←─MCP 协议─→  GitHub Server / DB Server / 文件 Server / ...

价值

维度 传统集成 MCP
集成成本 每个 LLM × 每个工具 一次开发,多端复用
生态 各家闭环 跨厂商通用

关键技术

  • 客户端-服务器架构
  • 服务器暴露 Resources(数据)、Prompts(模板)、Tools(功能)
  • API 契约设计是关键——简单包装传统 API 智能体可能不会用

适用场景
Cursor、Claude Desktop、企业内部 AI 平台快速接入工具生态。


模式 14:知识检索(RAG)

核心原理
检索(Retrieval)+ 增强(Augmented)+ 生成(Generation)——查询知识库,把相关片段塞进提示,再让 LLM 生成答案。

用户问题 → [检索] → 相关文档片段 → [拼接进提示] → [LLM 生成] → 答案 + 引用

价值

  • 突破训练数据的时效与范围限制
  • 减少幻觉,提供可溯源答案
  • 支持企业私有知识接入

关键技术

  • 嵌入(Embedding)+ 文本相似度
  • 文档分块(Chunking)
  • 向量数据库(Milvus / Qdrant / Chroma)
  • 进阶:Graph RAG、Agentic RAG(让 Agent 主动评估、改写 query、多源检索)

适用场景
企业知识助手、客服 FAQ、研究助手。

Agentic RAG 是从"被动数据管道"到"主动问题解决"的跃迁——Agent 可评估来源、调和冲突、决定是否再次检索。


C 组:质量与自我提升

模式 4:反思(Reflection)

核心原理
智能体对自身输出进行评估、批判并迭代优化,是一种自我纠错机制。常见架构:Generator + Critic。

[Generator] → 草稿 → [Critic] → 批判意见 → [Generator] → 改进版 → ...

价值
为智能体增加元认知层,显著提升输出质量与指令遵循度。

关键技术

  • 单 Agent 自我反思 vs 双 Agent(生产者/批评者)
  • 状态管理:保存历次草稿与反馈
  • 终止条件:达到质量阈值或最大轮次

适用场景
代码生成、文案润色、医疗/法律等高准确率场景。

详见 doc/ai6.md 的"模式四:自我反思"。


模式 9:学习与适应(Learning and Adaptation)

核心原理
智能体通过经验不断改变思维、行为或知识,从执行指令进化为持续优化。

关键技术

学习方式 说明
强化学习(PPO) 通过环境奖励信号优化决策策略
直接偏好优化(DPO) 比 PPO 更直接的人类偏好对齐方法
监督 / 无监督学习 经典 ML 范式
少样本 / 零样本 通过 Prompt 示例快速适应
在线学习 部署后基于真实流量持续更新
基于记忆的学习 把过往经验存入记忆库供检索复用

适用场景
个性化助手、动态环境中的自主系统、长期运行的客服 Agent。


模式 17:推理技术(Reasoning Techniques)

核心原理
显式化智能体的"思考过程"——在推理阶段分配更多计算,让模型拆解问题、考虑中间步骤。

关键技术清单

技术 全称 特点
CoT Chain-of-Thought 让模型分步推理(“Let’s think step by step”)
ToT Tree-of-Thoughts 树状探索多种路径
ReAct Reason + Act 推理与行动交替
Self-Correction 自我纠错 检测错误并修正
RLVR 可验证奖励强化学习 用可验证奖励优化推理
CoD Chain-of-Debate 多 Agent 辩论
GoD Graph-of-Debate 图结构辩论
MASS Multi-Agent System Search 自动优化多 Agent 提示与结构

推理扩展定律:性能不仅取决于模型大小,更取决于"思考时间"(推理算力)。

适用场景
复杂推理、数学题、多步规划、深度研究。


D 组:状态与目标

模式 8:记忆管理(Memory Management)

核心原理
让智能体保留并利用过去的交互、观察和经验。

关键技术

类型 含义 实现
短期记忆 当前对话上下文 上下文窗口、滑动窗口
长期-语义 记住事实 向量库
长期-情景 记住经历 事件日志 + 检索
长期-程序 记住规则、技能 提示模板、工作流

适用场景
个性化助手、长期对话、多轮任务。


模式 11:目标设定与监控(Goal Setting and Monitoring)

核心原理
为智能体设定明确目标,并赋予追踪进度、判断是否达成的能力。让智能体从"被动响应"变为"主动目标驱动"。

关键技术

  • SMART 原则:具体、可衡量、可达成、相关、有时限
  • 目标 → 子目标 → 任务的层级分解
  • 自我检查清单(如代码 Agent 的 QA Checklist)
  • 进度监控 + 偏离纠正

适用场景
长任务执行、复杂工作流、自主代理。


模式 20:优先级排序(Prioritization)

核心原理
当面对多任务、多目标、有限资源时,根据紧急性、重要性、依赖关系等标准排序,确保智能体专注于最关键事项。

关键要素

  1. 标准定义:紧急性、重要性、依赖、资源成本、用户偏好
  2. 任务评估:规则 / 评分 / LLM 推理打分
  3. 调度逻辑:队列、规划组件
  4. 动态调整:随环境变化重排

适用场景
任务管理 Agent、多项目协调、资源受限系统。


E 组:协作与通信

模式 7:多智能体协作(Multi-Agent Collaboration)

核心原理
将系统拆分为多个专精不同领域的智能体协作团队,通过任务分解和分工解决复杂问题。

协作模式

模式 描述
顺序交接 A → B → C 流水线
并行处理 多 Agent 同时工作
辩论与共识 多 Agent 互相反驳达成共识
层级(监督者) 主管分发任务、下属汇报
专家团队 不同角色组成虚拟公司
批评-审查者 一个生成、一个审查

通信拓扑
单 Agent / 网络型 / 监督者 / 工具型监督者 / 层级型 / 定制型。

适用场景
跨领域研究、复杂软件开发、综合决策支持。


模式 15:智能体间通信(A2A)

核心原理
Google 于 2025 年 4 月提出的 Agent-to-Agent 协议,让不同框架(LangGraph、CrewAI、ADK 等)构建的智能体能跨边界协作。

A2A vs MCP

协议 解决的问题
MCP Agent ↔ 外部工具/数据
A2A Agent ↔ Agent

关键概念

  • Agent Card:Agent 的数字身份名片
  • Agent 发现:客户端通过多种方式发现 AgentCard
  • 任务:异步任务驱动的通信单元
  • 交互机制:同步请求/响应、异步轮询、SSE 流式、推送通知
  • 安全性:双向 TLS、身份认证、审计日志

国内对应协议:ACP(Agent Communication Protocol,2025-05)。

适用场景
跨厂商 Agent 协作、Agent 市场、企业级 Agent 编排。


F 组:可靠性与安全

模式 12:异常处理与恢复(Exception Handling and Recovery)

核心原理
让智能体面对错误、突发状况、外部服务故障时,依然能保持稳定运行。

关键技术

  • 预防:超时设置、参数校验、限流
  • 检测:监控、健康检查、异常感知
  • 应对:重试、备用方案、优雅降级、人工升级
  • 恢复:状态回滚、自我修复、错误日志

适用场景
任何生产级智能体——尤其涉及外部依赖(数据库、API、模型服务)。


模式 13:人在回路(HITL,Human-in-the-Loop)

核心原理
将人类的判断、创造、伦理把关与 AI 的速度、规模相结合。

关键场景

角色 含义
验证者/审查员 人工把关 AI 输出
实时指导者 在线纠正 AI 行为
协作伙伴 与 AI 共享界面解决问题
反馈提供者 喂给 RLHF 训练流程
升级接收者 Agent 超出能力时接管

适用场景
医疗诊断、金融审批、法律合规、自动驾驶接管。


模式 18:护栏与安全(Guardrails / Safety Patterns)

核心原理
多层防御机制,确保智能体安全、合规、不偏离预期。

关键技术清单

  • 输入护栏:清洗、注入检测、敏感话题拦截
  • 输出护栏:过滤、事实校验、PII 脱敏
  • 行为约束:工具白名单、权限分级
  • 外部审核:调用第三方内容审核 API
  • 小模型预筛:成本低,作为快速防线
  • 人在回路兜底:高风险操作必须人工确认

适用场景
所有面向用户的智能体,尤其是开放式对话产品。


模式 19:评估与监控(Evaluation and Monitoring)

核心原理
持续测量智能体的有效性、效率、合规性,建立反馈闭环。

关键指标

类别 指标
效果 任务成功率、准确率、相关性
体验 端到端延迟、满意度(NPS/CSAT)
成本 Token 用量、API 费用、算力开销
质量 LLM-as-a-Judge 评分
过程 智能体轨迹评估、工具调用合理性
多 Agent 协作效率、消息复杂度

关键技术

  • 离线评测集(Golden Dataset)
  • 在线 A/B 测试
  • LLM 作为评审员(LLM-as-a-Judge)
  • 可观测平台(Langfuse / LangSmith / Phoenix)

适用场景
所有生产级智能体的运营标配。


G 组:高阶能力

模式 16:资源感知优化(Resource-Aware Optimization)

核心原理
让智能体在运行中动态监控并管理计算、时间、财务资源,依据预算和实时约束做模型/路径决策。

关键技术

  • 动态模型切换:简单任务用小模型、复杂用大模型
  • 自适应工具选择:在工具中权衡精度/成本
  • 上下文裁剪与摘要:控制输入 Token
  • 主动资源预测:提前估算成本
  • 成本敏感探索:限制试错次数
  • 能效部署:选择最低能耗的算力
  • 并行/分布式感知:动态决定是否横向扩展
  • 学习型资源分配:用 RL 学习最佳分配策略
  • 优雅降级与回退:超预算时返回粗略答案

适用场景
大规模部署、多租户 SaaS、对成本极敏感的产品。


模式 21:探索与发现(Exploration and Discovery)

核心原理
让智能体主动寻找新信息、发现新可能、识别"未知的未知",而非仅在已知解空间内优化。

架构示例(AI Co-Scientist 联合科学家)

主管 Agent ─┬─ 生成 Agent     (提出假设)
            ├─ 反思 Agent     (批判方案)
            ├─ 排序 Agent     (评估优先级)
            ├─ 进化 Agent     (变异优化)
            ├─ 邻近 Agent     (探索相邻空间)
            └─ 元评审 Agent   (整体审查)

适用场景
科研助手(自动文献综述、假设生成、实验设计)、新材料发现、新药研发、未知问题探索。


四、模式组合:构建复杂系统

智能体设计的真正威力在于模式组合,而非单一模式孤立使用。

4.1 自主 AI 研究助手

目标:用户提出"分析量子计算对网络安全的影响",自动产出研究报告。

[用户] 输入研究目标
   ↓
[Planner Agent] ─── Planning 模式 ─── 拆解为:
   1. 研究量子计算基础
   2. 调研常见加密算法
   3. 查找专家分析
   4. 综合成报告
   ↓
[Researcher Agent] ─── Tool Use + RAG ─── 调用搜索/学术 API
   ↓
[Writer Agent]   ─── Multi-Agent + Memory ── 综合素材成稿
   ↓
[Critic Agent]   ─── Reflection ── 审查逻辑、事实、表达
   ↓
[Writer Agent]   ─── Self-Correction ── 优化稿件
   ↓
[人工审核]       ─── HITL ── 最终把关
   ↓
最终报告

用到的模式:Planning、Tool Use、RAG、Multi-Agent、Memory、Reflection、HITL(共 7 种)。

4.2 三个常用组合套餐

场景 模式组合
智能客服 路由 + 工具使用 + RAG + 记忆 + 护栏 + 评估
研究助手 规划 + RAG + 多智能体 + 反思 + 记忆
代码生成助手 规划 + 工具使用(代码执行)+ 反思 + 推理(CoT)+ 评估

4.3 典型双模式组合速查

组合 价值
路由 + 工具使用 多技能 Agent 的标准骨架
规划 + 反思 提升复杂任务交付质量
RAG + Agentic RAG 静态检索升级为动态检索
多智能体 + A2A 跨框架 Agent 协作
MCP + 工具使用 即插即用的工具生态
护栏 + 人在回路 高风险场景双保险

五、参考资料

5.1 主流开源项目

项目 用途 链接
LangChain / LangGraph 编排框架 https://github.com/langchain-ai
LangChain4j Java 智能体框架(本项目使用) https://github.com/langchain4j/langchain4j
AutoGen 多 Agent 对话 https://github.com/microsoft/autogen
CrewAI 角色化多 Agent https://github.com/crewAIInc/crewAI
MetaGPT 模拟软件公司 https://github.com/geekan/MetaGPT
LlamaIndex RAG + Agent https://github.com/run-llama/llama_index
Langfuse 可观测平台 https://github.com/langfuse/langfuse

结语

21 种设计模式不是要全部使用,而是构成一个模块化工具箱。真正的工程艺术,在于:

  1. 理解每个模式的本质问题(它解决什么)
  2. 从最少模式开始(先解决问题,再追加能力)
  3. 掌握模式组合(叠加产生质变)
  4. 建立评估体系(让选择有据可依)

智能体的终点,不是模型有多大,而是系统有多稳。
用对模式,让 LLM 的智能真正落到产品里。

Logo

欢迎加入 MCP 技术社区!与志同道合者携手前行,一同解锁 MCP 技术的无限可能!

更多推荐