21种AI智能体（Agent）设计模式学习教程

penngo

283人浏览 · 2026-06-23 09:23:14

penngo · 2026-06-23 09:23:14 发布

文章目录

一、引言：从 LLM 到智能体 AI

1.1 AI 范式的四阶段演变

短短两年间，AI 应用范式经历了从"问答工具"到"自主系统"的跃迁：

LLM        →     RAG         →   单体 Agent    →   智能体 AI
(语言生成)     (知识增强)        (工具调用)       (多智能体协作)

阶段	代表能力	局限
LLM	文本理解与生成	无法访问实时/私有数据
RAG	检索 + 生成	流程固定，无主动决策
单体 Agent	工具调用、推理	单点能力，复杂任务受限
智能体 AI	多 Agent 协作	系统复杂、协议依赖强

1.2 智能体（Agent）的概念

智能体是一种以 LLM 为推理核心、能感知环境、规划任务、调用工具、执行行动的自主系统。它具备四大核心特性：

特性	含义
自主性（Autonomy）	无需持续人工干预即可行动
主动性（Proactivity）	能主动采取行动实现目标
响应性（Reactivity）	能感知并应对环境变化
目标导向（Goal-oriented）	始终围绕既定目标推进

1.3 智能体执行任务的五步循环

获取目标 → 扫描环境 → 制定计划 → 执行行动 → 学习与优化
   ↑__________________________________________|

1.4 智能体能力等级

等级	能力	比喻
L0：核心推理引擎	仅依靠 LLM 预训练知识响应	闭门思考者
L1：连接型问题解决者	能调用搜索、RAG、工具	配备办公设备
L2：战略型问题解决者	主动规划、上下文工程、自我优化	资深专家
L3：协作型多智能体系统	多个专家 Agent 协同工作	跨职能团队

1.5 智能体未来的五个假设

通才智能体出现：从狭隘专家走向通用型选手
深度个性化与主动目标发现：从被动执行到主动预测
具身化：与机器人结合，进入物理世界
智能体驱动经济：成为新型经济参与者
目标驱动的变形多智能体系统：用户声明结果，系统自动达成

二、21 种模式关系图谱

2.1 总览表

编号	模式	解决的核心问题	关键依赖
1	提示链	复杂任务分解	上下文工程
2	路由	动态决策路径	分类器/LLM 判断
3	并行化	降低延迟	异步框架
4	反思	提升输出质量	LLM 自我评判
5	工具使用	突破知识边界	Function Calling
6	规划	多步任务编排	LLM 推理
7	多智能体	复杂跨域问题	A2A、记忆
8	记忆管理	跨会话连续性	向量库
9	学习与适应	持续进化	反馈数据
10	MCP	工具生态打通	协议规范
11	目标与监控	目标对齐	指标体系
12	异常处理	系统弹性	监控、回退
13	人在回路	高风险把关	UI/审批流
14	RAG	知识时效与私有化	向量库、Embedding
15	A2A	Agent 间互通	协议规范
16	资源感知	成本与延迟优化	监控、调度
17	推理技术	复杂推理质量	CoT/ToT/ReAct
18	护栏与安全	风险防控	多层过滤
19	评估与监控	持续改进	指标、评测集
20	优先级排序	资源与精力聚焦	评分体系
21	探索与发现	未知问题处理	多 Agent、生成式

2.2 核心能力维度归纳

[执行能力]   提示链、路由、并行化、规划
   +
[环境交互]   工具使用、MCP、RAG
   +
[质量保障]   反思、推理技术、学习与适应
   +
[状态管理]   记忆管理、目标监控、优先级
   +
[多体协作]   多智能体、A2A
   +
[可靠性]    异常处理、人在回路、护栏、评估
   +
[高阶]      资源感知、探索与发现

三、21 种设计模式详解

21 种模式是模块化的工具箱，单个模式各司其职，组合使用方能发挥真正威力。
每个模式按统一结构介绍：核心原理 → 价值 → 关键技术 → 适用场景。

A 组：执行与任务编排

模式 1：提示链（Prompt Chaining）

核心原理
将复杂问题拆解为一系列子问题，每个子问题用专门的提示处理，前一步输出作为下一步输入，形成链式依赖。又称 Pipeline 模式。

[Step1 Prompt] → 输出A → [Step2 Prompt(含A)] → 输出B → [Step3 Prompt(含B)] → 最终结果

价值

单一复杂提示容易丢失指令、累积错误、超出上下文
拆解后每步聚焦单一目标，认知负担低、可调试

关键技术

各步骤约定结构化输出（JSON / XML），保障数据完整性
配合上下文工程：系统性地为每一步构建完整信息环境

适用场景
文档摘要 → 翻译 → 风格调整；问题分类 → 信息抽取 → 结果生成。

模式 2：路由（Routing）

核心原理
根据输入或环境状态，将控制流动态导向不同的子流程、工具或子智能体，实现条件化执行。

            ┌── 如果是数据库问题 → SQL Agent
用户输入 →[Router]── 如果是订单问题 → Order Agent
            └── 如果是闲聊       → Chat Agent

价值
让智能体从固定执行路径变为动态、上下文感知的系统，是处理真实任务多样性的基础。

关键技术

基于 LLM 路由（提示判断）
基于 Embedding 相似度路由
基于规则 / 关键词路由
基于训练好的分类器路由

适用场景
多技能客服系统、Agent 网关、混合工具调度。

模式 3：并行化（Parallelization）

核心原理
识别流程中彼此无依赖的子任务，同时执行而非串行处理，显著降低端到端延迟。

       ┌─→ 子任务A ─┐
任务 ──┼─→ 子任务B ─┼─→ 汇总
       └─→ 子任务C ─┘

价值
尤其在涉及外部 API、数据库等"等待型"操作时，可成倍提升吞吐与响应速度。

关键技术

异步框架（asyncio / CompletableFuture）
分支-汇聚（Fan-out / Fan-in）模式
多 Worker Agent 并行执行 + 主 Agent 聚合

适用场景
多源信息聚合、批量评测、并行调用多个工具。

代价提醒：并发提升效率的同时，会增加调试与日志的复杂度。

模式 6：规划（Planning）

核心原理
让智能体前瞻性思考，将高层目标拆解为可执行的、有顺序的步骤集合，再逐步执行。

高层目标 → [Planner] → [Step1, Step2, Step3, ...] → 逐步执行 / 动态修正

价值
让智能体从"反应式"升级为"目标导向、战略型"，是处理多步骤任务的基础。

关键技术

LLM 自动分解：现代大模型已具备"目标→步骤"的内生能力
经典规划算法：HTN、PDDL（适用于强约束领域）
ReWOO 等"先规划再执行"模式

适用场景
项目自动化、自主调研、复杂工作流执行。

B 组：与外部世界交互

模式 5：工具使用（Tool Use）

核心原理
通过 Function Calling 机制让 LLM 调用外部 API、数据库、代码执行器等，突破训练数据的限制。

[LLM 决策] → 生成结构化调用请求 → [工具执行] → 观察结果 → [LLM 处理]

价值

访问最新信息（搜索）
执行精确计算（计算器、代码）
操作私有数据（数据库）
触发现实动作（发邮件、下单）

关键技术

工具的清晰描述（名称、参数、返回示例）
LLM 决策时机的提示设计
安全沙箱（针对代码执行）

适用场景
几乎所有生产级智能体的标配。

模式 10：模型上下文协议（MCP）

核心原理
Anthropic 于 2024 年 11 月推出的开放协议，为 LLM 与外部资源的连接提供标准化接口——AI 世界的"USB"。

LLM 应用 (Client)  ←─MCP 协议─→  GitHub Server / DB Server / 文件 Server / ...

价值

维度	传统集成	MCP
集成成本	每个 LLM × 每个工具	一次开发，多端复用
生态	各家闭环	跨厂商通用

关键技术

客户端-服务器架构
服务器暴露 Resources（数据）、Prompts（模板）、Tools（功能）
API 契约设计是关键——简单包装传统 API 智能体可能不会用

适用场景
Cursor、Claude Desktop、企业内部 AI 平台快速接入工具生态。

模式 14：知识检索（RAG）

核心原理
检索（Retrieval）+ 增强（Augmented）+ 生成（Generation）——查询知识库，把相关片段塞进提示，再让 LLM 生成答案。

用户问题 → [检索] → 相关文档片段 → [拼接进提示] → [LLM 生成] → 答案 + 引用

价值

突破训练数据的时效与范围限制
减少幻觉，提供可溯源答案
支持企业私有知识接入

关键技术

嵌入（Embedding）+ 文本相似度
文档分块（Chunking）
向量数据库（Milvus / Qdrant / Chroma）
进阶：Graph RAG、Agentic RAG（让 Agent 主动评估、改写 query、多源检索）

适用场景
企业知识助手、客服 FAQ、研究助手。

Agentic RAG 是从"被动数据管道"到"主动问题解决"的跃迁——Agent 可评估来源、调和冲突、决定是否再次检索。

C 组：质量与自我提升

模式 4：反思（Reflection）

核心原理
智能体对自身输出进行评估、批判并迭代优化，是一种自我纠错机制。常见架构：Generator + Critic。

[Generator] → 草稿 → [Critic] → 批判意见 → [Generator] → 改进版 → ...

价值
为智能体增加元认知层，显著提升输出质量与指令遵循度。

关键技术

单 Agent 自我反思 vs 双 Agent（生产者/批评者）
状态管理：保存历次草稿与反馈
终止条件：达到质量阈值或最大轮次

适用场景
代码生成、文案润色、医疗/法律等高准确率场景。

详见 doc/ai6.md 的"模式四：自我反思"。

模式 9：学习与适应（Learning and Adaptation）

核心原理
智能体通过经验不断改变思维、行为或知识，从执行指令进化为持续优化。

关键技术

学习方式	说明
强化学习（PPO）	通过环境奖励信号优化决策策略
直接偏好优化（DPO）	比 PPO 更直接的人类偏好对齐方法
监督 / 无监督学习	经典 ML 范式
少样本 / 零样本	通过 Prompt 示例快速适应
在线学习	部署后基于真实流量持续更新
基于记忆的学习	把过往经验存入记忆库供检索复用

适用场景
个性化助手、动态环境中的自主系统、长期运行的客服 Agent。

模式 17：推理技术（Reasoning Techniques）

核心原理
显式化智能体的"思考过程"——在推理阶段分配更多计算，让模型拆解问题、考虑中间步骤。

关键技术清单

技术	全称	特点
CoT	Chain-of-Thought	让模型分步推理（“Let’s think step by step”）
ToT	Tree-of-Thoughts	树状探索多种路径
ReAct	Reason + Act	推理与行动交替
Self-Correction	自我纠错	检测错误并修正
RLVR	可验证奖励强化学习	用可验证奖励优化推理
CoD	Chain-of-Debate	多 Agent 辩论
GoD	Graph-of-Debate	图结构辩论
MASS	Multi-Agent System Search	自动优化多 Agent 提示与结构

推理扩展定律：性能不仅取决于模型大小，更取决于"思考时间"（推理算力）。

适用场景
复杂推理、数学题、多步规划、深度研究。

D 组：状态与目标

模式 8：记忆管理（Memory Management）

核心原理
让智能体保留并利用过去的交互、观察和经验。

关键技术

类型	含义	实现
短期记忆	当前对话上下文	上下文窗口、滑动窗口
长期-语义	记住事实	向量库
长期-情景	记住经历	事件日志 + 检索
长期-程序	记住规则、技能	提示模板、工作流

适用场景
个性化助手、长期对话、多轮任务。

模式 11：目标设定与监控（Goal Setting and Monitoring）

核心原理
为智能体设定明确目标，并赋予追踪进度、判断是否达成的能力。让智能体从"被动响应"变为"主动目标驱动"。

关键技术

SMART 原则：具体、可衡量、可达成、相关、有时限
目标 → 子目标 → 任务的层级分解
自我检查清单（如代码 Agent 的 QA Checklist）
进度监控 + 偏离纠正

适用场景
长任务执行、复杂工作流、自主代理。

模式 20：优先级排序（Prioritization）

核心原理
当面对多任务、多目标、有限资源时，根据紧急性、重要性、依赖关系等标准排序，确保智能体专注于最关键事项。

关键要素

标准定义：紧急性、重要性、依赖、资源成本、用户偏好
任务评估：规则 / 评分 / LLM 推理打分
调度逻辑：队列、规划组件
动态调整：随环境变化重排

适用场景
任务管理 Agent、多项目协调、资源受限系统。

E 组：协作与通信

模式 7：多智能体协作（Multi-Agent Collaboration）

核心原理
将系统拆分为多个专精不同领域的智能体协作团队，通过任务分解和分工解决复杂问题。

协作模式

模式	描述
顺序交接	A → B → C 流水线
并行处理	多 Agent 同时工作
辩论与共识	多 Agent 互相反驳达成共识
层级（监督者）	主管分发任务、下属汇报
专家团队	不同角色组成虚拟公司
批评-审查者	一个生成、一个审查

通信拓扑
单 Agent / 网络型 / 监督者 / 工具型监督者 / 层级型 / 定制型。

适用场景
跨领域研究、复杂软件开发、综合决策支持。

模式 15：智能体间通信（A2A）

核心原理
Google 于 2025 年 4 月提出的 Agent-to-Agent 协议，让不同框架（LangGraph、CrewAI、ADK 等）构建的智能体能跨边界协作。

A2A vs MCP

协议	解决的问题
MCP	Agent ↔ 外部工具/数据
A2A	Agent ↔ Agent

关键概念

Agent Card：Agent 的数字身份名片
Agent 发现：客户端通过多种方式发现 AgentCard
任务：异步任务驱动的通信单元
交互机制：同步请求/响应、异步轮询、SSE 流式、推送通知
安全性：双向 TLS、身份认证、审计日志

国内对应协议：ACP（Agent Communication Protocol，2025-05）。

适用场景
跨厂商 Agent 协作、Agent 市场、企业级 Agent 编排。

F 组：可靠性与安全

模式 12：异常处理与恢复（Exception Handling and Recovery）

核心原理
让智能体面对错误、突发状况、外部服务故障时，依然能保持稳定运行。

关键技术

预防：超时设置、参数校验、限流
检测：监控、健康检查、异常感知
应对：重试、备用方案、优雅降级、人工升级
恢复：状态回滚、自我修复、错误日志

适用场景
任何生产级智能体——尤其涉及外部依赖（数据库、API、模型服务）。

模式 13：人在回路（HITL，Human-in-the-Loop）

核心原理
将人类的判断、创造、伦理把关与 AI 的速度、规模相结合。

关键场景

角色	含义
验证者/审查员	人工把关 AI 输出
实时指导者	在线纠正 AI 行为
协作伙伴	与 AI 共享界面解决问题
反馈提供者	喂给 RLHF 训练流程
升级接收者	Agent 超出能力时接管

适用场景
医疗诊断、金融审批、法律合规、自动驾驶接管。

模式 18：护栏与安全（Guardrails / Safety Patterns）

核心原理
多层防御机制，确保智能体安全、合规、不偏离预期。

关键技术清单

输入护栏：清洗、注入检测、敏感话题拦截
输出护栏：过滤、事实校验、PII 脱敏
行为约束：工具白名单、权限分级
外部审核：调用第三方内容审核 API
小模型预筛：成本低，作为快速防线
人在回路兜底：高风险操作必须人工确认

适用场景
所有面向用户的智能体，尤其是开放式对话产品。

模式 19：评估与监控（Evaluation and Monitoring）

核心原理
持续测量智能体的有效性、效率、合规性，建立反馈闭环。

关键指标

类别	指标
效果	任务成功率、准确率、相关性
体验	端到端延迟、满意度（NPS/CSAT）
成本	Token 用量、API 费用、算力开销
质量	LLM-as-a-Judge 评分
过程	智能体轨迹评估、工具调用合理性
多 Agent	协作效率、消息复杂度

关键技术

离线评测集（Golden Dataset）
在线 A/B 测试
LLM 作为评审员（LLM-as-a-Judge）
可观测平台（Langfuse / LangSmith / Phoenix）

适用场景
所有生产级智能体的运营标配。

G 组：高阶能力

模式 16：资源感知优化（Resource-Aware Optimization）

核心原理
让智能体在运行中动态监控并管理计算、时间、财务资源，依据预算和实时约束做模型/路径决策。

关键技术

动态模型切换：简单任务用小模型、复杂用大模型
自适应工具选择：在工具中权衡精度/成本
上下文裁剪与摘要：控制输入 Token
主动资源预测：提前估算成本
成本敏感探索：限制试错次数
能效部署：选择最低能耗的算力
并行/分布式感知：动态决定是否横向扩展
学习型资源分配：用 RL 学习最佳分配策略
优雅降级与回退：超预算时返回粗略答案

适用场景
大规模部署、多租户 SaaS、对成本极敏感的产品。

模式 21：探索与发现（Exploration and Discovery）

核心原理
让智能体主动寻找新信息、发现新可能、识别"未知的未知"，而非仅在已知解空间内优化。

架构示例（AI Co-Scientist 联合科学家）

主管 Agent ─┬─ 生成 Agent     （提出假设）
            ├─ 反思 Agent     （批判方案）
            ├─ 排序 Agent     （评估优先级）
            ├─ 进化 Agent     （变异优化）
            ├─ 邻近 Agent     （探索相邻空间）
            └─ 元评审 Agent   （整体审查）

适用场景
科研助手（自动文献综述、假设生成、实验设计）、新材料发现、新药研发、未知问题探索。

四、模式组合：构建复杂系统

智能体设计的真正威力在于模式组合，而非单一模式孤立使用。

4.1 自主 AI 研究助手

目标：用户提出"分析量子计算对网络安全的影响"，自动产出研究报告。

[用户] 输入研究目标
   ↓
[Planner Agent] ─── Planning 模式 ─── 拆解为：
   1. 研究量子计算基础
   2. 调研常见加密算法
   3. 查找专家分析
   4. 综合成报告
   ↓
[Researcher Agent] ─── Tool Use + RAG ─── 调用搜索/学术 API
   ↓
[Writer Agent]   ─── Multi-Agent + Memory ── 综合素材成稿
   ↓
[Critic Agent]   ─── Reflection ── 审查逻辑、事实、表达
   ↓
[Writer Agent]   ─── Self-Correction ── 优化稿件
   ↓
[人工审核]       ─── HITL ── 最终把关
   ↓
最终报告

用到的模式：Planning、Tool Use、RAG、Multi-Agent、Memory、Reflection、HITL（共 7 种）。

4.2 三个常用组合套餐

场景	模式组合
智能客服	路由 + 工具使用 + RAG + 记忆 + 护栏 + 评估
研究助手	规划 + RAG + 多智能体 + 反思 + 记忆
代码生成助手	规划 + 工具使用（代码执行）+ 反思 + 推理（CoT）+ 评估

4.3 典型双模式组合速查

组合	价值
路由 + 工具使用	多技能 Agent 的标准骨架
规划 + 反思	提升复杂任务交付质量
RAG + Agentic RAG	静态检索升级为动态检索
多智能体 + A2A	跨框架 Agent 协作
MCP + 工具使用	即插即用的工具生态
护栏 + 人在回路	高风险场景双保险

五、参考资料

5.1 主流开源项目

项目	用途	链接
LangChain / LangGraph	编排框架	https://github.com/langchain-ai
LangChain4j	Java 智能体框架（本项目使用）	https://github.com/langchain4j/langchain4j
AutoGen	多 Agent 对话	https://github.com/microsoft/autogen
CrewAI	角色化多 Agent	https://github.com/crewAIInc/crewAI
MetaGPT	模拟软件公司	https://github.com/geekan/MetaGPT
LlamaIndex	RAG + Agent	https://github.com/run-llama/llama_index
Langfuse	可观测平台	https://github.com/langfuse/langfuse

结语

21 种设计模式不是要全部使用，而是构成一个模块化工具箱。真正的工程艺术，在于：

理解每个模式的本质问题（它解决什么）
从最少模式开始（先解决问题，再追加能力）
掌握模式组合（叠加产生质变）
建立评估体系（让选择有据可依）

智能体的终点，不是模型有多大，而是系统有多稳。
用对模式，让 LLM 的智能真正落到产品里。

MCP技术社区

欢迎加入 MCP 技术社区！与志同道合者携手前行，一同解锁 MCP 技术的无限可能！

更多推荐

受不了 Burp 几百 MB 还要装 JRE：我用 Rust + GPUI 写了个 16MB 的安全套件

嫌 Burp Suite 动辄数百 MB、依赖 JVM、空载就吃几百兆内存，我用纯 Rust 内核 + gpui(GPU 加速)原生界面重写了一套对标 Burp 的安全测试工作台 Scry：单文件二进制 14MB、打包 .app 15MB、压缩包不到 10MB。本文拆解它如何做到这么小，以及 MITM 解密内核、TLS 指纹、WASM 扩展沙箱、给 AI 用的 MCP 接口等关键工程实现。

MCP技术社区

实践出真知-AI Agent-New

在直播盗录播治理场景中，由于等挑战，现有盗录播治理方案存在的核心问题。盗录播风险召回Agent 2.0 旨在，实现。并且通过，提升。

MCP技术社区

Go语言的cgo调用开销与纯Go实现性能对比的实际测量数据

测试内存拷贝操作时，纯Go的`copy`函数性能为1.2GB/s，而cgo通过C的`memcpy`仅实现0.8GB/s。在数值计算场景中，纯Go的斐波那契数列计算耗时约120纳秒，而cgo调用C实现的版本耗时达到800纳秒，开销增加近7倍。高并发场景下，纯Go的goroutine调度耗时稳定在微秒级，而cgo调用因线程锁定机制，并发数超过1000时延迟显著上升，峰值延迟增加10倍以上。实测表明，c

MCP技术社区

所有评论(0)

查看更多评论

penngo

@penngo

已为社区贡献1条内容

21种AI智能体（Agent）设计模式学习教程

penngo

文章目录

一、引言：从 LLM 到智能体 AI

1.1 AI 范式的四阶段演变

1.2 智能体（Agent）的概念

1.3 智能体执行任务的五步循环

1.4 智能体能力等级

1.5 智能体未来的五个假设

二、21 种模式关系图谱

2.1 总览表

2.2 核心能力维度归纳

三、21 种设计模式详解

A 组：执行与任务编排

模式 1：提示链（Prompt Chaining）

模式 2：路由（Routing）

模式 3：并行化（Parallelization）

模式 6：规划（Planning）

B 组：与外部世界交互

模式 5：工具使用（Tool Use）

模式 10：模型上下文协议（MCP）

模式 14：知识检索（RAG）

C 组：质量与自我提升

模式 4：反思（Reflection）

模式 9：学习与适应（Learning and Adaptation）

模式 17：推理技术（Reasoning Techniques）

D 组：状态与目标

模式 8：记忆管理（Memory Management）

模式 11：目标设定与监控（Goal Setting and Monitoring）

模式 20：优先级排序（Prioritization）

E 组：协作与通信

模式 7：多智能体协作（Multi-Agent Collaboration）

模式 15：智能体间通信（A2A）

F 组：可靠性与安全

模式 12：异常处理与恢复（Exception Handling and Recovery）

模式 13：人在回路（HITL，Human-in-the-Loop）

模式 18：护栏与安全（Guardrails / Safety Patterns）

模式 19：评估与监控（Evaluation and Monitoring）

G 组：高阶能力

模式 16：资源感知优化（Resource-Aware Optimization）

模式 21：探索与发现（Exploration and Discovery）

四、模式组合：构建复杂系统

4.1 自主 AI 研究助手

4.2 三个常用组合套餐

4.3 典型双模式组合速查

五、参考资料

5.1 主流开源项目

结语

所有评论(0)

温馨提示：您尚未绑定手机号

penngo