从零入手,玩转 AI Agent

AI Agents for Beginners — 完整学习指南
本文档涵盖课程完整结构、核心概念、设计模式与技术架构,图表穿插在对应章节中,方便对照学习。
📚 课程整体结构
本课程共 18 个单元,按模块分为 Foundation(基础)、Core Patterns(核心模式)、Advanced Topics(高级主题)三大板块,循序渐进带你掌握 AI Agent 开发全貌。

🤖 Lesson 01 — AI Agents 简介
AI Agent 是一个能够感知环境、自主推理并采取行动以实现目标的智能系统。与传统 LLM 的单轮问答不同,Agent 具备记忆、工具调用和持续反馈循环能力。
以下是 AI Agent 的核心感知-思考-行动循环(Perception-Cognition-Action Loop):

🛠️ Lesson 02 — Agent 框架与技术栈
本课程基于 Microsoft 生态技术栈,分为应用层、Agent 框架层、服务层、工具层和数据层五个层次,支持灵活组合选型。

🏗️ Lesson 03 — AI Agent 核心设计模式
本课程系统介绍 5 大 Agent 设计模式,涵盖从单 Agent 工具调用到多 Agent 协作、元认知自我反思的完整模式体系。

课程核心概念
AI Agent 与传统 LLM 的区别:
|
维度 |
传统 LLM |
AI Agent |
|---|---|---|
|
交互模式 |
单轮问答 |
多轮自主循环 |
|
记忆能力 |
无持久记忆 |
短期 + 长期记忆 |
|
工具使用 |
无 |
搜索/代码/API 等 |
|
目标导向 |
被动响应 |
主动规划执行 |
|
自主性 |
低 |
高 |
推荐学习路径
-
Week 1(基础) — Lesson 01-03:Agent 概念 + 框架选型 + 设计模式
-
Week 2(核心) — Lesson 04-07:工具调用 + RAG + 可信 Agent + 规划
-
Week 3(高级) — Lesson 08-10:多 Agent + 元认知 + 生产化
-
Week 4(专项) — Lesson 11-18:MCP / 多模态 / 安全 / 评估等专题
Lesson 01 详解 — AI Agents 简介
核心概念:
-
感知(Perception):接收用户输入、环境信息和工具执行结果
-
记忆(Memory):短期上下文窗口 + 长期向量存储
-
推理(Reasoning):基于 LLM 的目标分解和行动规划
-
行动(Action):工具调用、API 请求、代码执行、生成响应
实践项目: 构建第一个能回答问题并调用外部 API 的 Agent
代码示例(Azure AI Foundry Agent Service):
from azure.ai.projects import AIProjectClient
from azure.identity import DefaultAzureCredential
project_client = AIProjectClient.from_connection_string(
credential=DefaultAzureCredential(),
conn_str=os.environ["PROJECT_CONNECTION_STRING"]
)
agent = project_client.agents.create_agent(
model="gpt-4o-mini",
name="my-agent",
instructions="You are a helpful assistant"
)
Lesson 02 — Agent 框架对比
|
框架 |
特点 |
适用场景 |
|---|---|---|
| Azure AI Foundry Agent Service |
云原生托管,内置工具集成 |
企业级生产部署 |
| Semantic Kernel |
插件体系,C#/Python/Java |
微软技术栈集成 |
| AutoGen |
多 Agent 对话框架 |
研究/复杂协作场景 |
| LangChain |
生态丰富,社区活跃 |
快速原型开发 |
Lesson 03 详解 — 5 大设计模式
|
模式 |
核心能力 |
典型用例 |
|---|---|---|
| 工具使用(Tool Use) |
调用外部 API/工具 |
联网搜索、代码执行 |
| Agentic RAG |
向量检索增强生成 |
企业知识库问答 |
| 规划(Planning) |
任务分解与编排 |
复杂多步骤任务 |
| 多 Agent(Multi-Agent) |
专家协作分工 |
大型自动化流程 |
| 元认知(Metacognition) |
自我评估与反思 |
高质量、高可靠场景 |
Lesson 04 — 工具使用模式(Tool Use)
工具类型:
-
BingGroundingTool— 实时网络搜索 -
CodeInterpreterTool— 代码执行与数据分析 -
FunctionTool— 自定义业务函数 -
MCPTool— Model Context Protocol 标准工具
代码示例:
from azure.ai.projects.models import BingGroundingTool
bing = BingGroundingTool(connection_id=bing_connection_id)
agent = project_client.agents.create_agent(
model="gpt-4o-mini",
name="search-agent",
tools=bing.definitions,
tool_resources=bing.resources,
)
Lesson 05 — Agentic RAG(检索增强生成)
标准 RAG vs Agentic RAG:
|
维度 |
标准 RAG |
Agentic RAG |
|---|---|---|
|
检索触发 |
每次固定检索 |
Agent 自主判断何时检索 |
|
查询优化 |
原始问题直接检索 |
Agent 改写/分解查询 |
|
多跳推理 |
不支持 |
支持多步检索推理 |
|
结果验证 |
无 |
Agent 验证相关性 |

Lesson 06 — 可信 Agent(Trustworthy Agents)
构建可信赖的 AI Agent 需要关注:
-
透明性:记录推理过程和工具调用日志
-
可控性:关键操作前 Human-in-the-loop 确认
-
安全性:输入输出过滤,防止提示注入
-
可审计性:完整的执行轨迹追踪
Lesson 07 — 规划设计(Planning Design)
规划策略:
-
ReAct(Reasoning + Acting):交替推理和行动,逐步解决问题
-
Plan-and-Execute:先制定完整计划,再逐步执行
-
Reflexion:执行后反思,更新计划
-
Tree of Thought:并行探索多条推理路径

Lesson 08 — 多 Agent 系统(Multi-Agent)
常见拓扑结构:
-
主从模式(Orchestrator-Worker):一个主 Agent 协调多个专家 Agent
-
对等协作(Peer-to-Peer):多个 Agent 平等对话协商
-
流水线(Pipeline):Agent 间串行传递任务
-
辩论模式(Debate):多 Agent 互相质疑以提高答案质量

Lesson 09 — 元认知(Metacognition)
元认知让 Agent 能感知自身推理过程,识别错误并自动修正:
-
自我评估:评估当前答案的置信度和完整性
-
反思:识别推理链中的错误或缺失信息
-
修正:自动重新规划并执行修正动作
Lesson 10 — Agent 生产化
生产部署关键要素:
|
维度 |
考虑事项 |
|---|---|
| 可扩展性 |
并发处理、Token 预算控制 |
| 可观测性 |
链路追踪、Token 用量监控 |
| 安全性 |
权限隔离、敏感数据过滤 |
| 成本控制 |
缓存策略、模型降级路由 |
| 容错性 |
重试机制、降级方案 |
Lesson 11-18 — 专题模块
|
课程 |
主题 |
核心内容 |
|---|---|---|
|
Lesson 11 |
MCP(Model Context Protocol) |
标准化工具接口协议,构建跨平台工具生态 |
|
Lesson 12 |
多模态 Agent |
处理图片/视频/音频输入的 Agent 设计 |
|
Lesson 13 |
路由 Agent |
根据任务类型智能分发到专业 Agent |
|
Lesson 14 |
主动 Agent |
主动感知环境变化并触发行动 |
|
Lesson 15 |
Agent 安全 |
防提示注入、权限最小化、内容过滤 |
|
Lesson 16 |
上下文工程 |
高效压缩和管理 Agent 上下文窗口 |
|
Lesson 17 |
Agent 评估 |
自动化评估框架和基准测试 |
|
Lesson 18 |
通用 Agent |
跨领域自适应的通用 Agent 设计原则 |
🚀 快速开始
环境要求
-
Python 3.10+
-
Azure 账号(免费试用可用)
-
Git
安装步骤
git clone https://github.com/microsoft/ai-agents-for-beginners
cd ai-agents-for-beginners
pip install -r requirements.txt
cp .env.sample .env
# 在 .env 中填入 Azure AI Foundry 连接字符串
运行第一个 Agent
cd 01-intro-to-ai-agents
python solution.py
📦 资源链接
-
🔗 GitHub 仓库[1]
-
📖 Azure AI Foundry 文档[2]
-
🧩 Semantic Kernel 文档[3]
-
🤖 AutoGen 框架[4]
-
🛡️ MCP 协议规范[5]
引用链接
[1]GitHub 仓库: https://github.com/microsoft/ai-agents-for-beginners
[2]Azure AI Foundry 文档: https://learn.microsoft.com/azure/ai-foundry/
[3]Semantic Kernel 文档: https://learn.microsoft.com/semantic-kernel/
[4]AutoGen 框架: https://microsoft.github.io/autogen/
[5]MCP 协议规范: https://modelcontextprotocol.io/
更多推荐

所有评论(0)