AI Agents for Beginners — 完整学习指南

本文档涵盖课程完整结构、核心概念、设计模式与技术架构,图表穿插在对应章节中,方便对照学习。

📚 课程整体结构

本课程共 18 个单元,按模块分为 Foundation(基础)、Core Patterns(核心模式)、Advanced Topics(高级主题)三大板块,循序渐进带你掌握 AI Agent 开发全貌。

🤖 Lesson 01 — AI Agents 简介

AI Agent 是一个能够感知环境、自主推理并采取行动以实现目标的智能系统。与传统 LLM 的单轮问答不同,Agent 具备记忆、工具调用和持续反馈循环能力。

以下是 AI Agent 的核心感知-思考-行动循环(Perception-Cognition-Action Loop):

🛠️ Lesson 02 — Agent 框架与技术栈

本课程基于 Microsoft 生态技术栈,分为应用层、Agent 框架层、服务层、工具层和数据层五个层次,支持灵活组合选型。

🏗️ Lesson 03 — AI Agent 核心设计模式

本课程系统介绍 5 大 Agent 设计模式,涵盖从单 Agent 工具调用到多 Agent 协作、元认知自我反思的完整模式体系。

课程核心概念

AI Agent 与传统 LLM 的区别:

维度

传统 LLM

AI Agent

交互模式

单轮问答

多轮自主循环

记忆能力

无持久记忆

短期 + 长期记忆

工具使用

搜索/代码/API 等

目标导向

被动响应

主动规划执行

自主性

推荐学习路径

  1. Week 1(基础) — Lesson 01-03:Agent 概念 + 框架选型 + 设计模式

  2. Week 2(核心) — Lesson 04-07:工具调用 + RAG + 可信 Agent + 规划

  3. Week 3(高级) — Lesson 08-10:多 Agent + 元认知 + 生产化

  4. Week 4(专项) — Lesson 11-18:MCP / 多模态 / 安全 / 评估等专题


Lesson 01 详解 — AI Agents 简介

核心概念:

  • 感知(Perception):接收用户输入、环境信息和工具执行结果

  • 记忆(Memory):短期上下文窗口 + 长期向量存储

  • 推理(Reasoning):基于 LLM 的目标分解和行动规划

  • 行动(Action):工具调用、API 请求、代码执行、生成响应

实践项目: 构建第一个能回答问题并调用外部 API 的 Agent

代码示例(Azure AI Foundry Agent Service):

from azure.ai.projects import AIProjectClient
from azure.identity import DefaultAzureCredential

project_client = AIProjectClient.from_connection_string(
    credential=DefaultAzureCredential(),
    conn_str=os.environ["PROJECT_CONNECTION_STRING"]
)

agent = project_client.agents.create_agent(
    model="gpt-4o-mini",
    name="my-agent",
    instructions="You are a helpful assistant"
)

Lesson 02 — Agent 框架对比

框架

特点

适用场景

Azure AI Foundry Agent Service

云原生托管,内置工具集成

企业级生产部署

Semantic Kernel

插件体系,C#/Python/Java

微软技术栈集成

AutoGen

多 Agent 对话框架

研究/复杂协作场景

LangChain

生态丰富,社区活跃

快速原型开发


Lesson 03 详解 — 5 大设计模式

模式

核心能力

典型用例

工具使用(Tool Use)

调用外部 API/工具

联网搜索、代码执行

Agentic RAG

向量检索增强生成

企业知识库问答

规划(Planning)

任务分解与编排

复杂多步骤任务

多 Agent(Multi-Agent)

专家协作分工

大型自动化流程

元认知(Metacognition)

自我评估与反思

高质量、高可靠场景


Lesson 04 — 工具使用模式(Tool Use)

工具类型:

  • BingGroundingTool — 实时网络搜索

  • CodeInterpreterTool — 代码执行与数据分析

  • FunctionTool — 自定义业务函数

  • MCPTool — Model Context Protocol 标准工具

代码示例:

from azure.ai.projects.models import BingGroundingTool

bing = BingGroundingTool(connection_id=bing_connection_id)
agent = project_client.agents.create_agent(
    model="gpt-4o-mini",
    name="search-agent",
    tools=bing.definitions,
    tool_resources=bing.resources,
)

Lesson 05 — Agentic RAG(检索增强生成)

标准 RAG vs Agentic RAG:

维度

标准 RAG

Agentic RAG

检索触发

每次固定检索

Agent 自主判断何时检索

查询优化

原始问题直接检索

Agent 改写/分解查询

多跳推理

不支持

支持多步检索推理

结果验证

Agent 验证相关性


Lesson 06 — 可信 Agent(Trustworthy Agents)

构建可信赖的 AI Agent 需要关注:

  • 透明性:记录推理过程和工具调用日志

  • 可控性:关键操作前 Human-in-the-loop 确认

  • 安全性:输入输出过滤,防止提示注入

  • 可审计性:完整的执行轨迹追踪


Lesson 07 — 规划设计(Planning Design)

规划策略:

  1. ReAct(Reasoning + Acting):交替推理和行动,逐步解决问题

  2. Plan-and-Execute:先制定完整计划,再逐步执行

  3. Reflexion:执行后反思,更新计划

  4. Tree of Thought:并行探索多条推理路径


Lesson 08 — 多 Agent 系统(Multi-Agent)

常见拓扑结构:

  • 主从模式(Orchestrator-Worker):一个主 Agent 协调多个专家 Agent

  • 对等协作(Peer-to-Peer):多个 Agent 平等对话协商

  • 流水线(Pipeline):Agent 间串行传递任务

  • 辩论模式(Debate):多 Agent 互相质疑以提高答案质量


Lesson 09 — 元认知(Metacognition)

元认知让 Agent 能感知自身推理过程,识别错误并自动修正:

  • 自我评估:评估当前答案的置信度和完整性

  • 反思:识别推理链中的错误或缺失信息

  • 修正:自动重新规划并执行修正动作


Lesson 10 — Agent 生产化

生产部署关键要素:

维度

考虑事项

可扩展性

并发处理、Token 预算控制

可观测性

链路追踪、Token 用量监控

安全性

权限隔离、敏感数据过滤

成本控制

缓存策略、模型降级路由

容错性

重试机制、降级方案


Lesson 11-18 — 专题模块

课程

主题

核心内容

Lesson 11

MCP(Model Context Protocol)

标准化工具接口协议,构建跨平台工具生态

Lesson 12

多模态 Agent

处理图片/视频/音频输入的 Agent 设计

Lesson 13

路由 Agent

根据任务类型智能分发到专业 Agent

Lesson 14

主动 Agent

主动感知环境变化并触发行动

Lesson 15

Agent 安全

防提示注入、权限最小化、内容过滤

Lesson 16

上下文工程

高效压缩和管理 Agent 上下文窗口

Lesson 17

Agent 评估

自动化评估框架和基准测试

Lesson 18

通用 Agent

跨领域自适应的通用 Agent 设计原则


🚀 快速开始

环境要求

  • Python 3.10+

  • Azure 账号(免费试用可用)

  • Git

安装步骤

git clone https://github.com/microsoft/ai-agents-for-beginners
cd ai-agents-for-beginners
pip install -r requirements.txt
cp .env.sample .env
# 在 .env 中填入 Azure AI Foundry 连接字符串

运行第一个 Agent

cd 01-intro-to-ai-agents
python solution.py

📦 资源链接

  • 🔗 GitHub 仓库[1]

  • 📖 Azure AI Foundry 文档[2]

  • 🧩 Semantic Kernel 文档[3]

  • 🤖 AutoGen 框架[4]

  • 🛡️ MCP 协议规范[5]

引用链接

[1]GitHub 仓库: https://github.com/microsoft/ai-agents-for-beginners

[2]Azure AI Foundry 文档: https://learn.microsoft.com/azure/ai-foundry/

[3]Semantic Kernel 文档: https://learn.microsoft.com/semantic-kernel/

[4]AutoGen 框架: https://microsoft.github.io/autogen/

[5]MCP 协议规范: https://modelcontextprotocol.io/

Logo

欢迎加入 MCP 技术社区!与志同道合者携手前行,一同解锁 MCP 技术的无限可能!

更多推荐