什么是 Agent？

@MADLING

181人浏览 · 2026-07-04 22:16:03

@MADLING · 2026-07-04 22:16:03 发布

在这里插入图片描述

什么是 Agent？

你可能已经听过"AI Agent（智能体）"这个词了。

但它到底和 ChatGPT 有什么不一样？它是怎么"自主"完成任务的？循环又是什么意思？

这篇文章是我在学习 AI Agent 过程中的整理输出。用最简单的方式，把这几个问题讲清楚。

一、什么是 Agent？

一句话定义：

AI Agent = 大模型 + 工具调用能力 + 循环（loop）

这三个要素缺一不可：

大模型：负责"思考"，判断下一步该做什么
工具调用能力：让大模型能真正"动手"，比如搜索、写代码、查数据库
循环：执行完一步，把结果塞回去，继续思考下一步

“循环"是 Agent 区别于普通 LLM 最关键的特征。没有循环，工具调用也只是"调用一次就结束”。正是循环让 Agent 能处理需要多步骤的任务。

ReAct 模式：Agent 的运行机制

Agent 内部的循环，具体长这样：

用户输入问题
      ↓
   大模型思考
      ↓
 需要调用工具吗？
  ├── 否 → 直接输出结果
  └── 是 → 执行工具
           ↓
       把工具结果塞回上下文
           ↓
       继续思考（回到第二步）

这个"思考 → 判断 → 执行 → 再思考"的循环，就叫 ReAct 模式。

二、它与 ChatGPT 的区别？

ChatGPT：你说一句，它回一句。对话结束。

AI Agent：你说一句，它自己决定下一步做什么，自己去执行，自己看结果，自己再决定下一步……最后才把结果告诉你。

举个例子，你说"帮我查一下今天上海的天气，然后告诉我要不要带伞"：

ChatGPT 会说：“我没有实时数据，无法查询”
AI Agent 会：调用天气工具 → 拿到数据 → 思考要不要带伞 → 告诉你结论

关键差异在于：Agent 会主动"做事"，而不只是"回答"。

三、为什么循环次数是不确定的？

因为每次循环后，模型"看到的东西"都不一样：

第 1 次思考：只有"用户的问题"
         ↓ 调用工具
第 2 次思考：用户的问题 + 工具返回的结果
         ↓ 调用工具
第 3 次思考：用户的问题 + 结果1 + 结果2
         ↓ 没有工具需要调用了
     输出最终结果

任务复杂，需要调用的工具多，循环就多；任务简单，一次就够，甚至不需要循环。

所以循环次数不是预先设定的，而是由任务本身决定的：有工具要调用，就继续循环；没有了，就停。

注意第 2、3 次思考时，上下文里带着之前所有的工具结果。这意味着模型每一轮的"判断依据"都在增加——这也是为什么 Agent 能处理多步推理任务，而不是每次都从零开始。

结尾

总结一下：

Agent = 大模型 + 工具 + 循环，三者缺一不可
它和 ChatGPT 最大的区别是：能主动执行，而不只是回答
循环次数不固定，由任务复杂度决定

下一篇，我会聊工具（Tool）到底是什么，以及 Agent 是如何"知道"该用哪个工具的。

MCP技术社区

欢迎加入 MCP 技术社区！与志同道合者携手前行，一同解锁 MCP 技术的无限可能！

更多推荐

C++ Qt Creator 20 集成 AI Agent 支持：开启智能编程新纪元

现代 CPU 普遍采用多级缓存架构，通常包含 L1、L2、L3 三级缓存。缓存与主存之间的数据交换不是以字节为单位，而是以固定大小的块为单位，这个块被称为缓存行（Cache Line）。在 x86 架构上，缓存行大小一般为 64 字节，ARM 平台多为 64 或 128 字节。当 CPU 读取某个内存地址时，会将该地址所在的整个缓存行加载到缓存中。如果两个不同的变量位于同一个缓存行内，那么这两个变

MCP技术社区

Java 转 AI Agent 开发：Java 和 Python 的区别与快速学习指南

给 Java 开发者的核心建议心态转变：将 Python 视为探索 AI 可能性的“瑞士军刀”，将 Java 视为构建可靠 AI 系统的“重型机床”。两者结合，威力无穷。学习路径：概念 → Python 原型（理解框架） → Java 生态工具 → 工程化落地。立即行动今天：阅读一篇关于 ReAct 框架的博客。本周：在 Google Colab 上用 Python 和 LangChain 跑通第