什么是 Agent?
·

什么是 Agent?
你可能已经听过"AI Agent(智能体)"这个词了。
但它到底和 ChatGPT 有什么不一样?它是怎么"自主"完成任务的?循环又是什么意思?
这篇文章是我在学习 AI Agent 过程中的整理输出。用最简单的方式,把这几个问题讲清楚。
一、什么是 Agent?
一句话定义:
AI Agent = 大模型 + 工具调用能力 + 循环(loop)
这三个要素缺一不可:
- 大模型:负责"思考",判断下一步该做什么
- 工具调用能力:让大模型能真正"动手",比如搜索、写代码、查数据库
- 循环:执行完一步,把结果塞回去,继续思考下一步
“循环"是 Agent 区别于普通 LLM 最关键的特征。没有循环,工具调用也只是"调用一次就结束”。正是循环让 Agent 能处理需要多步骤的任务。
ReAct 模式:Agent 的运行机制
Agent 内部的循环,具体长这样:
用户输入问题
↓
大模型思考
↓
需要调用工具吗?
├── 否 → 直接输出结果
└── 是 → 执行工具
↓
把工具结果塞回上下文
↓
继续思考(回到第二步)
这个"思考 → 判断 → 执行 → 再思考"的循环,就叫 ReAct 模式。
二、它与 ChatGPT 的区别?
ChatGPT:你说一句,它回一句。对话结束。
AI Agent:你说一句,它自己决定下一步做什么,自己去执行,自己看结果,自己再决定下一步……最后才把结果告诉你。
举个例子,你说"帮我查一下今天上海的天气,然后告诉我要不要带伞":
- ChatGPT 会说:“我没有实时数据,无法查询”
- AI Agent 会:调用天气工具 → 拿到数据 → 思考要不要带伞 → 告诉你结论
关键差异在于:Agent 会主动"做事",而不只是"回答"。
三、为什么循环次数是不确定的?
因为每次循环后,模型"看到的东西"都不一样:
第 1 次思考:只有"用户的问题"
↓ 调用工具
第 2 次思考:用户的问题 + 工具返回的结果
↓ 调用工具
第 3 次思考:用户的问题 + 结果1 + 结果2
↓ 没有工具需要调用了
输出最终结果
任务复杂,需要调用的工具多,循环就多;任务简单,一次就够,甚至不需要循环。
所以循环次数不是预先设定的,而是由任务本身决定的:有工具要调用,就继续循环;没有了,就停。
注意第 2、3 次思考时,上下文里带着之前所有的工具结果。这意味着模型每一轮的"判断依据"都在增加——这也是为什么 Agent 能处理多步推理任务,而不是每次都从零开始。
结尾
总结一下:
- Agent = 大模型 + 工具 + 循环,三者缺一不可
- 它和 ChatGPT 最大的区别是:能主动执行,而不只是回答
- 循环次数不固定,由任务复杂度决定
下一篇,我会聊工具(Tool)到底是什么,以及 Agent 是如何"知道"该用哪个工具的。
更多推荐
所有评论(0)