Agent的概念、原理与构建模式
·
一、什么是Agent
在人工智能(AI)领域,Agent(智能体) 是指一个能够感知环境、做出决策、执行动作,并朝着特定目标自主运行的实体;
简单来说:
Agent = 感知 + 思考 + 行动 的循环执行者;
二、现代 LLM-based Agent 的运行原理(2024-2026 最流行形式)
1、ReAct模式
当前大家说的 “AI Agent” 大多指基于大语言模型(LLM)的 Agent,其运行原理通常是 ReAct(Reason + Act)框架 或其变体:
- 接收任务(User Goal)。
- 思考(Thought):LLM 分析当前状态,说出“下一步我想做什么”。
- 行动(Action):调用工具(Tool Use),如搜索网页、执行代码、读写数据库、控制浏览器等。
- 观察(Observation):工具返回结果 → 喂回给 LLM。
- 重复:直到 LLM 判断任务完成,或达到最大步数/成本限制。
典型流程(伪代码):
while not done:
thought = LLM(prompt + history + tools)
if thought 决定调用工具:
result = tool.execute(thought.action)
history.append(result)
else:
output final answer
基于ReAct模式运行的Agent流程:
ReAct 的工作流
ReAct 的核心逻辑是一个循环,大模型在这个循环中扮演“指挥官”:
- Thought (思考):大模型写下:“为了回答这个问题,我需要先搜索一下某某公司的财报。”
- Action (行动):大模型接着写出:“调用搜索工具,关键词:2023财报”。
- Observation (观察):系统执行搜索,并将搜索结果(外部客观数据)反馈给大模型。
- Thought (再次思考):大模型看到搜索结果后,再次预测文本:“搜索结果显示利润增长了 10 % 10\% 10%,接下来我需要计算……”
大模型(LLM)就是 ReAct 模式中的“大脑”。
2、Plan-And-Execute 模式
不一定所有的AI Agent都是按照这种模式进行,还有可能是先规划后执行,比如说:Manus;
基于Plan-And-Execute模式运行的Agent流程:
其中Re-Plan,拿到的是Plan计划执行了Agent的结果后,生成的新计划;
上面的例子中Plan,第一个执行计划是:
1、今年是哪一年;
2、查询日期的澳网男子冠军名字;
3、查询这位澳网冠军的家乡;
Re-Plan在拿到Agent执行的结果之后,会给出第二个执行计划:
1、查询2026年的澳网男子冠军名字;
2、查询这位澳网冠军的家乡;
以此类推下去…
LangChain Plan-And-Execute:https://langchain-ai.github.io/langgraph/tutorials/plan-and-execute/plan-and-execute/
三、自定义Agent
更多推荐



所有评论(0)