Agent的概念、原理与构建模式

开源至上

295人浏览 · 2026-05-09 12:18:39

开源至上 · 2026-05-09 12:18:39 发布

一、什么是Agent

在人工智能（AI）领域，Agent（智能体）是指一个能够感知环境、做出决策、执行动作，并朝着特定目标自主运行的实体;

简单来说：
Agent = 感知 + 思考 + 行动的循环执行者;

二、现代 LLM-based Agent 的运行原理（2024-2026 最流行形式）

1、ReAct模式

当前大家说的 “AI Agent” 大多指基于大语言模型（LLM）的 Agent，其运行原理通常是 ReAct（Reason + Act）框架或其变体：
在这里插入图片描述

接收任务（User Goal）。
思考（Thought）：LLM 分析当前状态，说出“下一步我想做什么”。
行动（Action）：调用工具（Tool Use），如搜索网页、执行代码、读写数据库、控制浏览器等。
观察（Observation）：工具返回结果 → 喂回给 LLM。
重复：直到 LLM 判断任务完成，或达到最大步数/成本限制。

典型流程（伪代码）：

while not done:
    thought = LLM(prompt + history + tools)
    if thought 决定调用工具:
        result = tool.execute(thought.action)
        history.append(result)
    else:
        output final answer

基于ReAct模式运行的Agent流程：
在这里插入图片描述

ReAct 的工作流

ReAct 的核心逻辑是一个循环，大模型在这个循环中扮演“指挥官”：

Thought (思考)：大模型写下：“为了回答这个问题，我需要先搜索一下某某公司的财报。”
Action (行动)：大模型接着写出：“调用搜索工具，关键词：2023财报”。
Observation (观察)：系统执行搜索，并将搜索结果（外部客观数据）反馈给大模型。
Thought (再次思考)：大模型看到搜索结果后，再次预测文本：“搜索结果显示利润增长了 $10\%$ ，接下来我需要计算……”

大模型（LLM）就是 ReAct 模式中的“大脑”。

2、Plan-And-Execute 模式

不一定所有的AI Agent都是按照这种模式进行，还有可能是先规划后执行，比如说：Manus；
在这里插入图片描述

基于Plan-And-Execute模式运行的Agent流程：
在这里插入图片描述

其中Re-Plan，拿到的是Plan计划执行了Agent的结果后，生成的新计划；

上面的例子中Plan，第一个执行计划是：
1、今年是哪一年；
2、查询日期的澳网男子冠军名字；
3、查询这位澳网冠军的家乡；

Re-Plan在拿到Agent执行的结果之后，会给出第二个执行计划：
1、查询2026年的澳网男子冠军名字；
2、查询这位澳网冠军的家乡；

以此类推下去…

LangChain Plan-And-Execute：https://langchain-ai.github.io/langgraph/tutorials/plan-and-execute/plan-and-execute/

三、自定义Agent

代码仓库：https://github.com/MarkTechStation/VideoCode;

MCP技术社区

欢迎加入 MCP 技术社区！与志同道合者携手前行，一同解锁 MCP 技术的无限可能！

更多推荐

cover

[开源] myclaw：2000 行 Go 平替 43 万行的 OpenClaw

MCP技术社区

cover

Gemini 3.5 Flash vs Claude Opus 4.7：智能体基准全面对比

MCP技术社区

cover

从0开始搭建AI Agent（一）

MCP技术社区

所有评论(0)

查看更多评论

开源至上

@weixin_44273367

已为社区贡献4条内容