一、什么是Agent

在人工智能(AI)领域,Agent(智能体) 是指一个能够感知环境做出决策执行动作,并朝着特定目标自主运行的实体;

简单来说:
Agent = 感知 + 思考 + 行动 的循环执行者;


二、现代 LLM-based Agent 的运行原理(2024-2026 最流行形式)

1、ReAct模式

当前大家说的 “AI Agent” 大多指基于大语言模型(LLM)的 Agent,其运行原理通常是 ReAct(Reason + Act)框架 或其变体:
在这里插入图片描述

  1. 接收任务(User Goal)。
  2. 思考(Thought):LLM 分析当前状态,说出“下一步我想做什么”。
  3. 行动(Action):调用工具(Tool Use),如搜索网页、执行代码、读写数据库、控制浏览器等。
  4. 观察(Observation):工具返回结果 → 喂回给 LLM。
  5. 重复:直到 LLM 判断任务完成,或达到最大步数/成本限制。

典型流程(伪代码):

while not done:
    thought = LLM(prompt + history + tools)
    if thought 决定调用工具:
        result = tool.execute(thought.action)
        history.append(result)
    else:
        output final answer

基于ReAct模式运行的Agent流程:
在这里插入图片描述

ReAct 的工作流

ReAct 的核心逻辑是一个循环,大模型在这个循环中扮演“指挥官”:

  • Thought (思考):大模型写下:“为了回答这个问题,我需要先搜索一下某某公司的财报。”
  • Action (行动):大模型接着写出:“调用搜索工具,关键词:2023财报”。
  • Observation (观察):系统执行搜索,并将搜索结果(外部客观数据)反馈给大模型。
  • Thought (再次思考):大模型看到搜索结果后,再次预测文本:“搜索结果显示利润增长了 10 % 10\% 10%,接下来我需要计算……”

大模型(LLM)就是 ReAct 模式中的“大脑”。


2、Plan-And-Execute 模式

不一定所有的AI Agent都是按照这种模式进行,还有可能是先规划后执行,比如说:Manus;
在这里插入图片描述

基于Plan-And-Execute模式运行的Agent流程:
在这里插入图片描述

其中Re-Plan,拿到的是Plan计划执行了Agent的结果后,生成的新计划;

上面的例子中Plan,第一个执行计划是:
1、今年是哪一年;
2、查询日期的澳网男子冠军名字;
3、查询这位澳网冠军的家乡;

Re-Plan在拿到Agent执行的结果之后,会给出第二个执行计划:
1、查询2026年的澳网男子冠军名字;
2、查询这位澳网冠军的家乡;

以此类推下去…

LangChain Plan-And-Execute:https://langchain-ai.github.io/langgraph/tutorials/plan-and-execute/plan-and-execute/


三、自定义Agent

代码仓库:https://github.com/MarkTechStation/VideoCode;

Logo

欢迎加入 MCP 技术社区!与志同道合者携手前行,一同解锁 MCP 技术的无限可能!

更多推荐