收藏 | 掌握大模型应用核心概念：从LLM到Agent的完整技术图谱

编程唐小宝

34人浏览 · 2026-06-23 11:59:34

编程唐小宝 · 2026-06-23 11:59:34 发布

本文深入解析大模型应用中的关键技术概念，如Context、RAG、Tool Calling、MCP、Agent、Memory、Skills、A2A、A2UI、Guardrails等。文章指出这些概念并非孤立的技术点，而是构成大模型应用链路的不同环节，从模型理解任务、补充上下文，到调用工具、执行结果反馈，再到界面交互和权限控制，每个环节都有其特定功能和价值。通过理解这些概念的定位和作用，开发者可以更有效地构建稳定、可靠的大模型应用系统，避免技术堆砌，实现清晰边界和高效协作。

最近看大模型应用和 Agent，经常会遇到一堆缩写：

RAG、Tool Calling、MCP、A2A、Memory、Skills、Workflow、A2UI、AG-UI、Evals、Guardrails。

每个词听起来都像是“让 AI 更有用”的方案。但如果只按热度记词，很快就会乱。

更好的理解方式是先问一句：

它到底在解决大模型应用里的哪一类问题？

大模型应用不是只有一个模型。真正跑起来以后，它会变成一条工程链路：

用户提出目标，模型理解任务，系统补充上下文，模型调用工具，执行结果回到模型，必要时继续规划，最后把过程和结果展示给用户。

这些概念不是一组互相替代的技术，而是分布在这条链路的不同位置。

大模型应用概念是分层协作，不是互相替代

LLM 是能力核心，但不是完整应用

先从最基础的 LLM 说起。

LLM 负责语言理解、推理、生成和泛化。它能读懂问题，组织答案，也能根据上下文判断下一步该做什么。

但 LLM 本身并不知道你的实时库存、公司文档、订单状态、代码仓库和用户偏好。它也不会天然拥有权限、状态、审计和可靠执行能力。

所以，大模型应用的关键不是“模型有多聪明”这一件事。

更关键的是：

你如何把模型放进一个有数据、有工具、有边界、有反馈的系统里。

后面这些概念，都是在补这件事。

Context 解决模型当下知道什么

Context 可以理解为模型这次回答时能看到的信息。

它包括用户输入、系统提示词、历史对话、检索到的资料、工具返回结果，以及开发者塞进来的业务规则。

很多人会把 Context Window 理解成“模型记忆”。其实更准确地说，它是模型这次推理的工作台。

工作台越大，不代表工作一定越好。

如果放进去的是重复、冲突、过期或无关内容，模型反而更容易跑偏。

所以 Context Engineering 的重点不是把所有东西都塞进去，而是决定：

哪些信息应该进来。以什么结构进来。什么时候更新。哪些内容必须排除。

这是大模型应用里最容易被低估的一层。

RAG 解决从资料里找答案

RAG 适合回答的问题是：

模型不知道某些资料，怎么在回答前把相关内容找出来？

典型流程是把文档切成片段，建立索引，用户提问时先检索相关内容，再交给模型生成答案。

它的价值很明确：让模型可以基于外部知识回答，而不是只靠训练时学到的内容。

但 RAG 不是万能知识库。

它擅长“查询时补资料”，不擅长“长期沉淀理解”。如果资料结构混乱、chunk 切得粗糙、检索召回不准，模型照样会答得很飘。

所以 RAG 更像知识接入层，不是智能本身。

Tool Calling 解决模型怎么做事

如果 RAG 是让模型“查资料”，Tool Calling 就是让模型“发起动作”。

比如查天气、搜网页、读数据库、发邮件、跑测试、生成图片、创建订单。

模型不直接完成这些事，而是判断需要调用哪个工具、给出什么参数，再由系统执行工具并把结果返回给模型。

这一步非常关键，因为它把大模型从“回答问题”推进到“参与执行”。

但工具调用也带来风险。

工具描述不清，模型会选错工具。参数约束不严，模型会传错值。权限边界不清，模型可能做不该做的事。

所以 Tool Calling 的重点不是把工具堆给模型，而是把工具设计成模型能正确理解、系统能安全执行的接口。

MCP 解决工具和数据接入的标准化

Tool Calling 继续往工程里走，就会遇到 MCP。

MCP 最适合回答的问题是：

Agent 怎么统一接入外部工具、资源和提示模板？

比如文件系统、数据库、设计稿、代码仓库、内部系统、搜索服务。

如果没有 MCP，每接一个系统都要写一套临时适配。工具定义、连接方式、权限、返回格式都会散在项目里。

MCP 的价值不是让模型变聪明，而是把“模型能接入什么能力”标准化。

一句话说：

Tool Calling 是模型调用工具的行为，MCP 是工具接入和暴露的协议层。

Workflow 解决确定流程

不是所有自动化都需要 Agent。

如果任务路径固定，步骤清楚，分支有限，Workflow 往往更合适。

比如：

收到表单后生成摘要。根据模板写周报。把日报同步到飞书。按固定规则跑一组检查。

这类任务不需要模型每一步都“自由决策”。系统只需要按流程执行，在某些节点调用模型即可。

Workflow 的优点是稳定、可测试、可复现。

它的边界也很清楚：当任务路径会变化、信息会缺失、执行结果需要反复检查时，固定流程就不够了。

这时才进入 Agent。

Agent 解决不确定任务的闭环

Agent 不是“更会聊天的机器人”。

更准确地说，Agent 是一个围绕目标持续行动的系统。

它通常包含几件事：

理解目标。规划下一步。调用工具。观察结果。根据反馈继续调整。必要时等待人类确认。

Agent 的关键不在于它像不像人，而在于它能不能形成闭环。

比如“帮我修一个线上 bug”，这不是一次问答。它可能要读日志、定位代码、修改文件、跑测试、发现失败、再回头改。

这类任务路径不确定，结果需要验证，才真正适合 Agent。

Memory 解决跨任务保留什么

Memory 经常被说得很玄，其实它要解决的问题很朴素：

模型下一次工作时，哪些信息不应该丢？

比如用户偏好、项目约定、长期目标、历史决策、失败经验、常用工作流。

但 Memory 不是把聊天记录全部保存。

好的 Memory 应该经过筛选、归纳和更新。否则它会变成噪音，把旧偏好、临时判断和错误信息一起带进后续任务。

可以把它理解成长期上下文管理，而不是无限聊天记录。

Skills 解决可复用方法怎么沉淀

Skills 这几年也开始频繁出现。

它要解决的问题不是“模型能调用什么工具”，而是：

一个 Agent 怎么复用一套做事方法？

比如写公众号文章、生成 PPT、分析表格、做代码 review、跑发布流程、处理某类业务资料。

这些任务不一定需要一个新工具，也不一定要做成固定 Workflow。它们更像一套可复用的操作手册：什么时候该用、先看什么、按什么步骤做、有哪些模板、哪些坑要避开。

所以 Skill 可以理解成给 Agent 的任务方法包。

它通常包含说明文档、步骤、示例、模板，甚至脚本和素材。模型在遇到相关任务时加载这套方法，再结合当前上下文执行。

它和几个概念容易混：

Prompt 是一次性的指令。 Memory 是跨任务保留的信息。 Tool 是可以被调用的外部能力。 Workflow 是固定流程。 Skill 是可复用的任务方法。

这层很重要，因为 Agent 真正要稳定工作，不能每次都从零摸索。

好的 Skill 会把经验沉淀下来，让 Agent 在相似任务里少犯同样的错。

A2A 解决 Agent 之间的协作

当一个 Agent 不够用时，就会遇到 A2A。

A2A 的核心问题是：

一个 Agent 怎么发现另一个 Agent，并知道它能做什么？

Google 的 A2A 介绍里提到，Agent 可以发布 Agent Card，描述自己的能力和 endpoint。调用方看到这张卡，就能知道远程 Agent 适不适合处理当前任务。

这很像服务发现，但对象从微服务变成了智能体。

它和 MCP 的区别也很简单：

MCP 是 Agent 接工具。 A2A 是 Agent 接 Agent。

如果你只是让一个 Agent 调几个本地工具，优先考虑工具设计和 MCP。

如果你要让多个专业 Agent 分工协作，比如采购 Agent、质量 Agent、物流 Agent 互相配合，A2A 才开始有意义。

A2UI 和 AG-UI 解决前端交互

很多 Agent demo 最后不是输在模型，而是输在前端。

Agent 能规划、能调用工具、能返回结果，但前端只显示一段文本。真实业务里，用户往往需要表格、订单卡片、审批按钮、筛选器、进度流和可中断操作。

A2UI 和 AG-UI 就是在解决这一层。

A2UI 更关心界面结构。它让 Agent 用受控组件描述一个可渲染界面，而不是让前端每次为新场景重写页面。

AG-UI 更关心交互事件流。Agent 的执行不是一次请求一次响应，它会流式输出、调用工具、暂停、恢复、等待用户输入。前端需要一种统一方式消费这些事件。

简单说：

A2UI 管界面长什么样。 AG-UI 管执行过程怎么流到界面。

Guardrails 解决什么不能做

大模型应用越接近真实业务，越不能只追求“能做”。

还要明确“什么不能做”。

Guardrails 就是这层边界。

它可能包括权限控制、敏感信息过滤、输出格式约束、危险动作拦截、人工确认、合规审查和回滚策略。

尤其是 Agent 能调用工具以后，边界比提示词更重要。

“不要删除用户数据”不能只写在 prompt 里。系统需要权限、确认、审计和失败保护。

这也是为什么交易和支付场景会出现 UCP、AP2 这类更细的协议。

UCP 关注购物车、结算、订单等交易流程的一致性。 AP2 关注用户授权、支付凭证和责任归属。

它们不是所有 Agent 都需要的通用基础设施，但它们提醒我们：一旦 AI 开始替用户做高风险动作，授权和审计就必须结构化。

Evals 和 Observability 解决怎么知道它靠不靠谱

最后是很多人最晚才意识到的一层：评测和可观测性。

大模型应用不能只靠“我试了几次感觉还行”。

Evals 要回答的是：

这个系统在典型任务上表现如何？在边界案例上会不会失败？换模型、换提示词、换检索策略以后有没有退化？

Observability 要回答的是：

模型看到了什么上下文？调用了哪个工具？参数是什么？工具返回了什么？哪一步开始跑偏？用户在哪里接管？

没有这些记录，Agent 出错时只能猜。

而真实系统里，能复盘、能定位、能回归测试，才是可靠性的起点。

不要把概念当插件清单

看到这里，很容易走到另一个极端：

既然每层都有概念，那是不是新项目都应该全接上？

不一定。

概念的价值来自边界，而不是来自名字本身。

如果你只是做内部脚本，固定调用几个工具，可能不需要复杂 Agent。

如果你的资料很少，普通搜索和手动上下文就够了，不一定要上 RAG。

如果没有多个远程专家协作，A2A 没必要提前引入。

如果前端只是简单聊天窗口，A2UI 也可能太早。

如果不涉及交易和支付，UCP、AP2 就只是概念储备。

真正成熟的做法，是先画清楚系统边界：

模型需要知道什么。模型需要调用什么。任务路径是否固定。是否需要长期记忆。是否有可复用的任务方法。是否需要多个 Agent 协作。哪些动作必须人工确认。出了错能不能复盘。

边界清楚之后，概念才有意义。

否则你不是在做架构，而是在收集缩写。

一句话记住这张图

我会这样记：

LLM 管理解和生成。 Context 管当下知道什么。 RAG 管从资料里找答案。 Tool Calling 管怎么做事。 MCP 管工具和数据怎么接入。 Workflow 管确定流程。 Agent 管不确定任务闭环。 Memory 管跨任务保留什么。 Skills 管可复用任务方法。 A2A 管 Agent 之间怎么协作。 A2UI 管界面结构。 AG-UI 管交互事件流。 Guardrails 管边界和权限。 Evals / Observability 管评测和复盘。

它们不是一组互相替代的名词，而是一张大模型应用的工程地图。

理解这张地图以后，再看新概念就不容易慌。

你只需要问：

它在补哪一层？它解决的是数据、工具、流程、协作、界面、权限，还是可靠性？它是不是我现在真的需要的边界？

大模型应用正在从“一个模型加几个提示词”，变成“模型、工具、数据、流程、界面和人类确认共同组成的系统”。

概念的意义，就是让这个系统少一点临时胶水，多一点清晰边界。

如何学习大模型 AI ？

由于新岗位的生产效率，要优于被取代岗位的生产效率，所以实际上整个社会的生产效率是提升的。

但是具体到个人，只能说是：

“最先掌握AI的人，将会比较晚掌握AI的人有竞争优势”。

这句话，放在计算机、互联网、移动互联网的开局时期，都是一样的道理。

我在一线科技企业深耕十二载，见证过太多因技术卡位而跃迁的案例。那些率先拥抱 AI 的同事，早已在效率与薪资上形成代际优势，我意识到有很多经验和知识值得分享给大家，也可以通过我们的能力和经验解答大家在大模型的学习中的很多困惑。我们整理出这套 AI 大模型突围资料包：

✅ 从零到一的 AI 学习路径图
✅ 大模型调优实战手册（附医疗/金融等大厂真实案例）
✅ 百度/阿里专家闭门录播课
✅ 大模型当下最新行业报告
✅ 真实大厂面试真题
✅ 2026 最新岗位需求图谱

所有资料 ⚡️ ，朋友们如果有需要 《AI大模型入门+进阶学习资源包》，下方扫码获取~
在这里插入图片描述

① 全套AI大模型应用开发视频教程

（包含提示工程、RAG、LangChain、Agent、模型微调与部署、DeepSeek等技术点）
在这里插入图片描述

② 大模型系统化学习路线

作为学习AI大模型技术的新手，方向至关重要。正确的学习路线可以为你节省时间，少走弯路；方向不对，努力白费。这里我给大家准备了一份最科学最系统的学习成长路线图和学习规划，带你从零基础入门到精通！
在这里插入图片描述

③ 大模型学习书籍&文档

学习AI大模型离不开书籍文档，我精选了一系列大模型技术的书籍和学习文档（电子版），它们由领域内的顶尖专家撰写，内容全面、深入、详尽，为你学习大模型提供坚实的理论基础。
在这里插入图片描述

④ AI大模型最新行业报告

2025最新行业报告，针对不同行业的现状、趋势、问题、机会等进行系统地调研和评估，以了解哪些行业更适合引入大模型的技术和应用，以及在哪些方面可以发挥大模型的优势。
在这里插入图片描述

⑤ 大模型项目实战&配套源码

学以致用，在项目实战中检验和巩固你所学到的知识，同时为你找工作就业和职业发展打下坚实的基础。
在这里插入图片描述

⑥ 大模型大厂面试真题

面试不仅是技术的较量，更需要充分的准备。在你已经掌握了大模型技术之后，就需要开始准备面试，我精心整理了一份大模型面试题库，涵盖当前面试中可能遇到的各种技术问题，让你在面试中游刃有余。

以上资料如何领取？

在这里插入图片描述

为什么大家都在学大模型？

最近科技巨头英特尔宣布裁员2万人，传统岗位不断缩减，但AI相关技术岗疯狂扩招，有3-5年经验，大厂薪资就能给到50K*20薪！

不出1年，“有AI项目经验”将成为投递简历的门槛。

风口之下，与其像“温水煮青蛙”一样坐等被行业淘汰，不如先人一步，掌握AI大模型原理+应用技术+项目实操经验，“顺风”翻盘！
在这里插入图片描述

这些资料真的有用吗？

这份资料由我和鲁为民博士(北京清华大学学士和美国加州理工学院博士)共同整理，现任上海殷泊信息科技CEO，其创立的MoPaaS云平台获Forrester全球’强劲表现者’认证，服务航天科工、国家电网等1000+企业，以第一作者在IEEE Transactions发表论文50+篇，获NASA JPL火星探测系统强化学习专利等35项中美专利。本套AI大模型课程由清华大学-加州理工双料博士、吴文俊人工智能奖得主鲁为民教授领衔研发。

资料内容涵盖了从入门到进阶的各类视频教程和实战项目，无论你是小白还是有些技术基础的技术人员，这份资料都绝对能帮助你提升薪资待遇，转行大模型岗位。
在这里插入图片描述

以上全套大模型资料如何领取？

在这里插入图片描述

MCP技术社区

欢迎加入 MCP 技术社区！与志同道合者携手前行，一同解锁 MCP 技术的无限可能！

更多推荐

动动嘴就能建模？Blender全流程部署AI建模插件教程 | 零门槛实现AI驱动3D创作

安装uv包管理器 → Blender安装addon插件 → Cursor配置MCP服务 → 启动连接并测试。只要严格按照步骤操作，就能在10分钟内完成整个部署，让你的Blender拥有AI原生创作能力。

MCP技术社区

IT爱学堂-DeepAgents 超级多智能体全流程 MCP A2A Skills实战资料

MCP技术社区

AI Agent在做什么，用户终于能看到了

文章摘要：AI Agent执行任务时存在"黑盒"痛点，用户无法实时了解执行进度和中间过程。JBoltAI的TokUI框架针对性地开发了三大可视化组件：思考过程组件展示AI推理步骤，工具调用组件实时显示工具状态，执行计划组件跟踪任务进度。这套方案通过动态更新技术实现状态流转，解决了企业场景中Agent执行的信任问题。TokUI已开源，其组件不仅适用于Agent场景，还可用于ETL