小白程序员必看：收藏这份大模型学习指南，轻松掌握Agent-ReAct-Skills-MCP-Tool技术演进

AI大模型_学习君

436人浏览 · 2026-04-03 17:44:35

AI大模型_学习君 · 2026-04-03 17:44:35 发布

小白程序员必看：收藏这份大模型学习指南，轻松掌握Agent-ReAct-Skills-MCP-Tool技术演进

本文从历史角度解析了Agent-ReAct-Skills-MCP-Tool技术的演进过程，详细解释了各概念定位。Skills是面向场景的SOP/最佳实践，解决Token效率问题；MCP解决能力接入问题。两者可配合使用，MCP负责工具调用，Skills负责业务流程编排。文章还讨论了Skills的局限性、企业应用策略及开源市场，认为Skills将成为企业构建智能体平台的关键组件。对于想要学习大模型技术的程序员，本文提供了实用的学习资源和成长路线图，帮助读者从零基础入门到精通。

发展历史

当概念太多理不清的时候，我们可以从历史的角度去分析，会发现技术演进是有迹可循的，每个技术的出现都有它的时代背景：

2022-10-06(学术突破)：姚顺雨在论文 Synergizing Reasoning and Acting in Language Models 中系统性地提出了 ReAct（将 Reasoning 与 Acting 结合的范式），通过 Reason + Act 的循环，让模型学会了 想一步，做一步，看一眼反馈，再想下一步，从而解决了CoT缺乏外部反馈以及传统决策模型缺乏更高层规划的问题。
2022-11-30（技术突破）：OpenAPI 的GPT-3.5 诞生，提供了强大的底座，证明了模型具备理解复杂指令并进行逻辑推理的基础能力。
2023-02 (学术突破)：Meta 发布 Toolformer 论文 Toolformer: Language Models Can Teach Themselves to Use Tools。它证明了模型可以通过自监督学习，学会在什么时候调用什么 API（如计算器、日历）来增强自身能力。
2023-03-23 (产品落地)：OpenAI 发布 ChatGPT Plugins。帮助 ChatGPT 访问最新信息、运行计算或使用第三方服务，比如网页浏览器和代码解释器。
2023-06-13 (技术标准化)：OpenAI 推出 Function Calling。它不再纯依赖模糊的 Prompt 完成任务，而是让模型原生支持输出结构化的 JSON，从而让模型能连接到外部工具和系统。
2023.07 - 2024.10（爆发期）：LangChain, AutoGPT, AutoGen 等框架蓬勃发展，工具定义碎片化，Agent 框架生态处于 烟囱式 增长。
2024-11-05（技术标准化）：Anthropic 发布 MCP 开放标准统一 Tool 发现和调用方式，将工具（Tools）和数据（Resources）从特定的 Agent 框架中解耦；
2025-12-16(技术标准化)：cli 工具 claude code 为了解决 Token-Efficency 问题和任务执行的成功率，提出了 Agent Skills 开放标准，让 ReAct 等思维框架能更有效的执行 SOP；

从这个历程看，Agent 的执行能力的标准化 （Function Calling/MCP/Skills） 是在工程化落地过程中会自然发生的。

基础概念

逻辑概念

Function Calling：LLM 原生的结构化能力，通过训练使模型能理解 JSON Schema 并在指令下 生成规范的工具调用请求。
Tool Calling：Agent 层 执行工具并获取反馈的过程，是 Function Calling 在应用逻辑中的具体执行链路。
Agent：Agent 具备规划（Planning）、记忆（Memory）和工具使用（Tool use）能力，能够根据模糊的目标自主决定调用哪些 Skill 和 Tool 来达成目标。
ReAct：Agent 的一种思维方式，ReAct = loop(Reason + Act)。模型在每一步都会交替进行 推理（Reason） 和 行动（Act）。它不仅在脑子里想，还会通过动态执行循环并根据外部工具的反馈来修正下一步的思考。

技术名词

Tool：执行任务的具体实现，通常是具体的 API 接口，负责解决原子的问题，使用工程化封装确定性的解决现实问题。
MCP：模型与工具连接方式，通过 统一工具描述和调用标准，实现 一次开发，多框架通用 的生态兼容。
Skills：面向场景的Skills（SOP/最佳实践）。它是指令（Prompt）、工具链（Tools）与工作流（Workflow）的复合体。Skill 通过预设的逻辑框架（Instruction），解决了 Agent 在复杂任务中 先做什么、后做什么、如何评估好坏 的确定性问题。它是 Agent 实现从单一接口调用到复杂业务流程自动化转换的关键模块。

	概念	角色	描述
Agent	自治实体	决策主体	负责接收指令、感知环境、并驱动整个决策闭环的独立计算实体。
ReAct	认知架构	编排引擎	系统的运行逻辑。动态解决问题的机制（规划 -> 执行 -> 修正）
Skills	领域策略	逻辑封装层	针对特定垂直场景，预定义好的处理流程（SOP）
Tools	原子能力	执行单元	改变环境或获取信息的具体手段（如 API 调用）
MCP	互联标准	连接协议	解耦模型与数据源，建立 AI 与数据/工具之间标准化的连接通道。

Skill 执行示例

以一个后端代码审查的 Agent 为例，介绍 CodeReview Skills 和 React，MCP 的交互过程

渐进式披露

渐进式披露（Progressive disclosure）是 Skills 标准中最关键的设计。
它确保简单理解，而不是预先加载所有内容，从而保持效率：

三阶段加载机制

Agent 在需要时准确获取所需内容（约 100 个 token）: 提供 Skills 的描述信息，快速判断相关性，如：类似书籍的目录
元数据优先加载（< 5k tokens）：详细的工作流程指导，最佳实践和业务规则，如：类似书籍的章节内容
完整指令加载：代码脚本，配置文件，示例数据，如：类似书籍的附录

Progressive disclosure 设计的优点

按需加载资源：不浪费上下文窗口
Token 效率：只加载需要的内容
性能优化：支持大量 Skills 同时存在

Skills 和 MCP 的关系

Skills 和 MCP 定位不同：
MCP 解决 能力接入 问题，如何让 AI 调用外部工具/数据源；
Skills 解决 Token-Efficency 问题，顺带优化了 能力选择 问题，能更好更省的组合能力完成特定领域任务。
Skills 和 MCP 都是arthropic提出并开放的行业标准。
MCP 的传输层有 stdio 和 streamable http 2 种具体的通信协议，有工程化规范（tools/list,tools/call,notifycation），而 Skills 比较轻量，它只在提示词定义标准和加载标准有要求，其他的 ReAct 的具体实现 agent 根据实际情况而定。
在实现中，可先在上下文声明可用的 MCP 工具，然后在 Skills 的 instruction 中指定这些 MCP 工具的使用场景和调用时机。

Skills 和 MCP 如何工程化配合？

MCP 广场，配置 MCPServer（url、header），加载 Tool 列表
Skills 广场，配置 Skills 的 Skills.md(Metadata、Instruction)，Instruction 中可引用 MCP-tools，可选资源（reference，assets，文件引用配置为 OSS 地址）。
智能体配置：配置 system prompt，选择 MCP-tools，选择 Skills。
智能体执行：通过 ReAct，获取 oss 资源，执行的 MCP，多轮执行并获取最终结果

Skills 的局限性

开源的 Skills 中的脚本不具备通用的运行环境，比如 python 脚本，很多脚本的 requirements 对运行环境是有要求的，有的甚至还要本地编译，很可能本地运行不起来。
也就是说 Skills 这方面对用户是有要求的，如果用户不懂编程，最后只能使用 纯提示词的Skills。
而 MCP 可以解决这个环境问题，屏蔽所有的技术环境相关的细节（复杂度），对用户是透明的，开箱即用。

比如高得地图的 MCP，填写一个 key，MCP 地址，就能使用让大模型基于 MCP 进行路线规划。

不过这个局限性，在不确定性的任务场景中，却是 Skills 的优势，script 在本地对 AI 是白盒，Agent 可以按需修改 script 完成任务 (coding)，而 MCP 是已有的工具不具备这个灵活性。

对于需要执行 script 的 Skills，有 3 种处理策略：

本地系统配置好环境，直接执行；
配置特定的 docker 镜像执行；
将 script 封装为 MCP 服务，在 instruction 中引用；

个人使用的话，我倾向于 1-本地执行；
企业工程化，我倾向于 3-MCP封装，这样能最大化复用已有的 MCP 基础设施；

企业 Skills 库的建设

Skills 在企业建设智能体平台过程中，会分 2 类：

通用 Skills，通用的工具使用流程，比如 git 操作，office 文档处理，代码安全扫描，比如写文档的 obsidian Skills，编程用的 superpowers
私有 Skills：企业内部 SOP 和合规规则，比如公司报销流程、考勤规则、客户分级标准；

通用的 Skills 通常从开源社区获取，私有 Skills 则需要企业自驱去做知识的积累沉淀。
注意：Skills 是能够抽象的高维知识（规则/方法论），和具备大量文档和分块的 RAG 知识库有所差别，企业里面混乱的 confluence 知识库是没法直接派上用场的，需要成结构化程度高的，简洁明了能实操的最佳实践才有价值。

## 最后

近期科技圈传来重磅消息：行业巨头英特尔宣布大规模裁员2万人，传统技术岗位持续萎缩的同时，另一番景象却在AI领域上演——AI相关技术岗正开启“疯狂扩招”模式！据行业招聘数据显示，具备3-5年大模型相关经验的开发者，在大厂就能拿到50K×20薪的高薪待遇，薪资差距肉眼可见！

业内资深HR预判：不出1年，“具备AI项目实战经验”将正式成为技术岗投递的硬性门槛。在行业迭代加速的当下，“温水煮青蛙”式的等待只会让自己逐渐被淘汰，与其被动应对，不如主动出击，抢先掌握AI大模型核心原理+落地应用技术+项目实操经验，借行业风口实现职业翻盘！

深知技术人入门大模型时容易走弯路，我特意整理了一套全网最全最细的大模型零基础学习礼包，涵盖入门思维导图、经典书籍手册、从入门到进阶的实战视频、可直接运行的项目源码等核心内容。这份资料无需付费，免费分享给所有想入局AI大模型的朋友！

👇👇扫码免费领取全部内容👇👇

在这里插入图片描述

部分资料展示

1、 AI大模型学习路线图

2、全套AI大模型应用开发视频教程

从入门到进阶这里都有，跟着老师学习事半功倍。

在这里插入图片描述

3、大模型学习书籍&文档

在这里插入图片描述

4、 AI大模型最新行业报告

2025最新行业报告，针对不同行业的现状、趋势、问题、机会等进行系统地调研和评估，以了解哪些行业更适合引入大模型的技术和应用，以及在哪些方面可以发挥大模型的优势。

5、大模型大厂面试真题

整理了百度、阿里、字节等企业近三年的AI大模型岗位面试题，涵盖基础理论、技术实操、项目经验等维度，每道题都配有详细解析和答题思路，帮你针对性提升面试竞争力。

在这里插入图片描述

6、大模型项目实战&配套源码

学以致用，在项目实战中检验和巩固你所学到的知识，同时为你找工作就业和职业发展打下坚实的基础。

👉学会后的收获：👈

• 基于大模型全栈工程实现（前端、后端、产品经理、设计、数据分析等），通过这门课可获得不同能力；

• 能够利用大模型解决相关实际项目需求：大数据时代，越来越多的企业和机构需要处理海量数据，利用大模型技术可以更好地处理这些数据，提高数据分析和决策的准确性。因此，掌握大模型应用开发技能，可以让程序员更好地应对实际项目需求；

• 基于大模型和企业数据AI应用开发，实现大模型理论、掌握GPU算力、硬件、LangChain开发框架和项目实战技能，学会Fine-tuning垂直训练大模型（数据准备、数据蒸馏、大模型部署）一站式掌握；

• 能够完成时下热门大模型垂直领域模型训练能力，提高程序员的编码能力：大模型应用开发需要掌握机器学习算法、深度学习框架等技术，这些技术的掌握可以提高程序员的编码能力和分析能力，让程序员更加熟练地编写高质量的代码。

👇👇扫码免费领取全部内容👇👇

在这里插入图片描述

这些资料真的有用吗？

这份资料由我和鲁为民博士(北京清华大学学士和美国加州理工学院博士)共同整理，现任上海殷泊信息科技CEO，其创立的MoPaaS云平台获Forrester全球’强劲表现者’认证，服务航天科工、国家电网等1000+企业，以第一作者在IEEE Transactions发表论文50+篇，获NASA JPL火星探测系统强化学习专利等35项中美专利。本套AI大模型课程由清华大学-加州理工双料博士、吴文俊人工智能奖得主鲁为民教授领衔研发。

资料内容涵盖了从入门到进阶的各类视频教程和实战项目，无论你是小白还是有些技术基础的技术人员，这份资料都绝对能帮助你提升薪资待遇，转行大模型岗位。
在这里插入图片描述