0 代码搭建实战：用 SF-FastGPT 打造一个 RAG + MCP 的 Agent 学习助手

学 Agent 最痛的不是看不懂概念，而是——概念能背，落不了地。
RAG、MCP、Skill 这些词张口就来，可真到配工作流、调检索命中、接外部工具时，问题出在哪根本说不清。
这篇文章，我用 SF-FastGPT，0 代码纯拖拽，手把手带你搭一个能 "查知识库 + 联网检索 + 综合排错" 的 Agent 学习辅助老师。全程截图，照着抄就能跑。

阅读本文你将收获：① 一套可复用的 RAG + MCP 工作流搭建套路；② RAG / MCP / Skill 的彻底搞懂。

0.读前须知：这篇文章适合谁

想入门 Agent，但一动手就懵的同学 —— 跟着抄，十几分钟跑通第一个 Agent。
会用大模型，但没搭过工作流的开发者 —— 理解"检索增强 + 工具调用"是怎么编排起来的。
企业里要做内部知识库助手 / 培训助手的同学 —— 本文的套路可直接平移到业务场景。

不需要任何编程基础，会拖拽、会填表单就行。

1.先说痛点：为什么初学者学 Agent 总在"原地打转"

带过几个想入门 Agent 的朋友后，我发现大家卡点高度一致：

术语更新太快：Agent、RAG、MCP、Skill、工作流……名词一大堆，看十篇文章十种说法。
会背不会用：能复述"RAG 就是检索增强生成"，但让他配一个能命中知识库的智能体，直接懵。
排错没头绪：检索没命中？提示词不生效？工具没调用？三个问题混在一起，根本不知道从哪查。

我把这种状态总结为一句话："概念在云端，双手在地面，中间隔着一条看不见的工作流。"

所以我的思路很简单：与其讲一堆理论，不如直接搭一个"老师"出来——它自己就是 RAG + MCP 的活教材，还能反过来教你怎么用。

这就是本文的作品：Agent 学习辅助老师（SF-FastGPT）。

它的核心能力有四个：

能力	解决什么问题	背后技术
RAG 知识库问答	回答有依据、可溯源，少编造	检索增强生成
MCP 工具检索	知识库覆盖不到的最新资料，联网补	MCP 协议 + 外部工具
Skill / 工具化思维教学	帮你把能力拆成可复用单元	工作流编排思维
实操排错	"现象→原因→排查→修复"定位问题	结构化提示词

下面进入正题，全程实操。

2.整体架构：先看懂这张图，再动手

动手前，先建立全局认知。整个 Agent 老师的工作链路是这样的：

一句话概括架构哲学："先翻书，书里没有再上网，最后老师综合讲给你听。"

记住这张图，下面所有步骤都是在实现它。

3.第一步：把 Hello Agent 文档导入知识库（RAG 的地基）

RAG 的本质是"先查再答"，所以第一步要先给模型一个"可查的书架"。

操作很简单：

提前下载好 Hello Agent 官方 PDF。
进入 SF-FastGPT，选择 通用知识库 导入。
上传 PDF，等待系统自动切分、向量化。

小 Tip：RAG 为什么能减少大模型幻觉？
大模型本质是"根据概率接话"，没有依据时容易一本正经地胡说。RAG 的做法是：回答前先去知识库里捞出最相关的几段原文，让模型"看着材料答题"。有了出处约束，模型就从"凭记忆瞎编"变成了"照着资料总结"，幻觉自然大幅下降。一句话——RAG 给模型发了一本开卷考试的参考书。

避坑提醒：导入不是"传完就行"
上传 PDF 后，一定要去看切片（chunk）结果。如果一份文档只切出了寥寥几片，或者切片内容明显错乱（比如表格被切碎、段落被拦腰截断），后面检索命中率会很差。好的切片，是高命中率 RAG 的隐形地基。

知识库这一步搞定，地基就有了。

4.第二步：搭一个最基础的 RAG 智能体（先让它会"查书"）

地基有了，先搭最小可用版本——只接知识库的基础智能体，确保 RAG 链路能跑通。

工程思维：为什么不一步到位直接搭复杂工作流？
这是搭 Agent 的一个重要习惯——先跑通最小链路（MVP），再逐步加料。如果一上来就把 RAG + MCP + 条件分支全堆上，一旦出问题，你根本分不清是知识库的锅还是工具的锅。分阶段验证，是排错效率最高的工作方式。

4.1 创建智能体

在 SF-FastGPT 里新建一个应用。

4.2 基础配置（接入 RAG）

关键就一步：在配置里关联刚才导入的知识库，让模型回答前先走一遍知识库检索。

这里有个容易被忽略的细节——系统提示词（System Prompt）。建议加一句类似：

"回答前请优先检索知识库，基于检索到的内容作答，并说明依据；若知识库无相关内容，再据实说明。"

这能让模型的行为更可控，避免它"懒得查、直接凭记忆答"。

4.3 测试 RAG 命中

配完别急着上线，一定要测命中。随便问一个 Hello Agent 文档里有的概念，看看：

模型有没有真的检索到知识库片段？
引用的来源对不对？

小 Tip：检索没命中怎么排？（新手必背排查顺序）
按这个顺序查最快：
① 知识库有没有导入成功 —— 看切片数量是否正常；
② 问题措辞和原文是否差太远 —— 向量检索靠语义相似度，换个更贴近原文的问法试试；
③ 相似度阈值是不是设太高 —— 阈值太高会把本该命中的片段过滤掉，适当调低；
④ 检索数量（topK）够不够 —— 设太小可能漏掉相关片段。
一步步缩小范围，比瞎调参数高效得多。

到这里，一个会查书的 RAG 智能体就成了。但它有个硬伤——只会查书里的内容，书里没有的就抓瞎。

这就引出了进阶版。

5.第三步（重头戏）：RAG 知识库 + MCP 工具的进阶工作流

我的目标很明确：

让模型的回答 = 知识库已有内容 + MCP 联网检索的最新内容，最终给出一个综合答案。

这样既保证了"有依据"，又解决了"知识库覆盖不到最新资料"的问题。

5.1 为什么要加 MCP？

RAG 的知识库是"静态"的——你导入什么它就只知道什么。但 Agent 领域日新月异，平台能力、新工具、新文档随时更新。MCP（Model Context Protocol）的价值，就是给智能体接上"外部世界的手"，需要时主动去联网、查数据库、解析文档。

小 Tip：一句话讲清 MCP / Tool / Skill 的区别

Tool（工具）：一个具体的能力，比如"网页搜索""查天气"，是最小执行单元。
MCP（协议）：一套标准化的"工具接入规范"，让智能体能统一地发现、调用各种外部工具，相当于"工具的插座标准"。
Skill（技能）：把一个或多个工具 + 流程封装成可复用的能力包，比如"竞品调研 Skill"内部可能就调用了搜索 + 摘要多个工具。

类比一下：

一句话：Tool 是螺丝刀，MCP 是插座标准，Skill 是装修工具箱。

概念	类比	角色
Tool	螺丝刀	单个具体能力
MCP	统一的插座/接口标准	让工具能被标准化接入
Skill	一整套装修工具箱	能力 + 流程的封装包

5.2 选择并新建 MCP 工具

在工作流里添加 MCP 节点，选择需要的工具（如网页搜索类）。

{
  "mcpServers": {
    "fetch": {
      "type": "sse",
      "url": "https://mcp.api-inference.modelscope.net/**********/sse"
    }
  }
}

配置过程中，系统会有相应的配置提示，按提示填好对应参数即可。

避坑提醒：MCP 接入最容易栽在这几处
① 参数没填全 / 填错 —— 严格按系统提示来，少一个必填项就调不通；
② 网络 / 权限问题 —— 联网类工具要确认环境能访问外网；
③ 没单独测工具 —— 建议先单独触发一次 MCP 工具，确认它本身能返回结果，再接进主工作流。先验证零件，再组装整机。

5.3 编排"知识库检索 + 工具调用"工作流

这一步是核心。在工作流编排里，把链路串成：

用户提问 → 先走知识库检索 → 判断知识库是否足够 → 不足则调用 MCP 联网检索 → 汇总知识库片段 + 检索结果 → 大模型综合输出

编排时的几个关键点：

数据流要接对：知识库检索节点的输出，要正确传给后续的汇总 / 大模型节点；
提示词要"指挥"模型综合：在最终回答节点的提示词里，明确要求模型"结合知识库内容和检索结果，给出结论、原因和建议"；
善用条件判断：让模型在知识库足够时不必多此一举地联网，既省 token 又快。

💡 小 Tip：怎么验证这个工作流真的"两条腿走路"？
问它两类问题对比测试：
① 问一个知识库里明确有的概念 → 看是否走 RAG、引用了文档片段；
② 问一个知识库里没有、需要最新资料的问题 → 看是否触发了 MCP 联网检索。
两类都正确，才说明"RAG + MCP"真正打通了。

5.4 最终效果

搭完之后，这个 Agent 老师回答问题时会：

优先查知识库，基于命中片段作答，给出依据；
知识库不够时，自动联网补充最新资料；
最终输出一个 "结论 → 原因 → 可执行建议" 的结构化综合回答。

6.实测三问：这个 Agent 老师到底好不好用

搭完得验货。我用三个有代表性的问题做了测试：

Q1：请用初学者能听懂的方式解释 RAG，并说明它为什么能减少大模型幻觉。
→ 它走了知识库，结合 Hello Agent 文档给出了"开卷考试"式的通俗解释，并附带了出处。✅ 命中链路：纯 RAG

Q2：MCP、Tool、Skill 三者有什么区别？请结合 Agent 工作流举例说明。
→ 知识库里有相关内容，命中 RAG，给出了带工作流举例的清晰对比。✅ 命中链路：RAG

Q3：我想让回答同时参考 Hello Agent 知识库和网上最新资料，SF-FastGPT 工作流应该如何配置和验证？
→ 这个问题涉及最新平台操作，它触发了 MCP 联网检索，给出了配置 + 验证的完整步骤。✅ 命中链路：RAG + MCP

三个问题分别命中了 纯 RAG、RAG、RAG + MCP 三种链路，说明工作流编排是有效的——这也正是验收一个混合工作流最直接的方法：用不同类型的问题，把每条路径都"踩"一遍。

7.一点客观测评：SF-FastGPT 用下来的感受

抛开教程，单纯聊聊体验：

优点 1 —— 0 代码、纯拖拽：知识库导入、RAG 配置、MCP 接入全程可视化，对不写代码的同学极其友好，搭一个能跑的 Agent 真的只要十几分钟。
优点 2 —— RAG + MCP 组合丝滑：知识库的"稳"和联网检索的"新"结合得很自然，工作流编排逻辑清晰，节点之间的数据流转一目了然。
优点 3 —— 复用性强：知识库只要换 PDF / 文档就能迁移到新场景；MCP 工具还能扩展到网页搜索、数据库查询、文档解析等更多 Skill。
可提升点：进阶工作流的节点配置对纯新手仍有一点学习门槛，"判断知识库是否足够"这类条件分支，建议官方多给几个开箱即用的模板。

总体而言，作为课程助教、企业内部 Agent 培训助手，甚至工作流配置顾问，它的迁移价值都很高——你完全可以把"学习老师"换成"财务问答助手""产品知识库客服"，底层套路一模一样。

延伸思考：这套套路还能怎么玩？

换知识库 → 企业产品手册客服
换 MCP 工具为数据库查询 → 业务数据问答助手
加文档解析工具 → 合同 / 报告自动摘要助手
学会这一个，等于解锁了一整类应用。

8.写在最后

这一篇，我们从 0 到 1 走完了：

导入知识库 → 搭基础 RAG 智能体 → 测命中 → 升级成 RAG + MCP 进阶工作流 → 实测验证 → 避坑总结

整个过程没写一行代码，全靠拖拽和配置。如果你也在学 Agent，强烈建议亲手搭一遍——比看十篇理论文章都管用。毕竟，最好的学习方式，就是亲手造一个能教你的老师。

MCP技术社区

欢迎加入 MCP 技术社区！与志同道合者携手前行，一同解锁 MCP 技术的无限可能！

更多推荐

Havenlon 对抗性完整（十四）：AI Agent 出错时，系统应该怎么失败

MCP技术社区

AI Agent 超100万上下文处理技术· 深度研究报告

超100万token上下文是AI Agent面试核心考点。矛盾在于窗口再大模型也只看首尾（Lost in the Middle的U型曲线）。工程上分五层应对：短期记忆靠上下文缩减/卸载控制token预算；长期记忆靠Mem0/Zep等框架持久化检索；压缩靠LLMLingua选择性剔除冗余；KV Cache靠MLA/PagedAttention降内存；前沿以MemGPT虚拟内存和Titans神经记忆为