0 代码搭建实战:用 SF-FastGPT 打造一个 RAG + MCP 的 Agent 学习助手

目录
3.第一步:把 Hello Agent 文档导入知识库(RAG 的地基)
4.第二步:搭一个最基础的 RAG 智能体(先让它会"查书")
5.第三步(重头戏):RAG 知识库 + MCP 工具的进阶工作流
学 Agent 最痛的不是看不懂概念,而是——概念能背,落不了地。
RAG、MCP、Skill 这些词张口就来,可真到配工作流、调检索命中、接外部工具时,问题出在哪根本说不清。
这篇文章,我用 SF-FastGPT,0 代码纯拖拽,手把手带你搭一个能 "查知识库 + 联网检索 + 综合排错" 的 Agent 学习辅助老师。全程截图,照着抄就能跑。阅读本文你将收获:① 一套可复用的 RAG + MCP 工作流搭建套路;② RAG / MCP / Skill 的彻底搞懂。
0.读前须知:这篇文章适合谁
- 想入门 Agent,但一动手就懵的同学 —— 跟着抄,十几分钟跑通第一个 Agent。
- 会用 大模型,但没搭过工作流的开发者 —— 理解"检索增强 + 工具调用"是怎么编排起来的。
- 企业里要做内部知识库助手 / 培训助手的同学 —— 本文的套路可直接平移到业务场景。
不需要任何编程基础,会拖拽、会填表单就行。
1.先说痛点:为什么初学者学 Agent 总在"原地打转"
带过几个想入门 Agent 的朋友后,我发现大家卡点高度一致:
- 术语更新太快:Agent、RAG、MCP、Skill、工作流……名词一大堆,看十篇文章十种说法。
- 会背不会用:能复述"RAG 就是检索增强生成",但让他配一个能命中知识库的智能体,直接懵。
- 排错没头绪:检索没命中?提示词不生效?工具没调用?三个问题混在一起,根本不知道从哪查。
我把这种状态总结为一句话:"概念在云端,双手在地面,中间隔着一条看不见的工作流。"
所以我的思路很简单:与其讲一堆理论,不如直接搭一个"老师"出来——它自己就是 RAG + MCP 的活教材,还能反过来教你怎么用。
这就是本文的作品:Agent 学习辅助老师(SF-FastGPT)。
它的核心能力有四个:
|
能力 |
解决什么问题 |
背后技术 |
|
RAG 知识库问答 |
回答有依据、可溯源,少编造 |
检索增强生成 |
|
MCP 工具检索 |
知识库覆盖不到的最新资料,联网补 |
MCP 协议 + 外部工具 |
|
Skill / 工具化思维教学 |
帮你把能力拆成可复用单元 |
工作流编排思维 |
|
实操排错 |
"现象→原因→排查→修复"定位问题 |
结构化提示词 |
下面进入正题,全程实操。
2.整体架构:先看懂这张图,再动手
动手前,先建立全局认知。整个 Agent 老师的工作链路是这样的:

一句话概括架构哲学:"先翻书,书里没有再上网,最后老师综合讲给你听。"
记住这张图,下面所有步骤都是在实现它。
3.第一步:把 Hello Agent 文档导入知识库(RAG 的地基)
RAG 的本质是"先查再答",所以第一步要先给模型一个"可查的书架"。
操作很简单:
- 提前下载好 Hello Agent 官方 PDF。
- 进入 SF-FastGPT,选择 通用知识库 导入。
- 上传 PDF,等待系统自动切分、向量化。


小 Tip:RAG 为什么能减少大模型幻觉?
大模型本质是"根据概率接话",没有依据时容易一本正经地胡说。RAG 的做法是:回答前先去知识库里捞出最相关的几段原文,让模型"看着材料答题"。有了出处约束,模型就从"凭记忆瞎编"变成了"照着资料总结",幻觉自然大幅下降。一句话——RAG 给模型发了一本开卷考试的参考书。
避坑提醒:导入不是"传完就行"
上传 PDF 后,一定要去看切片(chunk)结果。如果一份文档只切出了寥寥几片,或者切片内容明显错乱(比如表格被切碎、段落被拦腰截断),后面检索命中率会很差。好的切片,是高命中率 RAG 的隐形地基。
知识库这一步搞定,地基就有了。
4.第二步:搭一个最基础的 RAG 智能体(先让它会"查书")
地基有了,先搭最小可用版本——只接知识库的基础智能体,确保 RAG 链路能跑通。
工程思维:为什么不一步到位直接搭复杂工作流?
这是搭 Agent 的一个重要习惯——先跑通最小链路(MVP),再逐步加料。如果一上来就把 RAG + MCP + 条件分支全堆上,一旦出问题,你根本分不清是知识库的锅还是工具的锅。分阶段验证,是排错效率最高的工作方式。
4.1 创建智能体
在 SF-FastGPT 里新建一个应用。

4.2 基础配置(接入 RAG)
关键就一步:在配置里关联刚才导入的知识库,让模型回答前先走一遍知识库检索。

这里有个容易被忽略的细节——系统提示词(System Prompt)。建议加一句类似:
"回答前请优先检索知识库,基于检索到的内容作答,并说明依据;若知识库无相关内容,再据实说明。"
这能让模型的行为更可控,避免它"懒得查、直接凭记忆答"。
4.3 测试 RAG 命中
配完别急着上线,一定要测命中。随便问一个 Hello Agent 文档里有的概念,看看:
- 模型有没有真的检索到知识库片段?
- 引用的来源对不对?

小 Tip:检索没命中怎么排?(新手必背排查顺序)
按这个顺序查最快:
① 知识库有没有导入成功 —— 看切片数量是否正常;
② 问题措辞和原文是否差太远 —— 向量检索靠语义相似度,换个更贴近原文的问法试试;
③ 相似度阈值是不是设太高 —— 阈值太高会把本该命中的片段过滤掉,适当调低;
④ 检索数量(topK)够不够 —— 设太小可能漏掉相关片段。
一步步缩小范围,比瞎调参数高效得多。
到这里,一个会查书的 RAG 智能体就成了。但它有个硬伤——只会查书里的内容,书里没有的就抓瞎。
这就引出了进阶版。
5.第三步(重头戏):RAG 知识库 + MCP 工具的进阶工作流
我的目标很明确:
让模型的回答 = 知识库已有内容 + MCP 联网检索的最新内容,最终给出一个综合答案。
这样既保证了"有依据",又解决了"知识库覆盖不到最新资料"的问题。
5.1 为什么要加 MCP?
RAG 的知识库是"静态"的——你导入什么它就只知道什么。但 Agent 领域日新月异,平台能力、新工具、新文档随时更新。MCP(Model Context Protocol)的价值,就是给智能体接上"外部世界的手",需要时主动去联网、查数据库、解析文档。
小 Tip:一句话讲清 MCP / Tool / Skill 的区别
- Tool(工具):一个具体的能力,比如"网页搜索""查天气",是最小执行单元。
- MCP(协议):一套标准化的"工具接入规范",让智能体能统一地发现、调用各种外部工具,相当于"工具的插座标准"。
- Skill(技能):把一个或多个工具 + 流程封装成可复用的能力包,比如"竞品调研 Skill"内部可能就调用了搜索 + 摘要多个工具。
类比一下:
一句话:Tool 是螺丝刀,MCP 是插座标准,Skill 是装修工具箱。
|
概念 |
类比 |
角色 |
|
Tool |
螺丝刀 |
单个具体能力 |
|
MCP |
统一的插座/接口标准 |
让工具能被标准化接入 |
|
Skill |
一整套装修工具箱 |
能力 + 流程的封装包 |
5.2 选择并新建 MCP 工具
在工作流里添加 MCP 节点,选择需要的工具(如网页搜索类)。

{
"mcpServers": {
"fetch": {
"type": "sse",
"url": "https://mcp.api-inference.modelscope.net/**********/sse"
}
}
}
配置过程中,系统会有相应的配置提示,按提示填好对应参数即可。

避坑提醒:MCP 接入最容易栽在这几处
① 参数没填全 / 填错 —— 严格按系统提示来,少一个必填项就调不通;
② 网络 / 权限问题 —— 联网类工具要确认环境能访问外网;
③ 没单独测工具 —— 建议先单独触发一次 MCP 工具,确认它本身能返回结果,再接进主工作流。先验证零件,再组装整机。
5.3 编排"知识库检索 + 工具调用"工作流
这一步是核心。在工作流编排里,把链路串成:
用户提问 → 先走知识库检索 → 判断知识库是否足够 → 不足则调用 MCP 联网检索 → 汇总知识库片段 + 检索结果 → 大模型综合输出

编排时的几个关键点:
- 数据流要接对:知识库检索节点的输出,要正确传给后续的汇总 / 大模型节点;
- 提示词要"指挥"模型综合:在最终回答节点的提示词里,明确要求模型"结合知识库内容和检索结果,给出结论、原因和建议";
- 善用条件判断:让模型在知识库足够时不必多此一举地联网,既省 token 又快。
💡 小 Tip:怎么验证这个工作流真的"两条腿走路"?
问它两类问题对比测试:
① 问一个知识库里明确有的概念 → 看是否走 RAG、引用了文档片段;
② 问一个知识库里没有、需要最新资料的问题 → 看是否触发了 MCP 联网检索。
两类都正确,才说明"RAG + MCP"真正打通了。
5.4 最终效果


搭完之后,这个 Agent 老师回答问题时会:
- 优先查知识库,基于命中片段作答,给出依据;
- 知识库不够时,自动联网补充最新资料;
- 最终输出一个 "结论 → 原因 → 可执行建议" 的结构化综合回答。
6.实测三问:这个 Agent 老师到底好不好用
搭完得验货。我用三个有代表性的问题做了测试:
Q1:请用初学者能听懂的方式解释 RAG,并说明它为什么能减少大模型幻觉。
→ 它走了知识库,结合 Hello Agent 文档给出了"开卷考试"式的通俗解释,并附带了出处。✅ 命中链路:纯 RAG

Q2:MCP、Tool、Skill 三者有什么区别?请结合 Agent 工作流举例说明。
→ 知识库里有相关内容,命中 RAG,给出了带工作流举例的清晰对比。✅ 命中链路:RAG
Q3:我想让回答同时参考 Hello Agent 知识库和网上最新资料,SF-FastGPT 工作流应该如何配置和验证?
→ 这个问题涉及最新平台操作,它触发了 MCP 联网检索,给出了配置 + 验证的完整步骤。✅ 命中链路:RAG + MCP
三个问题分别命中了 纯 RAG、RAG、RAG + MCP 三种链路,说明工作流编排是有效的——这也正是验收一个混合工作流最直接的方法:用不同类型的问题,把每条路径都"踩"一遍。
7.一点客观测评:SF-FastGPT 用下来的感受

抛开教程,单纯聊聊体验:
- 优点 1 —— 0 代码、纯拖拽:知识库导入、RAG 配置、MCP 接入全程可视化,对不写代码的同学极其友好,搭一个能跑的 Agent 真的只要十几分钟。
- 优点 2 —— RAG + MCP 组合丝滑:知识库的"稳"和联网检索的"新"结合得很自然,工作流编排逻辑清晰,节点之间的数据流转一目了然。
- 优点 3 —— 复用性强:知识库只要换 PDF / 文档就能迁移到新场景;MCP 工具还能扩展到网页搜索、数据库查询、文档解析等更多 Skill。
- 可提升点:进阶工作流的节点配置对纯新手仍有一点学习门槛,"判断知识库是否足够"这类条件分支,建议官方多给几个开箱即用的模板。
总体而言,作为课程助教、企业内部 Agent 培训助手,甚至工作流配置顾问,它的迁移价值都很高——你完全可以把"学习老师"换成"财务问答助手""产品知识库客服",底层套路一模一样。
延伸思考:这套套路还能怎么玩?
- 换知识库 → 企业产品手册客服
- 换 MCP 工具为数据库查询 → 业务数据问答助手
- 加文档解析工具 → 合同 / 报告自动摘要助手
学会这一个,等于解锁了一整类应用。
8.写在最后
这一篇,我们从 0 到 1 走完了:
导入知识库 → 搭基础 RAG 智能体 → 测命中 → 升级成 RAG + MCP 进阶工作流 → 实测验证 → 避坑总结
整个过程没写一行代码,全靠拖拽和配置。如果你也在学 Agent,强烈建议亲手搭一遍——比看十篇理论文章都管用。毕竟,最好的学习方式,就是亲手造一个能教你的老师。
更多推荐


所有评论(0)