你给大模型(大脑)一段Prompt(指令),它消耗Token(脑力)思考。但光思考没用,所以有了Agent(机器人),给它装上Skill(工作流程)、连上MCP(万能工具接口),它就能干活了。几个这样的Agent凑一起就是多智能体(生产线)。Claude Code 和 OpenClaw 就是两个现成的、专门干活的Agent(一个写代码,一个控电脑)。

1. Token:大模型吃饭用的“米粒”

大白话: 大模型不认识“字”,它认识的是“Token”。你可以把Token理解为它处理信息的最小单位

  • 一个汉字可能是1-2个Token。

  • 一个英文单词可能是一个或多个Token。

举个例子: “我爱AI” 可能被拆成 “我”、“爱”、“AI” 三个Token。

  • 作用: 大模型根据你给它的Token数量来“收费”和“计工作量”。你说的话(输入)和它回答的话(输出),都是Token。上下文越长,Token越多,它“想”得就越累(也越贵)。


2. Prompt:你跟这个“大脑”说的话

大白话: 就是你向AI提问时,输入的那段指令。它是你和AI交流的唯一语言。

例子:

  • 烂Prompt: “写首诗” → AI给你一首打油诗。

  • 好Prompt: “请以李白豪放派的风格,写一首七言绝句,主题是赞美秋天的长城,要体现出历史的沧桑感。” → AI写出来的就像模像样了。

联系: Prompt是启动一切的命令。你给大模型一个好Prompt,它就能发挥得好。你给Agent(下面讲)一个任务Prompt,它就知道该干嘛。


3. Agent(智能体):给“大脑”装上“手和脚”

大白话: Agent就是那个被放出了玻璃房子、并且配上了各种工具的天才。它不仅能想,还能自己动手去做

一个典型的Agent = 大模型(大脑) + 工具(手和脚) + 规划能力(做事的方法)

它怎么干活?你告诉Agent:“帮我订一张明天去上海最便宜的高铁票。”

  1. 思考(大脑): “主人要订票,我得先查明天车次和价格。”

  2. 行动(手脚): 它自己打开浏览器(调用工具),登录12306网站,查信息。

  3. 再思考: “对比一下,这趟10点的最便宜。”

  4. 再行动: 它尝试帮你填写订单、付款。

  5. 反馈: “主人,已找到最便宜车次G101,票价500元,需要我帮你下单吗?”

关键区别:

  • 大模型:只会说“你该订票了”。

  • Agent:直接动手帮你“把票订了”。


4. MCP(模型上下文协议):Agent的“USB万能接口”

大白话: 以前,你想让Agent连你的电脑、连数据库、连微信,每个连接都得专门写代码,特别麻烦,像给每种电器配一个专用充电器。MCP就是统一的Type-C接口

只要Agent支持MCP,你给它插上一个“MCP服务器”(相当于一个转接头或驱动),它就能立刻:

  • 读取你电脑上的所有文件。

  • 操作Photoshop画图。

  • 查询你的公司数据库。

  • 控制你家的智能灯泡。

总结: MCP让Agent的“手脚”变得即插即用,大大扩展了它的能力范围。


5. Skill(技能):Agent的“预制菜”或“快捷方式”

大白话: 一个任务往往包含很多步骤。如果你每次都让Agent“从头思考每一步”,它可能会犯错,而且很慢。Skill就是把完成一项特定任务的最佳流程,打包成一个“一键启动”的按钮。

例子: 你想让Agent帮你写一篇小红书爆款笔记。

  • 不用Skill: 你得一步步教它:“先去微博找热点,再用网络流行语润色,加一些emoji,最后加上话题标签……” 说一大堆,累死了。

  • 用Skill: 你只要说一句“使用小红书写手技能”,这个Skill背后已经定义好了所有步骤(找热点、定人设、写标题、加标签、配表情)。Agent就会自动按这个最佳流程干活。

和Agent的关系: Agent是通用的“机器人”,Skill是给这个机器人安装的“岗位培训手册”或“工作流模板”。有了更多Skill,Agent干特定活就更专业、更稳定。


6. 多智能体(Multi-Agent):一个“AI复仇者联盟”

大白话: 一个Agent再厉害,也可能分身乏术。多智能体就是让多个各有专长的Agent凑在一起,互相配合完成一个复杂的大任务。

经典例子: 让你开发一个手机APP。

  • 产品经理Agent:负责分析需求,写设计文档。

  • 程序员Agent:负责写代码。

  • 测试员Agent:负责找Bug。

  • 设计师Agent:负责画界面。

  • 运维Agent:负责部署上线。

怎么协作? 它们可以开会、传递任务。程序员Agent写一段代码,立刻交给测试员Agent去测,测出问题再返回给程序员Agent修改。最后,运维Agent拿过最终代码,直接部署。

区别: 一个Agent是单打独斗的英雄,多智能体是一个有组织、有分工的团队


7. Claude Code & OpenClaw:两个具体的“明星产品”

Claude Code(Anthropic公司出的)

大白话: 这是一个专门为程序员设计的Agent。你可以在命令行里运行它,告诉它“帮我修好登录页面的那个Bug”,它就会自己分析你的代码、找到错误、修改文件、甚至运行测试。它是一个具体能用的产品

OpenClaw

大白话: 这是一个开源项目,它的目标就是让你能像控制Claude Code一样,控制一个能操作你电脑桌面的Agent。你可以理解为“电脑版自动驾驶AI”。你告诉它“帮我做个PPT,里面放上这个月的销售数据”,它就会自己去打开Excel、复制数据、打开PPT、粘贴、排版。OpenClaw更像一个实现方案或工具集,而不是一个最终产品(因为它开源,你可以自己搭建)。


最后,一张图总结所有区别和联系:

想象一个汽车制造厂(多智能体系统):

概念

比喻

大白话解释

大模型 一个有天赋的学徒的大脑

很聪明,能学习,但没经验,也没工具,只会空想。

Token 学徒思考时消耗的“脑细胞”

处理每个字、每件事都要消耗它,越多它越累。

Prompt 你对学徒下的指令

“给我造个车门”。指令好坏,决定结果好坏。

Skill 一份“造车门的标准作业流程图”

把“选材、冲压、焊接、喷漆”这系列步骤打包好,学徒按图操作,又快又好。

MCP 学徒手里的“万能扳手套装”

能拧任何螺丝、接任何管道,想操作什么机器就换什么头。

Agent 一个全能的“造车门工位机器人”

它有大脑(大模型)、有流程(Skill)、有工具(MCP),能独立完成“造车门”这个任务。

多智能体 整个汽车制造厂

有造车门的Agent,有造发动机的Agent,有组装整车的Agent,它们协作造出一辆完整的车。

Claude Code 工厂里一个专门“修代码Bug”的机器人

一个已经造好的、专门干编程活的Agent产品。

OpenClaw 一套教机器人“操作电脑鼠标键盘”的开源图纸

你自己可以照着图纸,造一个能像人一样操作你电脑的Agent。

Logo

欢迎加入 MCP 技术社区!与志同道合者携手前行,一同解锁 MCP 技术的无限可能!

更多推荐