大家好,我是深耕人工智能与智能体开发领域的开发者。本篇是智能体平台开发系列第二篇,上一篇我们系统学习了提示词工程的核心原理与进阶技术,掌握了约束大模型输出的底层方法。而在真实的智能体开发场景中,除了提示词设计,我们还需要整合工具调用、知识库、数据库、多模态能力等多个模块,从零搭建完整智能体的开发成本较高。Coze 作为低代码智能体开发平台,通过可视化拖拉拽的方式即可快速完成模型、工具、知识的组合,大幅降低了智能体的开发门槛。

一、智能体核心架构认知

1.1 智能体的核心定义

智能体(Agent)是以大语言模型作为思考中枢,搭配记忆能力、任务规划能力与工具使用能力形成的智能系统。和仅能被动回答问题的大模型相比,智能体可以主动接收用户目标,自主规划步骤、调用工具、执行操作,最终完成复杂任务,实现了从 “被动回答问题” 到 “主动完成任务” 的能力升级。

1.2 智能体的五大核心模块

一个完整的智能体由五大核心模块组成,各模块协同完成任务闭环:

  1. 中枢模块(Agent 大脑):是整个智能体的控制中心,负责统筹所有模块,接收用户目标后,调度规划、记忆、工具、行动模块协同工作,遵循 ReAct 的思考 + 行动范式。
  2. 记忆模块:用于保存历史对话、过往执行结果、工具返回信息,让智能体记住之前做过什么、结果是什么,避免重复操作,保障多轮任务的连贯性。
  3. 规划模块(任务规划):核心承担两件事,第一是任务拆解,将用户的复杂目标拆解为一步步可执行的小任务;第二是反思与完善,根据记忆中的历史结果,判断当前步骤是否正确,是否需要调整计划。
  4. 工具模块:是智能体突破大模型信息孤岛的核心,支持智能体主动调用外部能力获取实时信息、执行计算操作。常见的工具包括搜索工具、计算工具、代码解释器等。
  5. 行动模块:执行规划好的步骤,调用对应的工具完成检索、推理、编程等实际操作,最终将结果输出给用户,同时把执行结果存入记忆模块,形成完整闭环。

二、Coze 平台基础概述

2.1 平台定位

Coze 是一款低代码智能体开发平台,基于网页端运行,全程联网操作。开发者无需编写大量代码,通过鼠标拖拉拽的方式,即可自由完成大模型、工具、知识库、数据库的组合,快速搭建符合业务需求的各类智能体。

2.2 平台核心价值

  1. 降低开发门槛:无需从零搭建模型服务、开发工具接口,平台内置丰富的现成资源,直接调用即可使用;
  2. 提升开发效率:可视化编排工作流,所见即所得,大幅缩短智能体从需求到落地的周期;
  3. 能力体系完整:覆盖文本交互、多模态处理、知识库、数据库、插件扩展等全场景能力,适配从简单问答到复杂业务系统的各类需求。

三、Coze 平台核心资源模块

Coze 的所有能力以资源库的形式提供,开发者可按需取用组合,核心包含七大类资源:

3.1 插件

插件是智能体的扩展技能,相当于智能体可以调用的外部工具。平台内置大量官方与第三方插件,覆盖联网搜索、天气查询、车票查询、硬件控制等各类功能,开发者也可以自定义开发专属插件,扩展平台能力边界。

3.2 知识库

知识库是外挂的知识集合,支持上传 PDF、Word 等格式的文档资料,作为模型回答问题的参考依据,用于补充大模型的领域知识不足,减少事实性幻觉。

3.3 数据库

数据库以二维表格的形式存储结构化数据,可供智能体查询、新增、修改、删除,用于管理业务数据,比如员工信息表、面试题库、商品清单等。

3.4 提示词

提示词资源用于存储开发者预置的优质提示词模板,开发过程中可以随时取用,保障提示词的规范性与复用性,提升工作流搭建效率。

3.5 音色

音色资源用于语音合成场景,提供多种风格的发音音色,支持智能体输出语音内容,适配语音交互类的智能体需求。

3.6 记忆库

记忆库用于存储智能体的历史交互信息与用户画像,让智能体可以记住用户偏好、过往对话内容,实现个性化的多轮交互。

3.7 工作流

工作流是一类特殊的资源,本质是一个 DAG 有向无环图,也就是有方向、无闭环的工作流程图。工作流中的每一个节点,可以是插件、数据库、知识库、大模型等各类资源,通过节点串联实现固定业务流程的自动化执行。

四、工作流核心设计方法

工作流是 Coze 中实现复杂业务逻辑的核心载体,掌握工作流的设计方法是开发智能体的关键。

4.1 工作流的核心特征

  1. 结构上遵循有向无环图规则,有明确的开始节点与结束节点,节点之间按执行方向串联,不会形成循环闭环;
  2. 每个节点承担单一职责,比如信息抽取、数据查询、工具调用、内容生成等,节点之间传递数据,协同完成完整任务;
  3. 支持分支、循环、选择器等逻辑控制,可以实现条件判断、循环批量处理等复杂流程。

4.2 工作流设计核心技巧

4.2.1 巧用大模型节点做逻辑判断

大模型节点不仅可以处理大型生成任务,也可以承担小型的判断与抽取工作。比如可以让大模型判断用户提问中是否包含出发地城市,不包含则输出指定标识,配合后续选择器节点,动态决定是否向用户追问信息,让流程更灵活智能。

4.2.2 知识库分段策略选择

知识库的文档通常体积较大,无法直接全部传给模型,需要拆分为多个小分段后再做检索匹配。合理的分段可以有效提升检索的精准度与回答质量,Coze 提供三种分段模式,适配不同的文档类型:

  1. 自动分段与清洗:完全由平台自动完成分段和数据清洗,无需人工配置,适合小型文档或快速验证场景,精度相对有限。
  2. 自定义分段:开发者手动配置分段规则,可选择换行、句号、问号等作为分段标识符,设置分段最大长度与分段重叠度。其中分段重叠度用于保障语义连贯,指当前分段可以重叠上一个分段内容的比例,避免分段截断语义。该模式适合无天然层级结构的普通文本。
  3. 按层级分段:按照文档本身的标题层级自动分段,比如 Word 文档中的一级标题、二级标题结构,分段结果更贴合文档逻辑,适合带有清晰层级结构的正式文档。

分段的核心作用是将大文档拆分为多个语义完整的小片段,让检索时可以精准匹配到最相关的内容,再以小片段作为模型的参考资料,提升回答准确性。

4.2.3 知识库检索策略配置

知识库检索有三类核心参数,直接影响检索的精准度:

  1. 搜索策略:分为三种模式
  2. 语义检索:按照用户查询的含义做匹配,底层将文档与用户查询都转换为向量,通过余弦相似度计算匹配程度,结果为 0 到 1 之间的小数,数值越高语义越相似;
  3. 全文检索:按照用户查询的文字字面内容做匹配,精准匹配关键词;
  4. 混合检索:同时结合语义检索与全文检索的结果,兼顾含义匹配与关键词匹配,是多数场景下的最优选择。
  5. 最大召回数量:指一次查询返回的分段结果数量,数量越多参考信息越丰富,但也可能引入无关内容,需要根据任务场景调整。
  6. 最小匹配度:指语义相似度的最低阈值,只有高于该阈值的分段才会被召回。通常默认值为 0.5,代表二者含义存在关联;0.7 以上代表含义明确相关;0.85 以上代表含义基本一致;0.99 以上代表内容几乎完全相同。

五、典型工作流实战场景

Coze 的工作流可以适配非常多的业务场景,以下是六类高频实战场景的设计逻辑:

5.1 天气查询工作流

整个流程分为五个核心节点,依次执行完成天气查询:

  1. 城市识别节点:从用户输入中提取查询的城市名称,若未识别到则输出指定标识,用于后续追问;
  2. 城市名聚合节点:对识别到的城市名做格式规整,统一标准格式;
  3. 时间识别节点:从用户输入中提取查询日期,未识别到则默认返回当天;
  4. 日期转换节点:将 “明天”“周末” 这类相对时间,转换为标准日期格式;
  5. 天气查询节点:调用天气查询插件,传入标准化的城市与日期参数,获取天气结果并返回给用户。

5.2 旅行规划工作流

核心分为三个处理阶段:

  1. 信息抽取阶段:分别通过出发地识别节点、目的地识别节点,从用户需求中提取出发城市与目的城市;
  2. 信息校验阶段:判断出发地、目的地是否完整,缺失则引导用户补充;
  3. 规划生成阶段:将出发地、目的地与用户需求传入大模型节点,结合联网搜索的景点、交通、酒店信息,生成完整的旅行行程方案。

5.3 文档与链接读取工作流

  1. 文档读取工作流:先通过文件读取节点解析上传的文档内容,再传入大模型节点,由大模型根据用户意图基于文档内容作答,实现基于私有文档的问答。
  2. 链接读取工作流:先通过网页抓取节点读取目标 URL 的页面内容,再传入大模型节点做内容整理与润色,输出规整的网页内容摘要。

5.4 知识库查询工作流

  1. 接收用户提问后,先触发知识库检索节点,从知识库中召回匹配的相关分段;
  2. 同时可搭配联网搜索节点,补充知识库以外的实时信息;
  3. 最终将用户问题、知识库结果、联网结果一同传入大模型节点,由大模型整合信息生成最终答案。

5.5 数据库操作工作流

支持查询、新增、更新、删除四类核心数据库操作,流程逻辑一致:

  1. 信息抽取节点:从用户的自然语言输入中,提取出操作所需的字段信息,比如人名、工号、绩效等级等;
  2. 数据库操作节点:将提取到的结构化信息传入数据库节点,执行对应的查询、新增、更新或删除操作;
  3. 结果返回节点:将数据库执行结果整理为自然语言,反馈给用户。

5.6 多模态内容生成工作流

以文生视频场景为例,流程分为两步:

  1. 大模型节点:接收用户需求与知识库检索结果,归纳整理后生成符合要求的视频生成提示词,设计多个分镜脚本;
  2. 视频生成节点:将生成好的提示词传入视频生成插件,输出最终的视频内容。

六、自定义插件开发

当平台内置插件无法满足业务需求时,开发者可以自定义开发专属插件,扩展平台能力。

6.1 插件开发流程

完整的插件开发与发布分为六个步骤:

  1. 新建插件:在资源库中创建新插件,选择云端开发模式;
  2. 创建工具:定义插件包含的工具,设置工具的输入参数与输出参数;
  3. 编写逻辑:在云端编辑器中编写功能代码,实现工具的业务逻辑;
  4. 功能测试:传入测试参数,运行插件验证功能是否正常;
  5. 版本发布:测试通过后发布插件版本;
  6. 上架审核:提交插件上架申请,审核通过后即可在插件商店中使用。

6.2 插件迭代注意事项

  1. 插件每次代码更新后,都需要重新发布版本;
  2. 已上架的插件更新后,需要重新提交上架审核,更新才会生效。

Logo

欢迎加入 MCP 技术社区!与志同道合者携手前行,一同解锁 MCP 技术的无限可能!

更多推荐