从0到1写AI功能PRD——智能客服需求文档模板

lanchifeiyang

313人浏览 · 2026-06-15 10:00:31

lanchifeiyang · 2026-06-15 10:00:31 发布

说真的，产品经理写 PRD 本来就够头疼了，要是这个功能还跟 AI 沾边，那简直要了老命。传统功能的 PRD，你画个原型、写个逻辑、列个字段，开发看着就能干。但 AI 功能——尤其是智能客服这种东西——它不是 if else 能堆出来的，你得聊模型、聊数据、聊评测标准、聊“不可控”的边界。很多产品经理写着写着就变成了“我要一个聪明的客服机器人，它能自动回答用户问题，如果回答不了就转人工”。然后扔给技术，技术一脸懵逼反问你“什么叫聪明的？多聪明算聪明？知识库在哪儿？用谁的模型？”

别问我怎么知道的，这些坑我一个个全踩过。

所以我决定把从 0 到 1 写智能客服 PRD 的过程扯一遍，顺便给出一个我后来沉淀下来的模板，能直接套的那种。不保证你拿去就能让开发跪服，但至少不会被怼到桌子底下。

先说个前提，我最初对 AI 功能的 PRD 认知特别天真。以为跟做普通 C 端功能一样，画出对话界面，标清楚消息类型，写几个“意图识别”、“答案生成”的说明就完事了。结果到了评审会，研发老大叼着烟（线上评审没真叼，但我感觉他恨不得叼），问了我三个问题就把我问傻了：

“知识库从哪儿来？有现成的文档还是纯靠人工录入？如果没有知识库，机器人上线第一天它说什么？”
“你所谓的不满意转人工，谁来判断不满意？用户自己点按钮，还是机器人主动监测到自己回答不了？监测的标准是什么？”
“意图识别率你预期多少？90% 你觉得很高是吧，但剩下 10% 的 failure case，用户骂娘你负责？”

我当时嘴巴张了张，一个都答不上来。会后恶补了整整三天，才弄明白搞 AI 功能的 PRD 根本不是把功能描述清楚就够了，它是把研发之外的“脏活累活”全定义清楚的过程。你得定义数据、定义评测、定义人机协作的边界，甚至要定义什么叫做“好”。

话不多说，进入正题。我按照后来写的智能客服 PRD 模板，一块一块拆开讲，把我在每个模块踩的坑、想的折、偷的懒，全倒出来。

一、背景与目标——别写“提升效率”这种屁话

很多 PRD 上来就写“为提升客户服务效率，降低人工成本，打造 7x24 小时智能客服”。我跟你讲，这玩意儿开发看都不想看，太虚了。他们想知道的是：这东西到底解决什么具体问题？是售前咨询太多重复问题，还是售后工单填得乱七八糟想用机器人引导？目标得量化。

我后来的写法是直接拍数字：

当前人工客服日均接待量 800 通，其中约 60% 为重复性问题（查物流、退换货政策等）。
上线后，重复性问题自动解决率达到 70% 以上，转人工量控制在日均 240 以内。
用户满意度评分在机器应答环节不低于 3.8/5。
第一版不做多轮复杂对话，仅支持单轮 FAQ 及简单的多轮填槽（例如：退换货原因+订单号收集）。

直白地告诉所有人：我第一个版本不打算做全能机器人，就是一个能挡掉六成重复问题的问答工具。这个预期控制太重要了，别让业务方和老板脑补出一个电影里的 AI 秘书。

二、用户与场景——假装自己是客服坐在工位上

这部分我写的时候把自己想象成两个角色：一个是焦急的用户，一个是每天被气到心梗的客服。

用户侧场景我写了三个典型：

半夜十一点快递显示签收但没收到货，想查到底送哪了。
收到商品有瑕疵，着急想退但不知道怎么操作。
老用户想改绑手机号，结果界面绕来绕去找不到入口。

然后对应人工客服现在的痛点：晚上没人在，只能等第二天；退换货流程需要反复解释；改绑手机号其实是一个标准 SOP，但用户描述不准确导致来回扯皮。

这么写的目的不是为了讲故事感动谁，而是让研发和测试理解，“正确回答”不是把帮助文档原文扔过去就行，它要考虑用户的情绪和认知水平。一个问“东西烂了”的用户，你给他回“请您提供订单编号，我们将在 24 小时内审核”，他会更火大。这个认知在后面交互流程设计时会变得巨重要。

三、功能范围——砍需求是这个阶段最重要的能力

AI 功能最容易犯的错就是什么都想要。我见过一个 PRD 里同时写了意图识别、情绪识别、多轮对话、知识图谱推理、主动营销、多语言……我当时就想，这产品经理是不是刚看完科幻片。

我的模板里把功能范围分成了三块，而且写明版本节奏：

V1.0 必须做：

单轮 FAQ 匹配（基于知识库检索，最高置信度答案直接返回）。
简单填槽式多轮（退换货申请收集：原因、订单号、图片凭证）。
未匹配问题时转人工，并记录会话上下文传递给人工。
人工可查看机器人会话记录。

V1.0 明确不做：

意图澄清和反问（用户问“怎么办”，机器人不问“您遇到了什么问题”，直接列常见问题入口）。
情绪安抚或个性化回复。
主动推荐商品。
语音输入。

这个“不做”列表救了我的命。研发看完觉得可实现，业务方虽然有点不满足但也理解。我告诉他们，机器人不是人，第一版先当个听话的问答字典用，慢慢再教它撩骚。

四、数据与知识库——这是 AI 产品的原材料，不是你拍脑袋想的

这是重头戏，也是很多 PM 最容易滑过去的部分。你如果不写，开发默认以为你有结构化完美的 FAQ 表，实际上你可能只有一堆散落的帮助文档 PDF，甚至有些知识还在客服主管的脑子里。

我的 PRD 里增加了一个章节叫“知识来源与加工规范”：

知识来源枚举：现有的帮助中心网页、客服话术表、历史工单高频问题汇总（手工提取）。
知识条目格式：每一条包含标准问题、相似问法（至少 3 种）、答案（文本，允许富文本链接）、分类标签（售前/售后/物流/账户）、答案类型（文本/图文/操作引导）、转人工触发条件（如有）。
知识库建设责任方：由客服主管负责初版收集，运营人员录入系统，产品负责审核格式。开发不管录入，只提供导入工具和校验接口。
冷启动方案：初期没有任何真实问法数据时，用“标准问题+同义词替换+GPT 改写”的方式生成 5~10 条相似问法，上线后根据真实 query 再补充。

这里有一个我踩过的超大坑：最开始我觉得知识库嘛，就是把帮助文档拆成问答对就完事了。结果客服主管给了我一个 500 条的 Excel，每条的答案都是一整篇文章，里面包含七八个情况。机器人检索出来之后，把一大坨东西拍给用户，用户看都不看。所以我在模板里加了强制要求：答案必须精简，移动端展示不超过屏幕两屏（约 150 字），复杂流程用步骤图加文字。超过的一律拆成子问题。这个规定救了我的用户体验。

另外，数据安全要提一嘴，如果是医疗、金融行业，得注明哪些数据脱敏，不做本地缓存等。

五、模型与策略——别写“使用深度学习模型”这种废话，给我写清楚用什么、怎么评

很多产品经理为了显得专业，在 PRD 里写“系统利用 NLP 技术进行意图识别”。研发看了想打人，因为这句话跟没说一样。

我的模板里硬性规定要写清楚几个东西：

意图识别方案：采用 FAQ 检索式，用户问题经 embedding 向量化后与知识库问题向量做相似度匹配。技术选型配合研发定，产品定义阈值。
置信度阈值与动作：
- 相似度 ≥ 0.85：直接返回对应答案。
- 0.65 ≤ 相似度 < 0.85：列出 top3 候选问题让用户点选（“您是不是想问：1.xxx 2.xxx”）。
- 相似度 < 0.65：直接提示“我还没学会这个问题”，并记录日志，同时转人工（若人工在线）或引导留言。
多轮填槽管理：定义一个槽位收集的有限状态机。例如退换货流程必须收集：订单号、退换原因、凭证图片（选填）。如果用户中途打断或超时 5 分钟未输入，自动清理状态。
评测指标：这是 PM 的 KPI 武器。我定的指标包括：
- TOP1 准确率（机器人直接给答案且正确/总问答数）≥ 75%（V1.0 基线）。
- TOP3 召回率（正确答案出现在前三个候选中）≥ 90%。
- 转人工率 ≤ 30%。
- 答案满意率（用户点“已解决”按钮比例）≥ 60%。

这些指标如果不定义，上线后业务方说你做得烂，你没任何依据反驳。有了数据，你就可以理直气壮说“当初定的目标我们都达到了，剩下不满意的是长尾问题，现在开始二期优化”。

六、交互流程——把机器人当傻子，一步一步教它说话

交互这块，看起来简单，实际上 AI 对话的状态比普通界面复杂得多。我画了个超大的流程图，把“用户发消息”这个动作之后，系统要做的判断全列了出来：

用户消息是否为空？过滤。
当前是否在多轮填槽状态？如果是，消息作为槽位填入，推进一步；如果不是，走 FAQ 匹配。
匹配结果是否触发澄清？若触发，发候选问题列表，等待用户点击。
用户点击候选，视为新一轮提问，更新对话上下文。
若连续两次匹配失败，主动引导转人工或提示输入“人工”二字直接转。

这里面有两个设计让我得意：

一是“模糊澄清”不要逼问用户。很多智能客服喜欢反问“您是否想咨询订单问题还是退款问题？”，如果用户本身很急，看到反问就想摔手机。我改成在答案下方自动带出“您可能还关心”的关联问题，用户点就进，不点也不影响阅读当前答案。

二是转人工时把摘要带过去。用户点了转人工，机器人把刚才的会话记录总结成一段话发给人工：“用户问题：快递显示签收但没收到，机器人已推荐方案A未采纳，用户情绪可能焦躁”。人工一接手就秒懂，不用再问一遍“您好请问有什么可以帮您”。这个功能需要在 PRD 里明确要求后端把对话历史和知识库命中记录传递给客服工作台。

还有一条我坚持写在 PRD 里：不许用“亲”这种淘宝腔，也不许用过度的拟人化。因为用户一旦觉得对面是真人，发现被忽悠后会加倍愤怒。我强制机器人第一句就是“您好，我是智能助手小X，目前是自动应答，如不准确请随时输入‘人工’”。明牌告诉对方我是机器，降低期望值，反而满意率更高。

七、异常与边界——你就想吧，什么幺蛾子都写进去

做 AI，最重要的不是 sunny day，而是 rainy day。我在模板里专门开了一大节“异常场景处理”，里面列了一堆我想得到的破事：

用户输入完全无关内容（如“哈哈哈”、“你好漂亮”）：标准回复“我是智能助手，暂时只能回答业务相关问题，请输入您的问题或转人工”。
用户辱骂：内容过滤，忽略辱骂词，提取关键词尝试匹配；若纯辱骂无实质内容，回复中性引导并隐藏该条记录到质检池。
输入图片/语音（V1.0不支持）：回复“暂不支持图片/语音识别，请用文字描述您的问题”。
知识库查询超时（200ms 没返回）：降级为转人工提示，避免卡死。
网络异常：Web/App 侧显示断线提示，重连后恢复会话。
并发高峰（大促场景）：排队机制，预估等待时间。

这里有一个容易漏掉的：历史对话记忆策略。如果用户在对话中途切出去做别的事，过十分钟回来，机器人要不要续接？我写的策略是：会话 5 分钟无交互自动清理多轮状态，视为新会话，但要展示上次对话的简单摘要（只保留用户最后三条消息）。这是为了保护用户隐私同时提供一点连续性。

八、验收标准——让测试知道怎么测“聪明不聪明”

AI 功能的测试用例不好写，因为回答不唯一。你不能写“输入：我想退货，输出：请提供订单号”这太死板。我让测试设计一个测试集：从真实场景里抽 200 条问题，人工标注正确答案及可以接受的答案范围。然后用这个测试集去跑自动化评测，看命中率和满意率。PRD 里要写明测试集由谁提供、何时提供、更新频率。

此外，我还要求进行一次“对抗性测试”，找几个完全不了解系统的同事，故意刁难机器人，记录失败 case，开会复盘是不是需求漏掉了。这个环节发现了很多边界场景，比如用户发一段超长文本包含多个问题，机器人只答了第一个——后来我们针对长文本做截断和多意图识别提示。

九、上线与监控——上线只是开始，又不是结束

PRD 最后一部分是上线计划和数据埋点。我规定了必须上报的事件：

每次问答结果（含用户问题、返回答案 ID、置信度、是否转人工、用户点击“已解决/未解决”）。
多轮填槽完成率。
知识库命中率分布。

同时设了一个“观察期”：上线第一周，每天人工抽检 50 条会话，根据 badcase 补充知识库。第二周如果指标达标，则降低抽检频率。这叫“人机协同优化期”，必须写进计划里，不然上线后没人管，机器人会越来越蠢。

模板骨架大概就是这样。其实我后来回头看，发现写 AI 功能的 PRD 根本不是在写功能逻辑，而是在写数据和知识的组织方式、人与机器的协作边界、以及衡量“智能”的标尺。很多产品经理怕写，是因为习惯用界面思维解决问题，而 AI 的界面只是一个输入框，背后全是看不见的决策阈值。

如果你现在让我给建议，我会说：别怕写得细，就怕你不敢定义。你把置信度定成 0.7 还是 0.8，这不是技术决定的，是产品平衡准确率和召回率的商业选择。你写进去了，研发不仅不会骂你，还会觉得你懂行。你如果只写一句“要智能回复”，那等着被怼吧。

扯了这么多，我猜可能有人想要完整的文档模板，我放一个简化版在下面，把关键章节列出来，你照着填自己的业务就行。

《智能客服 V1.0 产品需求文档》模板骨架

1. 项目背景与目标

当前客服现状（量化数据）
上线后核心指标（自动解决率、转人工率、满意度）
版本范围与不做内容

2. 用户场景与痛点

至少 3 个典型用户场景
对应人工客服痛点

3. 功能详情

3.1 核心功能流程图（含匹配、澄清、转人工）
3.2 机器人应答策略（阈值与动作表格）
3.3 多轮填槽逻辑（状态机图）
3.4 转人工机制（摘要传递、排队策略）
3.5 异常场景处理列表

4. 知识库需求

来源与格式规范（问题、相似问法、答案、分类）
冷启动方案
更新维护流程
质量要求（答案精简等）

5. 数据需求与埋点

需要上报的事件及字段
业务监控看板指标

6. 评测与验收

测试集要求
评测指标目标值
对抗性测试计划

7. 上线与迭代

发布策略（灰度/全量）
观察期优化机制
二期规划方向

写完这篇东西，我最大的感触就是：产品经理要是自己搞不清楚模型能干啥不能干啥，就只能被研发牵着走，或者画大饼把团队带坑里。智能客服绝对不是一堆 if else，也不是上个 API 就完事，它需要你像经营一个刚上岗的新员工一样，给他建知识库、告诉他遇到不会的怎么举手、每天复盘他的表现。你把 PRD 当成这个新员工的《工作守则》，一切就清楚了。

希望这篇啰里吧嗦的实战总结，能让你下次写 AI 功能 PRD 时少掉几根头发。就算掉了，也别来找我，我发量也不多了。

MCP技术社区

欢迎加入 MCP 技术社区！与志同道合者携手前行，一同解锁 MCP 技术的无限可能！

更多推荐

MCP企业运用全面知识点-进阶篇

本文是MCP（Model Context Protocol）企业运用进阶指南，重点对比MCP与其他技术方案的差异，并详细阐述企业级部署方案。主要内容包括：技术方案对比：将MCP与Function Calling、OpenAI Plugins/Assistants API及传统REST/GraphQL API进行多维度比较，突出MCP在标准化、扩展性和上下文管理方面的优势。企业部署方案：提供从基

MCP技术社区

AI Agent 入门与实战：从对话到干活，理解下一代AI工作方式

你告诉Agent一个目标，它会自己拆解成步骤，调用工具（文件操作、命令行、API接口），逐步执行，遇到问题会自己尝试修复，最后给你交付结果。第一，Agent写的代码不是100%可靠的。对于一个已经在写代码的开发者来说，现在最重要的事情不是"学什么新语言或新框架"，而是学会怎么让Agent帮你干活、提高你不可替代的那部分能力——业务理解、架构设计、技术判断。用Agent的做法是：你告诉它需求，它自己