说真的,产品经理写 PRD 本来就够头疼了,要是这个功能还跟 AI 沾边,那简直要了老命。传统功能的 PRD,你画个原型、写个逻辑、列个字段,开发看着就能干。但 AI 功能——尤其是智能客服这种东西——它不是 if else 能堆出来的,你得聊模型、聊数据、聊评测标准、聊“不可控”的边界。很多产品经理写着写着就变成了“我要一个聪明的客服机器人,它能自动回答用户问题,如果回答不了就转人工”。然后扔给技术,技术一脸懵逼反问你“什么叫聪明的?多聪明算聪明?知识库在哪儿?用谁的模型?”

别问我怎么知道的,这些坑我一个个全踩过。

所以我决定把从 0 到 1 写智能客服 PRD 的过程扯一遍,顺便给出一个我后来沉淀下来的模板,能直接套的那种。不保证你拿去就能让开发跪服,但至少不会被怼到桌子底下。

先说个前提,我最初对 AI 功能的 PRD 认知特别天真。以为跟做普通 C 端功能一样,画出对话界面,标清楚消息类型,写几个“意图识别”、“答案生成”的说明就完事了。结果到了评审会,研发老大叼着烟(线上评审没真叼,但我感觉他恨不得叼),问了我三个问题就把我问傻了:

“知识库从哪儿来?有现成的文档还是纯靠人工录入?如果没有知识库,机器人上线第一天它说什么?”
“你所谓的不满意转人工,谁来判断不满意?用户自己点按钮,还是机器人主动监测到自己回答不了?监测的标准是什么?”
“意图识别率你预期多少?90% 你觉得很高是吧,但剩下 10% 的 failure case,用户骂娘你负责?”

我当时嘴巴张了张,一个都答不上来。会后恶补了整整三天,才弄明白搞 AI 功能的 PRD 根本不是把功能描述清楚就够了,它是把研发之外的“脏活累活”全定义清楚的过程。你得定义数据、定义评测、定义人机协作的边界,甚至要定义什么叫做“好”。

话不多说,进入正题。我按照后来写的智能客服 PRD 模板,一块一块拆开讲,把我在每个模块踩的坑、想的折、偷的懒,全倒出来。


一、背景与目标——别写“提升效率”这种屁话

很多 PRD 上来就写“为提升客户服务效率,降低人工成本,打造 7x24 小时智能客服”。我跟你讲,这玩意儿开发看都不想看,太虚了。他们想知道的是:这东西到底解决什么具体问题?是售前咨询太多重复问题,还是售后工单填得乱七八糟想用机器人引导?目标得量化。

我后来的写法是直接拍数字:

  • 当前人工客服日均接待量 800 通,其中约 60% 为重复性问题(查物流、退换货政策等)。
  • 上线后,重复性问题自动解决率达到 70% 以上,转人工量控制在日均 240 以内。
  • 用户满意度评分在机器应答环节不低于 3.8/5。
  • 第一版不做多轮复杂对话,仅支持单轮 FAQ 及简单的多轮填槽(例如:退换货原因+订单号收集)。

直白地告诉所有人:我第一个版本不打算做全能机器人,就是一个能挡掉六成重复问题的问答工具。这个预期控制太重要了,别让业务方和老板脑补出一个电影里的 AI 秘书。


二、用户与场景——假装自己是客服坐在工位上

这部分我写的时候把自己想象成两个角色:一个是焦急的用户,一个是每天被气到心梗的客服。

用户侧场景我写了三个典型:

  1. 半夜十一点快递显示签收但没收到货,想查到底送哪了。
  2. 收到商品有瑕疵,着急想退但不知道怎么操作。
  3. 老用户想改绑手机号,结果界面绕来绕去找不到入口。

然后对应人工客服现在的痛点:晚上没人在,只能等第二天;退换货流程需要反复解释;改绑手机号其实是一个标准 SOP,但用户描述不准确导致来回扯皮。

这么写的目的不是为了讲故事感动谁,而是让研发和测试理解,“正确回答”不是把帮助文档原文扔过去就行,它要考虑用户的情绪和认知水平。一个问“东西烂了”的用户,你给他回“请您提供订单编号,我们将在 24 小时内审核”,他会更火大。这个认知在后面交互流程设计时会变得巨重要。


三、功能范围——砍需求是这个阶段最重要的能力

AI 功能最容易犯的错就是什么都想要。我见过一个 PRD 里同时写了意图识别、情绪识别、多轮对话、知识图谱推理、主动营销、多语言……我当时就想,这产品经理是不是刚看完科幻片。

我的模板里把功能范围分成了三块,而且写明版本节奏:

V1.0 必须做:

  • 单轮 FAQ 匹配(基于知识库检索,最高置信度答案直接返回)。
  • 简单填槽式多轮(退换货申请收集:原因、订单号、图片凭证)。
  • 未匹配问题时转人工,并记录会话上下文传递给人工。
  • 人工可查看机器人会话记录。

V1.0 明确不做:

  • 意图澄清和反问(用户问“怎么办”,机器人不问“您遇到了什么问题”,直接列常见问题入口)。
  • 情绪安抚或个性化回复。
  • 主动推荐商品。
  • 语音输入。

这个“不做”列表救了我的命。研发看完觉得可实现,业务方虽然有点不满足但也理解。我告诉他们,机器人不是人,第一版先当个听话的问答字典用,慢慢再教它撩骚。


四、数据与知识库——这是 AI 产品的原材料,不是你拍脑袋想的

这是重头戏,也是很多 PM 最容易滑过去的部分。你如果不写,开发默认以为你有结构化完美的 FAQ 表,实际上你可能只有一堆散落的帮助文档 PDF,甚至有些知识还在客服主管的脑子里。

我的 PRD 里增加了一个章节叫“知识来源与加工规范”:

  • 知识来源枚举:现有的帮助中心网页、客服话术表、历史工单高频问题汇总(手工提取)。
  • 知识条目格式:每一条包含标准问题、相似问法(至少 3 种)、答案(文本,允许富文本链接)、分类标签(售前/售后/物流/账户)、答案类型(文本/图文/操作引导)、转人工触发条件(如有)。
  • 知识库建设责任方:由客服主管负责初版收集,运营人员录入系统,产品负责审核格式。开发不管录入,只提供导入工具和校验接口。
  • 冷启动方案:初期没有任何真实问法数据时,用“标准问题+同义词替换+GPT 改写”的方式生成 5~10 条相似问法,上线后根据真实 query 再补充。

这里有一个我踩过的超大坑:最开始我觉得知识库嘛,就是把帮助文档拆成问答对就完事了。结果客服主管给了我一个 500 条的 Excel,每条的答案都是一整篇文章,里面包含七八个情况。机器人检索出来之后,把一大坨东西拍给用户,用户看都不看。所以我在模板里加了强制要求:答案必须精简,移动端展示不超过屏幕两屏(约 150 字),复杂流程用步骤图加文字。超过的一律拆成子问题。这个规定救了我的用户体验。

另外,数据安全要提一嘴,如果是医疗、金融行业,得注明哪些数据脱敏,不做本地缓存等。


五、模型与策略——别写“使用深度学习模型”这种废话,给我写清楚用什么、怎么评

很多产品经理为了显得专业,在 PRD 里写“系统利用 NLP 技术进行意图识别”。研发看了想打人,因为这句话跟没说一样。

我的模板里硬性规定要写清楚几个东西:

  1. 意图识别方案:采用 FAQ 检索式,用户问题经 embedding 向量化后与知识库问题向量做相似度匹配。技术选型配合研发定,产品定义阈值。
  2. 置信度阈值与动作
    • 相似度 ≥ 0.85:直接返回对应答案。
    • 0.65 ≤ 相似度 < 0.85:列出 top3 候选问题让用户点选(“您是不是想问:1.xxx 2.xxx”)。
    • 相似度 < 0.65:直接提示“我还没学会这个问题”,并记录日志,同时转人工(若人工在线)或引导留言。
  3. 多轮填槽管理:定义一个槽位收集的有限状态机。例如退换货流程必须收集:订单号、退换原因、凭证图片(选填)。如果用户中途打断或超时 5 分钟未输入,自动清理状态。
  4. 评测指标:这是 PM 的 KPI 武器。我定的指标包括:
    • TOP1 准确率(机器人直接给答案且正确/总问答数)≥ 75%(V1.0 基线)。
    • TOP3 召回率(正确答案出现在前三个候选中)≥ 90%。
    • 转人工率 ≤ 30%。
    • 答案满意率(用户点“已解决”按钮比例)≥ 60%。

这些指标如果不定义,上线后业务方说你做得烂,你没任何依据反驳。有了数据,你就可以理直气壮说“当初定的目标我们都达到了,剩下不满意的是长尾问题,现在开始二期优化”。


六、交互流程——把机器人当傻子,一步一步教它说话

交互这块,看起来简单,实际上 AI 对话的状态比普通界面复杂得多。我画了个超大的流程图,把“用户发消息”这个动作之后,系统要做的判断全列了出来:

  • 用户消息是否为空?过滤。
  • 当前是否在多轮填槽状态?如果是,消息作为槽位填入,推进一步;如果不是,走 FAQ 匹配。
  • 匹配结果是否触发澄清?若触发,发候选问题列表,等待用户点击。
  • 用户点击候选,视为新一轮提问,更新对话上下文。
  • 若连续两次匹配失败,主动引导转人工或提示输入“人工”二字直接转。

这里面有两个设计让我得意:

一是“模糊澄清”不要逼问用户。很多智能客服喜欢反问“您是否想咨询订单问题还是退款问题?”,如果用户本身很急,看到反问就想摔手机。我改成在答案下方自动带出“您可能还关心”的关联问题,用户点就进,不点也不影响阅读当前答案。

二是转人工时把摘要带过去。用户点了转人工,机器人把刚才的会话记录总结成一段话发给人工:“用户问题:快递显示签收但没收到,机器人已推荐方案A未采纳,用户情绪可能焦躁”。人工一接手就秒懂,不用再问一遍“您好请问有什么可以帮您”。这个功能需要在 PRD 里明确要求后端把对话历史和知识库命中记录传递给客服工作台。

还有一条我坚持写在 PRD 里:不许用“亲”这种淘宝腔,也不许用过度的拟人化。因为用户一旦觉得对面是真人,发现被忽悠后会加倍愤怒。我强制机器人第一句就是“您好,我是智能助手小X,目前是自动应答,如不准确请随时输入‘人工’”。明牌告诉对方我是机器,降低期望值,反而满意率更高。


七、异常与边界——你就想吧,什么幺蛾子都写进去

做 AI,最重要的不是 sunny day,而是 rainy day。我在模板里专门开了一大节“异常场景处理”,里面列了一堆我想得到的破事:

  • 用户输入完全无关内容(如“哈哈哈”、“你好漂亮”):标准回复“我是智能助手,暂时只能回答业务相关问题,请输入您的问题或转人工”。
  • 用户辱骂:内容过滤,忽略辱骂词,提取关键词尝试匹配;若纯辱骂无实质内容,回复中性引导并隐藏该条记录到质检池。
  • 输入图片/语音(V1.0不支持):回复“暂不支持图片/语音识别,请用文字描述您的问题”。
  • 知识库查询超时(200ms 没返回):降级为转人工提示,避免卡死。
  • 网络异常:Web/App 侧显示断线提示,重连后恢复会话。
  • 并发高峰(大促场景):排队机制,预估等待时间。

这里有一个容易漏掉的:历史对话记忆策略。如果用户在对话中途切出去做别的事,过十分钟回来,机器人要不要续接?我写的策略是:会话 5 分钟无交互自动清理多轮状态,视为新会话,但要展示上次对话的简单摘要(只保留用户最后三条消息)。这是为了保护用户隐私同时提供一点连续性。


八、验收标准——让测试知道怎么测“聪明不聪明”

AI 功能的测试用例不好写,因为回答不唯一。你不能写“输入:我想退货,输出:请提供订单号”这太死板。我让测试设计一个测试集:从真实场景里抽 200 条问题,人工标注正确答案及可以接受的答案范围。然后用这个测试集去跑自动化评测,看命中率和满意率。PRD 里要写明测试集由谁提供、何时提供、更新频率。

此外,我还要求进行一次“对抗性测试”,找几个完全不了解系统的同事,故意刁难机器人,记录失败 case,开会复盘是不是需求漏掉了。这个环节发现了很多边界场景,比如用户发一段超长文本包含多个问题,机器人只答了第一个——后来我们针对长文本做截断和多意图识别提示。


九、上线与监控——上线只是开始,又不是结束

PRD 最后一部分是上线计划和数据埋点。我规定了必须上报的事件:

  • 每次问答结果(含用户问题、返回答案 ID、置信度、是否转人工、用户点击“已解决/未解决”)。
  • 多轮填槽完成率。
  • 知识库命中率分布。

同时设了一个“观察期”:上线第一周,每天人工抽检 50 条会话,根据 badcase 补充知识库。第二周如果指标达标,则降低抽检频率。这叫“人机协同优化期”,必须写进计划里,不然上线后没人管,机器人会越来越蠢。


模板骨架大概就是这样。其实我后来回头看,发现写 AI 功能的 PRD 根本不是在写功能逻辑,而是在写数据和知识的组织方式、人与机器的协作边界、以及衡量“智能”的标尺。很多产品经理怕写,是因为习惯用界面思维解决问题,而 AI 的界面只是一个输入框,背后全是看不见的决策阈值。

如果你现在让我给建议,我会说:别怕写得细,就怕你不敢定义。你把置信度定成 0.7 还是 0.8,这不是技术决定的,是产品平衡准确率和召回率的商业选择。你写进去了,研发不仅不会骂你,还会觉得你懂行。你如果只写一句“要智能回复”,那等着被怼吧。

扯了这么多,我猜可能有人想要完整的文档模板,我放一个简化版在下面,把关键章节列出来,你照着填自己的业务就行。


《智能客服 V1.0 产品需求文档》模板骨架

1. 项目背景与目标

  • 当前客服现状(量化数据)
  • 上线后核心指标(自动解决率、转人工率、满意度)
  • 版本范围与不做内容

2. 用户场景与痛点

  • 至少 3 个典型用户场景
  • 对应人工客服痛点

3. 功能详情

  • 3.1 核心功能流程图(含匹配、澄清、转人工)
  • 3.2 机器人应答策略(阈值与动作表格)
  • 3.3 多轮填槽逻辑(状态机图)
  • 3.4 转人工机制(摘要传递、排队策略)
  • 3.5 异常场景处理列表

4. 知识库需求

  • 来源与格式规范(问题、相似问法、答案、分类)
  • 冷启动方案
  • 更新维护流程
  • 质量要求(答案精简等)

5. 数据需求与埋点

  • 需要上报的事件及字段
  • 业务监控看板指标

6. 评测与验收

  • 测试集要求
  • 评测指标目标值
  • 对抗性测试计划

7. 上线与迭代

  • 发布策略(灰度/全量)
  • 观察期优化机制
  • 二期规划方向

写完这篇东西,我最大的感触就是:产品经理要是自己搞不清楚模型能干啥不能干啥,就只能被研发牵着走,或者画大饼把团队带坑里。智能客服绝对不是一堆 if else,也不是上个 API 就完事,它需要你像经营一个刚上岗的新员工一样,给他建知识库、告诉他遇到不会的怎么举手、每天复盘他的表现。你把 PRD 当成这个新员工的《工作守则》,一切就清楚了。

希望这篇啰里吧嗦的实战总结,能让你下次写 AI 功能 PRD 时少掉几根头发。就算掉了,也别来找我,我发量也不多了。

Logo

欢迎加入 MCP 技术社区!与志同道合者携手前行,一同解锁 MCP 技术的无限可能!

更多推荐