场景识别是 AI 产品经理核心工作流程的第一个环节,做对了,后续所有资源投入才有意义;做错了,越往后越难止损。

核心判断:这个问题该不该用 AI 解决

这个环节的核心任务:找到 AI 能创造差异化价值的场景。 不是"用 AI 做 XX",而是"XX 场景下,传统方法存在结构性瓶颈,AI 是目前最具性价比的突破路径"。不需要把所有业务问题都往 AI 上靠,核心判断是"要不要做",而不是"怎么做"。

决策原则补充:场景识别阶段的核心输出是一个大致的产品规划方向,明确要做什么,不做什么,先做什么,后做什么。

一、AI 与非 AI 的解法对比

规则引擎、人工处理、简单算法往往比大模型更稳定、成本更低。可以自问:这个问题是否一定要用 AI 解决?

1、适合规则引擎或简单算法的场景特征

输入明确、规则固定、输出要求100% 精确(如备案订单校验、合同条款校验、固定格式报表生成)。

2、适合 AI 的场景特征

1)输入多样、规则模糊、存在大量重复性脑力劳动(如策略生成、内容审核初筛);

2)需要从非结构化数据中提取结构化信息(如用户标签提取,对话意图识别);

3)输出是一个概率性区间,追求"好用"而非"100% 正确"的场景。

3、五维判断表

维度

判断问题

不适合 AI 的信号

模糊性

问题边界是否模糊、规则是否无法穷举?

规则可写成 if-else 且能覆盖95%以上场景

规模性

该问题的处理频次/数据量是否足够大?

若每天发生不足 100 次,人工完全可覆盖

容错性

输出结果是否允许一定比例的误差?

业务要求 100% 准确,零容忍错误

替代性

是否已有成熟的非 AI 方案可用?

业界已有低成本成熟工具,无需重造

差异化

AI 解法相比非 AI 解法是否有明显优势?

AI 方案成本远高于人工,但效果仅微弱提升

实操建议:把以上表格作为立项前筛查清单,与业务 Owner 在一次业务对齐中共同完成,这样能帮助业务方建立合理预期,避免后期需求反复。

二、业务价值量化

聚焦可量化的指标,拒绝"提升体验""赋能业务"等模糊表述。每个指标要有明确的基准值目标值可接受的最低阈值(低于阈值则终止项目)。

核心指标体系

1、业务指标(和业务目标挂钩)

  • 策略采纳率:业务人员对 AI 推荐结果的认可度

  • 自助解决率:用户不用提单解决问题的比例

  • 付费转化率:生成的策略最终带来的付费转化

2、产品竞争力指标(AI化后的产品能力评估)

  • 意图识别准确率

  • 知识答准率

  • 首token时延

  • 首屏加载时间

3、用户体验指标

  • NPS:净推荐值=(推荐人数-贬损人数)/总样本数。评估用户是否会帮你拉新。
  • NSS:净满意度=((5分+4分的用户数)-权重*(1分+2分的用户数))/总样本数。评估用户当下是否满意。

4、成本指标(必须与效率指标联动,避免"降本增本"的陷阱)

  • 人力成本节省量:以标准全职员工换算,明确是实际减员还是产能释放

    AI 调用成本:按 Token 用量或 API 调用次数估算月均成本

  • ROI 测算:建立简单的ROI 模型,以12 个月为周期核算收益/成本比

指标设置的常见误区

误区1:指标太多

超过5个核心指标往往意味着目标不清晰,建议锁定1个"北极星指标"和 2~3 个辅助指标。

误区2:基准值缺失

只有达到基准值才允许上线。

误区 3:只看正向指标

还应定义"负向护栏指标",如 AI 回复的有害内容率不超过 0.1%、用户投诉率不超过立项前的 X%,触碰红线则触发人工介入或降级机制。

三、落地可行性评估

业务、数据、技术三个维度缺一不可。任何一个维度出现根本性障碍,都应在立项阶段暂停推进。

1、业务层面

1)有无明确的业务 Owner?没有 Owner 对接,意味着业务目标看护、数据标注、Badcase 反馈都没人配合,项目无法推进;

2)业务Owner对此业务投入的优先级是否足够高?Owner 本身被其他项目占满,配合度会大打折扣,在项目启动时和 Owner 明确人员投入;

3)是否存在变革阻力?企业AI化一般在原有系统上改造,需考虑改造成本是否太高,改造动作能否得到业务Owner的支持;

4)业务流程是否已相对稳定?处于快速变化中的业务流程,AI 训练数据会迅速过时,建议等流程稳定后再立项;

2、数据层面

1)现有数据量是否支撑基本的模型评测?至少有 200 条可用标注数据才开始立项,1000 条才能支撑较可靠的测试结论;

2)数据质量如何?数量够但质量差同样无效,需检查标注口径一致性、数据时效性、是否存在大量缺失字段;

3)数据是否存在权限与合规风险?涉及用户隐私、跨部门数据、境外数据的场景,需在立项阶段完成权限确认和合规预审;

4)若需要多平台数据,是否有明确的采集方案和接口对齐计划?

3、技术层面

1)与算法/研发团队是否完成初步技术对齐?确认技术实现路径是否可行,明确主要技术风险点;

2)该问题用 AI 解决的案例是否充分?参考案例的效果数据是否可信?

3)落地周期是否在业务可接受范围内?建议区分 MVP 版本和完整版本,MVP 周期超过 3 个月的项目,业务接受度会显著下降;

4)依赖项清单:明确外部依赖(如第三方 API、基础模型授权、GPU 资源),以及每个依赖项的风险等级和备选方案;

4、可行性评估的输出物

建议产出一份"立项可行性评估报告"(1~2 页),包含业务/数据/技术三个维度的评估结论、关键风险与应对措施、推荐决策(立项/暂缓/放弃),以及附带 ROI 粗估。

四、任务拆分:先明确做什么,再考虑怎么做

场景确认后,要把业务需求拆解为具体的 AI 任务类型,这一步决定后续的技术选型方向和数据准备策略,是连接"要不要做"和"怎么做"的关键桥梁。

1、语言模型相关任务分类(按功能)

任务类型

典型场景举例

输入示例

输出示例

总结类

对话摘要、周报、会议纪要

原始对话文本(多轮,多角色)

结构化摘要,含关键结论、待办事项

提取类

用户标签提取、关键词提取、实体识别

用户行为日志、自然语言描述

结构化标签列表 + 置信度

检索类

知识库问答、文档检索增强(RAG)

用户查询 + 候选文档集

相关段落 + 来源引用

问答类

AI 客服、员工助手、内部知识问答

用户问题 + 上下文(可选)

自然语言回答 + 置信度(可选)

分类类

意图分类、工单分类、情感分类

单条文本

分类标签 + 置信度

生成类

话术生成、文案扩写、策略生成

主题/关键词/模板

完整生成文本(需标注"AI 生成"标识)

2、多模态任务分类

任务类型

典型场景

数据格式要求

与文本融合方式

图片识别 / 审核

商品图违规检测、OCR 识别

标准化分辨率 + 格式(JPG/PNG)

识别结果转文本后接入 LLM 处理

语音识别(ASR)

客服通话转写、会议录音转文字

WAV/MP3,采样率要求明确

转写结果作为文本任务的输入

语音合成(TTS)

智能外呼、语音播报

输入文本 + 音色参数

文本生成后接 TTS 模块

视频摘要

监控视频事件检测、直播摘要

帧率、分辨率、时长限制

视频帧 + 字幕文本联合输入

3、任务拆分的关键操作要点

1)明确输入/输出格式:清晰的输入输出格式定义直接影响Prompt 设计和评测标准。例如,意图分类的输出应定义为"一级意图标签 + 二级意图标签 + 置信度(0~1)",而非模糊的"识别用户意图"。

2识别任务之间的依赖关系:复杂场景往往是多个原子任务的编排,需要画出任务流图,明确哪些任务可以并行,哪些有先后依赖。例如,客服场景中"ASR 转写 → 意图分类 → 知识检索 → 回答生成"是串行链路,任何一环的失败都会影响最终效果。

3确认人工兜底机制:每个任务类型都应有明确的置信度阈值,低于阈值时触发人工审核,而非直接输出结果。

4)评估任务复杂度与ROI 匹配性:某些拆解出来的子任务,单独用规则或简单模型效果可能更好、成本更低。任务拆分的目的不是"把所有子任务都交给 LLM",而是按子任务的特性选择最合适的技术路径。

五、场景优先级排序

当同时存在多个候选场景时,需要有明确的优先级排序机制,而非凭直觉选择。

推荐使用 ICE 评分模型对候选场景进行快速排序,每个维度打 1~10 分:

维度

含义

评分参考

Impact(影响力)

场景的业务价值大小,对核心指标的改善程度

10 = 直接影响核心指标;1 = 影响边缘指标

Confidence(确定性)

对 AI 能解决该问题的把握程度

10 = 业界已有大量成功案例;1 = 完全未知领域

Ease(可行性)

实现难度,包括数据、技术、组织资源等综合成本

10 = 业务支持到位、数据充足、技术成熟;1 = 三者均不具备

优先选择"高Impact + 高 Confidence + 高Ease"的场景作为首个试点,建立组织内对 AI 能力的信任,再逐步扩展到高价值但难度更大的场景。

附常见需求优先级评估模型

模型

核心维度

适合场景

ICE

Impact、Confidence、Ease

快速排期、资源有限、增长实验

RICE

Reach、Impact、Confidence、Effort

更强调用户覆盖、长期价值

MoSCoW

Must/Should/Could/Won’t

需求分级、敏捷迭代、版本规划

Kano

基础 / 期望 / 兴奋 / 无差异

体验优化、功能价值定位

场景识别环节的标准输出物清单

1)场景识别报告:包含 AI vs 非 AI 解法对比、业务价值量化(北极星指标+基准值+目标值+最低阈值)、立项可行性结论;

2)AI任务类型拆分:明确所有 AI 子任务的输入/输出格式、依赖关系、人工兜底机制;

3)场景优先级矩阵(如有多个候选场景):ICE 评分及推荐优先级;

我整理了一份某个大厂要求AI产品经理必须掌握的文档, 里面把AI产品的研发流程、大模型的发展方向,以及当前AI产品真正的问题都拆清楚了。

Logo

欢迎加入 MCP 技术社区!与志同道合者携手前行,一同解锁 MCP 技术的无限可能!

更多推荐