AI产品经理核心工作流程---场景识别

机器学习算法

362人浏览 · 2026-05-05 17:29:34

机器学习算法 · 2026-05-05 17:29:34 发布

场景识别是 AI 产品经理核心工作流程的第一个环节，做对了，后续所有资源投入才有意义；做错了，越往后越难止损。

核心判断：这个问题该不该用 AI 解决

这个环节的核心任务：找到 AI 能创造差异化价值的场景。不是"用 AI 做 XX"，而是"XX 场景下，传统方法存在结构性瓶颈，AI 是目前最具性价比的突破路径"。不需要把所有业务问题都往 AI 上靠，核心判断是"要不要做"，而不是"怎么做"。

决策原则补充：场景识别阶段的核心输出是一个大致的产品规划方向，明确要做什么，不做什么，先做什么，后做什么。

一、AI 与非 AI 的解法对比

规则引擎、人工处理、简单算法往往比大模型更稳定、成本更低。可以自问：这个问题是否一定要用 AI 解决？

1、适合规则引擎或简单算法的场景特征

输入明确、规则固定、输出要求100% 精确（如备案订单校验、合同条款校验、固定格式报表生成）。

2、适合 AI 的场景特征

1）输入多样、规则模糊、存在大量重复性脑力劳动（如策略生成、内容审核初筛）；

2）需要从非结构化数据中提取结构化信息（如用户标签提取，对话意图识别）；

3）输出是一个概率性区间，追求"好用"而非"100% 正确"的场景。

3、五维判断表

维度	判断问题	不适合 AI 的信号
模糊性	问题边界是否模糊、规则是否无法穷举？	规则可写成 if-else 且能覆盖95%以上场景
规模性	该问题的处理频次/数据量是否足够大？	若每天发生不足 100 次，人工完全可覆盖
容错性	输出结果是否允许一定比例的误差？	业务要求 100% 准确，零容忍错误
替代性	是否已有成熟的非 AI 方案可用？	业界已有低成本成熟工具，无需重造
差异化	AI 解法相比非 AI 解法是否有明显优势？	AI 方案成本远高于人工，但效果仅微弱提升

实操建议：把以上表格作为立项前筛查清单，与业务 Owner 在一次业务对齐中共同完成，这样能帮助业务方建立合理预期，避免后期需求反复。

二、业务价值量化

聚焦可量化的指标，拒绝"提升体验""赋能业务"等模糊表述。每个指标要有明确的基准值、目标值、可接受的最低阈值（低于阈值则终止项目）。

核心指标体系：

1、业务指标（和业务目标挂钩）

策略采纳率：业务人员对 AI 推荐结果的认可度
自助解决率：用户不用提单解决问题的比例
付费转化率：生成的策略最终带来的付费转化

2、产品竞争力指标（AI化后的产品能力评估）

意图识别准确率
知识答准率
首token时延
首屏加载时间

3、用户体验指标

NPS：净推荐值=（推荐人数-贬损人数）/总样本数。评估用户是否会帮你拉新。
NSS：净满意度=（（5分+4分的用户数）-权重*（1分+2分的用户数））/总样本数。评估用户当下是否满意。

4、成本指标（必须与效率指标联动，避免"降本增本"的陷阱）

人力成本节省量：以标准全职员工换算，明确是实际减员还是产能释放

AI 调用成本：按 Token 用量或 API 调用次数估算月均成本

ROI 测算：建立简单的ROI 模型，以12 个月为周期核算收益/成本比

指标设置的常见误区

误区1：指标太多

超过5个核心指标往往意味着目标不清晰，建议锁定1个"北极星指标"和 2~3 个辅助指标。

误区2：基准值缺失

只有达到基准值才允许上线。

误区 3：只看正向指标

还应定义"负向护栏指标"，如 AI 回复的有害内容率不超过 0.1%、用户投诉率不超过立项前的 X%，触碰红线则触发人工介入或降级机制。

三、落地可行性评估

业务、数据、技术三个维度缺一不可。任何一个维度出现根本性障碍，都应在立项阶段暂停推进。

1、业务层面

1）有无明确的业务 Owner？没有 Owner 对接，意味着业务目标看护、数据标注、Badcase 反馈都没人配合，项目无法推进；

2）业务Owner对此业务投入的优先级是否足够高？Owner 本身被其他项目占满，配合度会大打折扣，在项目启动时和 Owner 明确人员投入；

3）是否存在变革阻力？企业AI化一般在原有系统上改造，需考虑改造成本是否太高，改造动作能否得到业务Owner的支持；

4）业务流程是否已相对稳定？处于快速变化中的业务流程，AI 训练数据会迅速过时，建议等流程稳定后再立项；

2、数据层面

1）现有数据量是否支撑基本的模型评测？至少有 200 条可用标注数据才开始立项，1000 条才能支撑较可靠的测试结论；

2）数据质量如何？数量够但质量差同样无效，需检查标注口径一致性、数据时效性、是否存在大量缺失字段；

3）数据是否存在权限与合规风险？涉及用户隐私、跨部门数据、境外数据的场景，需在立项阶段完成权限确认和合规预审；

4）若需要多平台数据，是否有明确的采集方案和接口对齐计划？

3、技术层面

1）与算法/研发团队是否完成初步技术对齐？确认技术实现路径是否可行，明确主要技术风险点；

2）该问题用 AI 解决的案例是否充分？参考案例的效果数据是否可信？

3）落地周期是否在业务可接受范围内？建议区分 MVP 版本和完整版本，MVP 周期超过 3 个月的项目，业务接受度会显著下降；

4）依赖项清单：明确外部依赖（如第三方 API、基础模型授权、GPU 资源），以及每个依赖项的风险等级和备选方案；

4、可行性评估的输出物

建议产出一份"立项可行性评估报告"（1~2 页），包含业务/数据/技术三个维度的评估结论、关键风险与应对措施、推荐决策（立项/暂缓/放弃），以及附带 ROI 粗估。

四、任务拆分：先明确做什么，再考虑怎么做

场景确认后，要把业务需求拆解为具体的 AI 任务类型，这一步决定后续的技术选型方向和数据准备策略，是连接"要不要做"和"怎么做"的关键桥梁。

1、语言模型相关任务分类（按功能）

任务类型	典型场景举例	输入示例	输出示例
总结类	对话摘要、周报、会议纪要	原始对话文本（多轮，多角色）	结构化摘要，含关键结论、待办事项
提取类	用户标签提取、关键词提取、实体识别	用户行为日志、自然语言描述	结构化标签列表 + 置信度
检索类	知识库问答、文档检索增强（RAG）	用户查询 + 候选文档集	相关段落 + 来源引用
问答类	AI 客服、员工助手、内部知识问答	用户问题 + 上下文（可选）	自然语言回答 + 置信度（可选）
分类类	意图分类、工单分类、情感分类	单条文本	分类标签 + 置信度
生成类	话术生成、文案扩写、策略生成	主题/关键词/模板	完整生成文本（需标注"AI 生成"标识）

2、多模态任务分类

任务类型	典型场景	数据格式要求	与文本融合方式
图片识别 / 审核	商品图违规检测、OCR 识别	标准化分辨率 + 格式（JPG/PNG）	识别结果转文本后接入 LLM 处理
语音识别（ASR）	客服通话转写、会议录音转文字	WAV/MP3，采样率要求明确	转写结果作为文本任务的输入
语音合成（TTS）	智能外呼、语音播报	输入文本 + 音色参数	文本生成后接 TTS 模块
视频摘要	监控视频事件检测、直播摘要	帧率、分辨率、时长限制	视频帧 + 字幕文本联合输入

3、任务拆分的关键操作要点

1）明确输入/输出格式：清晰的输入输出格式定义直接影响Prompt 设计和评测标准。例如，意图分类的输出应定义为"一级意图标签 + 二级意图标签 + 置信度（0~1）"，而非模糊的"识别用户意图"。

2）识别任务之间的依赖关系：复杂场景往往是多个原子任务的编排，需要画出任务流图，明确哪些任务可以并行，哪些有先后依赖。例如，客服场景中"ASR 转写 → 意图分类 → 知识检索 → 回答生成"是串行链路，任何一环的失败都会影响最终效果。

3）确认人工兜底机制：每个任务类型都应有明确的置信度阈值，低于阈值时触发人工审核，而非直接输出结果。

4）评估任务复杂度与ROI 匹配性：某些拆解出来的子任务，单独用规则或简单模型效果可能更好、成本更低。任务拆分的目的不是"把所有子任务都交给 LLM"，而是按子任务的特性选择最合适的技术路径。

五、场景优先级排序

当同时存在多个候选场景时，需要有明确的优先级排序机制，而非凭直觉选择。

推荐使用 ICE 评分模型对候选场景进行快速排序，每个维度打 1~10 分：

维度	含义	评分参考
Impact（影响力）	场景的业务价值大小，对核心指标的改善程度	10 = 直接影响核心指标；1 = 影响边缘指标
Confidence（确定性）	对 AI 能解决该问题的把握程度	10 = 业界已有大量成功案例；1 = 完全未知领域
Ease（可行性）	实现难度，包括数据、技术、组织资源等综合成本	10 = 业务支持到位、数据充足、技术成熟；1 = 三者均不具备

优先选择"高Impact + 高 Confidence + 高Ease"的场景作为首个试点，建立组织内对 AI 能力的信任，再逐步扩展到高价值但难度更大的场景。

附常见需求优先级评估模型

模型	核心维度	适合场景
ICE	Impact、Confidence、Ease	快速排期、资源有限、增长实验
RICE	Reach、Impact、Confidence、Effort	更强调用户覆盖、长期价值
MoSCoW	Must/Should/Could/Won’t	需求分级、敏捷迭代、版本规划
Kano	基础 / 期望 / 兴奋 / 无差异	体验优化、功能价值定位