盗录播快慢Agent(设计灵感来源?)

背景:

在直播盗录播治理场景中,由于形式繁杂、风险对抗快、判别逻辑复杂,缺少可解释依据等挑战,现有盗录播治理方案存在风险召回滞后、缺乏系统性的核心问题。

盗录播风险召回Agent 2.0 旨在构建多模态特征与工具链支撑的自主决策Agent,实现动态轨迹生成与聚合研判。并且通过Agentic RL优化基座模型Planning能力(怎么做的?),提升判别准召和通用泛化能力

主要工作:

  • 内容理解工具集:Workflow Tools、特征类 Tools、检索类 Tools;

  • 快慢思考框架:设计低延迟和高质量兼顾的Agent推理模式;

  • Agentic RL:通过Agentic SFT/RL优化基座模型Planning能力,提升判别准确率与召回率

整体架构

  • Agent 规划决策层 (LangGraph):负责 Agent 的核心逻辑规划决策。我们选择业界主流的 LangGraph 框架实现。在线服务的低延迟要求,与 ReAct、Plan-and-Execute 等主流 Agent 推理模式依赖多轮环境交互修正推理路径的特性相矛盾,导致在线决策 Agent 需在低延迟与推理质量之间进行权衡,为了解决这个问题,我们通过轨迹上报将反思修正offload到离线环境,构建在线低延迟、离线高质量的快慢思考 Agent 执行框架

    • 快思考:在线低延迟环境,只进行有限步的“规划→执行”,进行在线推理决策。

    • 慢思考:离线异步环境,针对在线轨迹进行反思修正,为在线agent做出反馈和优化。

  • 工具能力托管层 (AIPaas MCP Server):负责将所有外部依赖(如特征提取、检索、业务逻辑判断等)封装为标准化的工具。我们采用 AIPaas 提供的 MCP Server(Model Context Protocol Server)作为工具托管平台。这样做的好处在于:

    • 标准化与解耦:所有工具都遵循 MCP 协议,Agent 无需关心底层服务的实现(HTTP, RPC, FaaS 等),只需通过统一的 MCP Client 调用。降低了 Agent 与工具之间的耦合度。

    • 可观测与治理AIPaas 平台为 MCP Server 提供了完善的发布、调试、监控和鉴权能力。我们可以通过环境变量或请求变量安全地传递 PSM 授权、用户身份等敏感信息,并通过 SSE (Server-Sent Events) 或标准 HTTP 进行高效的数据传输。

    • 鲁棒性与效率(怎么理解?):缓存工具调用结果到Abase中,通过控制参数/中间件,区分进行工具执行还是缓存载入。保证轨迹评测时工具调用结果的可复现性,支撑高效的离线轨迹Rollout。

  • 轨迹上报与优化闭环层 (OrbitFlow Cache):负责 Agent 的可观测性、评测和数据驱动的优化。基于OrbitFlow框架的缓存机制,将Agent推理的特征输入、执行计划、工具结果等轨迹信息缓存到Abase中用于离线评测优化:

    • 轨迹上报与分析:通过OrbitFlow框架Abase缓存机制,将Agent 执行的每一个步骤(思考、工具调用、模型输入输出)自动上报,形成结构化的 Trace 轨迹。为问题定位、性能分析提供了Groundtruth数据。

    • 评测与数据回流:基于Aime、ValleyClaw等Agent平台,采样EROR、ASR、WLR等Hardcase数据集,对缓存的 Agent 轨迹进行自动化评估。将高价值的Case一键回流,构建用于 Agentic SFT 和 RL 的高质量数据集。

内容理解工具集

MCP Tools开发框架

  • MCP Server(怎么理解?):

    • 网关层(MCP协议解析):使用AI Paas平台发布工具(基于Faas计算服务)进行请求鉴权,工具发现等操作。构建异步函数支持在线/离线场景,将工具请求映射为对OrbitFlow服务的RPC调用。

    • 服务层(工具执行):使用Orbitflow服务框架(基于TCE计算服务)进行工具部署,支持来自机审、TCE服务、MCP网关的RPC调用。

  • MCP Client:

    • bytedance.mcp 实现工具发现。

    • bytedance.mcp_langgraph_adapter 将AI PaaS上发布的工具转换成LangGraph格式的Tools

MCP内容理解工具集

类型

能力

内容原子标签

直播、视频

  • 人物: 形象/年龄

  • 物品: 禁限售

  • 行为: 危险行为/敏感言论/赌博

  • 功效: 医疗/保健/美容

  • 导流: 方式/导流目标

  • 对抗: AB帧/三明治/人脸对抗/画面对抗

  • 宣传: 价格/功效/规格/话术/售后

  • 盗播: 重复/帧类别/非本地画风/站外水印

  • 录播: 屏幕录制/内容循环

  • 伪原创: 洗稿/混剪/镜像/变速

  • 低成本制作: AIGC/批量模板

  • 内容质量: 视觉/音频/语义/互动风格

  • 基础属性: 视频/直播/商品

  • 内容反馈: 举报/负反馈

达人原子标签

  • 基础信息: 昵称/国家/等级/类型/粉丝量

  • 入驻: 首次发文/首次电商发文/新手村

  • 活跃度: 历史发文量/7日发文量

  • 粉丝: 粉丝量/粉丝增长量/直播关注量

  • 风险: 达人风险分/风控等级/达人团伙规模

  • 销售: GMV/直播GMV/周GMV/月GMV

  • 用户反馈: 举报(周、月)/负反馈(周、月)

  • 违规: policy罚单量(周、月)

  • 申诉: policy申诉成功量(周、月)

消重检索

  • 消重: 画面/音频/ASR

  • 黑库: 画面/音频/人脸/商品

  • Pair比对: 画面/商品/文本

  • 相似聚簇: 音频/人物/商品/背景

数据查询

  • 单点查询: 直播切片/视频/商品

  • 批量查询: SQL执行/pearl_id_list

ExpertAgents

  • 负反馈 RCA Agent: Vulgar

  • 风险召回 Agent: 录播

  • 风险感知 Agent:录播

  • Auto-Workflow: ForgeSmith

  • 分割检测 Agent:Logo/水印检测

  • Caption Agent

快慢思考框架

Logo

欢迎加入 MCP 技术社区!与志同道合者携手前行,一同解锁 MCP 技术的无限可能!

更多推荐