实践出真知-AI Agent-New
盗录播快慢Agent(设计灵感来源?)
背景:
在直播盗录播治理场景中,由于形式繁杂、风险对抗快、判别逻辑复杂,缺少可解释依据等挑战,现有盗录播治理方案存在风险召回滞后、缺乏系统性的核心问题。
盗录播风险召回Agent 2.0 旨在构建多模态特征与工具链支撑的自主决策Agent,实现动态轨迹生成与聚合研判。并且通过Agentic RL优化基座模型Planning能力(怎么做的?),提升判别准召和通用泛化能力
主要工作:
-
内容理解工具集:Workflow Tools、特征类 Tools、检索类 Tools;
-
快慢思考框架:设计低延迟和高质量兼顾的Agent推理模式;
-
Agentic RL:通过Agentic SFT/RL优化基座模型Planning能力,提升判别准确率与召回率
整体架构

-
Agent 规划决策层 (LangGraph):负责 Agent 的核心逻辑规划决策。我们选择业界主流的 LangGraph 框架实现。在线服务的低延迟要求,与 ReAct、Plan-and-Execute 等主流 Agent 推理模式依赖多轮环境交互修正推理路径的特性相矛盾,导致在线决策 Agent 需在低延迟与推理质量之间进行权衡,为了解决这个问题,我们通过轨迹上报将反思修正offload到离线环境,构建在线低延迟、离线高质量的快慢思考 Agent 执行框架。
-
快思考:在线低延迟环境,只进行有限步的“规划→执行”,进行在线推理决策。
-
慢思考:离线异步环境,针对在线轨迹进行反思修正,为在线agent做出反馈和优化。
-
-
工具能力托管层 (AIPaas MCP Server):负责将所有外部依赖(如特征提取、检索、业务逻辑判断等)封装为标准化的工具。我们采用 AIPaas 提供的 MCP Server(Model Context Protocol Server)作为工具托管平台。这样做的好处在于:
-
标准化与解耦:所有工具都遵循 MCP 协议,Agent 无需关心底层服务的实现(HTTP, RPC, FaaS 等),只需通过统一的 MCP Client 调用。降低了 Agent 与工具之间的耦合度。
-
可观测与治理:AIPaas 平台为 MCP Server 提供了完善的发布、调试、监控和鉴权能力。我们可以通过环境变量或请求变量安全地传递 PSM 授权、用户身份等敏感信息,并通过 SSE (Server-Sent Events) 或标准 HTTP 进行高效的数据传输。
-
鲁棒性与效率(怎么理解?):缓存工具调用结果到Abase中,通过控制参数/中间件,区分进行工具执行还是缓存载入。保证轨迹评测时工具调用结果的可复现性,支撑高效的离线轨迹Rollout。
-
-
轨迹上报与优化闭环层 (OrbitFlow Cache):负责 Agent 的可观测性、评测和数据驱动的优化。基于OrbitFlow框架的缓存机制,将Agent推理的特征输入、执行计划、工具结果等轨迹信息缓存到Abase中用于离线评测优化:
-
轨迹上报与分析:通过OrbitFlow框架Abase缓存机制,将Agent 执行的每一个步骤(思考、工具调用、模型输入输出)自动上报,形成结构化的 Trace 轨迹。为问题定位、性能分析提供了Groundtruth数据。
-
评测与数据回流:基于Aime、ValleyClaw等Agent平台,采样EROR、ASR、WLR等Hardcase数据集,对缓存的 Agent 轨迹进行自动化评估。将高价值的Case一键回流,构建用于 Agentic SFT 和 RL 的高质量数据集。
-
内容理解工具集
MCP Tools开发框架

-
MCP Server(怎么理解?):
-
网关层(MCP协议解析):使用AI Paas平台发布工具(基于Faas计算服务)进行请求鉴权,工具发现等操作。构建异步函数支持在线/离线场景,将工具请求映射为对OrbitFlow服务的RPC调用。
-
服务层(工具执行):使用Orbitflow服务框架(基于TCE计算服务)进行工具部署,支持来自机审、TCE服务、MCP网关的RPC调用。
-
-
MCP Client:
-
bytedance.mcp实现工具发现。 -
bytedance.mcp_langgraph_adapter将AI PaaS上发布的工具转换成LangGraph格式的Tools
-
MCP内容理解工具集
|
类型 |
能力 |
|
内容原子标签 直播、视频 |
|
|
达人原子标签 |
|
|
消重检索 |
|
|
数据查询 |
|
|
ExpertAgents |
|
快慢思考框架
更多推荐

所有评论(0)