实践出真知-AI Agent-New

Victory_tc

14人浏览 · 2026-06-25 00:53:13

Victory_tc · 2026-06-25 00:53:13 发布

盗录播快慢Agent（设计灵感来源？）

背景：

在直播盗录播治理场景中，由于形式繁杂、风险对抗快、判别逻辑复杂，缺少可解释依据等挑战，现有盗录播治理方案存在风险召回滞后、缺乏系统性的核心问题。

盗录播风险召回Agent 2.0 旨在构建多模态特征与工具链支撑的自主决策Agent，实现动态轨迹生成与聚合研判。并且通过Agentic RL优化基座模型Planning能力（怎么做的？），提升判别准召和通用泛化能力

主要工作：

内容理解工具集：Workflow Tools、特征类 Tools、检索类 Tools；
快慢思考框架：设计低延迟和高质量兼顾的Agent推理模式；
Agentic RL：通过Agentic SFT/RL优化基座模型Planning能力，提升判别准确率与召回率

整体架构

Agent 规划决策层 (LangGraph)：负责 Agent 的核心逻辑规划决策。我们选择业界主流的 LangGraph 框架实现。在线服务的低延迟要求，与 ReAct、Plan-and-Execute 等主流 Agent 推理模式依赖多轮环境交互修正推理路径的特性相矛盾，导致在线决策 Agent 需在低延迟与推理质量之间进行权衡，为了解决这个问题，我们通过轨迹上报将反思修正offload到离线环境，构建在线低延迟、离线高质量的快慢思考 Agent 执行框架。
- 快思考：在线低延迟环境，只进行有限步的“规划→执行”，进行在线推理决策。
- 慢思考：离线异步环境，针对在线轨迹进行反思修正，为在线agent做出反馈和优化。
工具能力托管层 (AIPaas MCP Server)：负责将所有外部依赖（如特征提取、检索、业务逻辑判断等）封装为标准化的工具。我们采用 AIPaas 提供的 MCP Server（Model Context Protocol Server）作为工具托管平台。这样做的好处在于：
- 标准化与解耦：所有工具都遵循 MCP 协议，Agent 无需关心底层服务的实现（HTTP, RPC, FaaS 等），只需通过统一的 MCP Client 调用。降低了 Agent 与工具之间的耦合度。
- 可观测与治理：AIPaas 平台为 MCP Server 提供了完善的发布、调试、监控和鉴权能力。我们可以通过环境变量或请求变量安全地传递 PSM 授权、用户身份等敏感信息，并通过 SSE (Server-Sent Events) 或标准 HTTP 进行高效的数据传输。
- 鲁棒性与效率（怎么理解？）：缓存工具调用结果到Abase中，通过控制参数/中间件，区分进行工具执行还是缓存载入。保证轨迹评测时工具调用结果的可复现性，支撑高效的离线轨迹Rollout。
轨迹上报与优化闭环层 (OrbitFlow Cache)：负责 Agent 的可观测性、评测和数据驱动的优化。基于OrbitFlow框架的缓存机制，将Agent推理的特征输入、执行计划、工具结果等轨迹信息缓存到Abase中用于离线评测优化：
- 轨迹上报与分析：通过OrbitFlow框架Abase缓存机制，将Agent 执行的每一个步骤（思考、工具调用、模型输入输出）自动上报，形成结构化的 Trace 轨迹。为问题定位、性能分析提供了Groundtruth数据。
- 评测与数据回流：基于Aime、ValleyClaw等Agent平台，采样EROR、ASR、WLR等Hardcase数据集，对缓存的 Agent 轨迹进行自动化评估。将高价值的Case一键回流，构建用于 Agentic SFT 和 RL 的高质量数据集。

内容理解工具集

MCP Tools开发框架

MCP Server（怎么理解？）：
- 网关层（MCP协议解析）：使用AI Paas平台发布工具（基于Faas计算服务）进行请求鉴权，工具发现等操作。构建异步函数支持在线/离线场景，将工具请求映射为对OrbitFlow服务的RPC调用。
- 服务层（工具执行）：使用Orbitflow服务框架（基于TCE计算服务）进行工具部署，支持来自机审、TCE服务、MCP网关的RPC调用。
MCP Client：
- bytedance.mcp 实现工具发现。
- bytedance.mcp_langgraph_adapter 将AI PaaS上发布的工具转换成LangGraph格式的Tools

MCP内容理解工具集

类型	能力
内容原子标签直播、视频	人物: 形象/年龄物品: 禁限售行为: 危险行为/敏感言论/赌博功效: 医疗/保健/美容导流: 方式/导流目标对抗: AB帧/三明治/人脸对抗/画面对抗宣传: 价格/功效/规格/话术/售后盗播: 重复/帧类别/非本地画风/站外水印录播: 屏幕录制/内容循环伪原创: 洗稿/混剪/镜像/变速低成本制作: AIGC/批量模板内容质量: 视觉/音频/语义/互动风格基础属性: 视频/直播/商品内容反馈: 举报/负反馈
达人原子标签	基础信息: 昵称/国家/等级/类型/粉丝量入驻: 首次发文/首次电商发文/新手村活跃度: 历史发文量/7日发文量粉丝: 粉丝量/粉丝增长量/直播关注量风险: 达人风险分/风控等级/达人团伙规模销售: GMV/直播GMV/周GMV/月GMV 用户反馈: 举报（周、月）/负反馈（周、月）违规: policy罚单量（周、月）申诉: policy申诉成功量（周、月）
消重检索	消重: 画面/音频/ASR 黑库: 画面/音频/人脸/商品 Pair比对: 画面/商品/文本相似聚簇: 音频/人物/商品/背景
数据查询	单点查询: 直播切片/视频/商品批量查询: SQL执行/pearl_id_list
ExpertAgents	负反馈 RCA Agent: Vulgar 风险召回 Agent: 录播风险感知 Agent：录播 Auto-Workflow: ForgeSmith 分割检测 Agent：Logo/水印检测 Caption Agent

快慢思考框架

MCP技术社区

欢迎加入 MCP 技术社区！与志同道合者携手前行，一同解锁 MCP 技术的无限可能！

更多推荐

受不了 Burp 几百 MB 还要装 JRE：我用 Rust + GPUI 写了个 16MB 的安全套件

嫌 Burp Suite 动辄数百 MB、依赖 JVM、空载就吃几百兆内存，我用纯 Rust 内核 + gpui(GPU 加速)原生界面重写了一套对标 Burp 的安全测试工作台 Scry：单文件二进制 14MB、打包 .app 15MB、压缩包不到 10MB。本文拆解它如何做到这么小，以及 MITM 解密内核、TLS 指纹、WASM 扩展沙箱、给 AI 用的 MCP 接口等关键工程实现。

MCP技术社区

【无标题】

随着企业级AI应用进入快速发展阶段，越来越多组织开始建设属于自己的知识库系统、AI Agent平台以及数字员工体系。关键词：Dify企业版、Dify企业版服务商、Dify服务商、Dify最佳服务商、JOTO、聚托科技。作为专业的Dify企业版服务商，JOTO围绕企业AI建设形成了一整套实施方法论。因此对于希望长期建设企业AI能力的组织来说，专业服务团队的重要性正在不断提升。而在众多AI应用开发平台