A2A 协议落地 —— 从“前瞻设计“到“标准化接入“

暗黑小白

210人浏览 · 2026-06-25 17:18:35

暗黑小白 · 2026-06-25 17:18:35 发布

讨论 MCP 时，我们用"标准协议替代手写胶水"解决工具暴露问题。但那是"纵向"的——Agent 怎么调用工具。本文讨论"横向"的问题：当有多个 Agent 要相互协作，或者外部系统想把 Shop-Agent 当成一个黑盒能力直接调用时，他们怎么发现 Shop-Agent 能做什么、怎么把任务提交给它、怎么拿到结果？

答案是 A2A（Agent-to-Agent）协议。与 MCP 一样，A2A 本身不是"功能"，是"接口标准化"——它不替代业务逻辑，但让业务逻辑能被更多人、更多系统发现和使用。

先看问题：外部系统怎么"用" Shop-Agent？

在没有标准协议之前，外部系统要集成 Shop-Agent 只有两条路：

直接调 HTTP API：看源码找到对话端点，自己构造请求体、解析响应格式。问题是这套接口是"为人设计的"——同步阻塞、一次一问、没有任务概念。
用 WebSocket：更低延迟但协议完全自定义。

两个方案的共同问题：没有人能仅凭"标准约定"就知道 Shop-Agent 对外暴露了什么。 你永远需要看源码或文档——这就是胶水。A2A 的核心价值不在于"更快"或"更准"，在于让机器通过标准协议自动发现和调用 Agent。

A2A 协议的四层设计

以 Google A2A 规范为参考，实现了四层：

P0 异步任务：提交任务并返回 task_id，支持轮询结果和取消——区别于同步 HTTP API 的核心能力。
P1 Webhook：任务完成后主动回调订阅方，HMAC 签名防伪造，替代高频轮询。
P2 对话共享：外部系统可拉取历史消息，让多个 Agent 读同一段上下文，避免重复提问。
P3 健康检查：不只报告进程存活性，对 LLM、向量库、Redis、MCP Server 逐一做依赖探测。

配合 Agent Card（GET /.well-known/agent-card.json），外部系统在访问任何业务 API 之前就先知道这个 Agent 叫什么、能做什么、能力边界在哪。

核心设计决策

实现中几个关键决策值得展开聊聊——不是"怎么写"，而是**“为什么这么选”**。

1. Agent Card 与 MCP 的数据同源

Agent Card 和 MCP 的 tools/list 都在描述"Shop-Agent 能做什么"——如果两套描述来自不同数据源，早晚会不一致。所以Agent Card 的 skill 列表直接从 SkillRegistry 生成，与 MCP 共享同一份数据。skills/ 目录下的 Markdown 文件是唯一的 truth source，加一个 skill 两处自动同步。

Card 里除了 skill 列表，还声明了 capabilities.asyncTasks=true——这是 A2A 协议区别于普通 REST API 的关键字段。外部系统看到它就明白：任务异步执行，需要轮询或等 Webhook 回调。

首次构建触发冷启动，之后内存缓存命中——对 discovery 端点来说足够了。

2. 异步任务的"薄壳"模式

A2A 的任务 API 不是另起炉灶重写一套 Agent 调用逻辑。提交任务后立即创建任务记录（状态 pending），返回 task_id，然后在后台异步调已有的对话服务。

这是刻意为之——只在现有同步调用外面包一层异步外壳。好处很明显：A2A 层薄到不需要维护自己的 Agent 逻辑，所有意图识别、路由、工具调用的改进自动对 A2A 入口生效。

任务状态机只有五个值：pending → running → completed | failed | cancelled。cancelled 是终态不可恢复。列表接口支持分页，当前使用内存存储。

3. Webhook 与轮询的取舍

轮询方案最简单：每 N 秒查一次任务状态。但高频轮询浪费带宽，低频轮询增加端到端延迟。

Webhook 是 push 模式——任务完成后主动 POST 到订阅方。代价是订阅方需要暴露 HTTP 端点，而且需要防止伪造回调。所以加上了 HMAC-SHA256 签名：注册时提供 secret，每次回调在 X-A2A-Signature 头携带签名。订阅有 TTL 过期机制，内部定时清理。

两个方案不是非此即彼——A2A 协议同时支持轮询和 Webhook，集成方按自己的场景选择。轻量集成（比如脚本）用轮询；生产级集成（n8n、Dify）用 Webhook。

4. 对话共享：A2A 层的公共存储

多 Agent 协作有一个常见痛点：BuyerAgent 问了用户订单号，轮到 MediatorAgent 时又要再问一遍。A2A 层的对话共享就是解这个的——每次对话完成后自动存入公共存储，外部系统通过 API 拉取历史。

公共存储根据数据特点保存到 Redis 或数据库中。

5. 健康检查与服务降级

健康检查对 LLM、向量库、Redis、MCP Server 等依赖做独立探测，返回各自状态。上游编排系统可据此做降级路由——比如 LLM 不可用时暂停任务分发、向量库断连时 RAG 退化为纯 BM25。

A2A + MCP 的职责边界

这两个协议经常被放在一起讨论，但它们的职责完全不重叠：

A2A 管"谁跟谁说话"——发现 Agent、提交任务、等结果。MCP 管"手里有什么工具"——列出工具、调工具、取资源。两层互不重叠：A2A 不关心 ReActAgent 调了哪个 tool，MCP 不关心任务是谁提交的。

MCP 和 A2A 不能提升意图识别准确率，不能降低 RAG 延迟。它们解决的是另一个层级的问题：当你把系统做完了，谁能"看见"它？ 如果没有标准协议，答案是"只有你自己"——因为别人要读懂你的源码才知道怎么调用你。有了 MCP 和 A2A，任何遵循相同协议的系统都可以自动发现你、调用你——不需要看源码，不需要写胶水。

配合 MCP 实践，MCP 管纵向（Agent → Tool），A2A 管横向（Agent → Agent），两协议构成了 Shop-Agent 的标准化层。接入成本从"读源码翻文档"降为"读一张 Agent Card + 调一次 tools/list"。

实现上有一条核心原则值得单拎出来：A2A 是对外的门，不是对内的水管道。 ReActAgent ↔ ToolService 同进程内走直接函数调用就够了——不必把 JSON-RPC 序列化强塞进进程内部。反过来，也没有把 DisputeCoordinator 内部的 BuyerAgent/SellerAgent/MediatorAgent 拆成独立进程走 A2A 通信——因为它们在同一进程中闭环，拆了只增加网络开销，没有显性收益。知道什么时候不用一个协议，和知道什么时候用它一样重要。

MCP技术社区

欢迎加入 MCP 技术社区！与志同道合者携手前行，一同解锁 MCP 技术的无限可能！

更多推荐

AI Agent 入门与实战：从对话到干活，理解下一代AI工作方式

你告诉Agent一个目标，它会自己拆解成步骤，调用工具（文件操作、命令行、API接口），逐步执行，遇到问题会自己尝试修复，最后给你交付结果。第一，Agent写的代码不是100%可靠的。对于一个已经在写代码的开发者来说，现在最重要的事情不是"学什么新语言或新框架"，而是学会怎么让Agent帮你干活、提高你不可替代的那部分能力——业务理解、架构设计、技术判断。用Agent的做法是：你告诉它需求，它自己

MCP技术社区

MCP企业运用全面知识点-进阶篇

本文是MCP（Model Context Protocol）企业运用进阶指南，重点对比MCP与其他技术方案的差异，并详细阐述企业级部署方案。主要内容包括：技术方案对比：将MCP与Function Calling、OpenAI Plugins/Assistants API及传统REST/GraphQL API进行多维度比较，突出MCP在标准化、扩展性和上下文管理方面的优势。企业部署方案：提供从基