MCP 热了，A2A 来了，真正决定科研 Agent 上限的其实是“证据基础设施

m0_61134850

322人浏览 · 2026-06-22 10:30:04

m0_61134850 · 2026-06-22 10:30:04 发布

导语
过去一年，Agent 的热点从“会不会聊天”转向“能不能稳定调用工具、返回可追溯结果、跨系统协作”。对科研场景来说，真正的分水岭不是模型参数，而是证据层是否足够可靠。Sciverse 的价值，正好落在这个关键位置。

为什么这个话题是现在

如果把近一年的 Agent 技术脉络串起来，会看到四个非常明确的信号。

第一，Agent 已经从单轮生成，走向“模型 + 工具 +工作流”。OpenAI 在 2025 年 3 月发布 Responses API 和内置工具，把 Web Search、File Search、Computer Use 这类能力直接纳入 Agent 开发主线，说明“工具调用”已经不是外挂，而是主能力。

第二，MCP 正在把工具接入标准化。Anthropic 在 2024 年 11 月公开 Model Context Protocol，核心价值不是再造一个模型，而是给“模型如何安全、统一地连外部工具和数据源”提供公共接口层。对开发者而言，这意味着 Agent 能力开始从“单体产品功能”变成“可组合基础设施”。

第三，多 Agent 协作开始出现协议化趋势。Google 在 2025 年 4 月推出 Agent2Agent（A2A）协议，表明行业已经不满足于“一个 Agent 调很多工具”，而是进一步进入“多个 Agent 如何交换任务、上下文与结果”的阶段。

第四，开源模型也在主动靠近 Agent 生态。Qwen3 在 2025 年 4 月的官方发布中明确强调了对推理、指令跟随和 Agent 相关能力的增强，并给出与 MCP 结合的实践方向。开源模型不再只是“便宜替代”，而是在争夺 Agent 运行时入口。

一句话概括：Agent 的竞争正在从模型能力，迁移到协议、工具和证据链。

真正的瓶颈：科研 Agent 不是缺答案，而是缺“可验证答案”

通用 Agent 可以先追求“可用”，科研 Agent 则必须优先追求“可证”。因为科研任务里，用户真正关心的不是一句结论，而是：

这条结论来自哪篇论文？
原文片段是什么？
能不能定位到页码、偏移、DOI？
如果我要继续追问，系统能不能回到同一证据链？

这正是 Sciverse 能切入的位置。结合官网、公开仓库和项目内 PRD，Sciverse 当前最有代表性的能力不是一个“聊天机器人”，而是一组面向科研任务的证据型接口：

POST /agentic-search：面向自然语言问题做语义检索
POST /meta-search：面向年份、期刊、引用数等结构化条件筛选论文
GET /content：按 doc_id 与 offset 回读正文上下文
GET /meta-catalog：获取可筛选字段目录
API 基地址：https://api.sciverse.space
认证方式：Bearer $SCIVERSE_API_TOKEN

项目内 PRD 也很清楚地把这些能力包装成四类任务：自由检索、生成研究综述、筛选论文清单、跟踪研究方向。换句话说，Sciverse 不是只提供“搜索框”，而是在向上抽象“科研 Agent 可复用任务流”。

Sciverse 的切入点：把 MCP/A2A 上层热度，落到科研证据底座

一个很适合传播的判断是：

MCP 解决的是“Agent 怎么接工具”，Sciverse 解决的是“Agent 接上工具之后，拿到的科研证据是否可信”。

如果把整条链路拆开，角色非常清楚：

层级	行业热点	负责什么	Sciverse 的位置
模型层	Qwen3、各类推理模型	规划、总结、生成	可作为上层 LLM 使用
协议层	MCP、A2A、Responses API	工具接入、任务协作	可被封装为 Tool Provider
数据与证据层	科研检索、论文元数据、正文回读	提供可追溯事实	Sciverse 的核心价值
任务层	综述生成、方向跟踪、论文筛选	面向终端科研工作流	Sciverse 已有任务化雏形

这也是为什么通用 RAG 方案很难直接替代 Sciverse。通用 RAG 往往解决“召回文本”，但科研场景还要求：

元数据过滤要严谨
引文与正文片段要可追踪
证据包要适配综述、筛选、跟踪等不同任务
后续 Agent 调用要保留结构化上下文，而不是只吐自然语言

技术拆解：一个可落地的科研 Agent 架构

可以把 Sciverse 接入 Agent 的最小架构理解为 4 步：

用户问题
-> Agent 规划器
-> Sciverse 检索工具（agentic-search / meta-search）
-> 证据补全（content）
-> Evidence Pack
-> LLM 生成综述 / 清单 / 跟踪摘要
-> 输出可追溯结果

如果进一步对齐 MCP 思路，可以把 Sciverse 暴露成一组工具：

search_papers -> 映射 POST /meta-search
semantic_search -> 映射 POST /agentic-search
read_content -> 映射 GET /content
list_catalog -> 映射 GET /meta-catalog

这样做的好处是，上层 Agent 不必理解科研数据源的全部细节，只要会在合适时机调用工具，并把返回结果组装成 evidence pack 即可。

一个可改造的代码示例

下面示例展示“先结构化筛选，再补语义检索”的最小脚本，可直接改成 Node 服务或 MCP Tool handler：

const BASE = "https://api.sciverse.space";
const TOKEN = process.env.SCIVERSE_API_TOKEN!;

async function call(path: string, init: RequestInit) {
  const res = await fetch(`${BASE}${path}`, {
    ...init,
    headers: {
      Authorization: `Bearer ${TOKEN}`,
      "Content-Type": "application/json",
      ...(init.headers || {}),
    },
  });
  if (!res.ok) throw new Error(`${path} -> ${res.status} ${await res.text()}`);
  return res.json();
}

async function main() {
  const shortlist = await call("/meta-search", {
    method: "POST",
    body: JSON.stringify({
      query: "citation grounding scientific agents",
      filters: [
        { field: "publication_published_year", operator: "FILTER_OP_GTE", value: 2024 }
      ],
      page_size: 5
    }),
  });

  const evidence = await call("/agentic-search", {
    method: "POST",
    body: JSON.stringify({
      query: "How do scientific agents ground claims with citations?",
      top_k: 8,
      source_types: ["pdf", "web"],
      mode: "balanced"
    }),
  });

  console.log(JSON.stringify({ shortlist, evidence }, null, 2));
}

main().catch(console.error);

这段代码本身并不生成最终答案，但它已经完成了科研 Agent 最关键的一步：把“问题”转换成“可追溯证据集合”。

“别急着生成，先把证据包做对”

Evidence Pack 建议至少包含这些字段：

论文标题
doc_id
chunk_id
offset
page_no
DOI
相关度分数
原文片段
结构化筛选条件

原因很简单：后续无论是综述生成、清单导出，还是研究方向跟踪，都依赖同一批证据对象复用。如果这一步偷懒，后面的 Agent 再聪明，也只能在不稳定地“编”。

评测与验证方案

**本文未进行实测跑分。**下面只提供可复现实验设计，避免伪造吞吐、延迟、准确率或成本数字。

评测目标

比较三类方案在科研任务中的表现：

方案	描述	主要观察点
通用 Web/RAG	只用通用搜索或网页抓取	召回广，但证据一致性可能弱
Sciverse 检索链路	`meta-search + agentic-search + content`	证据可追溯性与结构化能力
Sciverse + Agent 编排	在前者之上加入综述/跟踪任务流	任务完成度与复用性

记录模板

任务：
输入：
方案：
召回文献数：
可回链结论数：
缺失字段：
人工复核意见：
是否适合进入下游写作/报告：

如果后续需要对外发布评测结果，建议同时公开：

测试日期
数据集来源
Prompt 模板
版本号
是否启用 rerank / filtering / content 回读

对 Sciverse 的启示

今天谈 Agent，最容易被高估的是“会不会用工具”，最容易被低估的是“工具返回的证据是否能支撑严肃任务”。

对 Sciverse 来说，这恰恰是机会窗口：

上层协议在标准化，意味着 Sciverse 更容易接入主流 Agent 运行时
开源模型在增强 Agent 能力，意味着更多团队需要现成的科研证据工具
科研工作流在从“检索框”升级为“任务流”，意味着 Sciverse 可以继续向综述、筛选、跟踪这些高频任务上收接口价值

一句适合传播的话是：

未来科研 Agent 的护城河，不只是推理能力，而是“证据能不能被反复调用、反复核查、反复复用”。

结尾

如果你正在做科研 Agent、科学检索、RAG for Science，或者想把 MCP/工具调用真正落到“可证据化”的工作流里，Sciverse 是一个值得尽快试接的基础层选择。比起再包装一个聊天入口，更重要的是先把证据链打通。

可以优先从三件事开始：

用 agentic-search 跑通一个学术问答原型
用 meta-search + content 做一个可追溯综述生成器
把公开的 Sciverse Agent Tools 接到你的 Agent/MCP 运行时里

事实核查清单

OpenAI Responses API 与内置工具发布时间：已核对为 2025-03-11
MCP 公开发布时间：已核对为 2024-11-25
Google A2A 发布时间：已核对为 2025-04-09
Qwen3 发布时间：已核对为 2025-04-29
Sciverse API 基地址与认证环境变量：已核对项目内实现
Sciverse 核心接口 /agentic-search、/meta-search、/content、/meta-catalog：已核对项目内实现与公开仓库说明
Sciverse 前端任务流“自由检索/综述/筛选/跟踪”：已核对项目内 PRD
Sciverse 公开 llms.txt：截至 2026-06-22 未检索到可确认公开地址，属待验证信息，本文未写死其存在

MCP技术社区

欢迎加入 MCP 技术社区！与志同道合者携手前行，一同解锁 MCP 技术的无限可能！

更多推荐

.NET 11 Preview 4 正式发布：Runtime-Async 全面启用、Process API 大幅扩展

NET 11 Preview 4 是一次覆盖面广、深度够足的更新。Runtime-Async 全面启用标志着 .NET 异步编程模型进入新阶段——从编译器生成状态机转向运行时原生调度，吞吐和体积收益将在后续预览版中逐步显现。Process API 扩展是系统编程（system programming）在 .NET 中的一次重要补位，让脚本式进程调用成为可能。在 OpenAPI、Blazor 基础设

MCP技术社区

AI Agent 替你写代码没问题，但这 3 类后端任务让它当场翻车

先给你一个结果数字：单测编写这件事，我以前每次要花 40 分钟，现在 5 分钟交给 AI，自己只需要 review 10 分钟，整体省了 25 分钟。但线上故障排查，我让 AI 介入了 3 次，有 1 次它给出的修复方案引入了新问题，排查时间反而比自己来更长。这篇文章想说清楚的就是这件事：AI Agent 的真实天花板在哪。图：后端工程师使用 AI Agent 前后的工作感受对比。