温馨提示:若页面不能正常显示数学公式和代码,请阅读原文获得更好的阅读体验。

作者: 丁星星 (连享会)
邮箱: lianxhcn@163.com

Source: Afonso, S., Galiani, S., Gálvez, R. H., & Sosa, R. A. (2026). Deep research on a loop: Using AI agents to construct economic datasets. NBER Working Paper No. 35188. LinkPDFGoogle.

  • 分类:AI 专题
  • Title: 用 AI Agent 收集数据:如何保证质量和可重复性?
  • Keywords: AI Agent, Deep Research, DRIL, 经济数据集, 数据构造, 政策文本, 研究助理, 实证研究
  • 提要: 实证研究中,AI Agent 可以帮助研究者查找资料、整理政策文本和构造变量,但真正困难的是如何保证数据质量、证据链和可重复性。Afonso 等 (2026) 提出的 DRIL 方法,把 Agent 置于固定的研究工具表、研究对象集合和证据规则之下,循环生成可审计的数据记录。本文介绍其方法框架、GTED 应用案例、风险边界和可操作流程。

导读

给 AI Agent 一个问题,它能给你一份措辞流畅、带引用的研究摘要。但如果你想研究 30 个国家 20 年的地方政府举债规则,需要它对 600 个国家-年份对象逐一执行同样的搜索、阅读和编码任务,并保证口径一致、证据可查,事情就完全不同了。Afonso 等 (2026) 提出的 DRIL (Deep Research on a Loop) 方法,正是为了解决这个问题:如何把 AI Agent 从一次性的问答工具,变成一条可重复、可审计的数据生产线。

afonso_dril_fig00-outline-v2-lianxh

1. 数据集构造:人工还是 Agent?

我很认可作者在文中提到的一个观点:实证经济学能回答什么问题,现实中往往不是由识别策略决定的,而是由研究者能否负担得起数据集构造的成本决定的。

比较制度、政治经济学、财政税收、产业政策和监管研究中,很多关键变量都无法从现成数据库中获取。它们分散在法律文本、政府公告、监管文件、财政报告和国际组织报告中。信息公开不等于数据可用——研究者还需要判断来源权威性、处理不同语言和格式、解决来源冲突,再把非结构化文本转化为结构化变量。

传统做法是安排研究助理逐条查找、摘录和编码。问题不只是费时,而是这个过程很难完全复现。有的助理会忽略某个来源,有的会把 A 类政策划为 B 类,这些细小判断几乎无法从最终数据表中看出来。数据在表面上整齐,但背后的判断过程不透明。

DRIL 的切入点在于,把人的判断前置到研究设计阶段,把后续重复性的搜索、记录和编码交给 Agent 循环执行。它解决的不是「AI 能不能帮我查一个问题」,而是「AI 能不能按同一套规则,帮我构造一张可复核的数据表」。

2. Deep Research 和数据集构造,差一个「循环」

不少研究者已经在用研究型 AI Agent 了。给它一个问题,它会自动搜索网页、阅读资料、比较来源,整理出一份带引用的研究报告。这类工具通常被称为 Deep Research,看起来很像一个研究助理。

但这种模式是一次性的。问题变了,输出结构也变了;研究对象变了,资料来源和判断标准也可能跟着漂移。对于构造数据集来说,这远远不够。数据集要求的是跨研究对象的一致性——如果对 600 个国家-年份对象每次都让 Agent 自由发挥,最终得到的是 600 份结构不同、口径不一的研究摘要,而不是 600 行可以合并、比较和回归的数据记录。

DRIL 的改进在于引入「循环」。它不让 Agent 对每个对象自由生成摘要,而是要求 Agent 在同一套规则下反复执行。每次循环对应一个预先定义好的研究对象,例如一个国家-年份、城市-年份、公司-季度或政策-地区。Agent 可以自主搜索和阅读,但不能临时增加变量,也不能改变编码口径。它必须按照预先冻结的规则,输出可审计的数据记录。

简言之,爬虫解决的是「把网页抓下来」,RAG 解决的是「基于已索引资料回答问题」,DRIL 解决的是「在统一研究设计下,把分散资料转化为可审计的数据记录」。

这套规则在论文里被称为「研究协议」,至少包括四个部分:

  • 研究工具表(规定要收集哪些变量、取值范围和编码规则)
  • 研究对象集合(预先枚举 Agent 需要逐一处理的对象范围)
  • 证据规则(来源优先级、引用格式、冲突处理方式)
  • 数据质量控制机制(记录无法编码情形和不确定性,避免把「查了没找到」和「根本没查」混在一起)

这套协议的价值在于,它把 Agent 的自由探索限制在一个可审计的制度内。Agent 可以搜索、阅读和判断,但判断必须留下证据;Agent 可以找不到资料,但不能静默填空;Agent 遇到来源冲突,必须标记冲突,而不是自己编一个看似合理的答案。

温馨提示:若页面不能正常显示数学公式和代码,请阅读原文获得更好的阅读体验。

Logo

欢迎加入 MCP 技术社区!与志同道合者携手前行,一同解锁 MCP 技术的无限可能!

更多推荐