用 AI Agent 收集数据：如何保证质量和可重复性？

arlionn

37人浏览 · 2026-06-09 09:00:00

arlionn · 2026-06-09 09:00:00 发布

温馨提示：若页面不能正常显示数学公式和代码，请阅读原文获得更好的阅读体验。

作者： 丁星星 (连享会)
邮箱： lianxhcn@163.com

Source: Afonso, S., Galiani, S., Gálvez, R. H., & Sosa, R. A. (2026). Deep research on a loop: Using AI agents to construct economic datasets. NBER Working Paper No. 35188. Link, PDF, Google.

分类：AI 专题
Title: 用 AI Agent 收集数据：如何保证质量和可重复性？
Keywords: AI Agent, Deep Research, DRIL, 经济数据集, 数据构造, 政策文本, 研究助理, 实证研究
提要： 实证研究中，AI Agent 可以帮助研究者查找资料、整理政策文本和构造变量，但真正困难的是如何保证数据质量、证据链和可重复性。Afonso 等 (2026) 提出的 DRIL 方法，把 Agent 置于固定的研究工具表、研究对象集合和证据规则之下，循环生成可审计的数据记录。本文介绍其方法框架、GTED 应用案例、风险边界和可操作流程。

导读

给 AI Agent 一个问题，它能给你一份措辞流畅、带引用的研究摘要。但如果你想研究 30 个国家 20 年的地方政府举债规则，需要它对 600 个国家-年份对象逐一执行同样的搜索、阅读和编码任务，并保证口径一致、证据可查，事情就完全不同了。Afonso 等 (2026) 提出的 DRIL (Deep Research on a Loop) 方法，正是为了解决这个问题：如何把 AI Agent 从一次性的问答工具，变成一条可重复、可审计的数据生产线。

afonso_dril_fig00-outline-v2-lianxh

1. 数据集构造：人工还是 Agent？

我很认可作者在文中提到的一个观点：实证经济学能回答什么问题，现实中往往不是由识别策略决定的，而是由研究者能否负担得起数据集构造的成本决定的。

比较制度、政治经济学、财政税收、产业政策和监管研究中，很多关键变量都无法从现成数据库中获取。它们分散在法律文本、政府公告、监管文件、财政报告和国际组织报告中。信息公开不等于数据可用——研究者还需要判断来源权威性、处理不同语言和格式、解决来源冲突，再把非结构化文本转化为结构化变量。

传统做法是安排研究助理逐条查找、摘录和编码。问题不只是费时，而是这个过程很难完全复现。有的助理会忽略某个来源，有的会把 A 类政策划为 B 类，这些细小判断几乎无法从最终数据表中看出来。数据在表面上整齐，但背后的判断过程不透明。

DRIL 的切入点在于，把人的判断前置到研究设计阶段，把后续重复性的搜索、记录和编码交给 Agent 循环执行。它解决的不是「AI 能不能帮我查一个问题」，而是「AI 能不能按同一套规则，帮我构造一张可复核的数据表」。

2. Deep Research 和数据集构造，差一个「循环」

不少研究者已经在用研究型 AI Agent 了。给它一个问题，它会自动搜索网页、阅读资料、比较来源，整理出一份带引用的研究报告。这类工具通常被称为 Deep Research，看起来很像一个研究助理。

但这种模式是一次性的。问题变了，输出结构也变了；研究对象变了，资料来源和判断标准也可能跟着漂移。对于构造数据集来说，这远远不够。数据集要求的是跨研究对象的一致性——如果对 600 个国家-年份对象每次都让 Agent 自由发挥，最终得到的是 600 份结构不同、口径不一的研究摘要，而不是 600 行可以合并、比较和回归的数据记录。

DRIL 的改进在于引入「循环」。它不让 Agent 对每个对象自由生成摘要，而是要求 Agent 在同一套规则下反复执行。每次循环对应一个预先定义好的研究对象，例如一个国家-年份、城市-年份、公司-季度或政策-地区。Agent 可以自主搜索和阅读，但不能临时增加变量，也不能改变编码口径。它必须按照预先冻结的规则，输出可审计的数据记录。

简言之，爬虫解决的是「把网页抓下来」，RAG 解决的是「基于已索引资料回答问题」，DRIL 解决的是「在统一研究设计下，把分散资料转化为可审计的数据记录」。

这套规则在论文里被称为「研究协议」，至少包括四个部分：