Google OKF v0.1规范解读：AI Agent知识格式标准化，对笔记工具意味着什么

qq_42817415

207人浏览 · 2026-06-27 13:36:14

qq_42817415 · 2026-06-27 13:36:14 发布

6月12日，Google Cloud发布了一份叫OKF的开放规范。

没有发布会，没有宣传视频，就是一篇博客文章加一个GitHub仓库。规范文件本身只有15KB，读完大概十分钟。但HN上讨论了76条，知乎和博客园上好几篇文章在解读，说明有人觉得这事值得关注。

我把规范文档和HN的讨论帖都过了一遍。说实话，第一感觉是：方向值得跟进，但文档本身确实还很粗糙。

OKF在做什么

先简单交代背景。OKF全称Open Knowledge Format，由Google Cloud Data Cloud团队的Sam McVeety和Amir Hormati主导开发。它本身是一份开放规范，不绑定任何具体产品——把知识表示成一组带YAML frontmatter的Markdown文件目录，人和AI Agent都能读写，不需要定制工具。

一个OKF知识包（Bundle）就是一个文件夹。每个Markdown文件描述一个概念（Concept），可以是一张数据表、一个API、一个业务指标、一份运维手册——什么都行。唯一必填的字段是type，其余的title、description、resource、tags、timestamp全部可选。

概念之间用标准Markdown链接互相引用，整个目录自动构成一张关系图。两个保留文件：index.md是整个Bundle的目录索引，Agent可以先读它了解全局结构；log.md记录变更历史。

规范还要求"容错消费"——消费者必须容忍未知的type值、缺失的可选字段和断裂的交叉链接，一个文件不合规不影响其他文件的可用性。这个设计有意做得很轻。

关于OKF"是什么"的部分，网上已经有很多文章讲过了，我不展开。

它解决了什么问题

Google在公告里说得很直接：随着模型能力持续提升，限制它们发挥的往往不是模型本身，而是缺乏相关上下文。模型能写代码、总结文档、分析数据，但它得先拿到正确的信息。

现实情况是，AI Agent需要的知识散落在各处——数据目录里的表结构、Wiki里的指标定义、GitHub里的API文档、共享盘里的运维手册。每次让Agent干一件事，它都得先拼凑这些上下文，每个Agent还要重复这个过程。

OKF的目标是把这些散落的碎片变成标准格式的知识包，任何生产者可以写，任何消费者可以读。一份知识写一次，不用为每个Agent重新组装。

这部分已经有文章讲得比较透了。我想聊的是另一件事：OKF对普通知识工作者意味着什么。

你的笔记工具跟得上吗

其实很多人忽略了一点：OKF虽然挂着Google Cloud的牌子，但它面向的受众比企业数据团队更广。如果你平时用Obsidian、Notion、Typora这类工具整理知识，OKF跟你有关系。

怎么理解？OKF知识包的结构——Markdown文件+YAML frontmatter+文件间链接——跟很多人的笔记组织方式已经很接近了。尤其是Obsidian用户，你的本地Markdown文件加双向链接，跟OKF的思路几乎一脉相承。

我做了个简单的对比：

维度	OKF规范要求	Obsidian	Notion	Typora/纯Markdown
文件格式	Markdown	本地.md文件	富文本+数据库，非纯Markdown	本地.md文件
元数据	YAML frontmatter	支持front matter	有属性但非YAML格式	支持
文件间链接	Markdown链接	双向链接，天然契合	页面引用，非标准Markdown链接	需手动维护
目录索引	index.md	有MOC实践但非标配	页面树自带索引	无内置索引
嵌套表格	不支持	原生不支持	核心功能，影响最大	原生不支持
版本管理	Git友好	纯文件，完美兼容	云端锁死，无法用Git	纯文件，完美兼容

从这个表能看出来，Obsidian用户离OKF最近，Notion用户离得最远。

换个角度看，这也意味着如果你正在选笔记工具，OKF兼容性可以作为一个参考维度。不是说现在就要按OKF规范来组织笔记——v0.1还早——但了解这个趋势，对未来的工具选型有帮助。

OKF v0.1有多粗糙

说完好的，说说现实。规范文档读下来，几个直观感受：

嵌套表格搞不定。 HN上有开发者指出，Markdown本身就不支持嵌套表格，OKF基于Markdown，自然继承了这个限制。如果你在Notion里用多层嵌套表格来表达结构，迁移到OKF格式会丢信息。这对Notion用户影响很大——Notion的数据库视图本身就是一种嵌套结构。

空间布局信息丢失。 HN用户sadschnitzel提到了一个很实际的问题：纯Markdown没法表达空间布局和颜色中隐含的语义，比如复杂电子表格或Miro白板里的信息。OKF选择了Markdown，也就选择了放弃这些维度。

15KB的规范，有人觉得太简陋。 HN用户port11的评论挺直白："Google发布了……带YAML frontmatter的Markdown，各位请鼓掌。15KB的规范就为了这个！"话是刻薄了点，但反映了部分开发者的疑虑——这规范是不是过于简单了？

也有人为此辩护。有人说简陋是好事，先跑起来再说，别一上来就搞个大而全的规范，最后谁也用不起来。两种意见都有道理。但v0.1就是v0.1，离"能直接用"有距离。

一个绕不开的老问题

读到OKF的时候，我脑子里冒出来的第一个问题是：这跟RDF和OWL有什么区别？

RDF（Resource Description Framework）和OWL（Web Ontology Language）是语义网时代的知识格式标准，W3C推的。理念很先进——用三元组描述知识关系，用本体定义知识结构。

结果呢？HN用户mrkiouak的评论一针见血：“RDF/OWL语义网格式每十年我就会重新看一次。总有一年会成功的！（暗示不会）”

知识格式标准化这件事，喊了二十多年，每隔几年就有人拿出来重新推一遍。OKF会不会走同样的路？

有一个差异可能重要：RDF/OWL是给机器看的，人基本没法直接读写，学习门槛很高；OKF基于Markdown+YAML，人能直接编辑，机器也能解析。一个格式如果人用不了，它永远只是论文里的概念。

但仅凭这一点就判断OKF能成，也过于乐观了。

Karpathy先跑了一年

还有一个背景值得说。OKF的直接灵感来自Andrej Karpathy提出的"LLM Wiki"模式——用Markdown维护一个Agent可读、可更新、可自维护的知识库。

过去一年，这个模式已经在社区里被无数团队各自实现了一遍。你可能在项目里见过AGENTS.md、CLAUDE.md，或者在Obsidian里见过index.md加log.md的文件夹结构。但每种实现都不兼容，各写各的。

OKF就是Google把这件事标准化了。

标准化有好处也有坏处。好处是有Google背书，可能吸引更多工具适配。Google同时给了三个参考实现：Enrichment Agent（自动为BigQuery数据集生成概念文档）、静态HTML可视化器（把Bundle变成交互图谱）、三个示例Bundle（GA4电商数据、Stack Overflow数据、Bitcoin数据集）。

坏处是一旦大公司主导标准，社区的声音可能被稀释。Karpathy的LLM Wiki是社区驱动的，迭代快但松散。OKF是公司主导的，规范但可能慢。而且Google有"砍产品"的历史——Reader、Plus、Wave，哪个不是轰轰烈烈开始，悄无声息结束？

OKF能不能成，标准本身只决定了一半，另一半看Google愿意投入多久。

现在该不该动

我的判断：方向值得跟进，但现在不急着迁移自己的笔记库。

如果你正好在选笔记工具，可以把OKF兼容性作为一个参考维度。如果你已经是Obsidian用户，你的笔记结构跟OKF最接近，未来如果要适配，成本最低。如果你是Notion重度用户，短期内不用担心，但可以开始关注——Notion的富文本和数据库结构跟纯Markdown之间有鸿沟，如果OKF真的推进下去，Notion要么自己适配，要么用户得考虑迁移。

对于已经在做AI Agent开发的团队，OKF的试用成本很低。一个Bundle就是一堆Markdown文件，不需要装任何东西，不需要注册任何服务。最坏的情况是你有了一份结构化的内容审计。

写在最后

OKF v0.1发布两周了。讨论热度不算高，但也没冷下来。

知识格式标准化这件事，喊了二十多年。这次Google来了，跟RDF时代不同的是，OKF选择了Markdown——一个普通人每天在用的格式。这个选择让OKF离知识工作者近了一步。

至于它能不能落地，现在谁也说不准。规范文档在GitHub上（仓库地址：GoogleCloudPlatform/knowledge-catalog），15KB，十分钟就能读完。建议你自己看一下，形成自己的判断。
🔑

数据来源：OKF规范文档（GitHub公开）、HN讨论帖（76条评论）、博客园/StartupHub解读文章，截至2026年6月25日。

OKF规范文档在GitHub上（仓库地址：GoogleCloudPlatform/knowledge-catalog），15KB，十分钟读完。我建议自己过一遍原文，比看任何二手解读都来得直接——v0.1够不够用，只有读了才知道。

MCP技术社区

欢迎加入 MCP 技术社区！与志同道合者携手前行，一同解锁 MCP 技术的无限可能！

更多推荐

世界模型年薪250万仍缺人，可你的AI连翻转都算不准——2026下半年最该补的不是新框架是这条公理

本文指出当前AI Agent缺乏物理公理致旋转仿真/流体外推失效；《旋生万物》从"退化圆"出发构建旋子代数与螺旋联络统一旋转、平移及物理定律，为世界模型提供几何先验；《圆道与螺旋系列丛书》（22部·300万字·公理I²=-N）覆盖螺旋数论至生成式AI提示工程。适合Java/Python/嵌入式/算法工程师构建不可替代竞争力。下载：https://doi.org/10.5281/zenodo.20

MCP技术社区

AI Agent评估体系构建：从Benchmark到生产环境监控的闭环工程

text## 蒸馏的伦理与合规### 蒸馏的边界模型蒸馏涉及知识产权和合规问题：| 蒸馏来源 | 合规风险 | 建议 ||---------|---------|------|| 开源模型（Llama, Qwen） | 低 | 遵循模型许可证 || API 蒸馏（GPT, Claude） | 高 | 违反 ToS，禁止 || 自有模型 | 无 | 完全合规 || 多模型混合蒸馏 | 中 | 需逐一

MCP技术社区

AI Agent评估体系构建：从Benchmark到生产环境监控的闭环工程

Agent 的行为是多步骤、非确定性的——同一个输入可能产生完全不同的执行路径，最终结果也可能"殊途同归"。更复杂的是，Agent 的失败模式往往是隐蔽的：它可能完成了任务但使用了低效的路径，或者得到了正确答案但基于错误的推理。本文将系统性地构建一个从开发到生产的 Agent 评估体系，涵盖离线 Benchmark、在线监控和持续改进的完整闭环。最重要的是：评估体系本身也需要持续迭代——随着 Ag