嗨,我是小华同学,专注解锁高效工作与前沿AI工具!每日精选开源技术、实战技巧,助你省时50%、领先他人一步。👉免费订阅,与10万+技术人共享升级秘籍!

这个项目最值得看的,不是又冒出来一个 AI Agent,而是它想给所有 Agent 加一层“调度塔”。

如果你已经在用 Claude Code、Codex、Cursor,或者尝试过多 Agent 协作,你大概率会遇到同一个问题:工具越来越多,但配置、权限、会话、沙箱、协作方式都散在各处。

这篇用 3 分钟讲清:Omnigent 为什么值得收藏、它和普通 Agent 框架有什么不同、以及它目前更适合谁。

Omnigent 官方桌面端截图

这张是项目 README 里的官方截图。你能看到它不是命令行玩具,而是在做一套会话、项目、技能和 Agent 选择的统一工作台。

今天分享的项目叫 Omnigent

它在 GitHub 上已经约 5.1k Star,官方定位很直接:

The open-source meta-harness for all your AI agents.

翻译成人话就是:它不是替代 Claude Code / Codex / Cursor,而是把这些 Agent 放到同一层里统一编排、治理和协作。


它解决的不是“没有 Agent”,而是“Agent 太分散”

现在 AI Coding Agent 很卷。

Claude Code 有 Claude Code 的交互方式,Codex 有 Codex 的运行方式,Cursor、OpenCode、Hermes、Pi 也都有自己的生态。

问题来了:

真实痛点 典型表现
工具割裂 每个 Agent 都有自己的配置、权限和会话
难以协作 A 写的代码,B 怎么 review?团队怎么共同看过程?
安全难管 shell、文件写入、网络、token 花费都需要规则
结果难追踪 任务、终端、文件、子 Agent、历史上下文散落各处
换工具成本高 想从 Claude 切到 Codex / Cursor,工作流又要重配

Omnigent 的思路是:不和 Agent 抢主角,而是做一层 meta-harness,把多个 Agent 统一接进来。

白板定位图:不是再造 Agent,而是给所有 Agent 加一层调度台

这也是标题里说“调度塔”的原因。

它更像 AI Agent 世界里的控制层:谁来写、谁来 review、在哪个沙箱跑、什么操作要审批、会话怎么共享,都放到一套系统里处理。


它到底能做什么?

根据 README 和文档,Omnigent 主要有几类能力:

能力 通俗理解 对程序员的价值
Meta-harness 统一跑 Claude Code、Codex、Cursor、OpenCode、Hermes、Pi 等 不被单一工具锁死
多 Agent 编排 一个任务可以拆给不同 Agent,并互相 review 更适合复杂开发任务
跨设备会话 终端、浏览器、手机、桌面端同步 不必一直守着电脑
云/本地沙箱 支持本地或云端 sandbox 执行 降低环境和权限风险
Policies 对 shell、文件、工具、成本做 ALLOW / DENY / ASK Agent 行为更可控
YAML Agent 用 YAML 定义 prompt、harness、tools、sub-agents、policies 自定义 Agent 更工程化

这里最值得注意的是 Policies

很多 Agent 工具的问题不是“不够聪明”,而是太容易越界:一会儿要跑 shell,一会儿要改文件,一会儿 token 花飞了。

Omnigent 的 policy 文档里把结果分成三类:

  • ALLOW:允许继续。
  • DENY:直接阻止。
  • ASK:暂停,等用户确认。

而且策略可以放在 server-wide、agent spec、session 三层,适合从个人玩法走向团队治理。


一个典型工作流长这样

你可以把 Omnigent 理解成六步:

1. 从终端、浏览器、手机或桌面端进入。 2. Omnigent Server 负责协调会话、消息、文件、终端和状态。 3. 选择具体 Agent harness:Claude、Codex、Cursor、Hermes、Pi 等。 4. 在本地或云端沙箱执行任务。 5. 用 Policy 管住权限、成本和高风险操作。 6. 团队可以分享会话、共同观察、co-drive,甚至 fork 一条会话继续做。

白板流程图:Omnigent 工作流

README 里有两个示例也很能说明它的定位:

Polly 像一个多 Agent 技术负责人:自己不直接写代码,而是规划任务、委派给 Claude Code / Codex / Pi 子 Agent,再让不同模型做 review。

Debby 则像双头脑暴伙伴:同一个问题交给 Claude 和 GPT 两边回答,再互相 critique,最后收敛。

这两个例子说明,Omnigent 真正在做的是:把 Agent 当成可以被组织、委派、审查和治理的团队成员。


为什么程序员值得关注?

我觉得它对三类人最有吸引力:

人群 为什么值得看
AI Coding Agent 重度用户 想同时用 Claude Code、Codex、Cursor,又不想每套工具各玩各的
团队技术负责人 想让 Agent 协作、review、留痕,而不是每个人本地乱跑
平台/工具开发者 想把自定义 Agent、MCP、Python 函数、沙箱和权限组合起来

它的价值不只是“多开几个 Agent 窗口”。

真正有意思的是,它把 Agent 的运行、权限、成本、会话、文件和团队协作,都变成可治理的工程对象。

Omnigent 官方 Policy trust model

上面这张是官方文档里的 policy trust model。它提醒我们:AI Agent 一旦能读写文件、调用工具、跑命令,问题就不再只是“回答得聪不聪明”,而是“谁来批准、谁来审计、谁来兜底”。

白板趣味创作图:让 Agent 组队干活


它不适合什么?

Omnigent 目前还是 alpha 状态,而且项目更新非常快。

如果你只是偶尔用一次 Claude Code 或 Codex,不需要团队协作、不需要沙箱、不需要多 Agent 编排,那它可能会显得偏重。

如果你追求最简单的“打开一个工具马上写代码”,直接用原生 Agent CLI 可能更省事。

但如果你已经开始认真思考这些问题:

  • 多个 Agent 怎么分工?
  • 怎么做跨模型 review?
  • shell / 文件写入 / token 成本怎么管?
  • 会话怎么分享给团队?
  • 怎么从手机接着看 Agent 跑任务?

那 Omnigent 就很值得放进收藏夹。


我的判断

Omnigent 代表了一个挺明显的趋势:

AI Agent 的下一阶段,不只是“哪个 Agent 更聪明”,而是“谁能把一群 Agent 管起来”。

今天先做短版分享。后面如果继续拆,我会重点看三块:Polly 多 Agent 编排到底怎么跑、Policies 如何做权限和成本治理、以及 Omnigent 怎么把 Codex / Claude Code / Cursor 接到同一个工作流里。

项目地址

GitHub:<https://github.com/omnigent-ai/omnigent>

官网:<https://omnigent.ai>

Logo

欢迎加入 MCP 技术社区!与志同道合者携手前行,一同解锁 MCP 技术的无限可能!

更多推荐