Agent 工具越用越乱？5.1k Star Omnigent，直接给 Claude Code/Codex/Cursor 加一座调度塔

leeit

16人浏览 · 2026-06-29 13:05:42

leeit · 2026-06-29 13:05:42 发布

嗨，我是小华同学，专注解锁高效工作与前沿AI工具！每日精选开源技术、实战技巧，助你省时50%、领先他人一步。👉免费订阅，与10万+技术人共享升级秘籍！

这个项目最值得看的，不是又冒出来一个 AI Agent，而是它想给所有 Agent 加一层“调度塔”。

如果你已经在用 Claude Code、Codex、Cursor，或者尝试过多 Agent 协作，你大概率会遇到同一个问题：工具越来越多，但配置、权限、会话、沙箱、协作方式都散在各处。

这篇用 3 分钟讲清：Omnigent 为什么值得收藏、它和普通 Agent 框架有什么不同、以及它目前更适合谁。

Omnigent 官方桌面端截图

这张是项目 README 里的官方截图。你能看到它不是命令行玩具，而是在做一套会话、项目、技能和 Agent 选择的统一工作台。

今天分享的项目叫 Omnigent。

它在 GitHub 上已经约 5.1k Star，官方定位很直接：

The open-source meta-harness for all your AI agents.

翻译成人话就是：它不是替代 Claude Code / Codex / Cursor，而是把这些 Agent 放到同一层里统一编排、治理和协作。

它解决的不是“没有 Agent”，而是“Agent 太分散”

现在 AI Coding Agent 很卷。

Claude Code 有 Claude Code 的交互方式，Codex 有 Codex 的运行方式，Cursor、OpenCode、Hermes、Pi 也都有自己的生态。

问题来了：

真实痛点	典型表现
工具割裂	每个 Agent 都有自己的配置、权限和会话
难以协作	A 写的代码，B 怎么 review？团队怎么共同看过程？
安全难管	shell、文件写入、网络、token 花费都需要规则
结果难追踪	任务、终端、文件、子 Agent、历史上下文散落各处
换工具成本高	想从 Claude 切到 Codex / Cursor，工作流又要重配

Omnigent 的思路是：不和 Agent 抢主角，而是做一层 meta-harness，把多个 Agent 统一接进来。

白板定位图：不是再造 Agent，而是给所有 Agent 加一层调度台

这也是标题里说“调度塔”的原因。

它更像 AI Agent 世界里的控制层：谁来写、谁来 review、在哪个沙箱跑、什么操作要审批、会话怎么共享，都放到一套系统里处理。

它到底能做什么？

根据 README 和文档，Omnigent 主要有几类能力：

能力	通俗理解	对程序员的价值
Meta-harness	统一跑 Claude Code、Codex、Cursor、OpenCode、Hermes、Pi 等	不被单一工具锁死
多 Agent 编排	一个任务可以拆给不同 Agent，并互相 review	更适合复杂开发任务
跨设备会话	终端、浏览器、手机、桌面端同步	不必一直守着电脑
云/本地沙箱	支持本地或云端 sandbox 执行	降低环境和权限风险
Policies	对 shell、文件、工具、成本做 ALLOW / DENY / ASK	Agent 行为更可控
YAML Agent	用 YAML 定义 prompt、harness、tools、sub-agents、policies	自定义 Agent 更工程化

这里最值得注意的是 Policies。

很多 Agent 工具的问题不是“不够聪明”，而是太容易越界：一会儿要跑 shell，一会儿要改文件，一会儿 token 花飞了。

Omnigent 的 policy 文档里把结果分成三类：

ALLOW：允许继续。
DENY：直接阻止。
ASK：暂停，等用户确认。

而且策略可以放在 server-wide、agent spec、session 三层，适合从个人玩法走向团队治理。

一个典型工作流长这样

你可以把 Omnigent 理解成六步：

1. 从终端、浏览器、手机或桌面端进入。 2. Omnigent Server 负责协调会话、消息、文件、终端和状态。 3. 选择具体 Agent harness：Claude、Codex、Cursor、Hermes、Pi 等。 4. 在本地或云端沙箱执行任务。 5. 用 Policy 管住权限、成本和高风险操作。 6. 团队可以分享会话、共同观察、co-drive，甚至 fork 一条会话继续做。

白板流程图：Omnigent 工作流

README 里有两个示例也很能说明它的定位：

Polly 像一个多 Agent 技术负责人：自己不直接写代码，而是规划任务、委派给 Claude Code / Codex / Pi 子 Agent，再让不同模型做 review。

Debby 则像双头脑暴伙伴：同一个问题交给 Claude 和 GPT 两边回答，再互相 critique，最后收敛。

这两个例子说明，Omnigent 真正在做的是：把 Agent 当成可以被组织、委派、审查和治理的团队成员。

为什么程序员值得关注？

我觉得它对三类人最有吸引力：

人群	为什么值得看
AI Coding Agent 重度用户	想同时用 Claude Code、Codex、Cursor，又不想每套工具各玩各的
团队技术负责人	想让 Agent 协作、review、留痕，而不是每个人本地乱跑
平台/工具开发者	想把自定义 Agent、MCP、Python 函数、沙箱和权限组合起来

它的价值不只是“多开几个 Agent 窗口”。

真正有意思的是，它把 Agent 的运行、权限、成本、会话、文件和团队协作，都变成可治理的工程对象。

Omnigent 官方 Policy trust model

上面这张是官方文档里的 policy trust model。它提醒我们：AI Agent 一旦能读写文件、调用工具、跑命令，问题就不再只是“回答得聪不聪明”，而是“谁来批准、谁来审计、谁来兜底”。

白板趣味创作图：让 Agent 组队干活

它不适合什么？

Omnigent 目前还是 alpha 状态，而且项目更新非常快。

如果你只是偶尔用一次 Claude Code 或 Codex，不需要团队协作、不需要沙箱、不需要多 Agent 编排，那它可能会显得偏重。

如果你追求最简单的“打开一个工具马上写代码”，直接用原生 Agent CLI 可能更省事。

但如果你已经开始认真思考这些问题：

多个 Agent 怎么分工？
怎么做跨模型 review？
shell / 文件写入 / token 成本怎么管？
会话怎么分享给团队？
怎么从手机接着看 Agent 跑任务？

那 Omnigent 就很值得放进收藏夹。

我的判断

Omnigent 代表了一个挺明显的趋势：

AI Agent 的下一阶段，不只是“哪个 Agent 更聪明”，而是“谁能把一群 Agent 管起来”。

今天先做短版分享。后面如果继续拆，我会重点看三块：Polly 多 Agent 编排到底怎么跑、Policies 如何做权限和成本治理、以及 Omnigent 怎么把 Codex / Claude Code / Cursor 接到同一个工作流里。

项目地址

GitHub：<https://github.com/omnigent-ai/omnigent>

官网：<https://omnigent.ai>

MCP技术社区

欢迎加入 MCP 技术社区！与志同道合者携手前行，一同解锁 MCP 技术的无限可能！

更多推荐

LangChain 框架入门：构建LLM应用

LangChain框架应运而生，它通过模块化设计简化了LLM应用的开发流程，让开发者能够快速构建智能对话、知识问答等场景的应用。这一特性尤其适合构建知识密集型应用，比如企业内部的智能客服或法律咨询系统，让模型能够基于最新数据生成准确回答。它将LLM应用拆分为多个可复用的组件，如模型调用、记忆管理、工具集成等。例如，通过简单的链式调用（Chain），就能实现“用户输入-模型处理-结果输出”的完整流程

MCP技术社区

你的Agent 为什么会失忆？不是上下文窗口给得不够大

【摘要】文章探讨了当前AI Agent开发中普遍存在的记忆持久化问题，指出单纯扩大上下文窗口是治标不治本的方案。作者推荐EverOS作为解决方案，其核心优势在于：1）采用Markdown文件作为记忆存储基础，保证可读性和可维护性；2）三层架构（Markdown+SQLite+LanceDB）兼顾检索效率与透明度；3）支持多模态内容摄取和自然语言检索。系统通过清晰的目录结构分离用户画像与Agent技