笔记定位:本笔记面向刚接触“Agent基础软件”概念的开发者,旨在用可上手的语言讲清楚:这些新概念到底在解决什么问题、怎么用、以及它们与日常使用的 Rust/C 有何区别。

📌 调研背景

关键词:

面向Agent的基础软件(OS和Compiler)、AgentOS、OpenClaw、Harness、面向Agent的编程语言和编译器

本笔记围绕以上关键词展开,从“问题是什么”到“现有方案有哪些”再到“怎么上手”,构建一个完整的认知地图。

一、Agent OS 到底是什么?

1.1 核心定义

Agent OS(智能体操作系统) 是一个专为 AI Agent 设计的软件平台,提供运行时执行、任务调度、资源治理、工具集成和安全隔离能力,让 Agent 能够自主、可靠地完成复杂工作。

和传统操作系统的根本区别:

对比维度 传统 OS Agent OS
调度对象 进程/线程 AI Agent 请求与任务
核心能力 CPU 调度、内存管理、文件系统 Agent 调度、上下文管理、工具调用、多 Agent 协同
交互方式 CLI / GUI,精确指令 自然语言交互
安全模型 基于用户/文件的访问控制 基于 Agent 行为的权限治理与沙箱隔离

1.2 四种主流发展路径

当前对 Agent OS 的实现思路已经分化为四条明显不同的技术路线:

类型 代表项目 核心思路
外接型 (OS Agent) Operator、Claude Computer Use、AutoGLM Agent 通过屏幕截图/GUI 接口适配现有系统
内置型 (Agentic OS) 阿里云 Agentic OS、微软 UFO2 改造 OS 内核与服务,让 Agent 成为系统“一等公民”
编排型 (Agent OS) OpenClaw、钉钉 Enterprise AgentOS 在应用层调度协调多个 Agent 协同工作
学术/架构型 (Agent-OS) AIOS、Qualixar OS 从零构建全新的 Agent 运行“基板”

二、三种主流Agent OS技术路线深度剖析

在四种主流Agent OS发展路径中,“外接型”、“内置型”和“学术/架构型”最具代表性和技术区分度。它们分别代表了“不改造系统”、“改造操作系统”、“重构操作系统”三种截然不同的设计哲学。本章以 AutoGLM(外接型)阿里云 Agentic OS(内置型)AIOS(学术/架构型) 为代表案例,深入剖析其设计原理、技术实现与语言构成。

2.1 外接型(OS Agent):AutoGLM——AI的“眼与手”

外接型Agent OS的核心思路是 “不改造操作系统,只武装AI” 。它把AI Agent当作一个“超级应用程序”,通过多模态大模型去“看”屏幕、理解界面、模拟人类点击,从而适配现有操作系统和软件。

AutoGLM是这一路线的典型代表,由智谱AI研发。它基于GLM系列语言模型和GLM-V系列视觉推理模型,将基座模型的语义理解与视觉识别能力发挥到极致,并结合“端到端异步强化学习”的技术突破,使AI能够在手机、电脑等图形界面上完成推理、编码、GUI操作等多类任务,根据需求灵活调用最合适的“子大脑”执行操作。

2.1.1 设计目标

AutoGLM的核心设计目标,是在不改变现有手机系统和应用生态的前提下,让AI具备“看懂屏幕、理解意图、动手执行”的能力。传统AI助手只能“回答”问题,而AutoGLM的目标是让AI真正“干”事情——从点外卖、订酒店到处理办公任务,实现“从说到做”的跨越[reference:1]。其长远愿景是构建以LLM为中心的通用计算系统(GLM-OS),在人与应用之间添加一个AI执行调度层,将人机交互范式带入“自然语言驱动全场景自动化”的新阶段。

2.1.2 技术架构与原理

AutoGLM构建了一个完整的“感知-决策-执行”闭环系统,由四大核心模块组成:

模块 功能 核心技术
感知层 理解屏幕内容(文字、图标、按钮、布局),解析用户自然语言指令 GLM-4.5语言模型 + GLM-4.5V视觉推理模型
规划层 将用户意图拆解为可执行的操作序列 强化学习训练的策略模型
执行层 通过ADB(Android Debug Bridge)或系统API模拟人类点击、滑动、输入等操作 ADB桥接 + 设备控制API
反馈层 实时检测执行结果,判断任务是否完成,失败时自动纠错并重试 屏幕状态比对 + 错误恢复机制

关键创新在于三大强化学习算法的引入:

  • MobileRL:创新难度自适应强化学习方法,通过“推理自举预热+难度自适应GRPO”,显著提升移动端任务的稳定性与收敛效率。
  • ComputerRL:提出API-GUI协同范式,提升数据多样性与计算效率;改进GRPO并提出Entropulse机制,增强探索与策略多样性。
  • AgentRL:通过交叉采样与任务优势归一化机制,解决多任务训练中的不稳定性与梯度分布不均问题,增强整体鲁棒性。

此外,AutoGLM引入“云端虚拟手机”架构,让AI在云端完成操作,用户无需交出本地设备控制权,期间可正常使用手机,实现了“自动驾驶手机”与“异步代理办公”。

2.1.3 语言构成与技术栈

AutoGLM的技术栈以Python为核心,分为模型层、框架层和交互层三层:

层级 实现语言/技术 说明
模型层 PyTorch(Python) GLM语言模型与GLM-V视觉模型的训练与推理框架
强化学习框架 Python + 自研RL算法 MobileRL、ComputerRL、AgentRL的训练与部署
设备控制层 ADB(Android Debug Bridge) 通过Python脚本调用ADB命令行工具控制安卓设备
部署与服务 Python(FastAPI/Flask) + Docker 模型API服务化部署
客户端 JavaScript/TypeScript(Web) + Kotlin/Java(Android) 提供Web界面和手机端App接入能力

AutoGLM于2025年12月9日正式开源(项目名Open-AutoGLM),提供Apache-2.0协议授权的完整代码库、模型训练脚本、应用适配接口及50+场景Demo,同时在Hugging Face开放AutoGLM-Phone-9B轻量级模型。截至2026年1月初,项目GitHub仓库已获20.9K Star。

构建与运行

  1. 环境准备:Python 3.10+,GPU(推荐24G×2),安卓手机(开启USB调试)+数据线
  2. 安装依赖:ADB工具、PyTorch、Transformers等
  3. 下载模型:从Hugging Face拉取AutoGLM-Phone-9B模型
  4. 启动服务:运行Python推理服务,手机通过ADB连接后,即可通过自然语言下发任务
2.1.4 优势与局限

优势:零侵入性,无需修改任何操作系统和应用代码;跨平台适配能力强(同时支持安卓和苹果);开源社区活跃,迭代迅速。

局限:执行效率受限于屏幕识别的准确性,复杂界面或动态内容可能导致操作失败;依赖视觉模型,对纯命令行环境支持有限;安全边界完全依赖模型自身的行为约束,缺乏系统级的安全防护。


2.2 内置型(Agentic OS):阿里云 Agentic OS——AI的“原生家园”

内置型Agent OS的核心思路是 “让操作系统去适配Agent,而非让Agent去适应操作系统” 。它不满足于在应用层打补丁,而是从操作系统层面进行增强和改造,为AI Agent提供原生的运行支持。

阿里云Agentic OS是这一路线的代表。它基于阿里自研的Alibaba Cloud Linux 4(Alinux 4)构建,完全兼容Alinux 4的所有能力(核心优化、云原生支持等),围绕Agent的认知方式和工作模式,构建全新的操作系统架构。

2.2.1 设计目标

Agentic OS的核心理念是 “让操作系统原生支持AI Agent工作负载” [reference:9]。其设计目标包括:

  • 极致Token经济性:将复杂的运维专家知识封装为标准化的OS Skills,大幅减少Agent执行环境理解以及试错探索的Token开销
  • 自然语言重定义人机交互:首次将Copilot Shell作为默认登录入口,用户通过自然语言即可驱动操作系统完成日常运维操作
  • OS级安全防线:从系统加固、沙箱隔离到Skill签名校验,构建纵深安全防线,确保Agent在受控、可审计、最小权限的环境中安全运行
  • 开箱即用的Agent运行环境:预置技能库和可观测工具,让Agent“拎包入住”
2.2.2 技术架构与原理

Agentic OS采用四层分层架构[reference:13]:

层级 组件 功能说明 技术实现
封装交互层 Copilot Shell(cosh) 替代默认Shell,支持自然语言+bash双模交互 Qwen Code + npm workspaces
能力层 OS Skills 内置技能包机制,Agent通过Skill说明书获得“动手能力” 本地+远程Skill编排
运行时层 AgentSecCore + AgentSight OS级纵深安全防线 + eBPF可观测引擎 Rust+Python + eBPF+SQLite
基础系统层 Alinux 4 核心优化、云原生支持等基础能力 Linux内核

① Copilot Shell(cosh)——交互入口

cosh替代bash作为系统登录后的第一入口,采用“双模交互”设计:自然语言模式下,用户用中文或英文描述意图,系统借助大模型(通义千问团队的Qwen Code)将其转化为文件系统操作;命令模式下,用户可通过!前缀快速执行Shell命令,或通过/bash回退到完整bash交互。

其技术实现采用npm workspaces单体仓库架构,包含packages/cli(终端UI层)、packages/core(后端核心)和packages/test-utils(测试工具)三个子包。

② OS Skills——能力封装层

OS Skills是Agentic OS的核心创新。它将复杂的运维专家知识封装为标准化技能模块,涵盖系统管理、监控、安全、DevOps和云集成等多个领域。Agent无需逐行摸索命令,直接调用Skill说明书即可完成内核升级、漏洞修复等高级操作。实测Token开销可降低30%-60%。

③ AgentSecCore——安全核心

随着AI Agent逐渐获得文件系统I/O、网络访问、进程管理等OS级执行能力,传统的应用安全边界已不再适用。AgentSecCore构建了从系统加固到安全决策的三层防御体系:

  • 系统加固:基于loongshield实现最小权限原则
  • 沙箱隔离:硬件级隔离异常Agent行为
  • 安全校验:GPG签名+SHA-256完整性校验,确保Skill未被篡改

④ AgentSight——可观测引擎

AgentSight是基于eBPF技术的AI Agent可观测工具,能够零侵入、无修改地实时监控Agent的LLM API调用、Token消耗及进程行为。其数据存储采用SQLite+SLS(日志服务)组合,兼顾本地轻量与云端聚合的需求。

2.2.3 语言构成

Agentic OS各组件采用不同语言实现,追求“各取所长”的工程效率:

组件 实现语言 选型理由
Copilot Shell Node.js/TypeScript 事件驱动模型天然适合高并发的I/O密集型网关;TypeScript提供类型约束防止Agent传参错乱
OS Skills Markdown + 可选脚本(Shell/Python) Markdown是人类、AI和机器都能顺畅阅读的“最大公约数”;脚本按需选用,灵活适配
AgentSecCore Rust + Python Rust负责安全边界(seccomp/namespace交互需精确控制内存);Python负责动态策略解析(热更新)
AgentSight Rust + eBPF eBPF程序运行在内核态,Rust编译到eBPF字节码可在编译期保证内核级内存安全
基础系统层 C(Linux内核) 传统OS内核技术栈
2.2.4 开源实现:ANOLISA

Agentic OS以ANOLISA(Agentic Nexus Operating Layer & Interface System Architecture)项目在GitHub开源。项目结构如下:

anolisa/
├── src/
│ ├── copilot-shell/ # Node.js/TypeScript,AI 终端助手
│ ├── os-skills/ # Markdown + 可选脚本,运维技能库
│ ├── agent-sec-core/ # Rust + Python,安全沙箱
│ └── agentsight/ # Rust,eBPF 可观测引擎
├── scripts/
│ └── build-all.sh # 一键构建脚本
└── Makefile

快速上手:在Alinux/Ubuntu等发行版上,通过sudo yum install一键安装四大组件,运行cosh命令即可启动AI驱动的终端助手。

2.2.5 优势与局限

优势:与现有Linux生态完全兼容,可无缝部署在阿里云ECS等主流云平台上;通过预置Skills和cosh大幅降低Agent的使用门槛;OS级安全防线为Agent执行提供系统级保障。

局限:目前仅支持X86 CPU架构,SW64等国产架构尚未适配;依赖大模型API调用,网络延迟可能影响实时交互体验;作为操作系统级产品,生态建设仍需时间积累。


2.3 学术/架构型(Agent-OS):AIOS——重新定义操作系统的“大脑”

学术/架构型Agent OS的核心思路是 “从零开始,重新定义操作系统的基本抽象” 。它不满足于在现有OS上叠加或改造,而是试图将LLM作为操作系统的“大脑”嵌入内核,重新设计资源调度、上下文管理、内存管理等基础服务。

AIOS(LLM Agent Operating System)由罗格斯大学研究团队提出,是这一路线的开创性学术工作。

2.3.1 设计目标

AIOS的核心理念是 “将LLM嵌入操作系统内核,使其成为操作系统的‘大脑’” ,旨在实现一个“有灵魂”的操作系统。其设计目标直击当前Agent开发的四大痛点:

  • 资源分配优化:通过统一调度器实现LLM调用资源的公平高效利用
  • 跨Agent上下文切换:支持Agent任务挂起时的状态保存与恢复
  • Agent并发执行:多LLM核心并行处理不同Agent请求
  • 统一工具服务:Agent无需各自管理工具,由系统统一协调
  • 访问控制维护:确保Agent在权限边界内运行
2.3.2 技术架构与原理

AIOS采用三层架构:应用层、内核层和硬件/基础设施层。内核层是核心创新所在,包含传统OS内核和一个全新的 LLM内核

层级 组件 功能
应用层 Agent应用程序 各种基于LLM的智能体应用,通过AIOS SDK调用内核服务
内核层 LLM内核 + 传统OS内核 核心调度与管理中枢,包含六大功能模块
硬件/基础设施层 LLM服务 + 工具资源 + 传统OS 底层LLM实例、外部工具API,以及传统操作系统资源

LLM内核的六大核心模块

① LLM核心(LLM Core(s)):最具创新性的抽象。将不同厂商的LLM实例统一封装为LLM Core,每个LLM被视为一个类似于CPU核心的计算单元。上层Agent通过统一接口调用任意LLM,调度器可将请求分配到不同LLM核心上并行执行。

② Agent调度器(Agent Scheduler):对Agent系统调用进行细粒度调度,提供两种调度策略:

调度器类型 任务选择 时间管理 任务抢占 状态处理
FIFOScheduler 先来先服务 无时间限制 不支持 仅“执行中”/“已完成”
RRScheduler 轮转调度 固定时间片 支持任务挂起和恢复 “执行中”/“已完成”/“挂起”

RRScheduler配合上下文管理器,可在任务被挂起时保存LLM生成状态快照,待轮转回来再恢复执行,实现类似传统操作系统中“进程切换”的机制。

③ 上下文管理器(Context Manager):负责上下文快照与恢复。当Agent请求被调度器暂停时,捕获并存储LLM当前生成状态的快照;当Agent重新获得执行时间片时,从快照恢复LLM的生成状态,从暂停点继续处理。

④ 内存管理器(Memory Manager):管理RAM中的临时数据,如Agent活动任务期间的临时变量或最近处理的数据。任务完成后,内存被清空。

⑤ 存储管理器(Storage Manager):管理磁盘上的持久化数据,用于Agent的长期记忆、日志记录等,即使会话结束后Agent仍可访问。

⑥ 工具管理器(Tool Manager)与访问管理器(Access Manager):工具管理器加载并管理AIOS-Agent SDK中可用的各种工具,协调多Agent对同一工具的并发访问;访问管理器负责协调不同Agent之间的访问控制操作。

2.3.3 语言构成与技术实现

AIOS采用前后端分离的Monorepo架构:

组件 实现语言/技术栈 说明
后端服务(AIOS Kernel) Python + LangGraph 核心调度、上下文管理等内核服务
前端桌面应用 Electron (Node.js + TypeScript) 跨平台桌面交互界面
AIOS SDK Python API套件 供Agent开发者调用的标准化接口

选择Python的原因:LangChain、LangGraph等主流Agent框架均基于Python;学术原型阶段,Python的快速迭代能力远超系统语言;与LLM API交互的成熟库均在Python生态中。

构建与运行

  1. 环境准备:Node.js LTS、Python 3.12+、npm、uv(Python包管理器)
  2. 启动后端:进入aios-langgraph-server目录,配置环境变量,运行langgraph dev
  3. 启动前端:进入aios-desktop-app目录,运行npm run dev启动Electron应用
  4. 前端自动连接到本地后端服务(http://localhost:2024
2.3.4 性能验证与学术价值

根据AIOS论文的实验数据,采用AIOS的调度和上下文管理机制后,Agent框架的执行速度可提升至2.1倍[reference:32]。这一性能提升主要来自:调度优化(避免无序竞争)、并发执行(多LLM核心并行处理)和上下文切换(避免从头重新生成)。

AIOS将传统操作系统概念与Agent管理需求建立了完整的映射:

传统OS概念 AIOS中的对应
CPU核心 LLM核心(LLM Core)
进程调度 Agent调度(Agent Scheduler)
进程上下文切换 上下文快照与恢复
内存管理(RAM) 内存管理器(Memory Manager)
文件系统(磁盘) 存储管理器(Storage Manager)
设备驱动 工具管理器(Tool Manager)
2.3.5 优势与局限

优势:学术上首次系统化提出了Agent OS的架构范式,为后续研究提供了可参考的蓝图;通过调度和上下文管理实现了可量化的性能提升;开源实现(GitHub仓库agiresearch/AIOS)可供研究者复现和扩展。

局限:目前仍是学术原型项目,缺乏生产环境所需的稳定性、安全性和可扩展性;不直接管理硬件,仍依赖底层Linux/Windows提供基础能力;生态尚弱,第三方工具集成有限。

2.4 三条路线的对比与总结

对比维度 AutoGLM(外接型) 阿里云 Agentic OS(内置型) AIOS(学术/架构型)
核心思路 AI适配系统,不改系统 系统适配AI,做增强层 重构系统,AI成内核
对现有OS的改造 零改造 在Linux之上叠加增强层 重新设计内核抽象
语言构成 Python为主(PyTorch+ADB),少量JS/Kotlin 多语言各取所长(Node.js+Rust+Python+eBPF) Python+LangGraph+Electron
实现形态 开源模型+框架(Open-AutoGLM) 操作系统镜像+开源组件(ANOLISA) 学术原型+开源代码
典型优势 零侵入、跨平台、社区活跃 兼容生态、开箱即用、OS级安全 架构范式创新、可量化性能提升
主要局限 依赖视觉模型、效率受限、无系统级安全 仅支持X86、依赖云厂商生态 非生产级、依赖传统OS、生态弱
适用场景 手机/电脑GUI自动化 云服务器运维与企业级Agent部署 学术研究与架构探索

三个判断

  1. AutoGLM是最容易“玩起来”的——无需改造系统,一条pip命令就能跑通手机自动化,适合快速验证Agent能力的开发者。
  2. 阿里云Agentic OS是最容易“用起来”的——预置Skills和cosh让Agent开箱即用,适合有生产级AI Agent部署需求的企业。
  3. AIOS是最值得“学起来”的——它为Agent OS建立了完整的理论框架,是理解这一领域底层设计原理的必读经典。

三、OpenClaw:Agent 编排与 OS 融合

3.1 是什么

OpenClaw 是一个开源、可自托管的 AI Agent 运行时,它通过 Gateway、Channels、Agents 和 Skills 四大模块,将大模型连接到各种消息平台和本地工具。它起源于 2025 年 11 月的 Clawdbot 项目,仅用约两个月时间便在 GitHub 积累了超过 20 万 Star。

3.2 架构核心:三层解耦

  • Gateway:一个长生命周期的 Node.js 进程,统一管理所有进出通信
  • Channels:抽象掉 WhatsApp、Telegram、Slack 等平台协议差异,类似传统 OS 中的 VFS 层
  • Agents & Skills:编排对话逻辑,通过可扩展的 Skill 模块执行文件操作、浏览器交互等具体动作

3.3 OpenClaw 与 OS 深度融合

软通天鸿 OS:基于 OpenHarmony 6.1 研发,在系统底层深度内置 OpenClaw 核心组件,实现“开机即用、零学习成本”。提供五大核心价值:零门槛部署、原生安全架构、双重持久化存储、混合模型灵活切换、自然语言驱动全场景任务自动化。

在鸿 OS 3.0:拓维信息旗下开鸿智谷打造,将 OpenClaw 作为系统级能力内置,深度融合分布式软总线与设备管理,支持跨设备协同与系统级操作权限。

四、Harness:Agent 的“运行时环境”

4.1 核心概念

Harness Engineering(驾驭工程)是 2026 年 AI 领域最流行的工程化范式:不改造模型,而是为 Agent 构建一套完整的运行环境、约束规则与反馈闭环,让它能稳定、可靠地完成复杂工作

公式:Agent = Model + Harness——Harness 是模型之外的一切代码、配置与执行逻辑。

4.2 字节开源 Harness 基础设施

字节跳动开源的 Harness 项目(含 DeerFlow 2.0)是一套生产级的 Agent 运行时基础设施,核心解决三大难题:

  • 持久化状态机:每一步中间状态、工具调用结果实时落盘,进程崩溃后可从断点恢复继续工作
  • 上下文工程:动态截断、滑动窗口与语义摘要机制,在上下文逼近极限时自动压缩非关键信息
  • 工具与生命周期管理:标准化的工具调用接口和生命周期钩子

DeerFlow 2.0 于 2026 年 2 月发布,上线当日即登顶 GitHub Trending 全球榜首,Stars 已突破 47k。

五、面向 Agent 的编程语言与编译器

在 AI 时代,当开发者开始让 AI 智能体(Agent)编写代码、执行任务时,一个根本性问题浮现了:传统编程语言是为人类设计的,而非为 AI 设计的。正如 Flask 作者 Armin Ronacher 所指出的,语言背后是复杂的权衡,在 AI 时代必须被重新审视;更关键的是,语言会直接影响 Agent 生成代码的质量[reference:0]。

当前,AI 编写代码时面临本质性困难:

  • C 语言:AI 不理解指针的物理含义,生成的 malloc/free 经常不配对,段错误频发。
  • Rust 语言:AI 无法理解“生命周期”这类编译期概念,面对借用检查器的错误只能瞎改。
  • Python:动态类型让 AI 生成的代码运行时频频崩溃。

为应对这些挑战,一批全新的、面向 Agent 的编程语言和编译器应运而生。它们不再仅仅是“翻译器”,而是升级为 AI 智能体的“安全管家”与“协作平台”,在开发阶段就能预防运行时灾难。

以下将当前主流的面向 Agent 的语言与编译器分为四大类进行详细剖析:

5.1 AI 原生编程语言——将 LLM 嵌入语言运行时

这类语言从底层设计上就将大模型(LLM)作为一等公民,试图在保持高性能的同时,让 AI 能够更可靠地生成和理解代码。

语言 核心设计理念与特点 代表项目 / 主要开发者
MoonBit 定位为“AI 这代人的 C 语言”,为 AI 原生场景构建的通用编程语言与全栈开发平台。语法扁平、强静态类型、多后端编译(原生/Wasm/JS),内置 MoonBit Pilot 作为业界首个语言原生 AI 编程助手[reference:1]。 IDEA 研究院 / 张宏波团队[reference:2]
仓颉 (Cangjie) 华为自研的新一代编程语言,面向全场景智能。核心特点是内嵌了 AgentDSL 框架,通过声明式编程将自然语言与编程语言有机融合,原生支持 MCP 通信协议[reference:3]。其官方开发框架为 Cangjie Magic[reference:4]。 华为[reference:5]
Azalea 一款革命性的 AI 原生语言,将 LLM 直接嵌入运行时。通过 import ai 等指令实现代码的动态生成,具备自愈执行能力(运行时错误触发 AI 自动分析),并包含自主 Agent 原语[reference:6]。 azae 项目[reference:7]
Dana 由 AI Alliance 发布的全球首个 AI 驱动的编程语言。主打“意图驱动开发”:用户只需描述想构建什么,语言本身负责处理具体实现。原生支持 Agent 工作流、记忆基础与并发[reference:8][reference:9]。 AI Alliance[reference:10]
Turn 一款为“智能体计算”设计的编译型、基于 Actor 模型的语言。创新性地引入了 认知类型安全置信度算子 等语言级特性,从编译器层面解决 AI 输出格式不可控、凭证泄漏等固有问题[reference:11]。 Turn Lang[reference:12]
Mog 一门专为 LLM 编写代码 而设计的静态类型、编译型、嵌入式语言。整个语言规范仅约 3200 个 Token,便于 AI 快速理解。其编译器采用 Rust 编写,可直接编译为本地机器码[reference:13][reference:14]。 gist.github.com[reference:15]
Wenli (文理) 一款 AI 原生编程语言,设计目标是打破自然语言的“模糊性”与机器指令的“确定性”之间的屏障。提出 “语境防火墙” 概念,仅将必需的变量注入模型,降低推理成本;具备 “静态蒸馏” 愿景,可将已验证的智能行为编译为确定性代码[reference:16][reference:17][reference:18]。 Wenli 项目[reference:19]
Aria 一款将面向对象编程(OOP)原则重新定义为面向 Agent 的编程语言。作为 Java 的超集,其编译器可将 Aria 代码转译为 Java 代码,从而无缝集成和复用整个 Java 生态系统[reference:20][reference:21]。 学术项目[reference:22]
Dyad 2.0 一种专注于物理系统建模的领域特定语言(DSL),并非图灵完备。它重新构想了在 Agentic AI 接口世界中,建模与仿真语言应有的形态[reference:23]。 JuliaHub[reference:24]
SPELL 一种为大型语言模型设计的创新编程语言,其语法采用 JSON 结构,与 LLM 训练中常用的数据格式紧密对齐,简化了集成和理解[reference:25]。 独立项目[reference:26]

5.2 Agent 编排与领域特定语言——指挥 AI “完成任务”

这类语言专注于为复杂的 AI 工作流提供一种表达力强且可控的编排方式,常以 DSL 或特定框架的形式出现。

语言 / 框架 核心设计理念与特点 代表项目 / 主要开发者
Pel 一款专为 LLM 编排设计的编程语言。语法极简、同像性(受 Lisp/Elixir 启发),通过静态依赖分析实现自动并行化。内置 LLM 评估的自然语言条件,并拥有 AI 辅助的错误自动修正环境(REPeL)[reference:27]。 Behnam Mohammadi 等[reference:28]
SARL 一种通用的、静态类型的 Agent 编程语言,旨在为处理并发、分布、交互等 Agent 核心特性提供基础抽象。其代码最终可转译为 JVM 字节码,与 Java 生态系统透明交互[reference:29]。 SARL.io[reference:30]
Eclipse ADL 由 Eclipse 基金会发布的 Agent 定义语言,是一种结构化、模型无关的声明式语言。它分离了 Agent 行为的定义与具体的提示工程,让业务专家和工程师能围绕同一份“Agent 行为标准”协作,是 Agent 领域的“SQL”[reference:31][reference:32]。 Eclipse 基金会[reference:33]
IAPL / 2APL / 3APL 基于 BDI(信念-愿望-意图)模型 的经典 Agent 编程语言家族,为构建具备认知能力的智能体提供了理论基础和编程框架[reference:34][reference:35]。 学术项目[reference:36]
Koog JetBrains 推出的基于 Kotlin 的 Agent 开发框架。它提供了一套图基策略(Graph-based Strategies)来管理复杂工作流,支持 JVM、Android、iOS、Wasm 等多平台,并内置了用于生产环境的特性[reference:37]。 JetBrains[reference:38]

5.3 编译器即安全验证器——将 AI 不确定性关进笼子

这是一类全新的编译器,它们的核心任务不仅是翻译代码,更是在编译时对 AI 生成代码的行为进行约束、优化和安全验证。

编译器 / 框架 核心设计理念与特点 代表项目 / 主要开发者
Agint 一个 Agent 图编译器。它将自然语言指令增量式地编译为带类型的、效果感知的代码有向无环图(DAG)。通过显式的“类型底板”(text→data→spec→code)和混合 LLM/函数 JIT 运行时,实现图的动态细化与可复现的优化执行[reference:39][reference:40]。 Abhi Chivukula 等[reference:41]
LLMCompiler 一种旨在通过 DAG 中的急切执行任务 来加速 Agent 任务执行的架构。它通过计算图来优化 Agent 工作流的执行效率[reference:42]。 独立项目[reference:43]
CELI 一个将控制逻辑直接嵌入 LLM 提示(Prompt)中的框架,使 LLM 能够自主管理复杂的、多阶段的计算工作流,同时与外部系统和功能保持无缝交互[reference:44][reference:45]。 学术项目[reference:46]

5.4 传统语言在 AI 时代的新角色

值得注意的是,AI 的崛起也重新定义了现有编程语言的战场,许多传统语言因自身特性而成为构建 Agent 的热门选择。

  • TypeScript 与 Python:根据 2026 年初的 GitHub 月度趋势统计,TypeScript(占比 50%)和 Python 是 AI Agent 项目的绝对主角[reference:47]。Python 凭借其庞大的机器学习生态占据主导,而 TypeScript 因其强大的类型系统在构建安全可靠的 AI 应用时更具优势[reference:48]。
  • Rust 与 Go:Rust 凭借其内存安全和高性能,成为构建 Agent 基础设施(如编译器、运行时)的“安全优先”选择[reference:49]。Go 语言则以其出色的并发能力,在需要扩展 AI 应用而无额外开销的场景中占据一席之地[reference:50]。
  • C#:正在从一个“传统企业级语言”成功转型为现代云原生和 AI 应用的核心力量,其生态系统内涌现了 BotSharp、Semantic Kernel、Microsoft Agent Framework 等一系列成熟的 Agent 框架[reference:51][reference:52]。

5.5 🇨🇳 聚焦国内:两大国产 Agent 原生语言深度解析

在全球范围内,面向 Agent 的编程语言正百花齐放。而在中国,以 MoonBit仓颉 为代表的国产力量,正以独特的定位和强劲的势头,试图在 AI 时代定义新的编程范式。

5.5.1 MoonBit:做 AI 这代人的 C 语言

MoonBit 由粤港澳大湾区数字经济研究院(IDEA)基础软件中心首席科学家张宏波带领团队研发,定位为“AI 这代人的 C 语言”——为 AI 原生场景构建的通用编程语言与全栈开发平台。

① 编程语言核心特性:

  • 多后端编译:一份代码可编译为原生机器码、WebAssembly 或 JavaScript。在云边端场景表现突出:WebAssembly 后端代码体积比 Rust 小 30%,是 TypeScript 和 Go 的 50%;在数值计算等基准测试中,性能超越 Java 近 10 倍。
  • 结构化并发:MoonBit 于 2025 年 9 月推出异步能力,补齐了关键特性的“最后一块拼图”。其结构化并发模型下,任务呈现嵌套树状结构:父任务生命周期依赖于所有子任务,若某一子任务失败,系统自动取消其他子任务。
  • AI 友好语法:采用原子化语法设计,将语言元素拆解为最小可预测单元;采用前缀优先的语法设计,使长代码块生成中断率降低 67%。

② 工具链与智能体生态:

  • MoonBit Pilot:业界首个语言内置的原生智能体。它通过垂直整合架构,将编程语言、编译器、调试器等组件与大模型深度耦合,形成数据流闭环,实现了真正意义上的多 Agent 并行修复能力,相比传统 Agent 工作流可实现 5 至 10 倍的效率提升。
  • MoonBit Agent SDK:于 2025 年 12 月正式开源,支持多种编程语言(不限于 MoonBit),拥有结构化并发框架,体积仅 6MB,远小于 OpenAI Codex 的 27MB 和 Gemini CLI 的数百 MB。
  • 生态增长:社区已积累 2000+ 个包,覆盖编译、测试、系统编程等多个领域;用户数量从 2024 年的几千人增长至 10 万人,预计 2026 年底将达到 100 万。

③ 权威验证:SWE-AGI 基准测试
2026 年 2 月发布的 SWE-AGI 基准测试,采用 MoonBit 作为唯一构建环境,要求 AI 从零构建解析器、解释器、SAT 求解器等中大型软件系统(每个任务 1000-10000 行核心逻辑)。由于 MoonBit 作为新兴语言未被纳入主流大模型训练语料,该基准有效排除了数据泄露干扰,强制 AI 依赖真正的逻辑推理。结果显示 GPT-5.3-codex 成功率高达 86.4%(19/22 个任务),claude-opus-4.6 为 68.2%。值得注意的是,当代码库规模扩大时,代码阅读(而非代码编写)成为 AI 开发的主要瓶颈。

④ 产学研生态: MoonBit 已进入清华大学和北京大学的课堂,同时获得国际认可——美国 NewStack 多次头版报道,AI 服务咨询公司将其评为 2025 年诞生于 AI 时代的最佳编程语言之一(与 Rust 并列)。

5.5.2 仓颉(Cangjie):华为自主的全场景智能化编程语言

仓颉是华为自主研发的新一代编程语言,面向全场景智能化应用开发,具备“原生智能化、天生全场景、高性能、强安全”四大技术特色。华为于 2025 年 7 月 30 日正式在 Gitcode 平台开源仓颉,涵盖运行时、编译器、命令行工具和标准库等核心组件。

① 编程语言核心特性:

  • 内嵌 Agent DSL:仓颉在语言层面内嵌了 Agent 声明式编程框架(AgentDSL),将自然语言与编程语言有机融合。开发者通过 @agent@prompt 等注解即可定义智能体,代码与仓颉本身语法一致,既能享受静态检查能力,又无需额外学习负担。
  • 跨平台编译能力:支持将代码编译到鸿蒙、Windows、macOS、Linux 等多个平台,计划通过突破性方案实现对 Android/iOS 原生接口的智能体调用能力。
  • 现代化语言特性:全方位的编译优化和运行时实现,提供开箱即用的 IDE 工具链支持。

② 智能体开发框架——Cangjie Magic:
2025 年 3 月 14 日,仓颉社区正式推出首个基于仓颉语言原生构建的 LLM Agent 开发平台 Cangjie Magic,通过三大核心技术突破重构智能体开发范式:

  • 独创 Agent DSL 架构:基于仓颉语言特性设计的领域专用语言,实现智能体建模的声明式编程。Agent DSL 编写的代码最终被转换为普通仓颉代码,由仓颉编译器完成编译。
  • 原生支持 MCP 协议:原生支持 Model Context Protocol 通信协议,实现统一工具接入。
  • 智能调度引擎:集成模块化服务调用机制与动态任务规划算法,支持自适应任务规划和上下文感知。

③ 生态建设:

  • 产学研:北京航空航天大学开设首门“仓颉语言程序设计”课程,面向计算机科学与技术、软件工程专业大二、大三本科生。
  • AgentSkills Runtime:社区贡献了基于仓颉实现的 Agent Skills 标准运行时环境,提供安全、高效的 AI 智能体技能运行环境,同时提供多语言 SDK 适配各种技术栈。
  • AI 赋能:aiXcoder Agent 通过自主学习官方文档,快速构建对仓颉语言特性的理解,能够自主完成项目初始化、模块拆分、编码实现、编译测试及部署全流程。
5.5.3 国内 Agent 编程工具生态全景

除了 MoonBit 和仓颉这两大底层编程语言,国内科技巨头也在 AI 编程平台和 IDE 领域全面布局,形成了完整的工具链生态:

公司 代表产品 定位与特点
字节跳动 Trae 2.0 国内首款 AI 原生 IDE,注重全栈开发能力,月活跃用户超百万
字节跳动 Eino Go 语言 LLM 应用开发框架,编排优先设计理念,类型安全的流式处理
腾讯 CodeBuddy 代码助手,重视产品开发部署,混元 + DeepSeek 双引擎,云原生一键部署
腾讯 Youtu-Agent 零闭源依赖智能体框架,基于 DeepSeek-V3 优化,成本控制优势明显
阿里巴巴 通义灵码 AI 代码助手,Java/Go 支持扎实,Spring Boot/Cloud 生成精度超 GitHub Copilot
阿里巴巴 AgentScope 多智能体开发平台,Python 生态,分布式多智能体支持,可视化 WebUI 界面
阿里巴巴 Qoder CLI AI 编程工具,标志着 AI 编程从“辅助补全”迈向“自主开发”
百度 Comate AI 代码助手,C++ 核心代码质量第一,Python 首生成率达 92.3%,知识图谱积累深厚

技术趋势总结:根据 2025 年国产 AI Agent 研究报告,AI 编程平台的落地逻辑是“优秀的 Coding 模型 + AI 编程平台协同配合”。国产 Coding 模型中,Kimi K2 和 Qwen3-Coder 表现突出。AI IDE 并未抛弃传统 IDE 的核心功能,而是通过 AI 能力降低开发门槛、提升效率,让大模型使用多工具的路径更流畅。北航联合阿里、字节、腾讯等近 30 家机构发布的 304 页 Code Agent 综述,系统梳理了代码智能领域从“辅助工具”到“自主开发者”的革命性转变。

六、用Rust构建Agent OS的探索:从零打造“原生”智能体操作系统

在前述章节中,我们探讨了三种主流的Agent OS技术路线。然而,除了“外接型”、“内置型”和“学术/架构型”之外,2026年初,一条全新的技术路径开始浮现:用Rust从零构建完整的Agent操作系统。这条路线在精神上与AIOS一脉相承——都是试图用操作系统的底层概念来重新定义Agent的运行模型——但它选择了一条更激进、更“硬核”的实现方式:不用Python做原型,不在Linux上叠增强层,而是用系统编程语言直接交付一个完整的、可运行的Agent OS内核。

本章将深入剖析这条路径上两个最具代表性的项目:OpenFangCofferOS,并分析它们与阿里Agentic OS的本质差异。

6.1 OpenFang:用Rust从零编写的Agent微内核OS

OpenFang由RightNow-AI团队打造,于2026年2月正式开源。在官方文档中,它对自己的定义极为明确:“OpenFang is an open-source Agent Operating System — not a chatbot framework, not a Python wrapper around an LLM, not a ‘multi-agent orchestrator.’ It is a full operating system for autonomous agents, built from scratch in Rust.”——一个用Rust从零构建的完整Agent操作系统。

OpenFang的出现,本质上是在回答一个问题:当Python框架的内存占用达到数百MB、冷启动需要3-6秒时,Agent基础设施的性能天花板在哪里?

6.1.1 设计哲学与核心理念

OpenFang的设计哲学可以用一句话概括:“Traditional agents wait for you to type. Hands work for you.”(传统Agent等你输入,Hands为你工作)。

传统Agent框架(如LangChain、AutoGPT)的典型工作模式是“你问它答”——用户输入指令,Agent响应。而OpenFang试图构建的是真正的“数字员工”——它们按计划运行、7×24小时工作,构建知识图谱、监控目标、生成线索、管理社交媒体,并将结果推送到你的仪表盘,无需任何人工提示。

这种设计哲学在技术层面体现为以下几个核心理念:

  • 单一二进制,零外部依赖:整个系统编译为约32MB的单一可执行文件,没有Python运行时依赖,没有Node.js层。这意味着部署OpenFang只需要一条命令,不需要配置虚拟环境、安装依赖包或拉取Docker镜像。

  • 微内核架构,模块化设计:OpenFang采用微内核架构,核心模块openfang-kernel负责编排、工作流、计量、RBAC、调度器和预算跟踪,其他13个crate围绕内核提供运行时、API、通道适配、记忆存储等能力。

  • Agent是“一等公民”:在OpenFang的世界里,Agent不是应用程序的附属物,而是操作系统的核心调度对象。你向OpenFang部署Agent的方式,就像向Kubernetes部署容器一样。

  • 安全内建而非事后修补:16层独立安全系统从设计之初就嵌入内核,而非在框架完成后才“打补丁”。

6.1.2 架构设计:14个Crate的模块化内核

OpenFang的整个系统由14个专门的Rust crate组成,总计137,728行Rust代码,通过了1,767+个单元测试,并且保持着零clippy警告的工程质量标准。

① 核心crate详解:

Crate名称 职责 关键特性
openfang-kernel 内核调度中枢 编排、工作流、计量、RBAC、调度器、预算跟踪
openfang-runtime Agent运行时 Agent循环、3种LLM驱动、53个工具、WASM沙箱、MCP/A2A协议支持
openfang-api API网关 140+ REST/WS/SSE端点、OpenAI兼容API、仪表盘后端
openfang-channels 通道适配层 40个消息通道适配器(Telegram、Discord、Slack等),支持速率限制和群组策略
openfang-memory 记忆管理 SQLite持久化、向量嵌入、会话管理、记忆压缩
openfang-types 核心类型系统 污点追踪、Ed25519清单签名、模型目录
openfang-skills 技能库 60个内置Skill、SKILL.md解析器、FangHub技能市场
openfang-hands 自主能力包 7个内置Hands、HAND.toml解析器、生命周期管理
openfang-extensions 扩展系统 25个MCP模板、AES-256-GCM凭证保险库、OAuth2 PKCE
openfang-wire P2P通信协议 OFP协议、HMAC-SHA256双向认证
openfang-cli 命令行界面 守护进程管理、TUI仪表盘、MCP服务器模式
openfang-desktop 桌面应用 Tauri 2.0原生应用(系统托盘、通知、全局快捷键)
openfang-migrate 迁移引擎 OpenClaw、LangChain、AutoGPT迁移工具

② Hands机制:OpenFang的核心创新

Hands是OpenFang最核心的创新——预构建的自治能力包。每个Hand不是一个简单的工具,而是一个完整的、可独立运行的Agent能力模块。

OpenFang内置了7个开箱即用的Hands:

Hand名称 功能描述
Clip 视频剪辑:8阶段流水线,整合FFmpeg、yt-dlp和5个STT后端,自动下载、剪辑、加字幕、AI配音
Lead 销售线索生成:每日自动运行,发现、评分(0-100)、去重并交付合格线索
Collector OSINT情报收集:变化检测、情感跟踪、知识图谱构建,重要变化时触发警报
Predictor 超级预测引擎:多源信号收集、校准推理链、置信区间预测、Brier分数自评估
Researcher 深度研究:多源交叉验证、CRAAP标准可信度评估、APA格式引用报告
Twitter 社交账号管理:7种轮换格式内容创作、最佳时间发布、审批队列保障安全
Browser 网页自动化:Playwright桥接、会话持久化、强制购买审批门禁

从技术实现角度看,每个Hand打包了四个核心组件:

  • HAND.toml:清单文件,声明允许使用的工具、技能、设置和要求
  • System Prompt:多阶段操作手册(500+字的专家流程,非单行提示)
  • SKILL.md:领域专业知识,运行时注入到上下文中
  • Guardrails:敏感操作的审批门禁(如Browser Hand在购买前强制审批)

所有内容编译进二进制,无需下载、pip install或Docker pull,实现了真正的“开箱即用”。

③ 16层安全系统

OpenFang的安全设计从第一行代码就开始了,而非事后修补:

  • WASM双计量沙箱:燃料计量+epoch中断,确保Agent工具执行被严格限制
  • Merkle哈希链审计追踪:所有操作以Merkle树形式记录,防篡改、可验证
  • 信息流污点追踪:敏感数据(如API密钥)被标记,追踪其流向,防止泄漏
  • Ed25519签名清单:所有Skill和Hands经过签名验证,确保未被篡改
  • SSRF防护、密钥归零化等10+层额外防御
6.1.3 性能表现

OpenFang的性能数据令人印象深刻:

指标 OpenFang 典型Python框架
冷启动时间 <200ms 3-6秒
空闲内存占用 ~40MB 180-400MB
安装体积 ~32MB(单一二进制) 100-500MB

一个更有说服力的数据是:在类似ZeroClaw这样用Rust重写OpenClaw的项目中,内存占用被从394MB压到了5MB。这充分说明,Rust在Agent基础设施领域的性能优势不是微小的优化,而是数量级的差距

6.1.4 语言构成

OpenFang的语言构成非常纯粹:100% Rust。没有Python运行时,没有Node.js层,没有C依赖。14个crate全部用Rust编写,编译产物是一个独立的静态链接二进制文件。

这一选择带来了多重优势:

  • 部署简单:一个二进制文件,复制即运行
  • 内存安全:Rust的所有权系统从根本上杜绝了内存错误
  • 高性能:零成本抽象,接近C语言的运行时性能
  • 并发安全:Rust的无畏并发让多Agent并行执行更可靠
6.1.5 开源生态与社区

OpenFang于2026年2月开源,上线即引发关注,迅速获得2700+ GitHub Star。项目采用Apache 2.0协议,仓库地址为github.com/RightNow-AI/openfang

OpenFang的生态建设也在快速推进:

  • FangHub技能市场:社区可上传和分享Skill
  • 25个MCP模板:覆盖主流开发场景
  • 迁移引擎:支持从OpenClaw、LangChain、AutoGPT无缝迁移

6.2 CofferOS:为Agent设计的Rust容器隔离内核

如果说OpenFang是“从零构建一个Agent OS”,那么CofferOS走的是一条更聚焦的路线:它不做一个完整的Agent OS,而是为Agent OS提供一个全新的内核隔离底座

CofferOS是一个来自KAIST(韩国科学技术院)的学术研究项目,其论文《CofferOS: Hardening OS-level Virtualization with Rust》发表于2026年4月的EuroSys(欧洲计算机系统顶会)上。尽管是学术项目,它的设计理念对Agent OS的未来演进具有深远的指导意义。

6.2.1 设计哲学:让Agent成为真正的“一等公民”

CofferOS的核心设计目标,是解决传统OS级虚拟化(如Linux容器)的一个根本性缺陷:所有容器共享同一个Linux内核

表面上看,Docker容器提供了隔离的文件系统、网络和进程空间。但在内核层面,所有容器运行在同一个Linux内核实例上,共享内核状态。这意味着:

  • 安全风险:一个容器的内核漏洞可能波及整个系统
  • 故障隔离不足:一个容器的内核崩溃会拖垮所有容器
  • 无法定制内核:所有容器必须使用相同的系统调用语义和资源管理策略

CofferOS的解决方案是:利用Rust的内存安全保证,将每个容器的整个内核状态封装在一个名为“Coffer”的类实例中。每个运行的容器被实例化为一个独立的Coffer实例,彼此之间零共享可变状态,实现了真正的完全隔离。

6.2.2 核心技术:Coffer抽象与Personality机制

① Coffer抽象——容器即类实例

在CofferOS中,一个容器被实现为一个Rust类,称为Coffer。这个类封装了该容器的整个内核状态,包括进程表、文件描述符表、内存管理结构等。每个运行的容器是Coffer类的一个独立实例,实例之间没有任何共享的可变状态。

这一设计的精妙之处在于:

  • 结构封装 + Rust内存安全 = 编译时保证的隔离边界
  • 零共享状态 = 一个容器的崩溃或安全漏洞不会波及其他容器
  • 轻量级 = 比传统虚拟机(每个需要独立内核镜像)轻量得多

② Personality机制——为每个Agent定制内核行为

CofferOS更进一步,引入了Personality机制,允许为每个容器定制内核行为。通过模块化和可插拔的设计,Personality可以控制:

  • 资源管理策略:不同Agent可以使用不同的CPU/内存调度策略
  • 隔离策略:从严格隔离到松散协作,按需选择
  • 系统语义:为特定Agent定制系统调用的行为

③ 为什么CofferOS是Agent OS的“天然基础”?

CofferOS的论文明确论证了其作为未来Agent OS底座的适用性:

新兴的Agent应用——如自主AI Agent、使用工具的LLM、长期运行的自适应服务——需要:

  • 每Agent隔离:不同Agent运行在不同的隔离域中,互不干扰
  • 细粒度内核行为控制:不同Agent可能有完全不同的系统资源使用模式
  • 动态演进系统策略:Agent的行为模式可能随时间变化,需要内核策略同步演进

CofferOS让每个Agent在自己的Coffer实例中运行,拥有定制的Personality,同时避免了完整虚拟机的沉重开销。这种设计允许操作系统将Agent视为一等公民,而非普通的进程,架起了OS级抽象与Agent中心化执行模型之间的桥梁。

6.2.3 性能评估

根据论文的实验数据,CofferOS在一系列工作负载上展现了与Linux容器相当的性能,同时提供了更强的安全隔离、故障隔离和内核定制能力。

这意味着CofferOS不是以牺牲性能为代价换取安全的学术玩具,而是一个具有实际部署潜力的系统。

6.2.4 语言构成

CofferOS完全用Rust实现。选择Rust的关键原因是:

  • 内存安全:Rust的所有权系统在编译时保证没有数据竞争和内存错误,这是实现“零共享状态”Coffer实例的前提
  • 零成本抽象:Coffer抽象不会带来运行时性能损失
  • 系统编程能力:Rust可以直接操作底层硬件和内存,适合编写操作系统内核
6.2.5 学术生态与状态

CofferOS目前处于学术原型阶段,论文发表于2026年EuroSys,研究团队来自KAIST计算机架构与系统实验室(CASYS)。论文作者包括Minkyu Jung、Chanshin Kwak、Junho Ahn等,通讯作者为Youngjin Kwon教授(KAIST)和Jeehoon Kang教授(浦项工科大学)。

需要强调的是,CofferOS目前尚未开源,仍然是一个学术研究原型。但其设计理念——利用Rust的内存安全来构建零共享状态的容器隔离内核——为Agent OS的未来演进提供了重要的理论参考。

6.3 三条路线的深度对比:OpenFang、CofferOS与阿里Agentic OS

将OpenFang、CofferOS与阿里Agentic OS放在一起对比,三条截然不同的技术哲学清晰呈现:

对比维度 OpenFang CofferOS 阿里Agentic OS
核心路线 从零用Rust构建完整Agent OS内核 从零用Rust构建容器隔离内核 在Linux上叠加增强层
对现有OS的依赖 运行在Linux/macOS之上(不直接管理硬件) 目标是替代传统容器内核 完全依赖Linux内核
设计哲学 “Agent OS就是操作系统”,微内核架构 “每个Agent拥有自己的内核实例” “让操作系统适配Agent”,增强而非替代
Agent的定位 Agent是“一等公民”,Hands是自治能力包 Agent是“一等公民”,运行在独立Coffer实例中 Agent是上层应用,通过Skills调用OS能力
语言构成 100% Rust(137K行,14 crates) 100% Rust Node.js + Rust + Python + eBPF + Markdown
隔离粒度 WASM沙箱级(工具执行隔离) Coffer实例级(整个内核状态隔离) 应用层沙箱 + eBPF监控
安全机制 16层安全(WASM双计量沙箱、Merkle审计链、污点追踪、Ed25519签名) 结构封装+Rust内存安全,零共享状态 AgentSecCore三层防御(系统加固、沙箱隔离、Skill签名)
性能 冷启动<200ms,空闲40MB,安装32MB 与Linux容器性能相当 Token开销降低30%-60%
成熟度 2026年2月开源,快速迭代,已可生产级部署 2026年EuroSys学术论文,原型阶段,未开源 2026年3月发布,已在阿里云ECS上线
生态系统 FangHub技能市场,25个MCP模板,40通道适配器 学术原型,无公开生态 阿里云云原生生态,OpenClaw/CoPaw等主流框架支持
分类 架构型(学术/架构型路线的工程实现) 学术/架构型 内置型

6.4 为什么是Rust?——技术选型的深度分析

OpenFang和CofferOS不约而同地选择了Rust,这绝非巧合。Rust在Agent OS领域具有独特的“天选之子”地位:

  1. 性能极致:在Agent场景下,Rust的性能优势被极度放大。OpenFang的冷启动<200ms,而Python框架需要3-6秒;空闲内存40MB vs 180-400MB。当系统需要同时调度数十上百个Agent时,这种差距将直接决定系统的可扩展性。

  2. 内存安全是隔离的前提:CofferOS的整个设计建立在Rust的内存安全保证之上——正是因为Rust编译器能在编译时证明没有数据竞争和内存错误,Coffer实例之间的“零共享状态”才能被信任。如果用C语言实现同样的设计,指针错误可能无声地破坏隔离边界,让整个安全模型形同虚设。

  3. 系统级语言的本质:Rust生来就是做系统编程的。它能直接与操作系统底层API交互,无缝编写eBPF程序,编译到裸机环境。这些能力是Python、JavaScript这类语言根本无法提供的。

  4. 零成本抽象:OpenFang的Hands机制、CofferOS的Coffer抽象,都是高级的编程语言抽象,但Rust保证了这些抽象不会带来运行时性能损失。你可以在代码中写出清晰的模块化设计,而编译器将其优化为接近手写汇编的效率。

  5. 工程质量的天然保障:OpenFang的137K行代码保持着零clippy警告,通过了1,767+个单元测试。Rust严格的编译器本身就是第一道质量关卡,它在开发阶段就消灭了内存错误、数据竞争等传统系统编程的顽疾。

6.5 总结:用Rust构建Agent OS的技术路线图

综合OpenFang和CofferOS的实践,用Rust构建Agent OS的三条可行路径已经清晰:

路径一:构建完整的Agent OS(OpenFang路线)

  • 核心思路:用Rust从零编写一个Agent OS内核,包含调度、内存管理、工具隔离、通道适配等完整能力
  • 适用场景:需要一个完整的、独立的Agent运行平台,追求极致性能和部署简便性
  • 技术栈:100% Rust,微内核架构,WASM沙箱
  • 成熟度:OpenFang已证明可行,137K行代码已开源,可生产级部署

路径二:构建Agent隔离内核(CofferOS路线)

  • 核心思路:用Rust构建一个全新的容器隔离内核,让每个Agent运行在独立的Coffer实例中
  • 适用场景:对Agent间隔离要求极高的场景(多租户、安全敏感应用)
  • 技术栈:Rust内核 + Coffer抽象 + Personality机制
  • 成熟度:学术原型阶段,已发表于EuroSys 2026,为未来Agent OS提供理论参考

路径三:Rust组件嵌入现有OS(阿里路线 + Rust增强)

  • 核心思路:在现有Linux内核之上,用Rust编写关键的安全和性能组件(沙箱、调度器、eBPF监控等)
  • 适用场景:快速落地,与现有生态兼容
  • 技术栈:Rust + Linux + eBPF
  • 成熟度:阿里Agentic OS已采用此模式(AgentSecCore和AgentSight均用Rust实现)

三个关键判断

  1. Rust正在成为Agent OS基础设施的“标准语言”——从OpenFang的全栈Rust到CofferOS的内核Rust,再到阿里Agentic OS中Rust实现的安全组件,Rust在Agent OS领域的渗透正在加速。

  2. “从零构建Agent OS”已被证明工程可行——OpenFang用137K行Rust代码交付了一个可生产部署的Agent OS,冷启动<200ms、空闲40MB的性能数据证明了Rust路线的工程价值。

  3. Agent OS的技术栈正在清晰分层:上层用AI原生语言(MoonBit/仓颉)写应用,中层用Agent OS(OpenFang/阿里Agentic OS)调度和管理,底层用Rust加固安全和隔离边界(CofferOS/AgentSecCore/WASM沙箱)。这个三层架构正在成为Agent基础设施的“标准答案”。

📚 参考资料

  1. 当操作系统遇见智能体,OS Agent 和 AgentOS 驱动的人机交互变革及启示(天翼智库,2025-07-09)

  2. AI Agent Operating Systems: Enterprise Guide and Evaluation 2025(SparkCo, 2026-02-26)

  3. AIOS: LLM Agent Operating System(arXiv:2403.16971, 2025-05-11)

  4. Alibaba Cloud Linux 4 Agentic Edition 产品概览(阿里云官方文档,2026-03-31)

  5. 开源项目 Agentic OS 实战指南:手把手教你从 ANOLISA 源码安装(SegmentFault, 2026-04-10)

  6. OpenClaw Architecture Deep Dive 2025(SparkCo, 2026-02-26)

  7. 软通动力:旗下软通天鸿 OS 率先完成预装 OpenClaw(证券时报,2026-03-12)

  8. 火爆 AI 圈的 Harness 是什么?看国内“大厂”怎么说(新京报,2026-04-03)

  9. 字节开源的 Harness:Agent 基础设施解析(七牛云新闻,2026-04-07)

  10. 暴涨 47.3k Stars!字节开源 Harness 项目 DeerFlow 2.0(知乎专栏,2026-03-26)

  11. AI-Native Programming Languages and Agent-Computer Interfaces: The MoonBit Case Study(HKUST-GZ, 2025-06-26)

  12. MoonBit:做 AI 这代人的 C 语言(IDEA 研究院,2025-12-02)

  13. 软通天鸿 OS 预装 OpenClaw:原生安全、上电即用(EETrend, 2026-03-12)

  14. 拓维信息旗下开鸿智谷打造“开源鸿蒙+OpenClaw”创新产品(人民网湖南频道,2026-03-07)

  15. 一些 Harness Engineering 的实践(阿里云开发者社区,2026-03-20)

  16. 阿里云发布 Agentic OS:预置 Skills,可降低 Agent 运行成本 30%(太平洋电脑网,2026-03-31)

  17. MoonBit AI:程序语言 & 大模型(MoonBit 官方论坛,2025-11-04)

  18. 华为开源仓颉编程语言,含运行时、编译器等核心组件(Readhub,2025-07-30)

  19. MoonBit 再添异步能力,实现 AI Agent 高效与稳定开发(IDEA 研究院,2025-09-28)

  20. 华为仓颉智能体开发框架 Cangjie Magic 开源(JavaForAll,2026-03-15)

  21. MoonBit Pilot:全球首个自底向上的代码智能体,全栈 AI 原生(IDEA 研究院,2025-07-30)

  22. 智能应用开发-未来工作规划-仓颉编程语言白皮书(华为开发者文档)

  23. 华为仓颉智能体开发框架 Cangjie Magic 开源(搜狐 / IT之家,2025-03-17)

  24. CangjieMagic:基于仓颉语言的 Agent 开发框架实践(InfoQ / AICon 2025)

  25. Agent 开发框架对比分析报告(腾讯云,2025-09-18)

  26. 2025 国产 AI Agent 研究报告(EET China,2025-08-13)

  27. 北航一篇 304 页的 Code Agent 综述!近 30 家机构参与(知乎专栏,2025-12-11)

  28. SWE-AGI: Benchmarking Specification-Driven Software Construction with MoonBit(arXiv:2602.09447,2026-02-10)

  29. SWE-AGI 基准评测:中大型软件在全新语言上的批量生成成功率已达 80%(CSDN / 网易,2026-02-27)

  30. 原生 AI 开发工具链革新:MoonBit Pilot 重构代码智能体底层范式(百度开发者,2026-04-15)

  31. 中国人自己的编程语言!华为官宣仓颉 7 月 30 日开源(EET China,2025-06-23)

  32. 华为宣布仓颉编程语言开源,7 月 30 日正式上线(中关村在线,2025-06-20)

  33. MoonBit Meetup 深圳站 | AI 时代下的基础软件的精彩回顾(OSCHINA,2025-10-28)

  34. 比 Cursor 更快更稳定的 Coding Agent?(网易,2025-08-27)

  35. 国内四大 AI 编程 IDE 对比(一):直观印象与模型能力(掘金,2026-02-10)

  36. 2025 主流 AI 编程工具横评:国产黑马崛起(腾讯云,2025-09-12)

  37. 智谱正式开源 AutoGLM:AI 的“眼与手”(CSDN,2025-12-10)

  38. 重磅开源!智谱AutoGLM正式上线,千行百业AI自动化时代到来!(CSDN,2026-01-04)

  39. AI Agent操作系统全景解读:从AutoGLM到AIOS的进化之路(CSDN,2026-04-09)

  40. Open-AutoGLM开源仓库(GitHub,2025-12)

  41. AIOS: LLM Agent Operating System(arXiv,2024-03-25)

  42. AIOS开源仓库(GitHub,2024)

  43. AIOS 论文解读:LLM Agent操作系统(CSDN,2025-03-28)

  44. 大模型智能体操作系统AIOS(一):架构剖析(CSDN,2024-08-02)

  45. AIOS —— 把大模型装进操作系统内核(安全内参,2024-03-11)

  46. 面向AI时代的操作系统:Agentic OS的设计与实现(阿里云开发者社区,2026-03-20)

  47. 深度解读Agentic OS:首个面向AI Agent的操作系统(InfoQ,2026-03-25)

  48. 阿里云Agentic OS技术白皮书(阿里云官方文档,2026-03)

  49. OpenFang - The Open-Source Agent Operating System Built in Rust(OpenFang官方文档,2026-03-07)

  50. OpenClaw再升级,OpenFang重磅开源!(知乎,2026-02-27)

  51. 一天一个开源项目(第42篇):OpenFang - 用Rust构建的Agent操作系统,16层安全与7个自主Hands(CSDN,2026-03-06)

  52. OpenFang来了,我们还要不要继续研究OpenClaw?(知乎,2026-03-01)

  53. 137K行代码、零clippy警告:这个开源项目凭什么让AI Agent领域炸锅?(53AI,2026-03-02)

  54. OpenFANG: The Rust Agent OS Benchmarked Against CrewAI & LangGraph(SitePoint,2026-03-05)

  55. OpenFang实战指南:用Rust构建高并发AI Agent操作系统(CSDN,2026-04-01)

  56. CofferOS: Hardening OS-level Virtualization with Rust(EuroSys 2026,2026-04)

  57. The Craft of Systems Research, in Retrospect: CofferOS Seminar(浦项工科大学,2026-03-13)

  58. Rust: The Future of Agent Operating Systems(阿里云开发者社区,2026-03-20)

Logo

欢迎加入 MCP 技术社区!与志同道合者携手前行,一同解锁 MCP 技术的无限可能!

更多推荐