面向Agent的基础软件深度调研笔记

huanhuanou

790人浏览 · 2026-04-16 16:53:37

huanhuanou · 2026-04-16 16:53:37 发布

笔记定位：本笔记面向刚接触“Agent基础软件”概念的开发者，旨在用可上手的语言讲清楚：这些新概念到底在解决什么问题、怎么用、以及它们与日常使用的 Rust/C 有何区别。

📌 调研背景

关键词：

面向Agent的基础软件（OS和Compiler）、AgentOS、OpenClaw、Harness、面向Agent的编程语言和编译器

本笔记围绕以上关键词展开，从“问题是什么”到“现有方案有哪些”再到“怎么上手”，构建一个完整的认知地图。

一、Agent OS 到底是什么？

1.1 核心定义

Agent OS（智能体操作系统） 是一个专为 AI Agent 设计的软件平台，提供运行时执行、任务调度、资源治理、工具集成和安全隔离能力，让 Agent 能够自主、可靠地完成复杂工作。

和传统操作系统的根本区别：

对比维度	传统 OS	Agent OS
调度对象	进程/线程	AI Agent 请求与任务
核心能力	CPU 调度、内存管理、文件系统	Agent 调度、上下文管理、工具调用、多 Agent 协同
交互方式	CLI / GUI，精确指令	自然语言交互
安全模型	基于用户/文件的访问控制	基于 Agent 行为的权限治理与沙箱隔离

1.2 四种主流发展路径

当前对 Agent OS 的实现思路已经分化为四条明显不同的技术路线：

类型	代表项目	核心思路
外接型 (OS Agent)	Operator、Claude Computer Use、AutoGLM	Agent 通过屏幕截图/GUI 接口适配现有系统
内置型 (Agentic OS)	阿里云 Agentic OS、微软 UFO2	改造 OS 内核与服务，让 Agent 成为系统“一等公民”
编排型 (Agent OS)	OpenClaw、钉钉 Enterprise AgentOS	在应用层调度协调多个 Agent 协同工作
学术/架构型 (Agent-OS)	AIOS、Qualixar OS	从零构建全新的 Agent 运行“基板”

二、三种主流Agent OS技术路线深度剖析

在四种主流Agent OS发展路径中，“外接型”、“内置型”和“学术/架构型”最具代表性和技术区分度。它们分别代表了“不改造系统”、“改造操作系统”、“重构操作系统”三种截然不同的设计哲学。本章以 AutoGLM（外接型）、阿里云 Agentic OS（内置型） 和 AIOS（学术/架构型） 为代表案例，深入剖析其设计原理、技术实现与语言构成。

2.1 外接型（OS Agent）：AutoGLM——AI的“眼与手”

外接型Agent OS的核心思路是 “不改造操作系统，只武装AI” 。它把AI Agent当作一个“超级应用程序”，通过多模态大模型去“看”屏幕、理解界面、模拟人类点击，从而适配现有操作系统和软件。

AutoGLM是这一路线的典型代表，由智谱AI研发。它基于GLM系列语言模型和GLM-V系列视觉推理模型，将基座模型的语义理解与视觉识别能力发挥到极致，并结合“端到端异步强化学习”的技术突破，使AI能够在手机、电脑等图形界面上完成推理、编码、GUI操作等多类任务，根据需求灵活调用最合适的“子大脑”执行操作。

2.1.1 设计目标

AutoGLM的核心设计目标，是在不改变现有手机系统和应用生态的前提下，让AI具备“看懂屏幕、理解意图、动手执行”的能力。传统AI助手只能“回答”问题，而AutoGLM的目标是让AI真正“干”事情——从点外卖、订酒店到处理办公任务，实现“从说到做”的跨越[reference:1]。其长远愿景是构建以LLM为中心的通用计算系统（GLM-OS），在人与应用之间添加一个AI执行调度层，将人机交互范式带入“自然语言驱动全场景自动化”的新阶段。

2.1.2 技术架构与原理

AutoGLM构建了一个完整的“感知-决策-执行”闭环系统，由四大核心模块组成：

模块	功能	核心技术
感知层	理解屏幕内容（文字、图标、按钮、布局），解析用户自然语言指令	GLM-4.5语言模型 + GLM-4.5V视觉推理模型
规划层	将用户意图拆解为可执行的操作序列	强化学习训练的策略模型
执行层	通过ADB（Android Debug Bridge）或系统API模拟人类点击、滑动、输入等操作	ADB桥接 + 设备控制API
反馈层	实时检测执行结果，判断任务是否完成，失败时自动纠错并重试	屏幕状态比对 + 错误恢复机制

关键创新在于三大强化学习算法的引入：

MobileRL：创新难度自适应强化学习方法，通过“推理自举预热+难度自适应GRPO”，显著提升移动端任务的稳定性与收敛效率。
ComputerRL：提出API-GUI协同范式，提升数据多样性与计算效率；改进GRPO并提出Entropulse机制，增强探索与策略多样性。
AgentRL：通过交叉采样与任务优势归一化机制，解决多任务训练中的不稳定性与梯度分布不均问题，增强整体鲁棒性。

此外，AutoGLM引入“云端虚拟手机”架构，让AI在云端完成操作，用户无需交出本地设备控制权，期间可正常使用手机，实现了“自动驾驶手机”与“异步代理办公”。

2.1.3 语言构成与技术栈

AutoGLM的技术栈以Python为核心，分为模型层、框架层和交互层三层：

层级	实现语言/技术	说明
模型层	PyTorch（Python）	GLM语言模型与GLM-V视觉模型的训练与推理框架
强化学习框架	Python + 自研RL算法	MobileRL、ComputerRL、AgentRL的训练与部署
设备控制层	ADB（Android Debug Bridge）	通过Python脚本调用ADB命令行工具控制安卓设备
部署与服务	Python（FastAPI/Flask） + Docker	模型API服务化部署
客户端	JavaScript/TypeScript（Web） + Kotlin/Java（Android）	提供Web界面和手机端App接入能力

AutoGLM于2025年12月9日正式开源（项目名Open-AutoGLM），提供Apache-2.0协议授权的完整代码库、模型训练脚本、应用适配接口及50+场景Demo，同时在Hugging Face开放AutoGLM-Phone-9B轻量级模型。截至2026年1月初，项目GitHub仓库已获20.9K Star。

构建与运行：

环境准备：Python 3.10+，GPU（推荐24G×2），安卓手机（开启USB调试）+数据线
安装依赖：ADB工具、PyTorch、Transformers等
下载模型：从Hugging Face拉取AutoGLM-Phone-9B模型
启动服务：运行Python推理服务，手机通过ADB连接后，即可通过自然语言下发任务

2.1.4 优势与局限

优势：零侵入性，无需修改任何操作系统和应用代码；跨平台适配能力强（同时支持安卓和苹果）；开源社区活跃，迭代迅速。

局限：执行效率受限于屏幕识别的准确性，复杂界面或动态内容可能导致操作失败；依赖视觉模型，对纯命令行环境支持有限；安全边界完全依赖模型自身的行为约束，缺乏系统级的安全防护。

2.2 内置型（Agentic OS）：阿里云 Agentic OS——AI的“原生家园”

内置型Agent OS的核心思路是 “让操作系统去适配Agent，而非让Agent去适应操作系统” 。它不满足于在应用层打补丁，而是从操作系统层面进行增强和改造，为AI Agent提供原生的运行支持。

阿里云Agentic OS是这一路线的代表。它基于阿里自研的Alibaba Cloud Linux 4（Alinux 4）构建，完全兼容Alinux 4的所有能力（核心优化、云原生支持等），围绕Agent的认知方式和工作模式，构建全新的操作系统架构。

2.2.1 设计目标

Agentic OS的核心理念是 “让操作系统原生支持AI Agent工作负载” [reference:9]。其设计目标包括：

极致Token经济性：将复杂的运维专家知识封装为标准化的OS Skills，大幅减少Agent执行环境理解以及试错探索的Token开销
自然语言重定义人机交互：首次将Copilot Shell作为默认登录入口，用户通过自然语言即可驱动操作系统完成日常运维操作
OS级安全防线：从系统加固、沙箱隔离到Skill签名校验，构建纵深安全防线，确保Agent在受控、可审计、最小权限的环境中安全运行
开箱即用的Agent运行环境：预置技能库和可观测工具，让Agent“拎包入住”

2.2.2 技术架构与原理

Agentic OS采用四层分层架构[reference:13]：

层级	组件	功能说明	技术实现
封装交互层	Copilot Shell（cosh）	替代默认Shell，支持自然语言+bash双模交互	Qwen Code + npm workspaces
能力层	OS Skills	内置技能包机制，Agent通过Skill说明书获得“动手能力”	本地+远程Skill编排
运行时层	AgentSecCore + AgentSight	OS级纵深安全防线 + eBPF可观测引擎	Rust+Python + eBPF+SQLite
基础系统层	Alinux 4	核心优化、云原生支持等基础能力	Linux内核

① Copilot Shell（cosh）——交互入口

cosh替代bash作为系统登录后的第一入口，采用“双模交互”设计：自然语言模式下，用户用中文或英文描述意图，系统借助大模型（通义千问团队的Qwen Code）将其转化为文件系统操作；命令模式下，用户可通过!前缀快速执行Shell命令，或通过/bash回退到完整bash交互。

其技术实现采用npm workspaces单体仓库架构，包含packages/cli（终端UI层）、packages/core（后端核心）和packages/test-utils（测试工具）三个子包。

② OS Skills——能力封装层

OS Skills是Agentic OS的核心创新。它将复杂的运维专家知识封装为标准化技能模块，涵盖系统管理、监控、安全、DevOps和云集成等多个领域。Agent无需逐行摸索命令，直接调用Skill说明书即可完成内核升级、漏洞修复等高级操作。实测Token开销可降低30%-60%。

③ AgentSecCore——安全核心

随着AI Agent逐渐获得文件系统I/O、网络访问、进程管理等OS级执行能力，传统的应用安全边界已不再适用。AgentSecCore构建了从系统加固到安全决策的三层防御体系：

系统加固：基于loongshield实现最小权限原则
沙箱隔离：硬件级隔离异常Agent行为
安全校验：GPG签名+SHA-256完整性校验，确保Skill未被篡改

④ AgentSight——可观测引擎

AgentSight是基于eBPF技术的AI Agent可观测工具，能够零侵入、无修改地实时监控Agent的LLM API调用、Token消耗及进程行为。其数据存储采用SQLite+SLS（日志服务）组合，兼顾本地轻量与云端聚合的需求。

2.2.3 语言构成

Agentic OS各组件采用不同语言实现，追求“各取所长”的工程效率：

组件	实现语言	选型理由
Copilot Shell	Node.js/TypeScript	事件驱动模型天然适合高并发的I/O密集型网关；TypeScript提供类型约束防止Agent传参错乱
OS Skills	Markdown + 可选脚本（Shell/Python）	Markdown是人类、AI和机器都能顺畅阅读的“最大公约数”；脚本按需选用，灵活适配
AgentSecCore	Rust + Python	Rust负责安全边界（seccomp/namespace交互需精确控制内存）；Python负责动态策略解析（热更新）
AgentSight	Rust + eBPF	eBPF程序运行在内核态，Rust编译到eBPF字节码可在编译期保证内核级内存安全
基础系统层	C（Linux内核）	传统OS内核技术栈

2.2.4 开源实现：ANOLISA

Agentic OS以ANOLISA（Agentic Nexus Operating Layer & Interface System Architecture）项目在GitHub开源。项目结构如下：

anolisa/
├── src/
│ ├── copilot-shell/ # Node.js/TypeScript，AI 终端助手
│ ├── os-skills/ # Markdown + 可选脚本，运维技能库
│ ├── agent-sec-core/ # Rust + Python，安全沙箱
│ └── agentsight/ # Rust，eBPF 可观测引擎
├── scripts/
│ └── build-all.sh # 一键构建脚本
└── Makefile

快速上手：在Alinux/Ubuntu等发行版上，通过sudo yum install一键安装四大组件，运行cosh命令即可启动AI驱动的终端助手。

2.2.5 优势与局限

优势：与现有Linux生态完全兼容，可无缝部署在阿里云ECS等主流云平台上；通过预置Skills和cosh大幅降低Agent的使用门槛；OS级安全防线为Agent执行提供系统级保障。

局限：目前仅支持X86 CPU架构，SW64等国产架构尚未适配；依赖大模型API调用，网络延迟可能影响实时交互体验；作为操作系统级产品，生态建设仍需时间积累。

2.3 学术/架构型（Agent-OS）：AIOS——重新定义操作系统的“大脑”

学术/架构型Agent OS的核心思路是 “从零开始，重新定义操作系统的基本抽象” 。它不满足于在现有OS上叠加或改造，而是试图将LLM作为操作系统的“大脑”嵌入内核，重新设计资源调度、上下文管理、内存管理等基础服务。

AIOS（LLM Agent Operating System）由罗格斯大学研究团队提出，是这一路线的开创性学术工作。

2.3.1 设计目标

AIOS的核心理念是 “将LLM嵌入操作系统内核，使其成为操作系统的‘大脑’” ，旨在实现一个“有灵魂”的操作系统。其设计目标直击当前Agent开发的四大痛点：

资源分配优化：通过统一调度器实现LLM调用资源的公平高效利用
跨Agent上下文切换：支持Agent任务挂起时的状态保存与恢复
Agent并发执行：多LLM核心并行处理不同Agent请求
统一工具服务：Agent无需各自管理工具，由系统统一协调
访问控制维护：确保Agent在权限边界内运行

2.3.2 技术架构与原理

AIOS采用三层架构：应用层、内核层和硬件/基础设施层。内核层是核心创新所在，包含传统OS内核和一个全新的 LLM内核 。

层级	组件	功能
应用层	Agent应用程序	各种基于LLM的智能体应用，通过AIOS SDK调用内核服务
内核层	LLM内核 + 传统OS内核	核心调度与管理中枢，包含六大功能模块
硬件/基础设施层	LLM服务 + 工具资源 + 传统OS	底层LLM实例、外部工具API，以及传统操作系统资源

LLM内核的六大核心模块：

① LLM核心（LLM Core(s)）：最具创新性的抽象。将不同厂商的LLM实例统一封装为LLM Core，每个LLM被视为一个类似于CPU核心的计算单元。上层Agent通过统一接口调用任意LLM，调度器可将请求分配到不同LLM核心上并行执行。

② Agent调度器（Agent Scheduler）：对Agent系统调用进行细粒度调度，提供两种调度策略：

调度器类型	任务选择	时间管理	任务抢占	状态处理
FIFOScheduler	先来先服务	无时间限制	不支持	仅“执行中”/“已完成”
RRScheduler	轮转调度	固定时间片	支持任务挂起和恢复	“执行中”/“已完成”/“挂起”

RRScheduler配合上下文管理器，可在任务被挂起时保存LLM生成状态快照，待轮转回来再恢复执行，实现类似传统操作系统中“进程切换”的机制。

③ 上下文管理器（Context Manager）：负责上下文快照与恢复。当Agent请求被调度器暂停时，捕获并存储LLM当前生成状态的快照；当Agent重新获得执行时间片时，从快照恢复LLM的生成状态，从暂停点继续处理。

④ 内存管理器（Memory Manager）：管理RAM中的临时数据，如Agent活动任务期间的临时变量或最近处理的数据。任务完成后，内存被清空。

⑤ 存储管理器（Storage Manager）：管理磁盘上的持久化数据，用于Agent的长期记忆、日志记录等，即使会话结束后Agent仍可访问。

⑥ 工具管理器（Tool Manager）与访问管理器（Access Manager）：工具管理器加载并管理AIOS-Agent SDK中可用的各种工具，协调多Agent对同一工具的并发访问；访问管理器负责协调不同Agent之间的访问控制操作。

2.3.3 语言构成与技术实现

AIOS采用前后端分离的Monorepo架构：

组件	实现语言/技术栈	说明
后端服务（AIOS Kernel）	Python + LangGraph	核心调度、上下文管理等内核服务
前端桌面应用	Electron (Node.js + TypeScript)	跨平台桌面交互界面
AIOS SDK	Python API套件	供Agent开发者调用的标准化接口

选择Python的原因：LangChain、LangGraph等主流Agent框架均基于Python；学术原型阶段，Python的快速迭代能力远超系统语言；与LLM API交互的成熟库均在Python生态中。

构建与运行：

环境准备：Node.js LTS、Python 3.12+、npm、uv（Python包管理器）
启动后端：进入aios-langgraph-server目录，配置环境变量，运行langgraph dev
启动前端：进入aios-desktop-app目录，运行npm run dev启动Electron应用
前端自动连接到本地后端服务（http://localhost:2024）

2.3.4 性能验证与学术价值

根据AIOS论文的实验数据，采用AIOS的调度和上下文管理机制后，Agent框架的执行速度可提升至2.1倍[reference:32]。这一性能提升主要来自：调度优化（避免无序竞争）、并发执行（多LLM核心并行处理）和上下文切换（避免从头重新生成）。

AIOS将传统操作系统概念与Agent管理需求建立了完整的映射：

传统OS概念	AIOS中的对应
CPU核心	LLM核心（LLM Core）
进程调度	Agent调度（Agent Scheduler）
进程上下文切换	上下文快照与恢复
内存管理（RAM）	内存管理器（Memory Manager）
文件系统（磁盘）	存储管理器（Storage Manager）
设备驱动	工具管理器（Tool Manager）

2.3.5 优势与局限

优势：学术上首次系统化提出了Agent OS的架构范式，为后续研究提供了可参考的蓝图；通过调度和上下文管理实现了可量化的性能提升；开源实现（GitHub仓库agiresearch/AIOS）可供研究者复现和扩展。

局限：目前仍是学术原型项目，缺乏生产环境所需的稳定性、安全性和可扩展性；不直接管理硬件，仍依赖底层Linux/Windows提供基础能力；生态尚弱，第三方工具集成有限。

2.4 三条路线的对比与总结

对比维度	AutoGLM（外接型）	阿里云 Agentic OS（内置型）	AIOS（学术/架构型）
核心思路	AI适配系统，不改系统	系统适配AI，做增强层	重构系统，AI成内核
对现有OS的改造	零改造	在Linux之上叠加增强层	重新设计内核抽象
语言构成	Python为主（PyTorch+ADB），少量JS/Kotlin	多语言各取所长（Node.js+Rust+Python+eBPF）	Python+LangGraph+Electron
实现形态	开源模型+框架（Open-AutoGLM）	操作系统镜像+开源组件（ANOLISA）	学术原型+开源代码
典型优势	零侵入、跨平台、社区活跃	兼容生态、开箱即用、OS级安全	架构范式创新、可量化性能提升
主要局限	依赖视觉模型、效率受限、无系统级安全	仅支持X86、依赖云厂商生态	非生产级、依赖传统OS、生态弱
适用场景	手机/电脑GUI自动化	云服务器运维与企业级Agent部署	学术研究与架构探索

三个判断：

AutoGLM是最容易“玩起来”的——无需改造系统，一条pip命令就能跑通手机自动化，适合快速验证Agent能力的开发者。
阿里云Agentic OS是最容易“用起来”的——预置Skills和cosh让Agent开箱即用，适合有生产级AI Agent部署需求的企业。
AIOS是最值得“学起来”的——它为Agent OS建立了完整的理论框架，是理解这一领域底层设计原理的必读经典。

三、OpenClaw：Agent 编排与 OS 融合

3.1 是什么

OpenClaw 是一个开源、可自托管的 AI Agent 运行时，它通过 Gateway、Channels、Agents 和 Skills 四大模块，将大模型连接到各种消息平台和本地工具。它起源于 2025 年 11 月的 Clawdbot 项目，仅用约两个月时间便在 GitHub 积累了超过 20 万 Star。

3.2 架构核心：三层解耦

Gateway：一个长生命周期的 Node.js 进程，统一管理所有进出通信
Channels：抽象掉 WhatsApp、Telegram、Slack 等平台协议差异，类似传统 OS 中的 VFS 层
Agents & Skills：编排对话逻辑，通过可扩展的 Skill 模块执行文件操作、浏览器交互等具体动作

3.3 OpenClaw 与 OS 深度融合

软通天鸿 OS：基于 OpenHarmony 6.1 研发，在系统底层深度内置 OpenClaw 核心组件，实现“开机即用、零学习成本”。提供五大核心价值：零门槛部署、原生安全架构、双重持久化存储、混合模型灵活切换、自然语言驱动全场景任务自动化。

在鸿 OS 3.0：拓维信息旗下开鸿智谷打造，将 OpenClaw 作为系统级能力内置，深度融合分布式软总线与设备管理，支持跨设备协同与系统级操作权限。

四、Harness：Agent 的“运行时环境”

4.1 核心概念

Harness Engineering（驾驭工程）是 2026 年 AI 领域最流行的工程化范式：不改造模型，而是为 Agent 构建一套完整的运行环境、约束规则与反馈闭环，让它能稳定、可靠地完成复杂工作。

公式：Agent = Model + Harness——Harness 是模型之外的一切代码、配置与执行逻辑。

4.2 字节开源 Harness 基础设施

字节跳动开源的 Harness 项目（含 DeerFlow 2.0）是一套生产级的 Agent 运行时基础设施，核心解决三大难题：

持久化状态机：每一步中间状态、工具调用结果实时落盘，进程崩溃后可从断点恢复继续工作
上下文工程：动态截断、滑动窗口与语义摘要机制，在上下文逼近极限时自动压缩非关键信息
工具与生命周期管理：标准化的工具调用接口和生命周期钩子

DeerFlow 2.0 于 2026 年 2 月发布，上线当日即登顶 GitHub Trending 全球榜首，Stars 已突破 47k。

五、面向 Agent 的编程语言与编译器

在 AI 时代，当开发者开始让 AI 智能体（Agent）编写代码、执行任务时，一个根本性问题浮现了：传统编程语言是为人类设计的，而非为 AI 设计的。正如 Flask 作者 Armin Ronacher 所指出的，语言背后是复杂的权衡，在 AI 时代必须被重新审视；更关键的是，语言会直接影响 Agent 生成代码的质量[reference:0]。

当前，AI 编写代码时面临本质性困难：

C 语言：AI 不理解指针的物理含义，生成的 malloc/free 经常不配对，段错误频发。
Rust 语言：AI 无法理解“生命周期”这类编译期概念，面对借用检查器的错误只能瞎改。
Python：动态类型让 AI 生成的代码运行时频频崩溃。

为应对这些挑战，一批全新的、面向 Agent 的编程语言和编译器应运而生。它们不再仅仅是“翻译器”，而是升级为 AI 智能体的“安全管家”与“协作平台”，在开发阶段就能预防运行时灾难。

以下将当前主流的面向 Agent 的语言与编译器分为四大类进行详细剖析：

5.1 AI 原生编程语言——将 LLM 嵌入语言运行时

这类语言从底层设计上就将大模型（LLM）作为一等公民，试图在保持高性能的同时，让 AI 能够更可靠地生成和理解代码。

语言	核心设计理念与特点	代表项目 / 主要开发者
MoonBit	定位为“AI 这代人的 C 语言”，为 AI 原生场景构建的通用编程语言与全栈开发平台。语法扁平、强静态类型、多后端编译（原生/Wasm/JS），内置 MoonBit Pilot 作为业界首个语言原生 AI 编程助手[reference:1]。	IDEA 研究院 / 张宏波团队[reference:2]
仓颉 (Cangjie)	华为自研的新一代编程语言，面向全场景智能。核心特点是内嵌了 AgentDSL 框架，通过声明式编程将自然语言与编程语言有机融合，原生支持 MCP 通信协议[reference:3]。其官方开发框架为 Cangjie Magic[reference:4]。	华为[reference:5]
Azalea	一款革命性的 AI 原生语言，将 LLM 直接嵌入运行时。通过 `import ai` 等指令实现代码的动态生成，具备自愈执行能力（运行时错误触发 AI 自动分析），并包含自主 Agent 原语[reference:6]。	azae 项目[reference:7]
Dana	由 AI Alliance 发布的全球首个 AI 驱动的编程语言。主打“意图驱动开发”：用户只需描述想构建什么，语言本身负责处理具体实现。原生支持 Agent 工作流、记忆基础与并发[reference:8][reference:9]。	AI Alliance[reference:10]
Turn	一款为“智能体计算”设计的编译型、基于 Actor 模型的语言。创新性地引入了认知类型安全、置信度算子等语言级特性，从编译器层面解决 AI 输出格式不可控、凭证泄漏等固有问题[reference:11]。	Turn Lang[reference:12]
Mog	一门专为 LLM 编写代码而设计的静态类型、编译型、嵌入式语言。整个语言规范仅约 3200 个 Token，便于 AI 快速理解。其编译器采用 Rust 编写，可直接编译为本地机器码[reference:13][reference:14]。	gist.github.com[reference:15]
Wenli (文理)	一款 AI 原生编程语言，设计目标是打破自然语言的“模糊性”与机器指令的“确定性”之间的屏障。提出 “语境防火墙” 概念，仅将必需的变量注入模型，降低推理成本；具备 “静态蒸馏” 愿景，可将已验证的智能行为编译为确定性代码[reference:16][reference:17][reference:18]。	Wenli 项目[reference:19]
Aria	一款将面向对象编程（OOP）原则重新定义为面向 Agent 的编程语言。作为 Java 的超集，其编译器可将 Aria 代码转译为 Java 代码，从而无缝集成和复用整个 Java 生态系统[reference:20][reference:21]。	学术项目[reference:22]
Dyad 2.0	一种专注于物理系统建模的领域特定语言（DSL），并非图灵完备。它重新构想了在 Agentic AI 接口世界中，建模与仿真语言应有的形态[reference:23]。	JuliaHub[reference:24]
SPELL	一种为大型语言模型设计的创新编程语言，其语法采用 JSON 结构，与 LLM 训练中常用的数据格式紧密对齐，简化了集成和理解[reference:25]。	独立项目[reference:26]

5.2 Agent 编排与领域特定语言——指挥 AI “完成任务”

这类语言专注于为复杂的 AI 工作流提供一种表达力强且可控的编排方式，常以 DSL 或特定框架的形式出现。

语言 / 框架	核心设计理念与特点	代表项目 / 主要开发者
Pel	一款专为 LLM 编排设计的编程语言。语法极简、同像性（受 Lisp/Elixir 启发），通过静态依赖分析实现自动并行化。内置 LLM 评估的自然语言条件，并拥有 AI 辅助的错误自动修正环境（REPeL）[reference:27]。	Behnam Mohammadi 等[reference:28]
SARL	一种通用的、静态类型的 Agent 编程语言，旨在为处理并发、分布、交互等 Agent 核心特性提供基础抽象。其代码最终可转译为 JVM 字节码，与 Java 生态系统透明交互[reference:29]。	SARL.io[reference:30]
Eclipse ADL	由 Eclipse 基金会发布的 Agent 定义语言，是一种结构化、模型无关的声明式语言。它分离了 Agent 行为的定义与具体的提示工程，让业务专家和工程师能围绕同一份“Agent 行为标准”协作，是 Agent 领域的“SQL”[reference:31][reference:32]。	Eclipse 基金会[reference:33]
IAPL / 2APL / 3APL	基于 BDI（信念-愿望-意图）模型的经典 Agent 编程语言家族，为构建具备认知能力的智能体提供了理论基础和编程框架[reference:34][reference:35]。	学术项目[reference:36]
Koog	JetBrains 推出的基于 Kotlin 的 Agent 开发框架。它提供了一套图基策略（Graph-based Strategies）来管理复杂工作流，支持 JVM、Android、iOS、Wasm 等多平台，并内置了用于生产环境的特性[reference:37]。	JetBrains[reference:38]

5.3 编译器即安全验证器——将 AI 不确定性关进笼子

这是一类全新的编译器，它们的核心任务不仅是翻译代码，更是在编译时对 AI 生成代码的行为进行约束、优化和安全验证。

编译器 / 框架	核心设计理念与特点	代表项目 / 主要开发者
Agint	一个 Agent 图编译器。它将自然语言指令增量式地编译为带类型的、效果感知的代码有向无环图（DAG）。通过显式的“类型底板”（text→data→spec→code）和混合 LLM/函数 JIT 运行时，实现图的动态细化与可复现的优化执行[reference:39][reference:40]。	Abhi Chivukula 等[reference:41]
LLMCompiler	一种旨在通过 DAG 中的急切执行任务来加速 Agent 任务执行的架构。它通过计算图来优化 Agent 工作流的执行效率[reference:42]。	独立项目[reference:43]
CELI	一个将控制逻辑直接嵌入 LLM 提示（Prompt）中的框架，使 LLM 能够自主管理复杂的、多阶段的计算工作流，同时与外部系统和功能保持无缝交互[reference:44][reference:45]。	学术项目[reference:46]

5.4 传统语言在 AI 时代的新角色

值得注意的是，AI 的崛起也重新定义了现有编程语言的战场，许多传统语言因自身特性而成为构建 Agent 的热门选择。

TypeScript 与 Python：根据 2026 年初的 GitHub 月度趋势统计，TypeScript（占比 50%）和 Python 是 AI Agent 项目的绝对主角[reference:47]。Python 凭借其庞大的机器学习生态占据主导，而 TypeScript 因其强大的类型系统在构建安全可靠的 AI 应用时更具优势[reference:48]。
Rust 与 Go：Rust 凭借其内存安全和高性能，成为构建 Agent 基础设施（如编译器、运行时）的“安全优先”选择[reference:49]。Go 语言则以其出色的并发能力，在需要扩展 AI 应用而无额外开销的场景中占据一席之地[reference:50]。
C#：正在从一个“传统企业级语言”成功转型为现代云原生和 AI 应用的核心力量，其生态系统内涌现了 BotSharp、Semantic Kernel、Microsoft Agent Framework 等一系列成熟的 Agent 框架[reference:51][reference:52]。

5.5 🇨🇳 聚焦国内：两大国产 Agent 原生语言深度解析

在全球范围内，面向 Agent 的编程语言正百花齐放。而在中国，以 MoonBit 和仓颉为代表的国产力量，正以独特的定位和强劲的势头，试图在 AI 时代定义新的编程范式。

5.5.1 MoonBit：做 AI 这代人的 C 语言

MoonBit 由粤港澳大湾区数字经济研究院（IDEA）基础软件中心首席科学家张宏波带领团队研发，定位为“AI 这代人的 C 语言”——为 AI 原生场景构建的通用编程语言与全栈开发平台。

① 编程语言核心特性：

多后端编译：一份代码可编译为原生机器码、WebAssembly 或 JavaScript。在云边端场景表现突出：WebAssembly 后端代码体积比 Rust 小 30%，是 TypeScript 和 Go 的 50%；在数值计算等基准测试中，性能超越 Java 近 10 倍。
结构化并发：MoonBit 于 2025 年 9 月推出异步能力，补齐了关键特性的“最后一块拼图”。其结构化并发模型下，任务呈现嵌套树状结构：父任务生命周期依赖于所有子任务，若某一子任务失败，系统自动取消其他子任务。
AI 友好语法：采用原子化语法设计，将语言元素拆解为最小可预测单元；采用前缀优先的语法设计，使长代码块生成中断率降低 67%。

② 工具链与智能体生态：

MoonBit Pilot：业界首个语言内置的原生智能体。它通过垂直整合架构，将编程语言、编译器、调试器等组件与大模型深度耦合，形成数据流闭环，实现了真正意义上的多 Agent 并行修复能力，相比传统 Agent 工作流可实现 5 至 10 倍的效率提升。
MoonBit Agent SDK：于 2025 年 12 月正式开源，支持多种编程语言（不限于 MoonBit），拥有结构化并发框架，体积仅 6MB，远小于 OpenAI Codex 的 27MB 和 Gemini CLI 的数百 MB。
生态增长：社区已积累 2000+ 个包，覆盖编译、测试、系统编程等多个领域；用户数量从 2024 年的几千人增长至 10 万人，预计 2026 年底将达到 100 万。

③ 权威验证：SWE-AGI 基准测试
2026 年 2 月发布的 SWE-AGI 基准测试，采用 MoonBit 作为唯一构建环境，要求 AI 从零构建解析器、解释器、SAT 求解器等中大型软件系统（每个任务 1000-10000 行核心逻辑）。由于 MoonBit 作为新兴语言未被纳入主流大模型训练语料，该基准有效排除了数据泄露干扰，强制 AI 依赖真正的逻辑推理。结果显示 GPT-5.3-codex 成功率高达 86.4%（19/22 个任务），claude-opus-4.6 为 68.2%。值得注意的是，当代码库规模扩大时，代码阅读（而非代码编写）成为 AI 开发的主要瓶颈。

④ 产学研生态： MoonBit 已进入清华大学和北京大学的课堂，同时获得国际认可——美国 NewStack 多次头版报道，AI 服务咨询公司将其评为 2025 年诞生于 AI 时代的最佳编程语言之一（与 Rust 并列）。

5.5.2 仓颉（Cangjie）：华为自主的全场景智能化编程语言

仓颉是华为自主研发的新一代编程语言，面向全场景智能化应用开发，具备“原生智能化、天生全场景、高性能、强安全”四大技术特色。华为于 2025 年 7 月 30 日正式在 Gitcode 平台开源仓颉，涵盖运行时、编译器、命令行工具和标准库等核心组件。

① 编程语言核心特性：

内嵌 Agent DSL：仓颉在语言层面内嵌了 Agent 声明式编程框架（AgentDSL），将自然语言与编程语言有机融合。开发者通过 @agent 和 @prompt 等注解即可定义智能体，代码与仓颉本身语法一致，既能享受静态检查能力，又无需额外学习负担。
跨平台编译能力：支持将代码编译到鸿蒙、Windows、macOS、Linux 等多个平台，计划通过突破性方案实现对 Android/iOS 原生接口的智能体调用能力。
现代化语言特性：全方位的编译优化和运行时实现，提供开箱即用的 IDE 工具链支持。

② 智能体开发框架——Cangjie Magic：
2025 年 3 月 14 日，仓颉社区正式推出首个基于仓颉语言原生构建的 LLM Agent 开发平台 Cangjie Magic，通过三大核心技术突破重构智能体开发范式：

独创 Agent DSL 架构：基于仓颉语言特性设计的领域专用语言，实现智能体建模的声明式编程。Agent DSL 编写的代码最终被转换为普通仓颉代码，由仓颉编译器完成编译。
原生支持 MCP 协议：原生支持 Model Context Protocol 通信协议，实现统一工具接入。
智能调度引擎：集成模块化服务调用机制与动态任务规划算法，支持自适应任务规划和上下文感知。

③ 生态建设：

产学研：北京航空航天大学开设首门“仓颉语言程序设计”课程，面向计算机科学与技术、软件工程专业大二、大三本科生。
AgentSkills Runtime：社区贡献了基于仓颉实现的 Agent Skills 标准运行时环境，提供安全、高效的 AI 智能体技能运行环境，同时提供多语言 SDK 适配各种技术栈。
AI 赋能：aiXcoder Agent 通过自主学习官方文档，快速构建对仓颉语言特性的理解，能够自主完成项目初始化、模块拆分、编码实现、编译测试及部署全流程。

5.5.3 国内 Agent 编程工具生态全景

除了 MoonBit 和仓颉这两大底层编程语言，国内科技巨头也在 AI 编程平台和 IDE 领域全面布局，形成了完整的工具链生态：

公司	代表产品	定位与特点
字节跳动	Trae 2.0	国内首款 AI 原生 IDE，注重全栈开发能力，月活跃用户超百万
字节跳动	Eino	Go 语言 LLM 应用开发框架，编排优先设计理念，类型安全的流式处理
腾讯	CodeBuddy	代码助手，重视产品开发部署，混元 + DeepSeek 双引擎，云原生一键部署
腾讯	Youtu-Agent	零闭源依赖智能体框架，基于 DeepSeek-V3 优化，成本控制优势明显
阿里巴巴	通义灵码	AI 代码助手，Java/Go 支持扎实，Spring Boot/Cloud 生成精度超 GitHub Copilot
阿里巴巴	AgentScope	多智能体开发平台，Python 生态，分布式多智能体支持，可视化 WebUI 界面
阿里巴巴	Qoder CLI	AI 编程工具，标志着 AI 编程从“辅助补全”迈向“自主开发”
百度	Comate	AI 代码助手，C++ 核心代码质量第一，Python 首生成率达 92.3%，知识图谱积累深厚

技术趋势总结：根据 2025 年国产 AI Agent 研究报告，AI 编程平台的落地逻辑是“优秀的 Coding 模型 + AI 编程平台协同配合”。国产 Coding 模型中，Kimi K2 和 Qwen3-Coder 表现突出。AI IDE 并未抛弃传统 IDE 的核心功能，而是通过 AI 能力降低开发门槛、提升效率，让大模型使用多工具的路径更流畅。北航联合阿里、字节、腾讯等近 30 家机构发布的 304 页 Code Agent 综述，系统梳理了代码智能领域从“辅助工具”到“自主开发者”的革命性转变。

六、用Rust构建Agent OS的探索：从零打造“原生”智能体操作系统

在前述章节中，我们探讨了三种主流的Agent OS技术路线。然而，除了“外接型”、“内置型”和“学术/架构型”之外，2026年初，一条全新的技术路径开始浮现：用Rust从零构建完整的Agent操作系统。这条路线在精神上与AIOS一脉相承——都是试图用操作系统的底层概念来重新定义Agent的运行模型——但它选择了一条更激进、更“硬核”的实现方式：不用Python做原型，不在Linux上叠增强层，而是用系统编程语言直接交付一个完整的、可运行的Agent OS内核。

本章将深入剖析这条路径上两个最具代表性的项目：OpenFang和CofferOS，并分析它们与阿里Agentic OS的本质差异。

6.1 OpenFang：用Rust从零编写的Agent微内核OS

OpenFang由RightNow-AI团队打造，于2026年2月正式开源。在官方文档中，它对自己的定义极为明确：“OpenFang is an open-source Agent Operating System — not a chatbot framework, not a Python wrapper around an LLM, not a ‘multi-agent orchestrator.’ It is a full operating system for autonomous agents, built from scratch in Rust.”——一个用Rust从零构建的完整Agent操作系统。

OpenFang的出现，本质上是在回答一个问题：当Python框架的内存占用达到数百MB、冷启动需要3-6秒时，Agent基础设施的性能天花板在哪里？

6.1.1 设计哲学与核心理念

OpenFang的设计哲学可以用一句话概括：“Traditional agents wait for you to type. Hands work for you.”（传统Agent等你输入，Hands为你工作）。

传统Agent框架（如LangChain、AutoGPT）的典型工作模式是“你问它答”——用户输入指令，Agent响应。而OpenFang试图构建的是真正的“数字员工”——它们按计划运行、7×24小时工作，构建知识图谱、监控目标、生成线索、管理社交媒体，并将结果推送到你的仪表盘，无需任何人工提示。

这种设计哲学在技术层面体现为以下几个核心理念：

单一二进制，零外部依赖：整个系统编译为约32MB的单一可执行文件，没有Python运行时依赖，没有Node.js层。这意味着部署OpenFang只需要一条命令，不需要配置虚拟环境、安装依赖包或拉取Docker镜像。
微内核架构，模块化设计：OpenFang采用微内核架构，核心模块openfang-kernel负责编排、工作流、计量、RBAC、调度器和预算跟踪，其他13个crate围绕内核提供运行时、API、通道适配、记忆存储等能力。
Agent是“一等公民”：在OpenFang的世界里，Agent不是应用程序的附属物，而是操作系统的核心调度对象。你向OpenFang部署Agent的方式，就像向Kubernetes部署容器一样。
安全内建而非事后修补：16层独立安全系统从设计之初就嵌入内核，而非在框架完成后才“打补丁”。

6.1.2 架构设计：14个Crate的模块化内核

OpenFang的整个系统由14个专门的Rust crate组成，总计137,728行Rust代码，通过了1,767+个单元测试，并且保持着零clippy警告的工程质量标准。

① 核心crate详解：

Crate名称	职责	关键特性
openfang-kernel	内核调度中枢	编排、工作流、计量、RBAC、调度器、预算跟踪
openfang-runtime	Agent运行时	Agent循环、3种LLM驱动、53个工具、WASM沙箱、MCP/A2A协议支持
openfang-api	API网关	140+ REST/WS/SSE端点、OpenAI兼容API、仪表盘后端
openfang-channels	通道适配层	40个消息通道适配器（Telegram、Discord、Slack等），支持速率限制和群组策略
openfang-memory	记忆管理	SQLite持久化、向量嵌入、会话管理、记忆压缩
openfang-types	核心类型系统	污点追踪、Ed25519清单签名、模型目录
openfang-skills	技能库	60个内置Skill、SKILL.md解析器、FangHub技能市场
openfang-hands	自主能力包	7个内置Hands、HAND.toml解析器、生命周期管理
openfang-extensions	扩展系统	25个MCP模板、AES-256-GCM凭证保险库、OAuth2 PKCE
openfang-wire	P2P通信协议	OFP协议、HMAC-SHA256双向认证
openfang-cli	命令行界面	守护进程管理、TUI仪表盘、MCP服务器模式
openfang-desktop	桌面应用	Tauri 2.0原生应用（系统托盘、通知、全局快捷键）
openfang-migrate	迁移引擎	OpenClaw、LangChain、AutoGPT迁移工具

② Hands机制：OpenFang的核心创新

Hands是OpenFang最核心的创新——预构建的自治能力包。每个Hand不是一个简单的工具，而是一个完整的、可独立运行的Agent能力模块。

OpenFang内置了7个开箱即用的Hands：

Hand名称	功能描述
Clip	视频剪辑：8阶段流水线，整合FFmpeg、yt-dlp和5个STT后端，自动下载、剪辑、加字幕、AI配音
Lead	销售线索生成：每日自动运行，发现、评分（0-100）、去重并交付合格线索
Collector	OSINT情报收集：变化检测、情感跟踪、知识图谱构建，重要变化时触发警报
Predictor	超级预测引擎：多源信号收集、校准推理链、置信区间预测、Brier分数自评估
Researcher	深度研究：多源交叉验证、CRAAP标准可信度评估、APA格式引用报告
Twitter	社交账号管理：7种轮换格式内容创作、最佳时间发布、审批队列保障安全
Browser	网页自动化：Playwright桥接、会话持久化、强制购买审批门禁

从技术实现角度看，每个Hand打包了四个核心组件：

HAND.toml：清单文件，声明允许使用的工具、技能、设置和要求
System Prompt：多阶段操作手册（500+字的专家流程，非单行提示）
SKILL.md：领域专业知识，运行时注入到上下文中
Guardrails：敏感操作的审批门禁（如Browser Hand在购买前强制审批）

所有内容编译进二进制，无需下载、pip install或Docker pull，实现了真正的“开箱即用”。

③ 16层安全系统

OpenFang的安全设计从第一行代码就开始了，而非事后修补：

WASM双计量沙箱：燃料计量+epoch中断，确保Agent工具执行被严格限制
Merkle哈希链审计追踪：所有操作以Merkle树形式记录，防篡改、可验证
信息流污点追踪：敏感数据（如API密钥）被标记，追踪其流向，防止泄漏
Ed25519签名清单：所有Skill和Hands经过签名验证，确保未被篡改
SSRF防护、密钥归零化等10+层额外防御

6.1.3 性能表现

OpenFang的性能数据令人印象深刻：

指标	OpenFang	典型Python框架
冷启动时间	<200ms	3-6秒
空闲内存占用	~40MB	180-400MB
安装体积	~32MB（单一二进制）	100-500MB

一个更有说服力的数据是：在类似ZeroClaw这样用Rust重写OpenClaw的项目中，内存占用被从394MB压到了5MB。这充分说明，Rust在Agent基础设施领域的性能优势不是微小的优化，而是数量级的差距。

6.1.4 语言构成

OpenFang的语言构成非常纯粹：100% Rust。没有Python运行时，没有Node.js层，没有C依赖。14个crate全部用Rust编写，编译产物是一个独立的静态链接二进制文件。

这一选择带来了多重优势：

部署简单：一个二进制文件，复制即运行
内存安全：Rust的所有权系统从根本上杜绝了内存错误
高性能：零成本抽象，接近C语言的运行时性能
并发安全：Rust的无畏并发让多Agent并行执行更可靠

6.1.5 开源生态与社区

OpenFang于2026年2月开源，上线即引发关注，迅速获得2700+ GitHub Star。项目采用Apache 2.0协议，仓库地址为github.com/RightNow-AI/openfang。

OpenFang的生态建设也在快速推进：

FangHub技能市场：社区可上传和分享Skill
25个MCP模板：覆盖主流开发场景
迁移引擎：支持从OpenClaw、LangChain、AutoGPT无缝迁移

6.2 CofferOS：为Agent设计的Rust容器隔离内核

如果说OpenFang是“从零构建一个Agent OS”，那么CofferOS走的是一条更聚焦的路线：它不做一个完整的Agent OS，而是为Agent OS提供一个全新的内核隔离底座。

CofferOS是一个来自KAIST（韩国科学技术院）的学术研究项目，其论文《CofferOS: Hardening OS-level Virtualization with Rust》发表于2026年4月的EuroSys（欧洲计算机系统顶会）上。尽管是学术项目，它的设计理念对Agent OS的未来演进具有深远的指导意义。

6.2.1 设计哲学：让Agent成为真正的“一等公民”

CofferOS的核心设计目标，是解决传统OS级虚拟化（如Linux容器）的一个根本性缺陷：所有容器共享同一个Linux内核。

表面上看，Docker容器提供了隔离的文件系统、网络和进程空间。但在内核层面，所有容器运行在同一个Linux内核实例上，共享内核状态。这意味着：

安全风险：一个容器的内核漏洞可能波及整个系统
故障隔离不足：一个容器的内核崩溃会拖垮所有容器
无法定制内核：所有容器必须使用相同的系统调用语义和资源管理策略

CofferOS的解决方案是：利用Rust的内存安全保证，将每个容器的整个内核状态封装在一个名为“Coffer”的类实例中。每个运行的容器被实例化为一个独立的Coffer实例，彼此之间零共享可变状态，实现了真正的完全隔离。

6.2.2 核心技术：Coffer抽象与Personality机制

① Coffer抽象——容器即类实例

在CofferOS中，一个容器被实现为一个Rust类，称为Coffer。这个类封装了该容器的整个内核状态，包括进程表、文件描述符表、内存管理结构等。每个运行的容器是Coffer类的一个独立实例，实例之间没有任何共享的可变状态。

这一设计的精妙之处在于：

结构封装 + Rust内存安全 = 编译时保证的隔离边界
零共享状态 = 一个容器的崩溃或安全漏洞不会波及其他容器
轻量级 = 比传统虚拟机（每个需要独立内核镜像）轻量得多

② Personality机制——为每个Agent定制内核行为

CofferOS更进一步，引入了Personality机制，允许为每个容器定制内核行为。通过模块化和可插拔的设计，Personality可以控制：

资源管理策略：不同Agent可以使用不同的CPU/内存调度策略
隔离策略：从严格隔离到松散协作，按需选择
系统语义：为特定Agent定制系统调用的行为

③ 为什么CofferOS是Agent OS的“天然基础”？

CofferOS的论文明确论证了其作为未来Agent OS底座的适用性：

新兴的Agent应用——如自主AI Agent、使用工具的LLM、长期运行的自适应服务——需要：

每Agent隔离：不同Agent运行在不同的隔离域中，互不干扰
细粒度内核行为控制：不同Agent可能有完全不同的系统资源使用模式
动态演进系统策略：Agent的行为模式可能随时间变化，需要内核策略同步演进

CofferOS让每个Agent在自己的Coffer实例中运行，拥有定制的Personality，同时避免了完整虚拟机的沉重开销。这种设计允许操作系统将Agent视为一等公民，而非普通的进程，架起了OS级抽象与Agent中心化执行模型之间的桥梁。

6.2.3 性能评估

根据论文的实验数据，CofferOS在一系列工作负载上展现了与Linux容器相当的性能，同时提供了更强的安全隔离、故障隔离和内核定制能力。

这意味着CofferOS不是以牺牲性能为代价换取安全的学术玩具，而是一个具有实际部署潜力的系统。

6.2.4 语言构成

CofferOS完全用Rust实现。选择Rust的关键原因是：

内存安全：Rust的所有权系统在编译时保证没有数据竞争和内存错误，这是实现“零共享状态”Coffer实例的前提
零成本抽象：Coffer抽象不会带来运行时性能损失
系统编程能力：Rust可以直接操作底层硬件和内存，适合编写操作系统内核

6.2.5 学术生态与状态

CofferOS目前处于学术原型阶段，论文发表于2026年EuroSys，研究团队来自KAIST计算机架构与系统实验室（CASYS）。论文作者包括Minkyu Jung、Chanshin Kwak、Junho Ahn等，通讯作者为Youngjin Kwon教授（KAIST）和Jeehoon Kang教授（浦项工科大学）。

需要强调的是，CofferOS目前尚未开源，仍然是一个学术研究原型。但其设计理念——利用Rust的内存安全来构建零共享状态的容器隔离内核——为Agent OS的未来演进提供了重要的理论参考。

6.3 三条路线的深度对比：OpenFang、CofferOS与阿里Agentic OS

将OpenFang、CofferOS与阿里Agentic OS放在一起对比，三条截然不同的技术哲学清晰呈现：

对比维度	OpenFang	CofferOS	阿里Agentic OS
核心路线	从零用Rust构建完整Agent OS内核	从零用Rust构建容器隔离内核	在Linux上叠加增强层
对现有OS的依赖	运行在Linux/macOS之上（不直接管理硬件）	目标是替代传统容器内核	完全依赖Linux内核
设计哲学	“Agent OS就是操作系统”，微内核架构	“每个Agent拥有自己的内核实例”	“让操作系统适配Agent”，增强而非替代
Agent的定位	Agent是“一等公民”，Hands是自治能力包	Agent是“一等公民”，运行在独立Coffer实例中	Agent是上层应用，通过Skills调用OS能力
语言构成	100% Rust（137K行，14 crates）	100% Rust	Node.js + Rust + Python + eBPF + Markdown
隔离粒度	WASM沙箱级（工具执行隔离）	Coffer实例级（整个内核状态隔离）	应用层沙箱 + eBPF监控
安全机制	16层安全（WASM双计量沙箱、Merkle审计链、污点追踪、Ed25519签名）	结构封装+Rust内存安全，零共享状态	AgentSecCore三层防御（系统加固、沙箱隔离、Skill签名）
性能	冷启动<200ms，空闲40MB，安装32MB	与Linux容器性能相当	Token开销降低30%-60%
成熟度	2026年2月开源，快速迭代，已可生产级部署	2026年EuroSys学术论文，原型阶段，未开源	2026年3月发布，已在阿里云ECS上线
生态系统	FangHub技能市场，25个MCP模板，40通道适配器	学术原型，无公开生态	阿里云云原生生态，OpenClaw/CoPaw等主流框架支持
分类	架构型（学术/架构型路线的工程实现）	学术/架构型	内置型

6.4 为什么是Rust？——技术选型的深度分析

OpenFang和CofferOS不约而同地选择了Rust，这绝非巧合。Rust在Agent OS领域具有独特的“天选之子”地位：

性能极致：在Agent场景下，Rust的性能优势被极度放大。OpenFang的冷启动<200ms，而Python框架需要3-6秒；空闲内存40MB vs 180-400MB。当系统需要同时调度数十上百个Agent时，这种差距将直接决定系统的可扩展性。
内存安全是隔离的前提：CofferOS的整个设计建立在Rust的内存安全保证之上——正是因为Rust编译器能在编译时证明没有数据竞争和内存错误，Coffer实例之间的“零共享状态”才能被信任。如果用C语言实现同样的设计，指针错误可能无声地破坏隔离边界，让整个安全模型形同虚设。
系统级语言的本质：Rust生来就是做系统编程的。它能直接与操作系统底层API交互，无缝编写eBPF程序，编译到裸机环境。这些能力是Python、JavaScript这类语言根本无法提供的。
零成本抽象：OpenFang的Hands机制、CofferOS的Coffer抽象，都是高级的编程语言抽象，但Rust保证了这些抽象不会带来运行时性能损失。你可以在代码中写出清晰的模块化设计，而编译器将其优化为接近手写汇编的效率。
工程质量的天然保障：OpenFang的137K行代码保持着零clippy警告，通过了1,767+个单元测试。Rust严格的编译器本身就是第一道质量关卡，它在开发阶段就消灭了内存错误、数据竞争等传统系统编程的顽疾。

6.5 总结：用Rust构建Agent OS的技术路线图

综合OpenFang和CofferOS的实践，用Rust构建Agent OS的三条可行路径已经清晰：

路径一：构建完整的Agent OS（OpenFang路线）

核心思路：用Rust从零编写一个Agent OS内核，包含调度、内存管理、工具隔离、通道适配等完整能力
适用场景：需要一个完整的、独立的Agent运行平台，追求极致性能和部署简便性
技术栈：100% Rust，微内核架构，WASM沙箱
成熟度：OpenFang已证明可行，137K行代码已开源，可生产级部署

路径二：构建Agent隔离内核（CofferOS路线）

核心思路：用Rust构建一个全新的容器隔离内核，让每个Agent运行在独立的Coffer实例中
适用场景：对Agent间隔离要求极高的场景（多租户、安全敏感应用）
技术栈：Rust内核 + Coffer抽象 + Personality机制
成熟度：学术原型阶段，已发表于EuroSys 2026，为未来Agent OS提供理论参考

路径三：Rust组件嵌入现有OS（阿里路线 + Rust增强）

核心思路：在现有Linux内核之上，用Rust编写关键的安全和性能组件（沙箱、调度器、eBPF监控等）
适用场景：快速落地，与现有生态兼容
技术栈：Rust + Linux + eBPF
成熟度：阿里Agentic OS已采用此模式（AgentSecCore和AgentSight均用Rust实现）

三个关键判断：

Rust正在成为Agent OS基础设施的“标准语言”——从OpenFang的全栈Rust到CofferOS的内核Rust，再到阿里Agentic OS中Rust实现的安全组件，Rust在Agent OS领域的渗透正在加速。
“从零构建Agent OS”已被证明工程可行——OpenFang用137K行Rust代码交付了一个可生产部署的Agent OS，冷启动<200ms、空闲40MB的性能数据证明了Rust路线的工程价值。
Agent OS的技术栈正在清晰分层：上层用AI原生语言（MoonBit/仓颉）写应用，中层用Agent OS（OpenFang/阿里Agentic OS）调度和管理，底层用Rust加固安全和隔离边界（CofferOS/AgentSecCore/WASM沙箱）。这个三层架构正在成为Agent基础设施的“标准答案”。

📚 参考资料

当操作系统遇见智能体，OS Agent 和 AgentOS 驱动的人机交互变革及启示（天翼智库，2025-07-09）
AI Agent Operating Systems: Enterprise Guide and Evaluation 2025（SparkCo, 2026-02-26）
AIOS: LLM Agent Operating System（arXiv:2403.16971, 2025-05-11）
Alibaba Cloud Linux 4 Agentic Edition 产品概览（阿里云官方文档，2026-03-31）
开源项目 Agentic OS 实战指南：手把手教你从 ANOLISA 源码安装（SegmentFault, 2026-04-10）
OpenClaw Architecture Deep Dive 2025（SparkCo, 2026-02-26）
软通动力：旗下软通天鸿 OS 率先完成预装 OpenClaw（证券时报，2026-03-12）
火爆 AI 圈的 Harness 是什么？看国内“大厂”怎么说（新京报，2026-04-03）
字节开源的 Harness：Agent 基础设施解析（七牛云新闻，2026-04-07）
暴涨 47.3k Stars！字节开源 Harness 项目 DeerFlow 2.0（知乎专栏，2026-03-26）
AI-Native Programming Languages and Agent-Computer Interfaces: The MoonBit Case Study（HKUST-GZ, 2025-06-26）
MoonBit：做 AI 这代人的 C 语言（IDEA 研究院，2025-12-02）
软通天鸿 OS 预装 OpenClaw：原生安全、上电即用（EETrend, 2026-03-12）
拓维信息旗下开鸿智谷打造“开源鸿蒙+OpenClaw”创新产品（人民网湖南频道，2026-03-07）
一些 Harness Engineering 的实践（阿里云开发者社区，2026-03-20）
阿里云发布 Agentic OS：预置 Skills，可降低 Agent 运行成本 30%（太平洋电脑网，2026-03-31）
MoonBit AI：程序语言 & 大模型（MoonBit 官方论坛，2025-11-04）
华为开源仓颉编程语言，含运行时、编译器等核心组件（Readhub，2025-07-30）
MoonBit 再添异步能力，实现 AI Agent 高效与稳定开发（IDEA 研究院，2025-09-28）
华为仓颉智能体开发框架 Cangjie Magic 开源（JavaForAll，2026-03-15）
MoonBit Pilot：全球首个自底向上的代码智能体，全栈 AI 原生（IDEA 研究院，2025-07-30）
智能应用开发-未来工作规划-仓颉编程语言白皮书（华为开发者文档）
华为仓颉智能体开发框架 Cangjie Magic 开源（搜狐 / IT之家，2025-03-17）
CangjieMagic：基于仓颉语言的 Agent 开发框架实践（InfoQ / AICon 2025）
Agent 开发框架对比分析报告（腾讯云，2025-09-18）
2025 国产 AI Agent 研究报告（EET China，2025-08-13）
北航一篇 304 页的 Code Agent 综述！近 30 家机构参与（知乎专栏，2025-12-11）
SWE-AGI: Benchmarking Specification-Driven Software Construction with MoonBit（arXiv:2602.09447，2026-02-10）
SWE-AGI 基准评测：中大型软件在全新语言上的批量生成成功率已达 80%（CSDN / 网易，2026-02-27）
原生 AI 开发工具链革新：MoonBit Pilot 重构代码智能体底层范式（百度开发者，2026-04-15）
中国人自己的编程语言！华为官宣仓颉 7 月 30 日开源（EET China，2025-06-23）
华为宣布仓颉编程语言开源，7 月 30 日正式上线（中关村在线，2025-06-20）
MoonBit Meetup 深圳站 | AI 时代下的基础软件的精彩回顾（OSCHINA，2025-10-28）
比 Cursor 更快更稳定的 Coding Agent？（网易，2025-08-27）
国内四大 AI 编程 IDE 对比（一）：直观印象与模型能力（掘金，2026-02-10）
2025 主流 AI 编程工具横评：国产黑马崛起（腾讯云，2025-09-12）
智谱正式开源 AutoGLM：AI 的“眼与手”（CSDN，2025-12-10）
重磅开源！智谱AutoGLM正式上线，千行百业AI自动化时代到来！（CSDN，2026-01-04）
AI Agent操作系统全景解读：从AutoGLM到AIOS的进化之路（CSDN，2026-04-09）
Open-AutoGLM开源仓库（GitHub，2025-12）
AIOS: LLM Agent Operating System（arXiv，2024-03-25）
AIOS开源仓库（GitHub，2024）
AIOS 论文解读：LLM Agent操作系统（CSDN，2025-03-28）
大模型智能体操作系统AIOS（一）：架构剖析（CSDN，2024-08-02）
AIOS —— 把大模型装进操作系统内核（安全内参，2024-03-11）
面向AI时代的操作系统：Agentic OS的设计与实现（阿里云开发者社区，2026-03-20）
深度解读Agentic OS：首个面向AI Agent的操作系统（InfoQ，2026-03-25）
阿里云Agentic OS技术白皮书（阿里云官方文档，2026-03）
OpenFang - The Open-Source Agent Operating System Built in Rust（OpenFang官方文档，2026-03-07）
OpenClaw再升级，OpenFang重磅开源！（知乎，2026-02-27）
一天一个开源项目（第42篇）：OpenFang - 用Rust构建的Agent操作系统，16层安全与7个自主Hands（CSDN，2026-03-06）
OpenFang来了，我们还要不要继续研究OpenClaw？（知乎，2026-03-01）
137K行代码、零clippy警告：这个开源项目凭什么让AI Agent领域炸锅？（53AI，2026-03-02）
OpenFANG: The Rust Agent OS Benchmarked Against CrewAI & LangGraph（SitePoint，2026-03-05）
OpenFang实战指南：用Rust构建高并发AI Agent操作系统（CSDN，2026-04-01）
CofferOS: Hardening OS-level Virtualization with Rust（EuroSys 2026，2026-04）
The Craft of Systems Research, in Retrospect: CofferOS Seminar（浦项工科大学，2026-03-13）
Rust: The Future of Agent Operating Systems（阿里云开发者社区，2026-03-20）

MCP技术社区

欢迎加入 MCP 技术社区！与志同道合者携手前行，一同解锁 MCP 技术的无限可能！

更多推荐

用多个 AI Agent 分工监管 MT5 EA：交易指挥官 / EA 监管员 / 策略分析师 / 风控员怎么协作

让一个大模型既盯盘、又分析、又风控、还回消息，很快就乱。更稳的做法是按职责拆成多个 Agent：forex-commander（交易指挥官，主调度）、ea-supervisor（EA 监管员，只读取真实数据）、strategy-analyst（策略分析师，做解读和优化建议）、risk-guard（风控员，盯敞口/保证金/集中度报警）。开源项目 EasyDeal（GPL-3.0）的 opencla

MCP技术社区

AI Agent 上线前，先把 5 类失败演练跑一遍

MCP技术社区

DeepSeek++ 扩展源码解读：MCP 工具系统、Agentic 记忆与 Skill 调度模块如何协同？

MCP（Model Context Protocol）是由 Anthropic 在 2024 年底提出的开放标准，为动态工具发现与调用提供了一套 schema 驱动的规范。受 Language Server Protocol（LSP）启发，MCP 采用 schema 驱动、基于 JSON-RPC 的架构，将工具封装为 MCP 服务器。简单说，MCP 就是让 AI 能直接调用外部工具的“万能遥控器”

MCP技术社区

所有评论(0)

查看更多评论

huanhuanou

@huanhuanou

已为社区贡献3条内容

面向Agent的基础软件深度调研笔记

huanhuanou

📌 调研背景

一、Agent OS 到底是什么？

1.1 核心定义

1.2 四种主流发展路径

二、三种主流Agent OS技术路线深度剖析

2.1 外接型（OS Agent）：AutoGLM——AI的“眼与手”

2.1.1 设计目标

2.1.2 技术架构与原理

2.1.3 语言构成与技术栈

2.1.4 优势与局限

2.2 内置型（Agentic OS）：阿里云 Agentic OS——AI的“原生家园”

2.2.1 设计目标

2.2.2 技术架构与原理

2.2.3 语言构成

2.2.4 开源实现：ANOLISA

2.2.5 优势与局限

2.3 学术/架构型（Agent-OS）：AIOS——重新定义操作系统的“大脑”

2.3.1 设计目标

2.3.2 技术架构与原理

2.3.3 语言构成与技术实现

2.3.4 性能验证与学术价值

2.3.5 优势与局限

2.4 三条路线的对比与总结

三、OpenClaw：Agent 编排与 OS 融合

3.1 是什么

3.2 架构核心：三层解耦

3.3 OpenClaw 与 OS 深度融合

四、Harness：Agent 的“运行时环境”

4.1 核心概念

4.2 字节开源 Harness 基础设施

五、面向 Agent 的编程语言与编译器

5.1 AI 原生编程语言——将 LLM 嵌入语言运行时

5.2 Agent 编排与领域特定语言——指挥 AI “完成任务”

5.3 编译器即安全验证器——将 AI 不确定性关进笼子

5.4 传统语言在 AI 时代的新角色

5.5 🇨🇳 聚焦国内：两大国产 Agent 原生语言深度解析

5.5.1 MoonBit：做 AI 这代人的 C 语言

5.5.2 仓颉（Cangjie）：华为自主的全场景智能化编程语言

5.5.3 国内 Agent 编程工具生态全景

六、用Rust构建Agent OS的探索：从零打造“原生”智能体操作系统

6.1 OpenFang：用Rust从零编写的Agent微内核OS

6.1.1 设计哲学与核心理念

6.1.2 架构设计：14个Crate的模块化内核

6.1.3 性能表现

6.1.4 语言构成

6.1.5 开源生态与社区

6.2 CofferOS：为Agent设计的Rust容器隔离内核

6.2.1 设计哲学：让Agent成为真正的“一等公民”

6.2.2 核心技术：Coffer抽象与Personality机制

6.2.3 性能评估

6.2.4 语言构成

6.2.5 学术生态与状态

6.3 三条路线的深度对比：OpenFang、CofferOS与阿里Agentic OS

6.4 为什么是Rust？——技术选型的深度分析

6.5 总结：用Rust构建Agent OS的技术路线图

📚 参考资料

所有评论(0)

温馨提示：您尚未绑定手机号

huanhuanou