我对桌面版Agent产品Cowork设计

软件工程师罗小东

197人浏览 · 2026-06-16 22:32:30

软件工程师罗小东 · 2026-06-16 22:32:30 发布

我对桌面版Agent产品Cowork设计

产品灵感和参考来源于Claude Cowork桌面版。

体验地址：https://cloud.linesno.com

引言

你是否也经历过这样的早晨？
打开 ChatGPT 聊需求，切到 IDE 写代码，再打开 Notion 整理计划，翻出 Terminal 跑脚本，中间还要在五个窗口间反复粘贴上下文——AI 本应解放生产力，但工具碎片化正在吞噬你的专注力。

这就是我们打造 Cowork 的原因。

Cowork 不只是一个聊天窗口，它是一个一站式桌面 AI 工作台，将「对话 / 规划 / 执行 / 技能 / MCP / 记忆 / 子代理 / IM / 定时任务」深度融合于一体。在这里，AI 真正理解你的任务上下文，能规划、能干活、能调用工具，成为你桌面上不可或缺的智能协同伙伴。

产品概览

Cowork 是一款基于 Tauri 2 + Vue 3 + TypeScript 构建的桌面 AI 智能协同工作台。它运行在你的本地设备上，数据安全可控，同时拥有原生桌面应用的启动速度和系统级能力。

与传统的 AI 对话界面不同，Cowork 的核心设计理念是 “Agent-First”——AI 不是被动的应答者，而是能主动规划、执行、反思的工作代理。

你只需下达一个高层次任务，Cowork 便会：

自动评估是否需要制定执行计划
选择合适的技能或外部工具（MCP）
在 ReAct 循环中推理-行动-观察
必要时启动子代理并行处理子任务
将所有过程、结果、日志持久化到本地记忆系统

最终呈现在你面前的不是一个孤立的回答，而是一条完整的、可追踪的任务执行链，产物包括代码、文档、数据分析报告、图表等，可在右侧面板直接预览。

六大核心能力

1. 🤖 双模 Agent 引擎：快速响应还是深思熟虑，由你而定

Cowork 内置 ReAct Agent 和 Plan Agent 两套推理范式。

前端通过 TaskRunner 统一调度。

ReAct Agent（Reason-Act-Observe） 遵循经典的推理-行动循环，适合明确、紧急、迭代性强的任务。LLM 每轮思考后调用工具，观察结果，再决定下一步，直到任务完成。支持流式输出，让你实时看到 AI 的思考过程（包括 DeepSeek 等模型的 reasoning_content 深度思考内容），工具调用中的错误会被自动捕获并优化。
**Plan Agent（规划执行）**面对复杂、多步骤任务时，Plan Agent 会先评估复杂度，生成结构化的执行计划，每个步骤都具备清晰的状态追踪（pending / in_progress / completed / failed）。计划的生成过程同样支持流式输出，你可以在 UI 上看到每一步的推进。执行阶段再交由 ReAct Agent 逐项攻破。
TaskRunner 统一调度
管理任务全生命周期：启动、暂停、恢复、终止、流式回调、上下文压缩、中间问题澄清。长对话自动压缩保持稳定性，大结果自动缓存避免 token 爆炸。你甚至可以随时向进行中的任务追加指令，Agent 会动态调整规划。

2. 📋 Plan-Execute 智能规划：让复杂任务有条不紊

想象一下你要“为这个 Vue 项目引入国际化方案”。

这样的任务无法一步到位，需要分析现有代码、选择 i18n 库、改造目录结构、替换硬编码文本、编写语言包、测试切换效果……

Cowork 的 Plan-Execute 引擎会：

自动评估：判断任务是否足够复杂，触发规划流程
生成计划：输出 5~10 个步骤的结构化清单，每个步骤都包含目标、工具建议、预期输出
逐步执行：TaskView 界面实时显示计划树，每一步状态一目了然
动态干预：你可以随时暂停、添加或移除计划项，AI 会顺滑调整执行路径

这相当于为每项复杂任务配备了一位项目经理 + 执行工程师，而你——只需要审核计划并确认最终产物。

3. 🧩 技能系统：扩展 AI 能力的“应用商店”

Cowork 的技能系统遵循社区标准 SKILL.md 规范（来自 agentskills.io），支持三种来源：

内置技能：文件操作、代码搜索、Shell 执行等基础能力
用户安装技能：通过 Git 仓库安装社区技能，例如“生成 Python ETL 脚本”、“审计 SQL 慢查询”
AI 自创建技能：Cowork 可以从成功执行的任务中自动提炼技能，沉淀为可复用的元能力

技能管理采用 Copy-on-Modify 保护机制，用户修改技能时自动创建私有副本，避免升级冲突。

执行前还会进行安全扫描，拦截危险操作。这就像给你的 AI 安装了一个安全沙箱化的扩展商店，越用越强大。

4. 🔌 MCP 工具集成：打通外部工具生态

Cowork 原生支持 Model Context Protocol (MCP)，可连接任何遵循该协议的工具服务器。三种传输协议全面覆盖：

HTTP：连接远程 RESTful 工具服务，支持 API Key / Bearer Token 等认证
SSE：服务器推送事件，实现实时数据流工具
stdio：本地进程通信，调用本机脚本或 CLI 工具

Cowork 会自动发现服务器提供的工具列表，并在任务执行中按需调用。连接池管理确保多工具并发调用的稳定与高效。

这意味着 Cowork 的边界不仅限于内置能力——你的数据库、CI/CD 流水线、企业内部 API，都可以成为 Agent 手中的“工具”。

5. 👥 子代理协作：多线并行，高效率攻坚

复杂任务中往往包含多个相对独立的子问题。Cowork 支持子代理委派：主代理可以将一个子任务打包，发送给一个全新的独立 ReAct Agent 循环处理。子代理拥有独立的上下文窗口和工具集，执行完毕后将摘要和结果流式回传给主代理。

例如，主代理正在开发一个全栈应用，可以同时委派：

子代理 A 编写后端 API 单元测试
子代理 B 优化前端打包配置
子代理 C 生成 API 文档

它们并行工作，进度实时回传，最终汇总到主代理——多核思维，十倍效能。

6. 🧠 记忆与上下文：越用越懂你的工作习惯

Cowork 将所有交互持久化到本地 ~/.aipcowork/ 目录，包括：

完整的会话历史（支持搜索）
上下文文件与工具调用大结果的自动缓存
执行日志、计划快照、技能使用记录

上下文智能压缩是 Cowork 的一项关键能力。

当对话历史逼近模型窗口上限时，系统会自动总结早期对话，保留关键决策和产出，丢弃冗余细节，让 Agent 始终“清醒”。压缩过程对用户透明，你可以随时查看完整历史。

长期来看，Cowork 会逐渐学习你的偏好：你习惯的项目结构、代码风格、命名词表、常用工具组合……它不只是工具，而是会成长的数字同事。

技术亮点

亮点	说明
Tauri 2 桌面端	原生启动速度，Rust 保障内存安全。跨平台支持 macOS / Windows / Linux
本地优先存储	所有对话、文件、配置均存储在本地，不上传至任何云端。企业用户可完全控制数据流向
开放模型支持	对接任意 OpenAI 兼容的 LLM 服务，包括 DeepSeek、Qwen、Moonshot 等。深度思考模式无缝传递
现代前端技术栈	Vue 3 Composition API + TypeScript + Pinia 状态管理 + Element Plus UI，代码结构清晰，易于二次开发
流式交互体验	从 LLM token 到计划步骤到工具执行结果，全链路流式渲染，界面响应丝滑