云端Agent想使用你本地机器的浏览器，该如何设计呢？

叫我Paul就好

231人浏览 · 2026-05-20 11:07:37

叫我Paul就好 · 2026-05-20 11:07:37 发布

Agent在控制你的浏览器会话讲到 Codex 的 Chrome 插件可以解决登录态的问题。

昨天我反复思考，发现这些插件设计出来的前提是 Agent 一定要运行在本地（必须要使用 Codex DeskTop App）。于是我不停地反问自己，有没有云端Agent能使用本地浏览器的方式？这种场景会有吗？

云端Agent使用你的浏览器并不是不可以，做起来也不麻烦。

（我一下子没画出来什么好图，将就着看吧~~）

核心在于，用户本地和云端都需要一个 WebSocket 管理的后台进程。

首先，因为云端 Agent 需要使用用户端的浏览器，那一定是云端 Agent 向用户端发送“请求”。

我们如果把用户侧设计成服务端，那就必须要求用户端暴露一个公网IP，云端Agent去连接它，这是肯定不现实的。那只能反过来，必须是云端推送给用户端一个浏览器使用的消息，用户端去“处理”这个消息。所以，云端必须要作为WebSocket的服务端，用户端来连接。

云端 Agent 和本地浏览器交互的方式如下：

云端 Agent -> MCP Server -> WebSocket(Server) -> WebSocket(Local) -> Chrome

当然，可能会有些过度设计（或者说设计上的 Trade Off）。

- 是否真的需要将 MCP Server 和 WebSocket Server 设计成两个独立的进程？

- 为什么一定需要 MCP Server 而不是将 WebSocket Server 的连接管理能力通过 CLI 来暴露？

重点：这个系统其实重点不在于怎么设计通讯方式，而是云端 WebSocket 的管理问题的设计。

- WebSocket 连接何时建立，何时销毁？

- 如何安全建立连接，以保证WebSocket连接和用户绑定？

- 在使用 WebSocket 来控制浏览器时，不同session之间如何避免浏览器使用的冲突？

还留了一个问题~，这个使用的场景在哪里？

MCP技术社区

欢迎加入 MCP 技术社区！与志同道合者携手前行，一同解锁 MCP 技术的无限可能！

更多推荐

AI Agent评估体系构建：从Benchmark到生产环境监控的闭环工程

text## 蒸馏的伦理与合规### 蒸馏的边界模型蒸馏涉及知识产权和合规问题：| 蒸馏来源 | 合规风险 | 建议 ||---------|---------|------|| 开源模型（Llama, Qwen） | 低 | 遵循模型许可证 || API 蒸馏（GPT, Claude） | 高 | 违反 ToS，禁止 || 自有模型 | 无 | 完全合规 || 多模型混合蒸馏 | 中 | 需逐一

MCP技术社区

AI Agent评估体系构建：从Benchmark到生产环境监控的闭环工程

Agent 的行为是多步骤、非确定性的——同一个输入可能产生完全不同的执行路径，最终结果也可能"殊途同归"。更复杂的是，Agent 的失败模式往往是隐蔽的：它可能完成了任务但使用了低效的路径，或者得到了正确答案但基于错误的推理。本文将系统性地构建一个从开发到生产的 Agent 评估体系，涵盖离线 Benchmark、在线监控和持续改进的完整闭环。最重要的是：评估体系本身也需要持续迭代——随着 Ag

MCP技术社区

AI Agent多智能体协作框架对比：CrewAI、AutoGen与LangGraph的生产级选型

text| 框架 | 并行支持 | 实测吞吐（tasks/min） | 资源消耗 ||------|---------|---------------------|---------|| CrewAI | 不支持原生并行 | 8-12 | 中 || AutoGen | 对话级并行（有限） | 10-15 | 高 || LangGraph | 原生并行节点 | 20-30 | 低 |### 维度三：