Playwright可以退休了？CDP Bridge MCP：这才是LLM操控浏览器的终极形态！

征途黯然.

520人浏览 · 2026-05-23 13:47:27

征途黯然. · 2026-05-23 13:47:27 发布

今天，我们要自荐一下工作室第二个开源项目 CDP Bridge MCP，目前已经有140Star。它完美解决了这个问题：不启动新浏览器，而是直接连接你正在使用的真实 Chrome/Chromium 会话。对于需要管理数十个账号的运营团队，或希望将浏览器操作纳入 Agent 能力的内部开发人员来说，这是一个颠覆性的解决方案。

在 AI Agent 落地的过程中，我们常遇到一个尴尬的瓶颈：

LLM 很聪明，能写代码、能分析数据，但它看不见你屏幕上那个已经登录了小红书、知乎或公司内部 CRM 系统的浏览器标签页。

传统的解决方案通常是 Playwright 或 Selenium。但它们有两个致命痛点：

状态隔离：它们是“无头”或“新启”的浏览器实例，你需要费力地导出 Cookie、处理验证码、模拟指纹，才能勉强维持登录态。
交互僵硬：它们适合跑固定的测试脚本，却很难让 LLM 根据页面实时变化进行灵活的“看-想-做”。

为什么它比 Playwright MCP 更适合业务场景？

1. 真正的“所见即所得”，复用真实登录态

CDP Bridge 通过 Chromium 插件接入，直接读取你当前打开的标签页。

无需重新登录：你在浏览器里登入了哪个账号，Agent 就操作哪个账号。

无缝衔接：对于需要双重验证、复杂滑块验证的平台，人工登录后，Agent 直接接管后续操作，彻底绕过最难的“破防”环节。

2. 单机多账号并行，一人爽爽运营N号

这是本项目最具杀伤力的功能。

Profile 隔离：你可以在同一台电脑上打开 Chrome 的多个 Profile（配置文件），分别登录不同的小红书、抖音或 Twitter 账号。

Token 绑定：通过配置不同的 Token，CDP Bridge 服务端会将这些 Profile 隔离成独立的会话空间。

并发操作：Agent 可以同时向这 5 个账号发送指令——“去 A 账号发一篇笔记，去 B 账号回复评论，去 C 账号采集竞品数据”。一人一机，抵得上一个运营小组。

3. 专为 LLM 优化的页面理解

普通的 HTML 抓取充满了 <script>、CSS 样式和无用的 <div>，既浪费 Token 又干扰模型判断。
CDP Bridge 内置了 browser_scan 工具，它会：

清洗 DOM：过滤不可见元素、脚本和样式。

保留语义：只提取对模型有用的正文、按钮、输入框和结构信息。

结果：用更少的 Token，让模型更准确地理解页面布局，从而做出正确的点击或输入决策。

4. 企业级架构：支持远端部署与多用户接入

对于公司内部开发而言，CDP Bridge 不仅仅是一个本地工具，它是一个标准的 MCP (Model Context Protocol) 服务。

Streamable-HTTP 模式：你可以将 cdp-bridge 部署在公司内网服务器上。

多用户并发：员工 A、员工 B、员工 C 可以在各自的电脑上安装插件，连接到同一个后端服务。只要 Token 不同，他们的浏览器会话完全隔离，互不干扰。

集成内部 Agent：公司的客服 Agent、数据采集 Agent 或自动化办公 Agent，可以直接通过 MCP 协议调用浏览器能力，实现“自动查单”、“自动填表”、“自动截图汇报”等复杂流程。

架构解析：它是如何工作的？

简而言之：

Agent 发出指令（如：“截图当前页面”）。
MCP 服务 根据 Token 找到对应的浏览器会话。
浏览器插件 接收指令，通过 CDP 协议在页面主世界执行 JS 或截图。
结果原路返回给 Agent。

它能帮你做什么？

场景一：新媒体矩阵自动化运营

痛点：每天要在 10 个账号上分发内容、回复私信、采集竞品数据。

方案：在 Chrome 中登录 10 个账号 Profile。编写一个简单的 Agent Prompt：“检查每个 Profile 的私信，如果有用户咨询价格，自动回复标准话术并记录到 Excel。”

效果：全天候无人值守，且因为使用的是真实浏览器环境，封号风险远低于传统脚本。

场景二：企业内部系统“最后一公里”自动化

痛点：公司旧版 ERP/CRM 系统没有 API，或者 API 文档缺失，但员工每天需要手动录入大量数据。

方案：部署 CDP Bridge 在内网。开发一个内部 Agent，员工只需对 Agent 说：“把这份 Excel 里的客户信息录入到 CRM 系统。”

效果：Agent 控制员工的浏览器，自动点击、填充表单、提交。无需改造老旧系统，即可实现 RPA 级别的自动化。

场景三：复杂网页的数据采集与分析

痛点：目标网站有强反爬、动态加载、无限滚动，且需要登录才能查看详细信息。

方案：人工登录一次，Agent 接管。利用 browser_scan 提取结构化数据，利用 browser_execute_js 处理翻页和弹窗。

效果：像真人一样浏览，像机器一样高效。

快速上手

项目基于 Python 开发，支持 stdio 和 streamable-http 两种模式。

1. 安装服务端
确保已安装 uv，然后一键启动：

uvx cdp-bridge@latest

2. 加载浏览器插件
在 Chrome 扩展程序页面，开启“开发者模式”，加载项目中的 src/cdp_bridge/tmwd_cdp_bridge 文件夹。

3. 配置 MCP 客户端
以 Claude Desktop 为例，在配置文件中添加：

{
  "mcpServers": {
    "cdp-bridge": {
      "command": "uvx",
      "args": ["cdp-bridge@latest"]
    }
  }
}

4. 开始对话
打开任意网页，对 Claude 说：“帮我分析一下这个页面的主要内容和布局。” 或者 “帮我把这个表单填完。”

欢迎Star！

CDP Bridge MCP 的出现，标志着 Browser Agent 从“实验室脚本”走向了“真实生产力”。

它不再要求工程师去逆向复杂的登录协议，也不再要求运营人员去维护脆弱的爬虫脚本。它只是简单地架起了一座桥，让大模型的智慧，能够直接流淌进我们每天使用的真实浏览器中。

对于追求效率的团队和个人来说，这不仅是一个工具，更是一种全新的工作流范式。

项目地址：https://github.com/Unagi-cq/cdp-bridge-mcp

MCP技术社区

欢迎加入 MCP 技术社区！与志同道合者携手前行，一同解锁 MCP 技术的无限可能！

更多推荐

ngx-image-cropper：Angular图像裁剪的终极解决方案

ngx-image-cropper是一款专为Angular框架设计的高效图像裁剪工具，它提供了直观的界面和丰富的功能，帮助开发者轻松实现图片裁剪功能。无论是头像上传、产品图片处理还是用户照片编辑，这款工具都能满足你的需求，让图像裁剪变得简单而高效。## 🌟 为什么选择ngx-image-cropper？在众多图像裁剪工具中，ngx-image-cropper脱颖而出的原因在于它专为Ang