Playwright可以退休了?CDP Bridge MCP:这才是LLM操控浏览器的终极形态!
今天,我们要自荐一下工作室第二个开源项目 CDP Bridge MCP,目前已经有140Star。它完美解决了这个问题:不启动新浏览器,而是直接连接你正在使用的真实 Chrome/Chromium 会话。对于需要管理数十个账号的运营团队,或希望将浏览器操作纳入 Agent 能力的内部开发人员来说,这是一个颠覆性的解决方案。
在 AI Agent 落地的过程中,我们常遇到一个尴尬的瓶颈:
LLM 很聪明,能写代码、能分析数据,但它看不见你屏幕上那个已经登录了小红书、知乎或公司内部 CRM 系统的浏览器标签页。
传统的解决方案通常是 Playwright 或 Selenium。但它们有两个致命痛点:
- 状态隔离:它们是“无头”或“新启”的浏览器实例,你需要费力地导出 Cookie、处理验证码、模拟指纹,才能勉强维持登录态。
- 交互僵硬:它们适合跑固定的测试脚本,却很难让 LLM 根据页面实时变化进行灵活的“看-想-做”。
为什么它比 Playwright MCP 更适合业务场景?
1. 真正的“所见即所得”,复用真实登录态
CDP Bridge 通过 Chromium 插件接入,直接读取你当前打开的标签页。
无需重新登录:你在浏览器里登入了哪个账号,Agent 就操作哪个账号。
无缝衔接:对于需要双重验证、复杂滑块验证的平台,人工登录后,Agent 直接接管后续操作,彻底绕过最难的“破防”环节。
2. 单机多账号并行,一人爽爽运营N号
这是本项目最具杀伤力的功能。
Profile 隔离:你可以在同一台电脑上打开 Chrome 的多个 Profile(配置文件),分别登录不同的小红书、抖音或 Twitter 账号。
Token 绑定:通过配置不同的 Token,CDP Bridge 服务端会将这些 Profile 隔离成独立的会话空间。
并发操作:Agent 可以同时向这 5 个账号发送指令——“去 A 账号发一篇笔记,去 B 账号回复评论,去 C 账号采集竞品数据”。一人一机,抵得上一个运营小组。
3. 专为 LLM 优化的页面理解
普通的 HTML 抓取充满了 <script>、CSS 样式和无用的 <div>,既浪费 Token 又干扰模型判断。
CDP Bridge 内置了 browser_scan 工具,它会:
清洗 DOM:过滤不可见元素、脚本和样式。
保留语义:只提取对模型有用的正文、按钮、输入框和结构信息。
结果:用更少的 Token,让模型更准确地理解页面布局,从而做出正确的点击或输入决策。
4. 企业级架构:支持远端部署与多用户接入
对于公司内部开发而言,CDP Bridge 不仅仅是一个本地工具,它是一个标准的 MCP (Model Context Protocol) 服务。
Streamable-HTTP 模式:你可以将 cdp-bridge 部署在公司内网服务器上。
多用户并发:员工 A、员工 B、员工 C 可以在各自的电脑上安装插件,连接到同一个后端服务。只要 Token 不同,他们的浏览器会话完全隔离,互不干扰。
集成内部 Agent:公司的客服 Agent、数据采集 Agent 或自动化办公 Agent,可以直接通过 MCP 协议调用浏览器能力,实现“自动查单”、“自动填表”、“自动截图汇报”等复杂流程。
架构解析:它是如何工作的?
简而言之:
- Agent 发出指令(如:“截图当前页面”)。
- MCP 服务 根据 Token 找到对应的浏览器会话。
- 浏览器插件 接收指令,通过 CDP 协议在页面主世界执行 JS 或截图。
- 结果 原路返回给 Agent。
它能帮你做什么?
场景一:新媒体矩阵自动化运营
痛点:每天要在 10 个账号上分发内容、回复私信、采集竞品数据。
方案:在 Chrome 中登录 10 个账号 Profile。编写一个简单的 Agent Prompt:“检查每个 Profile 的私信,如果有用户咨询价格,自动回复标准话术并记录到 Excel。”
效果:全天候无人值守,且因为使用的是真实浏览器环境,封号风险远低于传统脚本。
场景二:企业内部系统“最后一公里”自动化
痛点:公司旧版 ERP/CRM 系统没有 API,或者 API 文档缺失,但员工每天需要手动录入大量数据。
方案:部署 CDP Bridge 在内网。开发一个内部 Agent,员工只需对 Agent 说:“把这份 Excel 里的客户信息录入到 CRM 系统。”
效果:Agent 控制员工的浏览器,自动点击、填充表单、提交。无需改造老旧系统,即可实现 RPA 级别的自动化。
场景三:复杂网页的数据采集与分析
痛点:目标网站有强反爬、动态加载、无限滚动,且需要登录才能查看详细信息。
方案:人工登录一次,Agent 接管。利用 browser_scan 提取结构化数据,利用 browser_execute_js 处理翻页和弹窗。
效果:像真人一样浏览,像机器一样高效。
快速上手
项目基于 Python 开发,支持 stdio 和 streamable-http 两种模式。
1. 安装服务端
确保已安装 uv,然后一键启动:
uvx cdp-bridge@latest
2. 加载浏览器插件
在 Chrome 扩展程序页面,开启“开发者模式”,加载项目中的 src/cdp_bridge/tmwd_cdp_bridge 文件夹。
3. 配置 MCP 客户端
以 Claude Desktop 为例,在配置文件中添加:
{
"mcpServers": {
"cdp-bridge": {
"command": "uvx",
"args": ["cdp-bridge@latest"]
}
}
}
4. 开始对话
打开任意网页,对 Claude 说:“帮我分析一下这个页面的主要内容和布局。” 或者 “帮我把这个表单填完。”
欢迎Star!
CDP Bridge MCP 的出现,标志着 Browser Agent 从“实验室脚本”走向了“真实生产力”。
它不再要求工程师去逆向复杂的登录协议,也不再要求运营人员去维护脆弱的爬虫脚本。它只是简单地架起了一座桥,让大模型的智慧,能够直接流淌进我们每天使用的真实浏览器中。
对于追求效率的团队和个人来说,这不仅是一个工具,更是一种全新的工作流范式。
更多推荐


所有评论(0)