一个浏览器扩展,如何让 DeepSeek 网页版从“聊天工具”变身“自动化 Agent”?本文深入源码,拆解 MCP、记忆与 Skill 三大模块的协同奥秘。

一、缘起:DeepSeek 网页版很好,但不够好

1.1 免费的代价:功能“阉割”的遗憾

2026年4月24日,深度求索(DeepSeek)正式发布全新大语言模型系列 DeepSeek-V4 的预览版本,并同步向全球开源。该系列包含 deepseek-v4-pro 和 deepseek-v4-flash 两个模型,全系标配 100 万 token 上下文,在智能体能力、通用世界知识覆盖及复杂推理性能等方面均达到国内及开源模型领域的领先水平。

其中,DeepSeek-V4-Flash 是一个高性价比的 MoE 大模型,总参数 284B、激活参数仅 13B,采用 DSA2 稀疏注意力与架构优化,推理算力与 KV Cache 占用仅为 V3.2 的 10% 和 7%。完整版 V4-Pro 更是达到了 1.6T 总参数,每层配置 384 个专家、每次激活 6 个。

但问题也随之而来——网页版免费,功能却“阉割”严重

原版 DeepSeek 网页版缺少长期记忆、工具调用、技能模式、自动化任务等核心能力。用户每次新开对话都要重复自我介绍、重复交代背景,无法调用外部工具,也无法实现定时任务自动化。

痛点总结: 模型能力顶尖,但交互形态停留在“单次问答”,距离真正的 AI Agent 还有一段距离。

1.2 社区破局:DeepSeek++ 横空出世

2026年5月24日,就在 DeepSeek V4 网页版正式开放免费使用的同一天,国内开发者推出了一款名为 DeepSeek++ 的 Chrome 扩展。

项目作者坦言:“作为 DeepSeek 的狂热粉丝,本人经常使用 DeepSeek。但是官方网页版的功能过于简单,于是借鉴 Claude Code 和 Claude 桌面版开发了一个谷歌插件对其进行增强。”

DeepSeek++ 为 DeepSeek 网页版注入了六大核心能力:

模块 核心能力
类原生工具调用 XML 协议驱动的自动工具执行
MCP 工具系统 标准 MCP 协议,支持本地/远程工具
Agentic 记忆系统 跨会话长期记忆,自动提取与注入
Skill 技能系统 9 大内置技能 + 自定义技能
系统提示词预设 多角色预设,一键切换
自动化任务 Codex 风格定时任务,支持 Cron

2026年6月1日,DeepSeek++ 发布 0.5.1 版本,标志着项目从单纯的记忆插件转型为功能完备的 AI 工具平台。

本文将从源码角度,深入拆解其中三个核心模块——MCP 工具系统、Agentic 记忆与 Skill 调度——的协同机制。

二、架构总览:一个“中间件”的自我修养

2.1 零服务端依赖的设计哲学

DeepSeek++ 最精妙的设计在于:不修改 DeepSeek 服务端任何代码,不搭建任何后台服务器,所有能力完全依靠浏览器扩展提供的开放 API 实现

它是一个运行在浏览器沙箱里的“中间件”——在所有请求进出浏览器的必经之路上安插拦截器,替 AI 把该做的事情执行掉,再把结果悄无声息地塞回对话。

2.2 源码结构概览

根据社区分析,DeepSeek++ 的源码主要分为以下层次:

deepseek-pp/
├── src/
│   ├── content_scripts/
│   │   ├── main.ts          # 主世界脚本:DOM 操作、/ 面板渲染
│   │   └── isolated.ts      # 隔离世界脚本:网络拦截
│   ├── skill-registry.ts    # 技能注册表
│   ├── memory/
│   │   └── memory-manager.ts # 记忆管理
│   ├── mcp/
│   │   └── mcp-client.ts    # MCP 客户端
│   └── automation/
│       └── cron-scheduler.ts # 定时任务调度
├── dist/
│   └── chrome-mv3/          # 打包后的扩展目录
└── manifest.json

2.3 双世界脚本:拦截的底层原理

DeepSeek++ 部署了两套 Content Script,对应 Chrome 扩展的两种运行环境:

MAIN world(主世界) :对应 src/content_scripts/main.ts,和网页共享全局变量和 DOM。负责弹出 / 面板、筛选渲染技能列表,还通过 Object.getOwnPropertyDescriptor(HTMLInputElement.prototype, 'value') 绕过 React 对输入框的受控组件限制。

Isolated world(隔离世界) :对应 src/content_scripts/isolated.ts,关在独立沙箱里,与网页完全隔离。独占网络请求拦截能力——用自定义函数替换 window.fetchXMLHttpRequest.prototype.send

两套脚本都在 document_start 注入——网页 HTML 刚下载完、页面脚本还没运行的瞬间。通过 chrome.scripting.registerContentScripts() 注册,runAt: "document_start" 指定注入时机。

关键洞察: 双世界隔离是 DeepSeek++ 安全性的基石。主世界负责 UI 交互,隔离世界负责网络拦截——即使网页被恶意脚本攻破,隔离世界中的拦截逻辑和密钥存储依然安全。

三、MCP 工具系统:给 AI 装上“万能遥控器”

3.1 什么是 MCP?

MCP(Model Context Protocol)是由 Anthropic 在 2024 年底提出的开放标准,为动态工具发现与调用提供了一套 schema 驱动的规范。受 Language Server Protocol(LSP)启发,MCP 采用 schema 驱动、基于 JSON-RPC 的架构,将工具封装为 MCP 服务器。

简单说,MCP 就是让 AI 能直接调用外部工具的“万能遥控器”

传统的 API 接口调用需要自己搭服务器、写代码、配置一堆东西。而 MCP 标准协议统一了工具的描述、发现和调用方式——DeepSeek++ 遵循标准 MCP 生命周期,支持本地/远程工具调用,打破网页版无法连接外部系统的壁垒。

3.2 DeepSeek++ 中的 MCP 实现

根据 DeepSeek++ 0.5.1 版本的发布说明,MCP 工具系统支持多种连接方式:

传输方式 适用场景
HTTP 远程 REST API 工具
SSE(Server-Sent Events) 流式响应工具
stdio bridge 本地命令行工具
Native Messaging 浏览器原生扩展通信

用户在侧边栏可以直接管理 MCP 服务、测试连接并查看调用历史。权限采用可视化管理,本地密钥安全存储不泄露。

0.5.1 版本还集成了 Shell MCP 和 OfficeCLI,赋予模型调用本机命令及处理 docx/xlsx/pptx 等 Office 文档的能力。同时内置了 web_searchweb_fetch 网络工具,提升实时信息的准确性。

3.3 MCP 调用流程源码解析

MCP 工具调用的核心流程可以概括为四个步骤:

Step 1:工具发现

扩展启动时,通过 MCP 客户端向已配置的 MCP 服务器发送 tools/list 请求,获取所有可用工具的 schema 定义(包括工具名称、描述、参数结构等)。

Step 2:请求拦截与识别

当用户在对话中触发工具调用(无论是通过自然语言还是 / 命令),隔离世界的网络拦截器会捕获发往 https://chat.deepseek.com/api/v0/chat/completion 的请求。

Step 3:Prompt 增强与工具注入

拦截器在请求体中注入工具描述信息,让 DeepSeek 模型“知道”自己可以调用哪些工具、每个工具的参数格式是什么。这相当于在模型的原生能力之上叠加了一层“工具感知层”。

Step 4:响应拦截与工具执行

模型返回的响应中如果包含工具调用指令(采用 XML 工具协议),扩展会解析指令、调用对应的 MCP 工具、获取结果,然后将结果作为新的消息追加到对话中,驱动 DeepSeek 进行下一步决策。

这就是“思考-行动-观察”循环(ReAct 模式)在浏览器端的完整实现。

3.4 技术亮点:前端注入范式

DeepSeek++ 的 MCP 实现展示了一种有趣的 “前端注入”开发范式——在不受官方 API 限制或后端改动的前提下,通过浏览器扩展直接为网页版 AI 模型注入高级能力。

这种技术路径大大降低了普通用户使用 AI Agent 的门槛——无需复杂的本地配置,即可在浏览器中体验类似 Claude Code 的自动化体验。

四、Agentic 记忆:让 AI 真正“懂你”

4.1 为什么需要 Agentic 记忆?

原版 DeepSeek 网页版的对话是“一次性”的——每次新开对话,模型对用户一无所知。你需要在每次对话中重复交代:“我是谁”、“我的偏好是什么”、“之前讨论过什么”。

Agentic 记忆的核心价值在于:让 AI 自动记住并理解用户,无需反复重复背景。

4.2 记忆的分类与管理

根据 DeepSeek++ 的功能设计,Agentic 记忆系统将信息分为四类进行结构化存储:

记忆类型 说明 示例
用户画像 用户的基本身份和长期特征 “我是前端工程师,擅长 React”
行为反馈 用户对 AI 回答的偏好倾向 “我喜欢简洁的回答风格”
话题上下文 特定话题的历史讨论 “上周讨论过项目 X 的架构方案”
参考信息 需要长期保存的事实性信息 “我的邮箱是 xxx@example.com”

AI 自动识别对话中的关键信息并进行分类保存。侧边栏支持随时编辑、置顶、导出备份记忆,隐私完全可控。

4.3 记忆的存储与检索机制

存储层面: 所有记忆数据存储在浏览器本地(LocalStorage 或 IndexedDB),不上传任何第三方服务器。密钥等敏感信息同样本地存储,确保数据主权在用户手中。

检索层面: 新对话开始时,系统自动智能匹配并注入相关记忆。匹配逻辑可能基于:

  • 记忆的时效性(最近使用的优先)
  • 与当前话题的语义相关性
  • 记忆的重要性/优先级标记

4.4 记忆与 MCP 的协同

记忆系统与 MCP 工具系统的协同是 DeepSeek++ 最精妙的设计之一。

场景示例: 假设用户之前告诉过 AI “我习惯用 Python 写脚本”。当用户说“帮我写个脚本处理这个 CSV 文件”时:

  1. 记忆系统自动检索到“Python 偏好”并注入上下文
  2. MCP 工具系统调用文件读取工具获取 CSV 内容
  3. DeepSeek 模型结合记忆(Python 偏好)和工具输出(CSV 内容)生成 Python 脚本
  4. 用户无需额外说明语言偏好

这种“记忆提供个性化上下文 + MCP 提供执行能力”的协同模式,是 DeepSeek++ 从“聊天工具”进化为“个性化 Agent”的关键。

五、Skill 调度模块:一键切换专家模式

5.1 Skill 是什么?

Skill(技能)是 DeepSeek++ 中面向场景的“专家模式切换”机制。用户通过输入 /skill 指令,即可即时切换至特定专家模式,适配不同专业场景需求。

DeepSeek++ 内置了 9 大常用技能:

Skill 名称 适用场景
极致深度思考 复杂问题推理
前端设计 UI/UX 设计与代码生成
PPT 创作 演示文稿内容生成
算法编程 算法题解与优化
Shell 命令 本地命令行操作
网页搜索 实时信息检索
文档处理 Word/Excel/PPT 文档操作
翻译 多语言翻译
代码审查 代码质量检查

5.2 Skill 的实现机制

根据社区对源码的分析,Skill 系统的核心是 src/skill-registry.ts 中维护的技能注册表。

Skill 的调用流程:

  1. 触发: 用户在聊天框输入 /,主世界脚本渲染自动补全面板
  2. 匹配: 系统根据输入匹配 skill-registry.ts 中的技能定义
  3. 注入: 将对应技能的 System Prompt 注入到请求中
  4. 执行: 模型在“专家模式”下完成回答

Skill 与记忆的联动: 技能可以搭配记忆联动使用。例如,“前端设计”技能 + 记忆中的“偏好 Material Design” = 生成符合用户审美偏好的界面代码。

Skill 的自定义: 用户可以在侧边栏自己编写新技能,也可以从 GitHub 一键导入别人写好的技能包。

5.3 一个完整的 Skill 执行示例

/shell ls 为例,完整流程如下:

用户输入:/shell ls
    ↓
主世界脚本捕获输入,弹出 / 面板
    ↓
匹配 skill-registry.ts 中的 shell 技能
    ↓
隔离世界拦截网络请求
    ↓
将 "/shell ls" 翻译为完整的 Prompt 指令:
   "你是一个 Shell 命令执行专家,请执行 ls 命令并返回结果..."
    ↓
DeepSeek 模型生成工具调用指令(XML 格式)
    ↓
MCP 工具系统通过 stdio bridge 执行本地 ls 命令
    ↓
执行结果通过 MCP 回传
    ↓
模型整理结果,返回给用户

整个过程对用户来说只是输入了一行 /shell ls,背后却完成了“命令识别 → 技能匹配 → 请求拦截 → Prompt 增强 → 模型推理 → 工具调用 → 结果回传”的完整链路。

六、三大模块如何协同?一个完整的自动化场景

6.1 场景:每日自动生成行业简报

假设你是一名产品经理,需要每天早上 9 点收到一份 AI 生成的行业资讯简报。

Step 1:记忆配置(Agentic 记忆)

首次使用时,告诉 AI:“我关注 AI 行业,偏好简洁的要点式简报,重点关注融资新闻和技术突破。”记忆系统自动保存这些偏好。

Step 2:Skill 选择(Skill 调度)

输入 /web_search 切换到网页搜索技能,再输入 /ppt-creator 切换到简报生成技能——或者创建一个名为“行业简报”的自定义 Skill,一次性配置好所有参数。

Step 3:自动化任务配置(Cron 调度)

在自动化任务面板中,创建任务:

  • 触发条件:Cron 0 9 * * *(每天上午 9 点)
  • 执行内容:预设 Prompt“基于昨天的 AI 行业动态,生成一份 500 字的简报”
  • 执行模式:独立会话,自动运行

Step 4:每日自动执行

每天早上 9 点:

  1. Cron 调度器触发任务
  2. 系统自动创建独立会话
  3. 记忆系统注入用户偏好(简洁、要点式、关注融资和技术)
  4. Skill 系统加载“行业简报”技能配置
  5. MCP 工具系统调用 web_search 获取最新资讯
  6. DeepSeek 模型生成简报
  7. 结果保存(可配置邮件发送或本地存储)

整个流程无需人工干预,真正实现“无人值守”的 AI 自动化。

6.2 协同机制总结

模块 在场景中的角色 关键能力
Agentic 记忆 提供个性化上下文 跨会话持久化、自动检索注入
Skill 调度 定义任务执行范式 专家模式切换、Prompt 模板化
MCP 工具系统 提供外部执行能力 文件读写、网络请求、Shell 命令
自动化调度 驱动定时执行 Cron 定时、独立会话、状态追踪

三者协同的本质:记忆提供“知道什么”,Skill 提供“怎么思考”,MCP 提供“能做什么”,自动化提供“何时做”——四个维度组合,构成了完整的 AI Agent 能力闭环。

七、竞品对比:DeepSeek++ vs Claude Code vs Codex

7.1 定位差异

维度 DeepSeek++ Claude Code Codex
运行环境 浏览器扩展 桌面客户端 云端服务
基础模型 DeepSeek-V4 Claude GPT 系列
工具调用 MCP 协议 原生工具 函数调用
记忆系统 Agentic 跨会话记忆 会话内记忆 有限记忆
自动化 Cron 定时任务 有限支持 Codex 风格自动化
部署方式 本地浏览器 需安装客户端 API 调用
成本 免费(DeepSeek 网页版) 需订阅 按 API 计费

7.2 DeepSeek++ 的独特优势

1. 零门槛部署

DeepSeek++ 的安装只需下载压缩包,通过 Chrome 扩展管理页面的“加载已解压的扩展程序”即可完成。相比之下,Claude Code 需要安装桌面客户端,Codex 需要配置 API 密钥和开发环境。

2. 前端注入范式的创新

DeepSeek++ 展示了一种独特的“前端注入”开发范式——在不受官方 API 限制或后端改动的前提下,通过浏览器扩展直接为网页版 AI 注入高级能力。这种模式:

  • 降低了 AI Agent 的使用门槛
  • 绕过了官方 API 的功能限制
  • 保持了数据的本地化(所有数据存储在用户浏览器中)

3. 生态互补

对于 DeepSeek 生态而言,DeepSeek++ 这类第三方工具有效弥补了官方客户端在功能丰富度上的暂时滞后,加速了模型在自动化办公和开发场景中的落地应用。

7.3 DeepSeek-V4 的底层能力支撑

DeepSeek++ 的能力离不开 DeepSeek-V4 强大的底层模型支撑。

根据 DeepSeek 官方技术报告,DeepSeek-V4 系列在架构上有多项创新:

  • mHC(Manifold-Constrained Hyper-Connections) :强化残差连接
  • Hybrid Attention 架构:CSA 和 HCA 交替叠加,解决长文效率问题
  • Muon 优化器:替代传统 AdamW
  • DSA2 稀疏注意力:融合 DSA 与 NSA 两种方案

DeepSeek-V4-Pro 在 Agentic Coding 评测中已达开源模型最佳,使用体验优于 Claude Sonnet 4.5,交付质量接近 Opus 4.6 非思考模式。

正是 DeepSeek-V4 强大的推理能力和工具调用理解能力,让 DeepSeek++ 的“前端注入”成为可能——模型“听得懂”工具调用指令,“做得到”复杂任务分解。

八、安全与风险:浏览器扩展的“双刃剑”

8.1 安全优势

DeepSeek++ 在安全设计上有几个值得肯定的点:

数据本地化: 所有记忆数据、API 密钥等敏感信息均存储在浏览器本地,不上传任何第三方服务器。用户拥有完全的数据主权。

权限可视化管理: MCP 工具的权限采用可视化管理,用户可清晰知道每个工具有什么权限。

隔离世界沙箱: 隔离世界脚本与网页完全隔离,即使网页被恶意脚本攻破,拦截逻辑和密钥存储依然安全。

8.2 潜在风险

1. 扩展权限过大

Chrome 扩展需要“读取和更改所有网站数据”权限才能拦截 DeepSeek 的请求。这意味着理论上扩展可以读取用户在任何网站上的数据——虽然 DeepSeek++ 是开源项目,代码可审计,但普通用户未必有能力验证。

2. 手动安装的安全隐患

DeepSeek++ 目前尚未上架 Chrome 官方商店,需要通过“开发者模式”手动安装。这意味着:

  • 用户需要从非官方渠道下载(可能被篡改)
  • 开发者模式本身会降低浏览器的安全防护

3. MCP 工具的系统访问风险

MCP 工具系统中的 Shell MCP 可以执行本地命令。如果恶意构造的 Prompt 诱导模型执行危险命令(如 rm -rf /),理论上存在安全风险——尽管扩展设计了权限管理来缓解这一问题。

8.3 安全建议

  1. 仅从官方 GitHub Release 下载,避免第三方分发渠道的篡改风险
  2. 定期审查 MCP 工具权限,移除不需要的工具
  3. 敏感对话使用独立浏览器配置文件,隔离 DeepSeek++ 的数据
  4. 关注项目更新,及时修复潜在安全漏洞

九、部署与实践指南

9.1 安装步骤

DeepSeek++ 支持 Chrome、Edge、Firefox 三大浏览器。以 Chrome 为例:

# 1. 从 GitHub Release 下载最新版本压缩包
# 2. 解压到本地目录

# 3. 打开 Chrome,访问 chrome://extensions/
# 4. 开启右上角「开发者模式」
# 5. 点击「加载已解压的扩展程序」
# 6. 选择项目下的 dist/chrome-mv3/ 目录

9.2 快速上手配置

安装完成后,打开 DeepSeek 聊天页面(chat.deepseek.com),右上角会出现 DeepSeek++ 的侧边栏图标。

首次使用建议按以下顺序配置:

  1. 设置记忆: 在侧边栏的 Memory 面板中,手动添加或让 AI 自动提取你的基本信息和偏好
  2. 探索 Skill: 在聊天框输入 /,浏览内置的 9 大技能,试用一两个
  3. 配置 MCP: 如果需要调用本地工具,在 MCP 面板中添加 stdio 类型的 MCP 服务器
  4. 创建自动化: 设置一个简单的定时任务(如每日提醒),体验无人值守的自动化

9.3 进阶:自定义 Skill

在侧边栏的 Skills 面板中,用户可以自己编写新技能。一个 Skill 的本质是一组 System Prompt 配置:

{
  "name": "my-custom-skill",
  "description": "我的自定义技能",
  "systemPrompt": "你是一个XXX专家,请按照以下方式工作...",
  "tools": ["web_search", "file_read"],
  "triggers": ["/my-skill"]
}

9.4 常见问题

问题 解决方案
扩展无法加载 确认选择了正确的 dist/chrome-mv3/ 目录
/ 命令无响应 刷新 DeepSeek 页面,确保扩展已激活
MCP 工具连接失败 检查 MCP 服务器配置,确认 stdio bridge 路径正确
记忆未自动保存 在侧边栏 Memory 面板中检查“自动保存”开关

十、总结与趋势判断

10.1 核心结论

DeepSeek++ 通过 MCP 工具系统、Agentic 记忆与 Skill 调度三大模块的深度协同,将 DeepSeek 网页版从一个“单次问答工具”升级为具备“思考-行动-观察”闭环能力的 AI Agent。

三者的协同关系可以概括为:

  • Agentic 记忆 = 大脑的“长期记忆区”——记住用户是谁、喜欢什么、讨论过什么
  • Skill 调度 = 大脑的“模式切换”——根据不同任务切换不同的思考范式
  • MCP 工具系统 = 身体的“手脚”——执行具体操作,与外部世界交互

三者缺一不可。没有记忆,AI 每次都是“陌生人”;没有 Skill,AI 无法应对不同场景的专业需求;没有 MCP,AI 只能“动口不动手”。

10.2 对开发者的启示

DeepSeek++ 的“前端注入”模式给 AI 应用开发者提供了一个重要启示:在官方 API 能力不足时,浏览器扩展可以成为快速补齐能力的有效途径。

这种模式特别适合:

  • 快速验证产品概念,无需等待官方 API 更新
  • 降低用户使用门槛,无需复杂的环境配置
  • 保持数据本地化,满足隐私合规要求

10.3 未来趋势判断

趋势一:浏览器扩展将成为 AI Agent 的重要载体

DeepSeek++ 的成功证明,浏览器扩展可以在不依赖官方 API 更新的前提下,快速为 AI 产品注入 Agent 能力。随着 Chrome 扩展 API 的不断进化(如侧边栏 API、文件系统 API 等),这种模式的潜力将进一步释放。

趋势二:MCP 协议将加速 AI 工具生态的标准化

Anthropic 推出的 MCP 协议正在成为 AI 工具调用的事实标准。DeepSeek++ 对 MCP 的完整支持,以及 Shell MCP、OfficeCLI 等工具的集成,预示着未来 AI 工具将更加标准化、可互操作。

趋势三:本地优先的 AI 将成为主流

DeepSeek++ 的所有数据存储在本地,不依赖云端服务。这种“本地优先”的设计理念,加上 DeepSeek-V4-Flash 极低的推理成本(算力占用仅为 V3.2 的 10%),正在推动 AI 从“云端垄断”走向“本地普惠”。

趋势四:开源社区将持续推动模型能力“下沉”

DeepSeek-V4 的开源加上 DeepSeek++ 这类社区工具,正在形成“强大开源模型 + 社区增强工具”的完整生态。这种组合让中小企业甚至个人开发者都能以极低成本使用顶尖的 AI 能力。

10.4 给读者的建议

如果你是 DeepSeek 网页版的日常用户,强烈建议安装 DeepSeek++——它能让你免费享受原本需要付费订阅才能获得的 Agent 能力。

如果你是 AI 应用开发者,DeepSeek++ 的源码值得深入研读——它展示了一种“轻量级 Agent 化”的技术路径,无需重写后端即可为现有产品注入智能化能力。

如果你是 开源爱好者,可以关注 DeepSeek++ 的 GitHub 仓库,参与 Skill 市场的建设,或贡献新的 MCP 工具集成。


最后提醒: 根据 DeepSeek 官方公告,旧有的 API 接口模型名 deepseek-chatdeepseek-reasoner 将于 2026 年 7 月 24 日停止使用。建议开发者及时迁移至 V4 系列模型(deepseek-v4-prodeepseek-v4-flash),以享受百万上下文和更优的 Agent 能力。


本文基于 DeepSeek++ 开源项目(GitHub: zhu1090093659/deepseek-pp)及 DeepSeek-V4 官方技术文档撰写,所有代码示例和架构分析均来源于公开可获取的源码与社区讨论。

Logo

欢迎加入 MCP 技术社区!与志同道合者携手前行,一同解锁 MCP 技术的无限可能!

更多推荐