前言

在软件开发中,两个关键环节长期处于割裂状态:

  • 沟通阶段:需求讨论会、技术评审、Bug复盘、客户访谈——产生大量语音记录,但会后整理耗时且信息流失严重
  • 交付阶段:需求文档转代码、技术方案落地、原型开发——需要从零开始梳理上下文,重复劳动多

聆犀AI录音卡(SonicNote)+ 妙记App 负责「语音 → 结构化文本」的转化,ZCode(智谱AI编程环境)负责「文本描述 → 代码交付」的转化。

本文将系统分析:聆犀AI录音卡如何与 ZCode 结合,通过 Skills(技能) 机制将会议录音直接转化为开发任务和代码产出,形成从沟通到交付的全链路 AI 编程体验。


一、两张王牌:聆犀AI录音卡 × ZCode

聆犀AI录音卡(SonicNote)

聆犀AI录音卡配合妙记(SonicNote)App,是一个「录音 → AI转写 → 智能摘要 → API对接」的全流程工具。硬件仅卡片大小(3.2mm 厚、约 32g),支持最长 35 小时连续录音,内置 32GB/64GB 存储,随时随地记录不中断。

其核心亮点在于与智谱 GLM 模型的深度集成:录音数据经由妙记App 上传至智谱 GLM 进行语音转写和语义理解,实现高准确率的说话人识别、自动摘要和要点提炼——底层模型能力决定了转写质量的上限。

更重要的是,聆犀录音卡并非封闭系统——它提供了开放的 MCP Key 接口Skills 生态对接能力。这意味着你可以将录音数据直接接入 ZCode 等 AI 编程环境,通过自定义 Skill 将会议讨论自动转化为开发任务和代码产出,真正打通「沟通 → 编程」的全链路。

ZCode(智谱AI编程环境)

ZCode 是智谱推出的 Agentic Development Environment(ADE)——智能体驱动的开发环境。它区别于传统 AI 编辑器(如 Cursor)的核心定位是:你当项目经理,ZCode 当开发团队

特性维度 详细说明
产品定位 Agent 驱动的开发环境(ADE),非传统编辑器
交互方式 全 GUI 可视化桌面应用,零命令行门槛
Agent 内核 自研 ZCode Agent,深度适配 GLM-5.2
上下文窗口 支持 1M Token,可处理整个中型代码仓库
编程语言 无限制——底层模型决定能力,支持 Python/JS/Go/Java 等
Skills 系统 完全兼容 Claude Code SKILL.md 标准,可扩展自定义工作流
目标群体 中文开发者、新手/可视化偏好者、长链路任务开发者、团队协作
价格优势 免费额度每日约 300 万 Token;Coding Plan 最低 0 元起

Skills:连接两座岛屿的桥梁

Skills(技能) 是一组可复用的工作指令,以 SKILL.md 文件定义触发条件、执行步骤和输出要求。ZCode 完全兼容 Claude Code 的 Skill 标准。

其核心价值在于:

聆犀录音卡将「口语 → 结构化文本」,Skills 将「文本 → 开发工作流」——两个转化器通过 Skill 机制无缝衔接,形成「听 → 想 → 做」的完整闭环。


二、完整安装教程:两步搭建「语音→编程」全链路

下面手把手教你完成整套环境的搭建。整个过程分为两大步:录音端(聆犀录音卡 + 妙记App) → 编程端(ZCode + Skills)


准备工作

项目 说明 获取方式
聆犀AI录音卡硬件 必备,推荐使用录音卡保障录音质量 妙记App内购买或官方渠道
妙记App(SonicNote) 录音硬件配套App,负责录音管理和AI转写 ainote.easylinkin.com
ZCode 智谱AI编程环境桌面端 zcode.z.ai 下载

步骤一:配置聆犀录音卡 + 妙记App

1.1 下载并注册妙记App

1.2 使用聆犀录音卡录音

  • 打开妙记App,按提示蓝牙配对聆犀录音卡
  • 配对成功后,App 首页显示录音卡在线状态
  • 建议使用聆犀录音卡硬件录音,保障高保真收音和长续航

💡 提示:聆犀录音卡采用磁吸触点充电、支持最长 35 小时录音、待机长达 166 天,日常随身携带不中断,随时进入录音状态。

1.3 试录一段并确认AI转写

  • 录一段 1-2 分钟音频(如需求讨论或技术评审)
  • 等待 AI 转写完成
  • 确认转写文本、说话人识别、AI摘要都正常生成

验证标准:App 内能看到带说话人标签的转写文本和 AI 自动生成的摘要卡片

1.4 获取 API Key(关键步骤)

这是让外部工具对接你录音数据的凭证:

  1. 打开妙记App → 进入「我的」页面
  2. 找到 「MCP Key 管理」「API Key」 入口
  3. 点击「创建新 Key」,生成一个以 sk- 开头的密钥
  4. 复制并妥善保存

步骤二:安装并配置 ZCode

2.1 下载安装 ZCode

  1. 访问 https://zcode.z.ai/cn 下载对应系统版本(macOS / Windows)
  2. 双击安装包完成安装
  3. 打开 ZCode,使用 Z.AIBigmodel.cn 账号登录

2.2 配置模型服务

ZCode 支持多种模型接入方式:

  1. 点击左下角设置 → 模型供应商
  2. 选择 BigModel 并填写 API Key(获取:bigmodel.cn
  3. 或配置 Claude Code、DeepSeek 等第三方模型
  4. 保存设置

💡 建议:首次使用可体验免费额度(新用户每日约 300 万 Token),再按需升级 Coding Plan

2.3 验证 ZCode 基础功能

  • 在对话框中输入自然语言指令,如「创建一个 Python 的 Flask Web 服务器」
  • 观察 ZCode Agent 自主完成代码编写、文件创建
  • 确认终端、文件管理、预览等功能正常

验证标准:Agent 能根据自然语言描述生成并运行完整代码


步骤三:安装 Skills(技能)—— 打通声控编程的核心

Skills 是实现「录音内容 → 开发任务自动转化」的关键。以下是三种安装方式:

通过 SkillHub 一键安装 sonicnote 技能

SkillHub 是国内最大的 AI Skills 社区平台,收录 8 万+ Skills:

  1. 访问 https://www.skillhub.cn/skills/sonicnote 查看 sonicnote 技能详情
  2. 使用 SkillHub CLI 安装:
    # 安装 SkillHub CLI
    curl -fsSL https://skillhub.cn/install/install.sh | bash
    
    # 安装 sonicnote 技能
    skillhub install sonicnote
    
    # 链接到 ZCode
    skillhub link zcode
    

验证完整流程

安装完成后,验证整条链路是否打通:

1. 聆犀录音卡录音 → 妙记App转写成功               ✅
2. ZCode 安装好 Skills sonicnote            ✅  可正常调用
3. 将会议AI摘要粘贴给 ZCode,输入 $sonicnote-meeting  ✅  自动生成代码

至此,你已经搭建了完整的 聆犀录音卡 → 妙记App → ZCode Skills → 代码交付 全链路!


三、核心打通路径:数据从录音到代码的完整流

录音卡采集音频(需求讨论会 / 技术评审 / Bug复盘)
    ↓
妙记App AI转写 + 说话人识别 + 智能摘要
    ↓
AI摘要/转写文本 导出或API获取
    ↓
ZCode Skills 加载($sonicnote-meeting)
    ↓
Agent 自动分析 → 拆解任务 → 生成代码 → 交付产出

核心链路非常清晰:

说话讨论 → AI转写摘要 → Skills解析 → Agent编程 → 代码交付

整个过程不需要手动写需求文档、不需要拆解任务列表——你只需要说话,剩下的交给 AI。


四、五大应用场景:从沟通到交付的实战想象

结合聆犀录音卡的「口语记录」能力和 ZCode 的「编程执行」能力,以下场景极具落地价值:


场景一:需求讨论会 → 直接出原型

痛点:产品经理和开发开完需求会,产品要花半天写 PRD,开发要花一天理解需求、搭原型——沟通到交付的周期太长。

聆犀 + ZCode 解决方案

  1. 需求讨论会全程用聆犀录音卡录音
  2. 妙记App 自动转写并生成 AI 摘要,标注关键需求点和决策
  3. 将 AI 摘要输入 ZCode,调用 $sonicnote-meeting Skill
  4. 技能自动分析需求 → 拆解功能列表 → 选择技术栈 → 生成可运行的原型代码
  5. 开发者在 ZCode 中直接预览、调试、修改

价值:一场 1 小时的需求讨论会,会后 30 分钟就能拿到可交互的原型。产品需求到代码的转化周期从「天」缩短到「小时」。

适合角色:全栈开发者、创业团队、独立开发者、产品经理兼开发

参考学习ZCode 快速原型:1小时打造电商网站MVP


场景二:技术评审会 → 自动生成代码框架

痛点:技术方案评审会上讨论了架构设计、接口定义、数据模型,但会后开发还是得从头写代码框架,评审中的讨论要点容易遗忘。

聆犀 + ZCode 解决方案

  1. 技术评审会录音,妙记App 识别出架构决策、API 设计、数据库模型等关键信息
  2. AI 摘要结构化输出:接口清单数据模型技术选型约束条件
  3. ZCode 加载 Skill,根据技术方案自动生成项目骨架
    • 目录结构
    • 数据模型代码
    • API 接口桩代码
    • 配置文件
    • 测试框架
  4. 开发者专注填充核心业务逻辑

价值:评审会上的架构讨论直接落地为代码框架,防止「会上讨论得很清楚,会后写代码走样」的经典问题。

适合角色:技术负责人、架构师、后端开发者


场景三:Bug 复盘会 → AI 定位并修复

痛点:线上事故复盘会上,大家讨论根因、修复方案、改进措施。但讨论记录和实际修复代码之间没有直接关联,复盘建议容易「说了就过了」。

聆犀 + ZCode 解决方案

  1. Bug 复盘会全程录音,妙记App 自动标注「根因分析」「修复方案」「预防措施」段落
  2. AI 摘要提取关键信息:错误类型、影响范围、修复建议、涉及代码模块
  3. ZCode 加载 Bug 修复 Skill:
    • 自动定位到涉及的代码文件和行号
    • 根据讨论的修复方案生成修复代码
    • 自动补充单元测试
    • 生成变更日志
  4. 开发者审查并合并

价值:从「讨论根因」到「提交修复代码」的链路直接打通,复盘会的产出不再是会议纪要,而是实际的代码变更

适合角色:后端开发者、SRE、质量保障团队


场景四:客户需求沟通 → 定制化开发交付

痛点:外包/定制开发团队跟客户沟通需求,每次电话或视频会议聊了很多细节,但整理需求→报价→开发→交付,链条太长,沟通失真。

聆犀 + ZCode 解决方案

  1. 与客户通话全程用录音卡记录
  2. 妙记App 自动转写,AI 提取功能需求、UI偏好、预算范围、时间要求
  3. ZCode 根据客户需求,自动生成功能列表 + 技术方案 + 报价估算
  4. 如有需要,Skill 可直接生成 Demo 页面分享给客户确认
  5. 确认后进入迭代开发

价值:客户沟通到 Demo 交付的周期大幅缩短,减少「客户想要 A,你理解成 B」的沟通失真。

适合角色:自由开发者、外包团队、SaaS 产品经理


场景五:技术学习 + 代码实践联动

痛点:听技术播客、参加技术培训、看教学视频时觉得都懂了,但动手写代码时还是无从下手。学习和练习之间缺少衔接机制。

聆犀 + ZCode 解决方案

  1. 听技术分享/网课时用录音卡录制
  2. 妙记App AI 生成知识点摘要、代码示例、关键概念
  3. ZCode 加载学习类 Skill:
    • 根据课程内容自动生成配套练习项目
    • 设计课后作业代码框架
    • 生成知识点复习卡片
  4. 学习者在 ZCode 中边阅读摘要边动手实践

价值:学习内容不再是「听过就忘」,而是自动转化为可动手练习的代码项目,真正做到「学以致用」。

适合角色:编程学习者、转行者、技术培训学员


五、面向 ZCode 用户群体的多种场景

ZCode 的典型使用群体包括:中文开发者、新手/转行者、长链路任务开发者、团队协作场景、偏好可视化操作的开发者。针对这些群体的特点,以下场景具有高度匹配性:

面向新手开发者:语音驱动的编程入门

场景:零基础学习者想做一个个人博客网站但不知道从哪开始。

工作流:学习者用自然语言描述想法(如"我想做一个带评论功能的博客…")→ 录音卡记录 → AI 转写 → ZCode 自动生成完整项目 → 学习者在生成的代码基础上修改学习。

ZCode 匹配点:零命令行、全 GUI、自然语言驱动,降低编程入门门槛。

面向中文开发者:母语级的需求表达

场景:英文编程工具对中文长文本理解不够好,复杂需求需要多次调优 Prompt。

工作流:直接用中文讨论需求 → 妙记App 中文转写(98% 准确率)→ ZCode 原生中文理解(GLM-5.2)→ 直接生成符合中文需求的代码。

ZCode 匹配点:原生中文模型,深度优化中文开发场景,无需中英文转换损耗。

面向长链路任务:从想法到交付的全程跟踪

场景:一个跨两周的功能开发,涉及需求调研、技术设计、编码、测试、部署。

工作流:每次讨论录音 → AI 摘要归档 → ZCode Goal 模式将多次录音的产出纳入同一个开发目标 → 从整体规划到最终交付统一管控。

ZCode 匹配点:1M Token 上下文、Goal 目标模式、Git 图谱管理,适合长周期项目。

面向团队协作:远程语音驱动开发

场景:开发者在外面用手机,突然想到一个代码修改方案,但身边没有电脑。

工作流:聆犀AI录音卡记录想法 → API 同步到 ZCode → ZCode Bot Channel(飞书/微信 @ 机器人触发)→ 远程完成代码编写。

ZCode 匹配点:Bot Channel 远程控制、跨设备同步、手机扫码远程连接。


六、总结

维度 过去的方式 聆犀+ZCode 的方式
需求到代码 讨论→文档→理解→编码(数天) 讨论→AI转写→Agent编程(数小时)
技术评审落实 会上讨论→会后遗忘 评审自动生成代码框架
Bug 修复 复盘会→写修复方案→编码 复盘录音→AI提取根因→自动修复
客户沟通 反复沟通→需求文档→开发 一次沟通→AI理解→出原型
学习实践 听课→自己做练习项目 听课→AI生成配套练习
开发者门槛 需要掌握命令行和IDE 自然语言驱动,全GUI操作

聆犀AI录音卡的核心价值,在于它是「口语知识 → 结构化文本」的高效转化器。

ZCode 的核心价值,在于它是「结构化文本 → 可运行代码」的智能执行器。

Skills 是连接两者的「万能适配器」——你只需要把工作中的重复流程写成 SKILL.md,就能让每个人都能像调用函数一样复用最佳实践。

说话 → 转写摘要 → Skills 解析 → Agent 编程 → 代码交付

——每一次会议讨论,都不再是沟通的终点,而是代码交付的起点。


参考链接

Logo

欢迎加入 MCP 技术社区!与志同道合者携手前行,一同解锁 MCP 技术的无限可能!

更多推荐