1.腾讯混元开源 4B 参数手机 Agent 模型 PhoneBuddy

腾讯混元开源PhoneBuddy4B手机Agent模型,同步推出PhoneWorld、PhoneHarness等5篇论文,系统覆盖环境、训练、执行、隐私与安全全链路。模型核心创新采用Real+Mock混合RL训练,将真实App与自建PhoneWorld mock环境结合,使4B模型在150项真机评测中多项指标超越GPT-5.4。

2.OpenAI 推出首款自研推理加速芯片 Jalapeño

OpenAI 发布首款自研推理芯片 Jalapeño,联合博通与 Celestica 打造,专为 ChatGPT、Codex 等模型量身定制。项目由前谷歌 TPU 核心成员 Richard Ho 主导,仅用 270 天完成从设计到流片,创高性能 ASIC 最快纪录。芯片通过优化数据搬运与资源平衡提升实际利用率,计划 2026 年底部署,每瓦性能大幅优于现有方案。

3.华为宣布全机型开放鸿蒙龙虾「小艺 Claw」

华为宣布鸿蒙”龙虾”小艺 Claw全机型开放,HarmonyOS 5.0 及以上机型只需将小艺 App 升级至 11.6.4.300 及以上版本即可使用。同时小艺 Claw 的套餐服务同步更新,49 元体验包上线 Auto-Model 模式,199 元标准包支持openPangu-2.0-Pro、DeepSeek V4-Flash、DeepSeek V4-Pro、MiniMax M3四种模型自选。

4.阿里云推出 AI 语音输入法 CosyVoice

阿里云推出新一代AI语音输入法CosyVoice,搭载千问大模型,支持语音实时转写、自动过滤口语冗余、识别自我修正及结构化整理。工具可理解用户意图生成制式文稿,支持上海话、粤语、四川话等多种方言转普通话。工具主打大模型深度赋能的语义级理解与文本再生成能力,区别于传统语音输入法仅做声学转写。

5.豆包正式推出专业版

豆包专业版正式上线,基于豆包2.1系列大模型推出全新办公任务模式,支持本地电脑操作、浏览器、Skills技能调用、定时任务及内置Office套件,可完成文档处理、应用开发、数据分析等专业工作。订阅采用三级阶梯定价:标准套餐68元/月、加强套餐200元/月、高级套餐500元/月;大学生认证可享38元/月专属优惠。

6.火山引擎推出音频创作模型「豆包音频生成模型1.0」

火山引擎推出豆包音频生成模型1.0,首次支持文本或音频参考输入,可端到端生成目标音频。模型能在单条Prompt中编排多角色对白、情绪语气、背景音乐与环境氛围,直接产出完整音频作品,可在长时生成中保持音色一致性。

7.Anthropic 推出企业级 AI 协作工具 Claude Tag

Anthropic 推出Claude Tag企业级 AI 协作工具,将 AI 从一问一答升级为常驻 Slack 频道的虚拟同事。团队成员可 @Claude 分配任务,工具阁能自动拆解、调用工具、执行并汇报结果,支持多人接力协作、持续性组织记忆、主动监控提醒及异步长任务处理。

8.通义千问推出原生语言世界模型 Qwen-AgentWorld

阿里通义正式推出Qwen-AgentWorld,首个原生语言世界模型,可在 MCP、Search、Terminal、SWE、Web、OS、Android 七大领域模拟智能体交互环境。模型基于超 1000 万条真实环境轨迹,经 CPT→SFT→RL 三阶段端到端训练,在自研评测基准 AgentWorldBench 上整体模拟质量超越 GPT-5.4、Claude Opus 4.8 等顶尖模型。

9.影眸科技完成数亿元新一轮融资

影眸科技完成数亿元新融资,本轮融资由凯辉基金、上海国投先导领投,老股东持续跟投。同步发布最新3D生成模型Hyper3DRodin Gen-2.5,首次引入大语言模型先思考再生成模式,支持五档思考深度,最快4秒生成百万面模型,同步推出全球首个12K精度原生3D贴图模型。

10.字节跳动推出全新智能体模型 Seed2.1

字节跳动推出Seed2.1系列模型,定位为面向真实生产力场景的全新智能体。模型在通用 Agent 能力、代码端到端交付及多模态理解三大维度显著提升,在 Workspace Bench、GDPval、MobileWorld 等多项基准测试中表现领先,Coding 场景众测胜率超Claude Opus 4.6。

Logo

欢迎加入 MCP 技术社区!与志同道合者携手前行,一同解锁 MCP 技术的无限可能!

更多推荐