上海明星AI公司裁员停薪;曝拼多多已组建多个大模型小组团队;全球首个混合推理模型Claude 3.7发布 | 极客头条...
「极客头条」—— 技术人员的新闻圈!CSDN 的读者朋友们好,「极客头条」来啦,快来看今天都有哪些值得我们技术人关注的重要新闻吧。整理 | 郑丽媛出品 | CSDN(ID:CSDNnews)一分钟速览新闻点!内部人士谈 DeepSeek 繁忙次数变少:通过技术优化实现,使得较少资源情况下仍能支持广泛用户使用曝拼多多挖角多位百度大佬,已组建多个大模型小组团队,内部进行赛马 PK上海一明星 AI 公司

「极客头条」—— 技术人员的新闻圈!
CSDN 的读者朋友们好,「极客头条」来啦,快来看今天都有哪些值得我们技术人关注的重要新闻吧。
整理 | 郑丽媛
出品 | CSDN(ID:CSDNnews)

一分钟速览新闻点!
-
内部人士谈 DeepSeek 繁忙次数变少:通过技术优化实现,使得较少资源情况下仍能支持广泛用户使用
-
曝拼多多挖角多位百度大佬,已组建多个大模型小组团队,内部进行赛马 PK
-
上海一明星 AI 公司倒下,员工遭停薪,澜码创始人周健回应:正寻求被并购
-
网传 5G 比 4G 辐射更强、对人体危害很大,工信部辟谣
-
消息称国内 GPGPU“独角兽”壁仞科技考虑赴港 IPO,拟筹集 3 亿美元
-
YY 语音公司接入 DeepSeek 上线“YYDS”
-
全球首个混合推理模型 Claude 3.7 发布,即将完成 35 亿美元融资
-
DeepSeek 让微软变卦了?被曝取消多个数据中心租约,缩减开支大幕已开启
-
苹果宣布未来四年将在美国投资超 5000 亿美元,增设 2 万岗位并与富士康合作生产 AI 服务器
-
消息称英伟达包下台积电今年超 70% 的先进封装产能
-
赛富时与谷歌达成数十亿美元合作协议,深化 AI 与云计算集成
-
DeepSeek 开源第一枪:FlashMLA 让 H800 性能飙升
-
iOS 18.4 Beta 出问题被撤回,iPhone 12 等机型更新遇阻
-
Ubuntu 25.04 特性冻结完成,预计 4 月 17 日发布

国内要闻
内部人士谈 DeepSeek 繁忙次数变少:通过技术优化实现,使得较少资源情况下仍能支持广泛用户使用
2 月 24 日,有用户反馈近期 DeepSeek 算力紧张的情况有所缓解。高峰期使用 DeepSeek 已较少出现“服务器繁忙,请稍后再试”等情况。此前,有行业从业者猜测,“DeepSeek 官方 App 可能限制了一名用户一个小时只能使用一次”。在社交媒体上也出现大量用户称 DeepSeek 对使用次数设置了上限。
对于此,有接近 DeepSeek 的人士表示,“DeepSeek 没有特别限制过,但之前可能是资源不太够”,对于近期 DeepSeek 繁忙次数变少,系 DeepSeek 官方团队仍在进行技术架构优化实现,使得较少资源情况下仍能支持广泛用户使用。
曝拼多多挖角多位百度大佬,已组建多个大模型小组团队,内部进行赛马 PK
近期,有知情人士向媒体透露,拼多多内部悄然成立了一支专注于电商推荐的大模型研发团队,该团队的领军人物曾是百度凤巢团队的骨干成员,拥有极其丰富的行业经验。据透露,这位负责人在百度任职期间,年薪已高达千万级别。而此次加入拼多多,公司给出的待遇更是诚意满满,年薪数额远超其在百度时的水平,足见拼多多对电商推荐技术创新的重视。
不仅如此,拼多多在过去一年中已从百度招募了一批技术精英,共同投入到大模型相关项目的研发中。目前,拼多多的大模型产品已广泛应用于比价系统、个性化推荐、广告投放、搜索优化以及客户服务等多个领域,这些领域均得到了持续的投入与优化。值得注意的是,拼多多内部的大模型团队之间还形成了一种竞争机制。每个小组的大模型团队都会进行“赛马”,以直接 PK 的结果来决定收益分配,这种机制无疑将激发团队的创新活力,推动技术不断突破。(ITBEAR)
上海一明星 AI 公司倒下,员工遭停薪,澜码创始人周健回应:正寻求被并购
国内企业级AI Agent(智能体)公司上海澜码科技有限公司(以下简称“澜码科技”)近期对数十名员工直接解除劳动合同,停薪资、停社保已经超过三个月(去年10月起)。同时,“澜码科技”公众号自去年10月28日至今处于停更状态。
对此,澜码科技创始人、CEO周健23日晚称,“元旦的时候公司可能收缩了一下,有一些裁员,然后我们本身也是安排后面赔偿,可能他们情绪比较重,我们最近其实也已经付了三分之二的资金。没有(50名员工都裁掉),我们现在还留了大概20(名员工)。主要还是融资上问题。”周健对强调,公司现在寻求被并购的可能性,已经有企业在谈。“我们已经在积极自救了,我自己其实也已经借了钱,我已经卖房子再去还(员工薪资)。”
网传 5G 比 4G 辐射更强、对人体危害很大,工信部辟谣
来自工业和信息化部的数据显示,截至 2024 年底,我国 5G 通信用户已突破 10 亿户。网络信号的传输需要建立移动通信基站,而随着通信用户的快速增长,伴随着的担忧也逐渐显现。
据央视新闻报道,最近,诸如“手机基站都有辐射,5G 基站比 4G 多,所以 5G 辐射会比 4G 要大,对人体危害更大!”等一些说法引发公众关注,对此,北京邮电大学教授彭木根表示,5G 通信基站的辐射值很低,且为电磁辐射,距离越远信号越弱,对人体的影响可忽略不计。
彭木根还称:“实际上我一直认为 5G 的辐射严格来说是可以忽略的,包括 4G 的基站辐射也可以忽略。严格来说,真正对人体辐射的不是基站,而是我们的手机,特别是手机信号不好的时候,它的功率发射是满功率发射的,这时候辐射更大。”有媒体注意到,工信部昨日午间转发了这则报道,进行官方辟谣。(IT 之家)
消息称国内 GPGPU“独角兽”壁仞科技考虑赴港 IPO,拟筹集 3 亿美元
2 月 24 日,彭博社报道称,中国 GPGPU(通用 GPU)“独角兽”企业壁仞科技考虑赴港 IPO,拟筹集 3 亿美元(IT之家备注:当前约 21.76 亿元人民币)。该企业正同中金公司、中银国际、平安证券就可能在今年进行的股票出售展开合作。但壁仞科技这次也可能选择不上市。该企业早在 2023 年就考虑过在港交所上市,也在去年进行了 IPO 并上市的辅导备案;不过壁仞在港交所上市的初次尝试没有落地,在上交所科创板上市的可能也逐渐走弱。
YY 语音公司接入 DeepSeek 上线“YYDS”
2 月 24 日消息,YY 公司宣布接入 DeepSeek,并推出“低延时、不卡顿”的 YY-DeepSeek R1-满血版(简称“YYDS”),旗下 YY 直播、YY 语音等产品已经上线产品入口。
据 YY 相关负责人介绍,YYDS 是 YY 顺应用户需求推出的 AI 大模型产品,不仅全面支持 DeepSeek V3 联网和 R1 深度思考模式,还通过服务器的优化改进解决了 DeepSeek 的卡顿、响应迟缓等问题,实现“低延时、不卡顿的顺畅使用体验”。YY 方面表示,未来,YY 还将与 DeepSeek 进行产品的深度结合,推出具有 DeepSeek 功能的智能体社区,打造智能体官频及频道内智能体组件。

国际要闻
全球首个混合推理模型 Claude 3.7 发布,即将完成 35 亿美元融资
今日凌晨,Anthropic 突然发布了全球首款混合推理模型、迄今为止最好的编码模型——Claude 3.7 Sonnet。据官方介绍,Claude 3.7 Sonnet 具有“一个模型,两种思考方式”(One model, two ways to think)的特点,即标准和扩展思考模式。用户可以选择何时让模型正常回答问题,何时让模型思考更长时间再回答问题。Claude 3.7 Sonnet 可以生成近乎即时的响应,也可以生成用户可见的扩展、逐步思考的结果,在编码和前端网络开发方面的改进尤为显著。另外,API 用户还可以对模型的思考时间进行精细控制。
除了发布 Claude 3.7 Sonnet 之外,Anthropic 还同步推出了名为 Claude Code 的命令行工具,专注于智能编码。该工具目前以有限研究预览版的形式提供,旨在让开发者可以直接在终端环境中,将大量的工程任务交给 Claude 处理。在运营方面,该公司表示即将完成 35 亿美元融资,估值达到 615 亿美元。
DeepSeek 让微软变卦了?被曝取消多个数据中心租约,缩减开支大幕已开启
今年1月末,中国初创公司DeepSeek人工智能开源模型R1的横空出世,对美国科技巨头的影响似乎还在发酵。近日,美国券商TD Cowen发布的一份渠道调查报告引发市场关注。这份报告通过调查来源于供应链和第三方的信息称,微软公司已经取消了与至少两家私营数据中心运营商的数项租赁协议,涉及功率总计“数百兆瓦”。此外,微软还已经暂停了将已协商并签署的资格声明(SOQ)转换为租赁协议,并将其国际支出的很大一部分重新分配给了美国——当日,微软股价下跌 1.9%。
这不禁令外界再次猜测,在DeepSeek的低成本AI模型震惊市场后,美国科技巨头们可能已开始考虑缩减成本。不过,微软公司自身并不承认这一猜测,而是对外回应称:取消部分数据中心租约只是在部分地区的战略性调整。
苹果宣布未来四年将在美国投资超 5000 亿美元,增设 2 万岗位并与富士康合作生产 AI 服务器
本周一,苹果宣布将在未来四年内投资 5000 亿美元(约 3.63 万亿元人民币)用于美国本土业务扩张,包括在休斯顿建设 AI 服务器制造工厂、在密歇根州设立供应商学院,以及扩大与现有美国供应商的合作规模,这也是苹果迄今为止在美国给出的最大一次承诺。
根据声明,苹果将与富士康合作,于今年晚些时候在休斯顿开始生产 Private Cloud Compute(PCC)服务器系统。并计划于明年在休斯顿地区打造一个占地 25 万平方英尺的服务器制造厂。此外苹果表示,新增的 2 万个岗位绝大多数集中于研发、芯片工程、软件开发以及 AI 和机器学习领域。苹果还计划在底特律开设制造学院,为中小企业提供技术支持,并将在美国制造业基金中追加 50 亿美元,使总规模达到 100 亿美元(约 725.42 亿元人民币)。
消息称英伟达包下台积电今年超 70% 的先进封装产能
近日业界传出消息,NVIDIA最新Blackwell构架GPU芯片需求强劲,已包下台积电今年超过70%的CoWoS-L先进封装产能,出货量以每季环比增长20%以上逐季冲高,助力台积电营运热转。业界分析称,NVIDIA将于26日美股盘后发布上季财报与展望,随NVIDIA大举包下台积电先进封装产能,意味今年旗下AI芯片出货持续放量,四大云端服务供应商(CSP)拉货动能续强,为NVIDIA财报会议提前报喜。
赛富时与谷歌达成数十亿美元合作协议,深化 AI 与云计算集成
赛富时与谷歌达成一项价值 25 亿美元的长期合作协议,双方将在 CRM 软件、AI 助手和 Data Cloud 解决方案等领域进行深度集成,并与 Google Cloud 实现无缝对接。此次合作将加强 Google Workspace 与赛富时 AI CRM 工具的整合,提供更强大的 AI 模型和数据分析功能。赛富时目前主要依赖亚马逊 AWS 云计算服务,但此次合作加深了其与谷歌在云计算领域的合作。赛富时计划于本周三公布 2025 财年第四季度财报,市场预计其调整后每股收益为 2.61 美元,营收为 100.4 亿美元。

程序员专区
DeepSeek 开源第一枪:FlashMLA 让 H800 性能飙升
国内 AI 巨头 DeepSeek 开源周终于开始,本周一发布的重磅项目 FlashMLA 又一次点燃了 AI 技术圈。这是一款专为英伟达 Hopper 架构 GPU 优化的高效解码内核,不仅将 H800 GPU 的性能推向新高度,可以说是大模型推理服务的革命性加速器了。经实测,FlashMLA 在 H800 SXM5 平台上(CUDA 12.6),在内存受限配置下可达最高 3000GB/s,在计算受限配置下可达峰值 580 TFLOPS。团队在致谢部分表示,FlashMLA的设计参考了 FlashAttention-2、FlashAttention-3 以及 CUTLASS 的技术实现(开源地址:https://github.com/deepseek-ai/FlashMLA)。
iOS 18.4 Beta 出问题被撤回,iPhone 12 等机型更新遇阻
近期,苹果公司对外宣布了其iOS 18.4 Beta的首个开发者测试版本遭遇技术阻碍,导致该版本被紧急撤回。据悉,这一决定是由于部分设备在安装该测试版后出现了严重问题。具体而言,iPhone 12系列,包括iPhone 12 mini、iPhone 12、iPhone 12 Pro及iPhone 12 Pro Max,均无法顺利安装iOS 18.4 Beta 1版本。同时,一些旧款的iPad Air以及入门级iPad也遭遇了同样的安装难题。
据MacRumors的报道,受影响的设备在安装iOS 18.4 Beta 1后,出现了“启动循环”故障,即设备无法正常启动,陷入无限重启的状态,严重影响了用户的正常使用。针对这一突发情况,苹果公司迅速作出反应,建议用户谨慎对待iOS Beta版本的安装,并在安装前务必备份好数据,以防不测。
Ubuntu 25.04 特性冻结完成,预计 4 月 17 日发布
2月22日,Canonical宣布Ubuntu 25.04的特性冻结已正式生效,标志着其开发进入后期阶段。这款代号为'Plucky Puffin'的新版本预计于4月17日正式发布,为用户带来多项优化和改进。Ubuntu 25.04将搭载Linux 6.14内核,默认使用GNOME 48桌面环境,并支持Mesa 25.0图形驱动,带来更流畅的视觉体验。此外,GIMP 3.0安装程序的加入也为用户提供了更强大的图像处理能力。
此次更新特别优化了对BitLocker加密设备的支持,解决了用户在安装Ubuntu时遇到的兼容性问题。新版本的安装程序将更好地处理搭载BitLocker加密的Windows 11系统设备,为用户带来更顺畅的双系统使用体验。

观点

推荐阅读:
▶ 马斯克“查美国社保”后怒批150岁领保障金,竟是年轻程序员不懂COBOL惹了祸!
▶ 直击DeepSeek技术真相,对我们究竟意味着什么?| 万有引力
▶ 大模型下半场战争硝烟四起,AI进化论第二季开启 | 第一季DeepSeek十日谈精彩回顾

更多推荐


所有评论(0)