引言

过去十年,人工智能(AI)技术,尤其是大模型(大型预训练模型)领域经历了飞跃式发展。伴随这一进程,围绕AI大模型的上下游产业链逐步形成:从底层算力芯片,到数据资源供给,再到模型训练和算法研发,以及支撑这些工作的算力基础设施,最终是各种应用层面的落地(包括生成式AI内容、自动驾驶、医疗AI等)。本报告将对近十年来全球AI大模型相关产业链的发展进行全面分析,总结各环节的市场数据与趋势,并基于技术实力、融资情况、市场份额和客户群体等评估标准,甄别出中国最具潜力的AI企业,包括目前占据主导地位但仍有拓展空间的公司,以及未来几年可能增长最快的新兴公司。

近十年AI大模型产业趋势

过去十年是深度学习和大模型崛起的十年。2015年前后深度神经网络在图像识别、语音识别上超越传统方法,引爆了AI应用浪潮。2017年谷歌提出Transformer架构奠定了通用大模型的基础,此后预训练模型规模飞速增长:如2018年的BERT,2020年的GPT-3(1750亿参数),以及2022-2023年出现的多模态生成模型和ChatGPT等里程碑应用,使“大模型”成为AI发展的核心方向。资本市场对AI的热情与日俱增:2024年全球AI领域融资达到792亿美元,同比大增27%,其中约40%流向了生成式AI创业公司 (State of AI in 2025: Key Trends Shaping the Future of AI)。大型基金争相投入超大规模模型研发:仅2024年就出现了13笔单笔超过10亿美元的巨额融资,OpenAI、xAI、Anthropic等打造前沿模型的公司占据了五大融资案中的四个 (State of AI in 2025: Key Trends Shaping the Future of AI)。这种投入也带来了模型性能的跃升,但同时模型训练成本飙涨——据估算,OpenAI的GPT-4训练计算成本高达7800万美元,Google正在研发的Gemini Ultra模型更是预计耗费1.91亿美元计算资源 (AI Index Report 2024 – Artificial Intelligence Index)。

随着投入提高,产业界已成为AI前沿研发的主导。2023年业界机构贡献了51个具有影响力的新模型,而学术界仅贡献15个 (AI Index Report 2024 – Artificial Intelligence Index)。AI创新重心向大公司和独角兽集中,但也出现“繁荣与泡沫”并存的特征:一方面,各行业对AI的采用快速增加,亚太和中国地区的企业部署生成式AI的比例显著上升 (The state of AI in early 2024 | McKinsey);另一方面,大部分传统企业仍处于起步阶段,只有约10%的公司真正将AI(尤其是生成式AI)大规模应用于业务 (From Potential to Profit: Closing the AI Impact Gap | BCG)。总体而言,近十年AI技术的突破与商业应用的落地并不完全同步,产业界在2023-2025年仍面临“将潜力转化为现实收益”的挑战 (From Potential to Profit: Closing the AI Impact Gap | BCG)。不过展望未来,各国政府和企业均在加码投入AI:例如麦肯锡预测生成式AI每年可为全球带来2.6万亿~4.4万亿美元经济价值 (Economic potential of generative AI | McKinsey)。这意味着围绕大模型的产业链各环节将持续高速发展,为有技术实力的企业提供巨大的增长机遇。

接下来,我们将按照产业链环节依次分析基础芯片、数据供应、模型训练与算法、算力基础设施和应用层的全球格局与趋势,为后文对企业的评估奠定基础。

产业链环节分析

基础芯片:GPU/TPU等算力引擎

GPU(图形处理器)在过去十年成为AI大模型计算的核心硬件。自2012年AlexNet证明GPU擅长深度学习训练后,NVIDIA等公司的高性能GPU几乎垄断了大模型训练市场。据统计,2023年NVIDIA在全球AI数据中心加速器市场的收入份额高达98%,预计到2027年仍占87%左右 (Ongoing Saga: How Much Money Will Be Spent On AI Chips?)。这种近乎垄断的地位意味着无论是云巨头还是研究机构,要训练大模型几乎离不开NVIDIA GPU。在推理加速方面,谷歌自研的TPU(张量处理器)自2015年以来在内部大规模部署,并对外提供云服务,但总体上GPU依然是主流选择。此外,Intel收购Habana推出AI加速芯片、AMD开发MI系列GPU,以及创业公司如Graphcore、Cerebras等推出专用架构,均在挑战NVIDIA的地位。然而截至目前,这些挑战者的市场占比微小。

这种需求带动了AI芯片市场的爆发式增长。全球企业争相扩充算力,2024年上半年全球AI计算和存储硬件支出达到474亿美元,同比激增97% (US leading AI infrastructure market followed by China and Asia-Pacific | Moonshot News)。服务器加速卡成为标配——2024年上半年70%的AI服务器部署了加速器(GPU/ASIC),同比增速高达178% (US leading AI infrastructure market followed by China and Asia-Pacific | Moonshot News)。据IDC预测,到2028年全球AI基础设施年支出将达2230亿美元,是2024年的数倍 (US leading AI infrastructure market followed by China and Asia-Pacific | Moonshot News)。可以预见,算力需求的井喷将持续驱动上游芯片产业投资和技术革新。

在中国市场,由于对尖端GPU的高度依赖,近年来加速推进芯片国产化。2022年中国AI加速卡出货量约109万张,其中NVIDIA份额约85%,华为昇腾约10%,百度昆仑约2%,寒武纪和燧原各约1% (IDC:2022上半年到2023年上半年中国AI服务器市场规模成长了54% | 互联网数据资讯网-199IT | 中文互联网数据研究资讯中心-199IT)。可见国内厂商在高端AI芯片上仍处于起步阶段。不过在政策和资金支持下,国产AI芯片正在快速追赶:2023年上半年中国用于AI服务器的本土加速芯片出货达50万片,占AI服务器总加速芯片的10% (IDC:2022上半年到2023年上半年中国AI服务器市场规模成长了54% | 互联网数据资讯网-199IT | 中文互联网数据研究资讯中心-199IT)。IDC预计到2027年底,非GPU架构的AI加速器在中国AI服务器市场的占比将从当前的8%提升至12% (IDC:2022上半年到2023年上半年中国AI服务器市场规模成长了54% | 互联网数据资讯网-199IT | 中文互联网数据研究资讯中心-199IT)。这一方面说明NVIDIA等GPU短期内难以替代,另一方面也预示着华为海思昇腾、阿里平头哥含光、寒武纪Cambricon等国产芯片有望逐步扩大市场份额。尤其是在自动驾驶领域,**Horizon Robotics(地平线)**的边缘AI芯片已在多款国产汽车上量产,占据ADAS芯片重要一席,并吸引大众汽车20多亿欧元投资成立合资公司 (Volkswagen to take 60% stake in $2 bln tech JV with China’s Horizon Robotics | Reuters) (Volkswagen to take 60% stake in $2 bln tech JV with China’s Horizon Robotics | Reuters)。总体来看,基础芯片领域技术实力最强、潜力最大的公司依然是掌握尖端GPU技术的巨头,而中国本土企业正在高性能AI芯片研发布局上加速追赶,以期在特定应用(如自动驾驶、边缘AI)实现突破。

数据供应:AI训练的数据资源

数据是训练AI大模型的“燃料”。过去十年,互联网和物联网的爆炸式发展带来了海量的数据,但高质量、有标注的数据依然稀缺而宝贵。为了训练大模型,业界投入了大量资源进行数据收集和清洗标注,催生了专门的数据标注产业。全球范围内,像美国的Scale AI、澳大利亚的Appen、以及众包平台Amazon Mechanical Turk等为AI项目提供标注服务。这个市场增长迅猛——2024年全球数据采集与标注市场规模约22.3亿美元,预计2030年将增至82.3亿美元,年复合增速达24.1% (2025 Research: Data Collection Labeling Market Projected to)。这一增长动力来自各行业对高质量训练数据的迫切需求,以及自动驾驶、医疗、金融等垂直领域对专业标注数据的要求 (2025 Research: Data Collection Labeling Market Projected to)。

大模型的兴起对数据提出了新要求:一方面,像GPT-3这类模型通过抓取互联网海量文本进行自监督训练,充分利用了无标注的大规模语料;另一方面,在人机对话、医学影像等任务上仍需精细标注的数据来微调模型。为了解决数据不足,业界也探索合成数据、主动学习等技术以提高数据效率 (2025 Research: Data Collection Labeling Market Projected to)。

在中国,得益于庞大网民基数,本土科技公司积累了海量多语言、多模态数据(例如社交媒体、电子商务、视频等)。许多中国AI公司通过众包平台和数据服务商获取标注数据,典型如百度的“众测”平台、阿里巴巴的天池数据竞赛,以及科大讯飞在语音领域的大规模语料库等。政府也支持开放数据集建设,如智源研究院发布了通用大模型训练数据集“悟道”。整体来看,数据供应环节的进入壁垒相对较低,但数据质量和多样性成为区别竞争力的关键因素。有能力积累大规模高质量数据的企业(例如掌握用户规模优势的互联网巨头),在大模型训练中就拥有先发优势。

模型训练与算法开发

模型训练和算法开发是一切AI大模型的核心。在这一环节,近十年的关键词是“规模”和“创新”。一方面,大模型参数规模不断攀升,需要巨量算力训练;另一方面,新算法新架构层出不穷,引领模型性能提升。

在算法方面,深度学习在2012年前后兴起,此后卷积神经网络(CNN)、循环网络(RNN/LSTM)一度主导语音图像任务。2017年Transformer的发明则彻底改变了自然语言处理和多模态领域的范式,使得统一的大模型成为可能。自此,各类预训练模型如BERT、GPT系列横空出世,将NLP任务的效果提升到新水平。强化学习、生成对抗网络(GAN)、Diffusion扩散模型等创新算法也推动了强化决策、图像生成等方向的发展。

训练这些模型所需的计算量指数级增长。OpenAI的统计显示,顶尖AI模型的训练计算需求每3-4个月就翻一倍,高级模型的训练动辄使用上万颗GPU并耗时数周。业界为此开发了分布式训练框架和高性能算法,诸如Google的TensorFlow(2015年开源)和Facebook的PyTorch(2016年开源)大大降低了开发者构建和训练模型的门槛。中国百度推出的飞桨PaddlePaddle框架也在2016年开源,成为国内开发者生态的重要组成。可以说,开源框架与社区协作在算法普及中功不可没。

由于超大模型训练耗资巨大,只有具备雄厚资金和顶尖人才的机构才能参与这场“军备竞赛”。目前全球能自主训练千亿级参数模型的主要是美国的Big Tech(如Google、Meta)、AI独角兽(OpenAI、Anthropic)以及中国的大型科技公司(如百度、阿里巴巴、华为等)和政府支持的研究院(如北京智源的悟道模型)。2023年全球顶尖AI模型中,有61个由美国机构研发,而中国机构贡献了15个 (AI Index Report 2024 – Artificial Intelligence Index)。这一差距反映出中国在最高端算法创新上与美国仍有距离,但已涌现出一批具备大模型研发能力的团队。

中国企业在算法研究上的实力近年快速提升。例如百度多年来投入AI研究,其ERNIE大模型在中英文自然语言理解能力上接近GPT-3.5水平,并率先融合知识增强机制。阿里巴巴达摩院研发了超大规模多模态模型M6和通义千问模型,探索电商推荐、内容生成等应用。华为诺亚方舟实验室推出“盘古”系列大模型,在气象预测、医疗分子等领域取得领先精度。此外,商汤、腾讯等公司也建立了科研团队攻关计算机视觉、3D识别等算法。在全球顶会论文和专利数量上,中国近年已居于前列——大量优秀算法人才活跃在企业和学界,为产业提供创新源泉。

总的来说,模型训练与算法开发环节的竞争力取决于研发投入和人才。能否持续推出性能卓越的新模型,直接体现了一家AI企业的技术硬实力。这一环节中领先的公司,往往也是上下游业务拓展的核心支撑。

算力基础设施:云服务与算力网络

大模型训练和部署需要强大的算力基础设施支持,包括数据中心、云计算平台、高性能网络等。过去十年云计算的蓬勃发展为AI提供了弹性算力,越来越多企业选择在云端训练模型而非自建机房。据统计,2024年上半年用于AI的算力中有72%部署在云端或共享环境,大型云服务商和数字化服务提供商不断扩张AI基础设施 (US leading AI infrastructure market followed by China and Asia-Pacific | Moonshot News)。IDC预测这一比例还将提高,到2028年云端部署将占AI基础设施支出的82% (US leading AI infrastructure market followed by China and Asia-Pacific | Moonshot News)。

全球来看,亚马逊AWS、微软Azure、谷歌云是云基础设施的三巨头,提供从GPU/TPU租赁到完整机器学习平台等服务。它们不仅自有大规模算力,也开发了定制AI芯片(如AWS的Trainium、Inferentia,Google的TPU)来优化成本和性能。在这一领域,中国的阿里云、华为云、腾讯云、百度智能云等崛起迅速。中国公有云市场中,阿里云以约34%的份额领先,华为云、腾讯云紧随其后 (Volkswagen to take 60% stake in $2 bln tech JV with China’s Horizon Robotics | Reuters) (Volkswagen to take 60% stake in $2 bln tech JV with China’s Horizon Robotics | Reuters)。这些云厂商纷纷布局AI算力集群,例如阿里云推出“神龙”GPU云服务器,百度智能云建设了宏大的深度学习计算中心等。不仅企业在推动,政府也发起“东数西算”等工程,在内陆布局大型数据中心集群,为AI和大数据应用提供廉价算力支持。

除了通用云,高性能计算(HPC)中心也为AI研究提供支持。全球最快的超级计算机(如美国的Frontier、中国的天河系列)已广泛用于AI模型训练。许多国家正建设专门的AI超算中心,以满足未来Exa级(百亿亿次)AI计算需求。可以预见,算力基础设施的升级(如更快的网络、更高能效的算力架构)将是支撑AI大模型持续演进的关键。

应用层:AIGC、自动驾驶、医疗AI等

大模型的价值最终通过各种应用场景来体现。在应用层,过去十年多个行业涌现出AI驱动的创新应用。其中生成式AI(AIGC)、自动驾驶和医疗AI是备受关注且与大模型密切相关的领域代表。

AIGC(AI生成内容)

生成式AI是当前最火热的应用方向之一,大模型使得AI可以根据训练知识自主生成文本、图像、音频乃至视频。自从2022年底OpenAI的ChatGPT横空出世,在短短2个月内用户破亿,验证了大模型在人机交互和内容创作上的巨大潜力。如今AIGC应用百花齐放:例如GPT-4可以撰写文章代码,Stable Diffusion和Midjourney能绘制精美图画,音乐生成AI可以作曲配乐。这股热潮也反映在投融资上——2023年全球生成式AI创业融资激增了近8倍,达到约252亿美元 (AI Index Report 2024 – Artificial Intelligence Index)。主要玩家如OpenAI、Anthropic等获得巨额融资,科技巨头也竞相发布自家生成模型(谷歌的Bard/PaLM2、Meta的LLaMA等)。

AIGC正在改变内容生产方式,被视为提高生产力的新工具。企业已经开始将生成式AI用于客服、营销、设计、代码助手等场景,提高效率并节省成本。当然,AIGC的泛化也带来一些挑战,如生成内容的真实性、版权归属、道德安全等,各国监管机构正密切关注。今年中国发布了生成式AI管理暂行办法,要求内容合规和源数据合法合规,体现出在支持创新的同时防范风险的政策导向。

对于市场空间的预期,各种研究非常乐观。麦肯锡预计2030年前生成式AI每年为全球带来2.6万亿到4.4万亿美元价值 (Economic potential of generative AI | McKinsey),其用途覆盖制造、金融、生命科学等几乎所有行业。在中国市场,上千家企业和创业团队涌入AIGC赛道。百度于2023年3月发布了文心一言大模型,并报告已有超过26,000家企业用户使用其生成式AI服务 (China’s Generative AI Ecosystem in 2024: Rising Investment and Expectations | The National Bureau of Asian Research (NBR)),应用开发者数量也快速攀升。阿里巴巴的通义大模型上线仅数月,也宣称已有90,000家企业集成使用,涵盖医疗、交通、游戏等多个行业 (China’s Generative AI Ecosystem in 2024: Rising Investment and Expectations | The National Bureau of Asian Research (NBR))。此外,科大讯飞、腾讯等相继推出中文大模型平台,一批初创公司(如后文提及的智谱AI、MiniMax等)推出各具特色的生成式模型或应用。可以预见,AIGC将在未来几年持续高速成长,并与各行业深度融合,具有扩张潜力的企业有望在这一新兴市场占据重要位置。

自动驾驶

自动驾驶汽车是AI、大模型与机器人技术结合的另一大前沿应用。过去十年自动驾驶取得了长足进步,从最初的原型演示进入试运营阶段。Waymo(谷歌子公司)和Cruise(通用旗下)已经在美国部分城市推出无人驾驶出租车试运营,Tesla也在逐步增强其Autopilot功能。然而,全无人驾驶的普及比早先预期要缓慢,技术和安全法规仍在攻坚。一些创业公司经历了淘汰和整合,但头部玩家的投入未减。Waymo迄今已融资超过110亿美元 (Alphabet’s self-driving unit Waymo closes $5.6 billion funding round)并进行数千万英里路测,通用Cruise累计投入也超100亿美元(包括收购和研发投入)。市场研究预计,到2030年全球Robotaxi市场规模可达数百亿美元乃至更高,年均增长率可能超过50% (Robotaxi Market Size, Share, Growth, Trends & Forecast 2032) (Robo-Taxi Market: Global Industry Analysis and Forecast (2024-2030))。

在中国,自动驾驶也受到政府和企业的高度重视。百度的Apollo自动驾驶平台整合了众多车企和供应商资源,在北京、上海、深圳等多地开展Robotaxi载客试运营。2022年起,百度Apollo和创业公司文远知行(WeRide)等相继获得中国部分城市限定区域的全无人驾驶载客许可,标志着中国Robotaxi迈出关键一步。除百度外,Pony.ai小马智行在广州和加州均有测试运营,其估值一度达到85亿美元 (Pony AI debuts on Nasdaq at $5 billion valuation - CnEVPost)。WeRide文远知行获得雷诺-日产联盟投资,正开发自动驾驶小巴等商用场景。AutoX在深圳等地试点无人出租车业务。总体而言,中国在自动驾驶政策上采取了分区逐步开放的策略,产业界预计2025年前后会有更广泛的商业化试运营。

值得注意的是,自动驾驶不仅依赖感知决策算法,大模型也可应用于仿真训练、路况预测、人机对话(车载AI助手)等方面。自动驾驶生态链很长,包括车规级AI芯片、激光雷达等传感器、整车集成等。其中前文提到的地平线公司,专注车载AI芯片并已为多家主机厂量产供货,在特定细分具有优势 (Volkswagen to take 60% stake in $2 bln tech JV with China’s Horizon Robotics | Reuters)。此外,百度昆仑芯片也用于其自动驾驶计算平台。可以说,自动驾驶领域融合了硬件、软件和数据服务,需要各方面技术强劲的公司通力合作。在这一应用层,中国具备领先优势的公司(如百度Apollo)在本土市场占据先发,未来随着法规逐步放开,这些领军者仍有巨大的扩展空间;同时,一批技术扎实的创业公司也有望在商业化落地中实现飞跃。

医疗AI

医疗健康被视为AI最有社会价值的应用领域之一。利用大模型和AI,可以辅助医生进行诊断决策、药物研发、健康管理等,从而提高医疗效率和准确性。近十年医疗AI取得了一系列进展:在医学影像领域,深度学习模型已经能媲美放射科医生读片水平;在新药发现上,AI帮助筛选分子、预测蛋白结构(如DeepMind的AlphaFold破解了蛋白折叠难题)。各国监管机构也在加快对AI医疗产品的审批。美国FDA截至2024年8月已批准近950种AI/机器学习赋能的医疗器械上市,其中仅2023年一年就有221项获批,而2015年仅有6项 (The number of AI medical devices has spiked in the past decade | MedTech Dive)。这表明医疗AI从实验进入临床的速度在加快。

在中国,医疗AI应用同样蓬勃发展。中国幅员辽阔,优质医疗资源分布不均,AI被寄望于帮助提升基层医疗服务水平。许多中国公司和研究机构开发了面向常见病种的AI辅助诊断系统,例如:依图医疗推出肺癌、乳腺癌AI筛查系统,**推想医疗(Infervision)**的智能影像读片系统已在数百家医院部署,鹰瞳Airdoc的眼底影像AI筛查糖尿病视网膜病变并获得国家药监局III类医疗器械认证。除此之外,还有平安好医生等将AI用于线上问诊分诊,医渡云(Yidu)利用AI分析医疗大数据用于医保和科研决策等。医保局等政府部门也与科技企业合作,用AI模型检测医疗费用异常、辅助健康管理。

医疗AI的发展也需要大量高质量医学数据和严格的验证监管,因此落地较其他互联网AI应用更慢。但正由于壁垒高,率先取得监管批准并证明临床价值的企业将获得先发优势和市场信任。从全球看,GE医疗、西门子医疗等大型医疗设备公司已将AI作为创新卖点,集成到成像设备和诊断软件中 (The number of AI medical devices has spiked in the past decade | MedTech Dive);中国的联影医疗也布局了智能影像系统。可以预见,未来医疗AI会朝**“人机协同”**方向发展:AI辅助医生,使诊疗更加精准高效。在这一领域,拥有医学和AI跨界人才、以及深厚医院合作关系的企业,将最具成长潜力。

企业评估标准

在梳理完产业链各环节的格局和趋势后,我们将基于以下评估标准来挑选中国最具潜力的AI大模型相关企业:

  • 技术实力:这是首要考量。包括核心技术研发能力(算法创新、模型效果)、人才团队水平、知识产权和专利布局等。技术实力强的公司更有可能在激烈竞赛中胜出,并开拓新的应用领域。

  • 融资与资源:公司的融资情况、营收和政府支持等反映了其资金实力和资源调度能力。充足的资金支持意味着能承担大规模研发投入和市场拓展。若公司已经上市或具备稳定营收,也是一种实力体现。

  • 市场份额与地位:考察企业在所属细分市场的占有率或领导地位。例如是否主导了某类产品市场,或其平台拥有的用户规模、生态活跃度。当前已占优势的企业往往有更强的马太效应继续扩大优势。

  • 客户群体与商业化:客户类型和数量反映了企业技术落地能力。如果一家AI公司已服务众多行业头部客户或广泛的中小客户群,意味着其产品成熟度和适用性较高,未来增长更有保障。

综合以上维度,我们将企业分为两类:“领军拓展型”(目前已处于领先地位且有进一步扩张潜力)和**“高速成长型”**(未来几年有望最快发展的新星公司)。以下将列出在中国最具潜力的代表性企业,并给出理由。

中国最具潜力的AI大模型相关企业

领军拓展型企业

  • 百度(Baidu) – 技术全面的AI旗舰: 百度是中国在AI大模型领域投入最早、布局最广的公司之一。其研发的“文心大模型”在中文自然语言处理上处于领先,已推出对话、生成图像等多种大模型应用,并在2023年率先开放企业API服务,报告称已为85,000家企业提供大模型云服务 (China’s Generative AI Ecosystem in 2024: Rising Investment and Expectations | The National Bureau of Asian Research (NBR))。百度还拥有Apollo自动驾驶平台的领先地位,积累了中国最多的路测里程和开放道路运营经验。自主设计的昆仑AI芯片也用于内部大模型训练。凭借搜索和信息流业务,百度手握海量中文数据和场景,可将大模型赋能搜索、云服务、办公等多个领域。目前百度在搜索和AI云市场已是国内领导者,随着大模型技术成熟,有望将优势扩展到企业智能化转型和智能交通等更广阔市场。

  • 阿里巴巴(Alibaba) – 云端生态与大模型应用: 阿里在电商、云计算领域的庞大生态为其AI拓展提供了独特优势。阿里云是国内最大公有云,具备大规模模型训练所需的算力基础和企业客户资源。阿里达摩院研发的通义大模型(Qwen)已开放给开发者使用,并宣称已有超过2.2百万企业通过阿里企业应用钉钉调用其大模型服务 (China’s Generative AI Ecosystem in 2024: Rising Investment and Expectations | The National Bureau of Asian Research (NBR))。阿里将大模型应用在电商商品智能生成描述、客服智能助理等场景,直接提升主营业务效率。此外,阿里旗下平头哥半导体研发NPU芯片用于云端推理,菜鸟物流利用AI优化供应链,其业务链各环节都在叠加AI能力。阿里技术实力强(多次拿下国际AI比赛冠军),又有电商金融等营收支撑,将大模型融入电商、云、办公软件等产品后,有巨大的变现空间。作为国内科技巨头,阿里目前虽不以AI见长,但凭借云基础设施和企业客户基础,未来完全可能成长为**“AI即服务”**的领军提供商。

  • 华为(Huawei) – 软硬结合的创新引擎: 虽然华为因众所周知的原因在手机领域遇挫,但在AI领域依然具备深厚实力。其开发的昇腾AI训练芯片和麒麟芯片中的NPU使华为拥有硬件优势,配合自研的MindSpore框架,构建了自主可控的AI平台。华为云推出“盘古”系列大模型,涵盖NLP、CV和科学计算多个方向,在产业应用上强调与行业Know-how结合(如盘古气象、矿山模型等)。华为还将大模型融入自家产品,例如客服机器人、智慧汽车方案(HI智驾系统)中。技术上,华为具备全球领先的通信技术和算法工程化能力,其诺亚方舟实验室在CVPR、ICML等AI顶会上有大量成果发表。虽然芯片供应受限可能影响其算力规模,但华为庞大的研发投入和国家支持使其在AI核心技术上持续突破。作为少数能打通“芯-端-云-用”全栈的公司,华为一旦在算法上实现差异化创新(例如AI+5G网络优化、边缘AI大模型),就有潜力重新定义市场格局。考虑到华为在国内政企市场的信任度和渠道,其AI解决方案在智慧城市、安防、制造等领域已经占有相当市场。未来几年,华为很可能依托自身硬件+算法的一体化能力,在AI算力基础设施和行业大模型应用两方面大有可为。

  • 腾讯(Tencent) – 海量数据与应用平台: 腾讯作为中国最大互联网公司之一,拥有社交(微信/QQ)、游戏、内容等海量用户和数据,在AI应用上有天然优势。腾讯AI Lab和优图实验室在计算机视觉和语音方面起步早(人脸识别、语音合成技术国内领先),近年来也投入大模型研发,2023年发布了混元大模型。虽然腾讯在大模型竞争中声音相对低调,但不能忽视其强大的应用落地能力——例如将NLP模型应用于微信的智能客服、内容审核,或在游戏中生成NPC对话和场景。腾讯云也提供AI开发平台和预训练模型接口。值得一提的是,腾讯对于前沿技术通常采取“后来居上”策略,通过投资并购和内部孵化迅速赶超。它已投资多家AI初创,如支持了智源研究院和多家大模型创业公司 (China’s Generative AI Ecosystem in 2024: Rising Investment and Expectations | The National Bureau of Asian Research (NBR))。加上腾讯庞大的现金储备和用户生态,一旦找到大模型在社交娱乐领域的爆发点(例如AI助手深度融入微信工作流),腾讯的增长潜力不可小觑。当前腾讯在社交和游戏领域占据主导,但在产业AI云市场份额稍逊阿里、百度——这也意味着扩张空间。凭借技术人才储备和产品优势,腾讯完全有机会在后续的大模型竞赛中取得突破,从而进一步巩固其在中国数字经济中的核心地位。

  • 科大讯飞(iFLYTEK) – 语音智能龙头转战大模型: 科大讯飞是中国语音识别与合成领域的绝对领导者,中文语音技术全球领先。长期深耕语音AI使其积累了海量语料和先进算法,技术实力雄厚。2023年讯飞发布了“星火认知大模型”,标志着从语音AI向通用大模型迈进。星火在中文理解和代码能力等方面表现出色,被认为是本土有力的ChatGPT竞争者之一。科大讯飞的优势在于教育、政务等行业客户基础:其智慧课堂、会议转写、智能客服等产品覆盖众多学校和政府机构。一旦大模型技术成熟,讯飞可以迅速将之融入其教育助手、办公套件、车载语音助手等已有产品,为客户提供升级服务。例如,星火模型已用于安徽高考的作文智能批改试点。这种垂直整合能力,使得讯飞的大模型有直接的应用场景,不像纯互联网聊天机器人那样缺少变现渠道。加上科大讯飞作为上市公司财务稳健,也获得政府专项支持研发认知大模型,在国产AI软件阵营里扮演排头兵角色。因此,科大讯飞凭借过硬技术和明确应用方向,有望在大模型时代拓展其从语音到多模态认知的版图,成为中国认知智能产业的重要引擎。

  • 商汤科技(SenseTime) – 计算机视觉独角兽转型: 商汤是亚洲最大的纯AI算法公司,以人脸识别和视觉分析起家,2018年曾以超过45亿美元估值成为全球估值最高的AI初创公司 (World’s Most Valuable AI Startup Is Chinese and Alibaba-Backed)。商汤拥有庞大的算法团队和深厚的学术背景支持,在计算机视觉领域技术全球领先(人脸检测、姿态估计等多项世界第一)。它的平台和方案已经服务安防、手机、金融等行业数百家客户。近年来商汤将业务从视觉拓展到大模型和通用AI平台,推出了“商汤日日新大模型(SenseNova)”体系,包括文本、大图像生成、数字人等模型。依托过往项目积累的数据与场景,商汤可以训练具有行业特色的大模型(如精准的安防视频解析算法、多模态的AR/VR内容生成)。商汤的优势在于产研一体化:既有顶尖研发(累计发表论文数量世界前列),也有丰富的落地经验和渠道(覆盖智慧城市、手机终端等)。尽管受到海外制裁影响,其海外扩张受限,但中国市场依然巨大。凭借在视觉AI已有的主导地位和对新技术的快速跟进(例如发布了类ChatGPT的对话模型),商汤有潜力将业务从“赋能行业的算法供应商”升级为“提供通用AI能力的平台型公司”。当前它在细分市场已举足轻重,未来若其大模型技术取得突破,完全可能进军云服务、内容生成等更大增量空间。

高速成长型企业

  • 第四范式(4Paradigm) – 企业AI赋能者: 第四范式成立于2014年,是专注企业级AI解决方案的平台型公司。其核心产品是自动机器学习平台,帮助金融、零售等传统行业客户低门槛地开发和部署AI模型。第四范式技术团队来自百度等顶尖互联网公司,具有强算法实力,在AutoML(自动建模调参)领域居于全球前沿。在商业上,该公司已服务银行、保险、制造等众多头部客户,实现可观收入,并于2023年在香港上市募资(估值数十亿港元) (Chinese AI firm Fourth Paradigm leads Hong Kong IPO surge to raise $280 million | Reuters) (Chinese AI firm Fourth Paradigm leads Hong Kong IPO surge to raise $280 million | Reuters)。值得关注的是,第四范式也在布局大模型,与阿里云等合作推出面向企业的预训练模型解决方案。作为少数实现盈利和上市的AI独角兽,第四范式展现出强执行力。随着大模型在企业服务中的需求爆发(如金融风控、用户画像等),第四范式可以将AutoML与预训练模型相结合,占领“AI即服务”市场的高地。其融资背后有红杉、联想等知名投资者加持,显示出资本对其成长性的认可。在AI To B赛道上,第四范式已经占据领先,未来随着更多企业上云和AI化,该公司营收和规模有望持续高速增长。

  • 智谱AI(Zhipu AI) – 大模型新锐: 智谱AI是中国较早专注大语言模型的创业公司,由清华大学计算机教授创办。该团队研发的GLM系列开源大模型(如ChatGLM)在中文问答对话上表现优异,一经推出就在社区引发关注。智谱AI背靠清华的学术资源,聚集了NLP顶尖人才,并获得了腾讯等大厂投资 (Chinese AI startups make gains in challenge to US-based OpenAI)。目前智谱AI估值已超20亿元人民币(约合2.7亿美元) (Chinese AI startups make gains in challenge to US-based OpenAI),成为大模型领域的明星创业公司之一。它与多家行业客户合作,将通用大模型与医疗、金融等专业知识结合,探索“专用大模型”落地路径。作为创业公司,智谱AI的优势在于技术单点突破:其开源中文对话模型一度是国内体验最接近ChatGPT的方案,圈粉大量开发者。这种技术影响力有助于其快速建立生态和品牌。可以预见,在国家鼓励发展基础模型的大背景下,智谱AI有望获得更多资源,加速迭代模型规模和性能,抢占国内大模型高地。在未来几年,它有潜力发展成为“中国的OpenAI”式的领导企业之一。

  • 百川智能(Baichuan AI) – 连续创业者的新挑战: 百川智能由前搜狐CEO王小川于2023年创立,短时间内研发出多款高性能中文大模型(7B、13B参数量级),并开源供社区使用。这家公司创立即获得多家知名VC投资,估值跃升为独角兽级别,展现出市场对成功企业家+顶尖团队组合的信心。百川智能的人才主要来自互联网大厂AI部门和研究机构,善于工程实现和产品落地。王小川的战略是走开源和开放路线,快速迭代模型吸引开发者。今年其开源模型在权威评测中逼近GPT-3.5水平,一定程度上缓解了国内缺少优质基础模型的困境。百川智能虽然成立不久,但增长势头迅猛,被视为中国大模型赛道的“黑马”之一。未来随着模型能力提升和生态完善,百川可能探索云端API服务、行业定制等商业模式,实现从技术影响力向商业价值的转化。鉴于创始团队丰富的创业及管理经验,如果能跨过技术和市场推广的门槛,百川智能成长为头部AI公司指日可待。

  • MiniMax – 隐秘而强大的AI力量: MiniMax是一家低调但估值快速攀升的AI创业公司,创始团队来自于商汤、Face++等知名AI企业。该公司专注通用人工智能Agent的研发,曾推出过在社交媒体爆红的对话机器人应用,在体验上逼近ChatGPT,被视为国内技术实力顶尖的初创之一。MiniMax目前融资估值已达十亿美元级别,同时保持对外神秘,产品多在灰度测试。它的理念是在多模态和连续对话上实现突破,打造可持续进化的AI助手。这种定位如果成功,将产生极大的商业价值(想象个人AI助理的市场)。MiniMax有一支追求长期技术理想的团队,不急于变现,而是潜心打磨技术。资本市场对其投入也带有一些赌未来的意味。尽管存在不确定性,但如果MiniMax的通用AI技术取得领先,其成长速度可能呈指数级,并威胁现有巨头的地位。在“中国版OpenAI”的竞逐中,MiniMax无疑是不能忽视的竞争者之一,具备成为未来行业颠覆者的潜质。

  • 寒武纪科技(Cambricon) – 本土AI芯片先锋: 寒武纪是中国第一家以AI芯片为主业上市的公司,曾为华为手机提供NPUIP,后拓展云端训练芯片。寒武纪的云端MLU系列芯片已经迭代多代,最新产品在ResNet训练性能上接近NVIDIA主流GPU。这家公司技术底蕴源自中科院计算所,多项架构设计独树一帜(如MLU的脑神经元计算架构)。尽管受限于工艺和生态,目前寒武纪在高端市场份额有限(2022年仅占中国加速卡市场1% (IDC:2022上半年到2023年上半年中国AI服务器市场规模成长了54% | 互联网数据资讯网-199IT | 中文互联网数据研究资讯中心-199IT)),但国家和资本持续支持其研发。随着国内大模型算力需求暴涨,寒武纪有望在政府项目、特定行业私有化部署等场景赢得订单,从而实现业绩飞跃。寒武纪的成长性还体现在边缘端芯片业务(思元系列)上,AIoT市场空间广阔。作为国产AI芯片的代表,如果寒武纪能在制程和生态上取得突破,未来有潜力向国内“AI芯片龙头”迈进,支撑起中国大模型所需的算力底座。

  • 地平线机器人(Horizon Robotics) – 汽车智能芯片新秀: 地平线专注于自动驾驶和车载AI芯片,是本土少数实现大规模前装量产的AI芯片企业。其Journey系列车规级AI芯片已装载在数十款中国品牌汽车上,用于高级驾驶辅助系统(ADAS)的感知计算。在与国际巨头竞争中,地平线凭借本土化支持和性价比取得一定优势。尤其值得一提的是,大众汽车于2022年宣布对地平线投资约24亿欧元并成立合资公司,大众将持股60%共同开发面向中国市场的自动驾驶芯片 (Volkswagen to take 60% stake in $2 bln tech JV with China’s Horizon Robotics | Reuters)。这一合作使地平线获得世界级车厂的背书和资金,为其技术加速提供了有力支撑。随着汽车“新四化”(电动化、智能化等),车载AI芯片市场未来几年将高速增长。地平线目前在国内ADAS芯片出货量名列前茅,已进入快速收获期。同时公司正研发更高算力的车载芯片,以支持L3/L4级自动驾驶需求。如果成功,地平线将从ADAS供应商成长为无人驾驶核心计算平台提供商,想象空间巨大。因此在AI+汽车这一关键赛道,地平线无疑是中国最值得关注和看好的公司之一。

  • 医疗AI新锐(如鹰瞳Airdoc、医渡云等)– 深耕垂直场景: 在医疗AI领域,也有一些高速成长的中国企业值得一提。鹰瞳Airdoc作为专注眼科AI的公司,率先拿到国家药监局最高级别认证,其产品已在体检中心和基层筛查广泛应用,上市后保持高速业绩增长。医渡云Yidu深耕医疗大数据和AI分析,服务医院和政府,在香港上市后继续拓展医院客户和商业保险场景。这些公司规模不如前述互联网巨头,但在垂直领域扎根,建立起数据和算法壁垒。一旦医疗AI应用规模化(如慢病筛查纳入常规体检、医院全面应用AI读片),这些先行者的业绩可能出现跳变式增长。此外,大模型在医疗领域的出现(如辅助诊疗对话、医学文献分析)也为垂直医疗AI公司提供了二次腾飞的契机。如果它们能将通用大模型与专业医疗知识相结合,推出医生信赖的产品,那么业务边界将从单点扩展到整个医疗服务流程,成长前景广阔。鉴于医疗AI市场相对保守,这类公司的爆发可能稍滞后于其他AI应用领域,但正是当前布局者未来将最先受益。

(以上列举并非穷尽所有有前景的企业,但代表了各细分赛道中最具潜力的一批中国公司。它们要么已经在市场上取得领先且有更大扩张空间,要么在核心技术上厚积薄发、有望实现跨越式成长。)

综合结论

通过对全球AI大模型产业链的梳理,我们看到:算力芯片、数据资源、算法开发、基础设施和应用场景构成了一个环环相扣的生态体系。近十年来各环节都发生了巨大的变化——芯片性能飞跃和国产替代兴起,数据标注行业快速成长,算法从局部感知进化到通用认知,大模型训练对云计算提出新要求,生成式AI等应用迎来爆发。在这股浪潮中,中国的AI产业参与者从追随逐步走向引领,本土出现了一批在细分领域具备世界水准的企业。

本报告按照技术实力、融资、市场和客户等维度评估,筛选出了两类中国最具潜力的AI企业:一类是行业领军者,如百度、阿里巴巴、华为、腾讯、科大讯飞、商汤等,它们在各自领域已占据优势地位,并通过大模型技术的布局,有望开拓新的增长曲线;另一类是高速成长的新秀,如第四范式、智谱AI、百川智能、MiniMax、寒武纪、地平线等,它们以卓越的技术创新或独特的场景切入,在大模型时代迅速崛起,可能成为未来的巨头。上述企业各具优势:有的掌控核心算力和平台,有的精通垂直行业Know-how,有的聚焦前沿算法突破。这些不同类型的企业共同构成了中国AI大模型生态的希望。

需要强调的是,AI产业仍存在不确定性和信息不完全。例如,有些公司的实际大模型研发进展和商业化收入数据并未充分披露,外部评估存在局限;再如,全球政治环境和贸易限制也会影响技术供应链,进而影响企业成长路径。尽管如此,我们基于目前掌握的数据和趋势进行了尽可能理性的分析。在可以预见的将来,技术实力过硬且善于商业落地的企业将脱颖而出,引领中国乃至全球AI大模型产业的发展方向。而那些暂时落后的企业,如果无法弥补技术差距或找到差异化赛道,可能在新一轮竞争中被淘汰。

综上所述,中国AI大模型产业链已经具备从底层到应用的完整布局。一批兼具技术与市场优势的本土公司正蓄势待发,有望在全球AI竞争中取得更大话语权。从芯片到大模型,再到千行百业的智能化转型,中国企业都有机会参与并领先。持续的研发投入、开放的合作生态以及理性的监管支持,将是催生下一代AI领军企业的关键。我们对此抱有充分的信心,并期待这些最具潜力的中国公司在未来创造出更大的价值和影响力。

那么,如何系统的去学习大模型LLM?

作为一名深耕行业的资深大模型算法工程师,我经常会收到一些评论和私信,我是小白,学习大模型该从哪里入手呢?我自学没有方向怎么办?这个地方我不会啊。如果你也有类似的经历,一定要继续看下去!这些问题啊,也不是三言两语啊就能讲明白的。

所以我综合了大模型的所有知识点,给大家带来一套全网最全最细的大模型零基础教程。在做这套教程之前呢,我就曾放空大脑,以一个大模型小白的角度去重新解析它,采用基础知识和实战项目相结合的教学方式,历时3个月,终于完成了这样的课程,让你真正体会到什么是每一秒都在疯狂输出知识点。

由于篇幅有限,⚡️ 朋友们如果有需要全套 《2025全新制作的大模型全套资料》,扫码获取~
在这里插入图片描述

👉大模型学习指南+路线汇总👈

我们这套大模型资料呢,会从基础篇、进阶篇和项目实战篇等三大方面来讲解。
在这里插入图片描述
在这里插入图片描述

👉①.基础篇👈

基础篇里面包括了Python快速入门、AI开发环境搭建及提示词工程,带你学习大模型核心原理、prompt使用技巧、Transformer架构和预训练、SFT、RLHF等一些基础概念,用最易懂的方式带你入门大模型。
在这里插入图片描述

👉②.进阶篇👈

接下来是进阶篇,你将掌握RAG、Agent、Langchain、大模型微调和私有化部署,学习如何构建外挂知识库并和自己的企业相结合,学习如何使用langchain框架提高开发效率和代码质量、学习如何选择合适的基座模型并进行数据集的收集预处理以及具体的模型微调等等。
在这里插入图片描述

👉③.实战篇👈

实战篇会手把手带着大家练习企业级的落地项目(已脱敏),比如RAG医疗问答系统、Agent智能电商客服系统、数字人项目实战、教育行业智能助教等等,从而帮助大家更好的应对大模型时代的挑战。
在这里插入图片描述

👉④.福利篇👈

最后呢,会给大家一个小福利,课程视频中的所有素材,有搭建AI开发环境资料包,还有学习计划表,几十上百G素材、电子书和课件等等,只要你能想到的素材,我这里几乎都有。我已经全部上传到CSDN,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费
在这里插入图片描述
相信我,这套大模型系统教程将会是全网最齐全 最易懂的小白专用课!!

Logo

欢迎加入 MCP 技术社区!与志同道合者携手前行,一同解锁 MCP 技术的无限可能!

更多推荐