企业如何选择大模型的建设路径？

企业可以直接使用嵌入了大模型的商业应用，例如金山办公WPS AI目前在底层嵌入了MiniMax、文心一言等大模型。

程序员鑫港

1793人浏览 · 2024-11-30 16:04:38

程序员鑫港 · 2024-11-30 16:04:38 发布

大模型领域目前正处于快速发展阶段，企业需要保持对新技术、新趋势的跟踪从而制定大模型应用战略，并定期更新战略。

前排提示，文末有大模型AGI-CSDN独家资料包哦！

对企业而言，大模型的建设路径有多种，企业需要了解每种大模型建设路径的技术差异以及优缺点，考虑所有关键因素，由此选择最合适企业的大模型建设路径。

企业大模型的建设路径

目前，企业建设大模型的路径方式主要有5种：

（1）购买嵌入了大模型的应用

定义：

企业可以直接使用嵌入了大模型的商业应用，例如金山办公WPS AI目前在底层嵌入了MiniMax、文心一言等大模型。

优势：

•企业可以以非常低的成本甚至零成本的方式体验大模型的能力；

• 基于大模型的应用所提升的能力将直接转换为用户的使用价值，而用户无需为底层大模型付出额外成本；

• 基本不会改变用户现有的工作流程。

不足：

• 缺乏灵活性，无法构建超出标准应用功能之外的工作流程，也无法将大模型的能力扩展到应用之外；

• 嵌入大模型的应用在理解和生成上下文准确响应方面存在固有局限性；

• 企业对数据安全和隐私保护的控制能力较弱，依赖于应用提供商对数据安全和隐私保护的控制措施。

（2）调用大模型的API接口

定义：

企业可以通过调用基础大模型API来构建自己的应用，然后通过提示工程进行进一步优化，引导大模型生成有效输出。

优势：

• 企业可以利用大模型快速创建一个定制化的应用，将大模型使用到现有产品中，只需要为模型的使用付费，而无需为其训练付费；

• 大模型可以通过小样本学习调优，允许大模型在只有少量示例的情况下进行学习和推理，并按预期完成任务；

• 提示工程为企业提供了一种灵活且轻量级的方法，通过改变问题的描述方式去影响模型内部的运行，从而改变输出，提示工程并不会改变模型本身，对企业而言简化了模型管理和治理的工作。

不足：

• 提示工程需要使用企业自身的数据进行训练，可能导致提示词和本地数据泄露的风险；

• 提示工程是一个新兴学科，具备相关技能的人才稀缺，提示词工作依赖于经验，因此需要大量的实验和探索；

• 提示词数据有限，可能会限制通过提示工程优化模型的范围，而且提示工在不同的模型中的表现可能会有很大差异；

• 向后兼容性问题，供应商必须继续支持旧版本的模型，否则会影响基于模型建立的应用。

（3）通过信息检索扩展大模型

定义：

检索增强生成使企业可以通过外挂数据库的方式将企业自有知识补充到大模型中，并将检索添加到提示中来增强提示词，提高特定任务领域大模型的响应质量。

优势：

• 通过RAG（检索增强生成）进行数据检索，企业可以将基础模型训练数据之外的其他数据纳入到模型中，解决了大模型的容量限制；

• 通过RAG的方式扩展大模型，为企业提供了一种将企业私有数据“外挂”到基础大模型的方式，使企业不需要为了特定任务重新训练整个大模型（微调或从头构建）；

• 通过及时增强模型，可以优化大模型在特定任务领域的输出，改善模型幻觉问题。

不足：

• RAG 方法受限于上下文窗口，限制了可发送给模型的检索信息量。同时，增强提示的额外检索步骤可能会导致延迟，影响应用过程中模型反馈的及时性；

• 使用RAG方法需要重新设计技术架构和工作流程，接入新的技术组件如向数据库、embedding模型等，增加这些技术组件会带来额外的成本；

• 企业需要在访问控制、信息检索、检索输出监控等方面建立防护机制，避免敏感信息泄露问题。

（4）在大模型的基础上微调

定义：

在大型预训练基础模型之上，将领域知识或企业知识喂给模型进行进一步训练，形成定制的领域大模型或企业大模型。

优势：

• 通过使用企业私有数据或特定领域数据对特定任务进行微调，可以提高特定任务的性能，减少模型幻觉；

• 与从头训练一个基础大模型所需要的数据相比，微调通常不需要大量数据（但是数据必须是高质量的）；

• 目前市场上有很多参数量更小但性能更高的开源大模型，例如Llama2等，这使得微调大模型变得更加可行且投入产出比更高。

不足：

• 将领域知识或企业自有知识注入大模型具有较大的挑战，需要大规模的微调数据集、大量的计算资源和扩展预训练。微调模型仍然是拥有数十亿参数的大模型，需要经过优化才能实现大规模应用；

• 企业在某一特定基础大模型上进行微调，如果未来出现更好用的基础大模型，切换成本较高；

• 针对特定任务进行微调的基础模型可能会使模型过于专业化，微调数据集可能无法覆盖所有变化和复杂性，导致模型在出现新情况下的泛化能力不足。

（5）自建基础大模型

定义：

企业按照自己的数据和业务领域，从0到1训练一个专属于企业的基础模型，这需要投入大量的算力、人力和资金。

优势：

• 模型完全根据企业自身需求和目标进行个性化定制，相较于其他建设路径，可以更好的适应特定的业务问题；

• 与同行相比，企业自主构建大模型可以产生技术和创新方面的差异化竞争优势，如果基础大模型具有足够强的性能，在特定领域表现足够出色，就有可能实现商业化。

不足：

• 训练和维护大模型的成本非常高，包括基础算力、数据获取、标注、模型质量的人工审核以及推理成本等；

• 企业自主构建大模型并定期维护和更新模型需要具备足够多的技术人才，而这些人才往往是稀缺的；

• 大模型市场目前正快速发展，对于大多数企业而言，外部技术供应商的创新速度远超企业内部的创新速度，企业从头自建大模型未必是最合理的决定。

企业大模型建设路径的决策框架

不同的大模型建设路径之间不是互斥关系，企业根据实际业务需求、企业技术能力、资源情况等选择其中的一种或几种。在选择建设路径时，企业需要考虑的关键因素包括：领域数据、使用 成本、数据安全与隐私保护、模型输出质量。

第一，领域数据。 大多数基础大模型都是都是通用大模型，虽然具有较强的泛化能力，但在特定任务上往往表现一般。

企业可以通过RAG、微调或者自建大模型的方式将领域数据或企业自有数据注入到大模型中，从而保证在某些任务下与需求更匹配。目前市场上一些大模型提供商也在开发垂直领域大模型并提供基础大模型的垂直行业解决方案，不仅具备强大的基础模型能力，也更加符合企业业务需求。

第二，使用成本。

• 使用嵌入了大模型的应用和调用大模型的API接口都不会产生模型训练成本，但会有使用成本或订阅费用。

• 在进行提示工程时，每次修改人工创建的提示词时会产生推理成本，但由于提示工程不会更新模型参数，因此成本不高。

• 数据检索会在模型提示词中添加更多数据，从而增加推理成本。

• 微调的成本与模型参数量有关，超过数十亿参数的模型，微调成本会很高。

• 企业自建基础大模型的成本非常之高。

第三，数据安全与隐私保护。 隐私安全和数据安全是企业使用大模型时必须要注意的问题，在引入大模型之前，企业需要考虑大模型可能对数据安全带来的风险。企业建立自己的模型或通过微调创建模型可以加强对数据的控制，并在安全措施方面具有更强的灵活性。企业需要建立相应的安全风险评估框架，建立模型的安全主内机制，对引入的大模型进行安全风险评估，确保模型满足监管合规要求。

第四，模型输出控制。 模型输出质量非常重要，但大模型固有的事实幻觉、输出内容不稳定等问题短期内难以完全解决，尤其是直接面向客户的场景，企业直接使用大模型可能无法提供确定性的服务。在对模型输出质量要求较高的场景，RAG、微调或自建大模型可能是企业最好的选择。大模型目前无法做到100%的正确，因此在一些关键业务场景，需要有人工的参与。

读者福利：如果大家对大模型感兴趣，这套大模型学习资料一定对你有用

对于0基础小白入门：

如果你是零基础小白，想快速入门大模型是可以考虑的。

一方面是学习时间相对较短，学习内容更全面更集中。
二方面是可以根据这些资料规划好学习计划和方向。

包括：大模型学习线路汇总、学习阶段，大模型实战案例，大模型学习视频，人工智能、机器学习、大模型书籍PDF。带你从零基础系统性的学好大模型！

😝有需要的小伙伴，可以保存图片到wx扫描二v码免费领取【保证100%免费】🆓

👉AI大模型学习路线汇总👈

大模型学习路线图，整体分为7个大的阶段：（全套教程文末领取哈）

第一阶段： 从大模型系统设计入手，讲解大模型的主要方法；

第二阶段： 在通过大模型提示词工程从Prompts角度入手更好发挥模型的作用；

第三阶段： 大模型平台应用开发借助阿里云PAI平台构建电商领域虚拟试衣系统；

第四阶段： 大模型知识库应用开发以LangChain框架为例，构建物流行业咨询智能问答系统；

第五阶段： 大模型微调开发借助以大健康、新零售、新媒体领域构建适合当前领域大模型；

第六阶段： 以SD多模态大模型为主，搭建了文生图小程序案例；

第七阶段： 以大模型平台应用与开发为主，通过星火大模型，文心大模型等成熟大模型构建大模型行业应用。

👉大模型实战案例👈

光学理论是没用的，要学会跟着一起做，要动手实操，才能将自己的所学运用到实际当中去，这时候可以搞点实战案例来学习。

在这里插入图片描述

👉大模型视频和PDF合集👈

观看零基础学习书籍和视频，看书籍和视频学习是最快捷也是最有效果的方式，跟着视频中老师的思路，从基础到深入，还是很容易入门的。
在这里插入图片描述

👉学会后的收获：👈

• 基于大模型全栈工程实现（前端、后端、产品经理、设计、数据分析等），通过这门课可获得不同能力；

• 能够利用大模型解决相关实际项目需求： 大数据时代，越来越多的企业和机构需要处理海量数据，利用大模型技术可以更好地处理这些数据，提高数据分析和决策的准确性。因此，掌握大模型应用开发技能，可以让程序员更好地应对实际项目需求；

• 基于大模型和企业数据AI应用开发，实现大模型理论、掌握GPU算力、硬件、LangChain开发框架和项目实战技能， 学会Fine-tuning垂直训练大模型（数据准备、数据蒸馏、大模型部署）一站式掌握；

• 能够完成时下热门大模型垂直领域模型训练能力，提高程序员的编码能力： 大模型应用开发需要掌握机器学习算法、深度学习框架等技术，这些技术的掌握可以提高程序员的编码能力和分析能力，让程序员更加熟练地编写高质量的代码。

👉获取方式：

😝有需要的小伙伴，可以保存图片到wx扫描二v码免费领取【保证100%免费】🆓

MCP技术社区

欢迎加入 MCP 技术社区！与志同道合者携手前行，一同解锁 MCP 技术的无限可能！

更多推荐

8种封装的1700V国产碳化硅(SiC)功率模块产品介绍及应用

MCP技术社区

（一篇入门）汽车电子电器之电机MCU控制器四

MCP技术社区

基于Echarts的甘特图实现与封装实战

Echarts（Enterprise Charts）是由百度开源的一款功能强大、高度可定制的JavaScript数据可视化库，广泛应用于各类企业级Web应用中。其核心设计理念是“以数据驱动视图”，通过声明式配置即可实现复杂图表的渲染与交互。在现代前端工程化背景下，Echarts不仅支持静态图表展示，更具备动态更新、大数据量处理和跨平台兼容等高级能力，成为构建高性能数据看板、实时监控系统和项目管理工