大模型私有化部署0基础指南，“草履虫”都学会了

科技的巨轮滚滚而来，据不完全统计，中国已经发布了近40个类ChatGPT的大模型产品，从文本生成、专业翻译到图片视频的生成剪辑，AI大模型水平已进入了百花齐放的阶段，达到可商业化水平。“逆势而为，不如审时度势，顺流而下”，未来必定是属于善于使用大模型的人，今天我们尝试对其进行探索性实验，来更了解大模型的特性。大模型的使用必将包含三个阶段：直接使用使用 API 定制自己的应用离线部署+微调，实现私有

咔咔学姐kk

984人浏览 · 2024-06-26 17:31:05

咔咔学姐kk · 2024-06-26 17:31:05 发布

【写在前边】

▋ 大模型使用的三个阶段

大模型的使用必将包含三个阶段：

直接使用
使用 API 定制自己的应用
离线部署+微调，实现私有数据模型化

我们将分阶段讨论大模型的离线部署+微调，今天先从0开始离线部署大模型。

[环境安装和配置]

–

本文以清华大学开源的 ChatGLM-6B 语言模型为例。ChatGLM-6B 是一个开源的、支持中英双语的对话语言模型，基于 General Language Model (GLM) 架构，具有 62 亿参数。结合模型量化技术，用户可以在消费级的显卡上进行本地部署。

实验使用的环境如下：

Windows11
Intel 13700KF
32G内存
RTX 3090 24G显存

ChatGLM-6B 可在最小 6GB 显存运行。如果没有合适的显卡或者想体验完整版，可以购买云服务商的 A100 GPU 服务器试用。以阿里云为例，最便宜的每小时 38 元左右。

【安装 Python】

Python 官网下载并安装 Python，记得选上“Add python.exe to PATH”。

【安装 CUDA】

由于 PyTorch 最新只能支持 11.8 的显卡驱动，不能安装最新版 CUDA。

在 Nvidia 官网下载 11.8 的 CUDA Toolkit Archive。

【安装 PyTorch】

在 PyTorch 官网执行对应版本的安装命令。

  
pip3 install torch torchvision torchaudio --index-url https:/  
/download.pytorch.org/whl/cu118

【安装 git】

从 git 官网下载 git

【部署代码】

–

Clone 代码

使用 git clone 对应的代码： git clone https://github.com/THUDM/ChatGLM-6B.git



**【安装依赖】**

  

cd ChatGLM-6B  

  

pip install -r requirements.txt

【下载模型】

代码在执行时默认自动下载模型。如果没有使用魔法，你需要手动下载模型。在清华大学云盘下载模型，假设下载到 D:\chatglm-6b-models

【运行代码】

启动 Python



python

hello world

依次输入下列代码：

from transformers import AutoTokenizer, AutoModel  
tokenizer = AutoTokenizer.from\_pretrained(r"D:\\chatglm-6b-models", trust\_remote\_code=True)  
model = AutoModel.from\_pretrained(r"D:\\chatglm-6b-models", trust\_remote\_code=True).half().cuda()  
model = model.eval()  
response, history = model.chat(tokenizer, "你好", history=\[\])  
print(response)

ChatGLM-6B 返回了“你好👋！我是人工智能助手 ChatGLM-6B，很高兴见到你，欢迎问我任何问题。”。至此，大语言模型的离线部署就实现了。我们可以发挥我们的聪明才智，让它给我们工作了。

【长文本生成】

让 ChatGLM-6B 为我们生成一篇文章。

经过大约10秒钟后，文章生成。看结果还是很不错的。

在任务管理器里查看显卡运行情况，使用了约 13G 的显存。

【后记】

离线部署大预言模型还是比较简单的。这为我们后续的微调提供了基础。接下来，我们将为大家介绍 ChatGLM-6B 微调的详细操作，敬请期待。

END

那么，如何系统的去学习大模型LLM？

我在一线互联网企业工作十余年里，指导过不少同行后辈。帮助很多人得到了学习和成长。

作为一名热心肠的互联网老兵，我意识到有很多经验和知识值得分享给大家，也可以通过我们的能力和经验解答大家在人工智能学习中的很多困惑，所以在工作繁忙的情况下还是坚持各种整理和分享。

但苦于知识传播途径有限，很多互联网行业朋友无法获得正确的资料得到学习提升，故此将并将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。

所有资料 ⚡️ ，朋友们如果有需要全套《LLM大模型入门+进阶学习资源包》，扫码获取~

篇幅有限，部分资料如下：

👉LLM大模型学习指南+路线汇总👈

💥大模型入门要点，扫盲必看！
在这里插入图片描述
💥既然要系统的学习大模型，那么学习路线是必不可少的，这份路线能帮助你快速梳理知识，形成自己的体系。

👉大模型入门实战训练👈

💥光学理论是没用的，要学会跟着一起做，要动手实操，才能将自己的所学运用到实际当中去，这时候可以搞点实战案例来学习。
在这里插入图片描述

👉国内企业大模型落地应用案例👈

💥《中国大模型落地应用案例集》 收录了52个优秀的大模型落地应用案例，这些案例覆盖了金融、医疗、教育、交通、制造等众多领域，无论是对于大模型技术的研究者，还是对于希望了解大模型技术在实际业务中如何应用的业内人士，都具有很高的参考价值。 （文末领取）
在这里插入图片描述
💥《2024大模型行业应用十大典范案例集》 汇集了文化、医药、IT、钢铁、航空、企业服务等行业在大模型应用领域的典范案例。

在这里插入图片描述

👉LLM大模型学习视频👈

💥观看零基础学习书籍和视频，看书籍和视频学习是最快捷也是最有效果的方式，跟着视频中老师的思路，从基础到深入，还是很容易入门的。 （文末领取）
在这里插入图片描述

👉640份大模型行业报告👈

💥包含640份报告的合集，涵盖了AI大模型的理论研究、技术实现、行业应用等多个方面。无论您是科研人员、工程师，还是对AI大模型感兴趣的爱好者，这套报告合集都将为您提供宝贵的信息和启示。
在这里插入图片描述

👉获取方式：

这份完整版的大模型 LLM 学习资料已经上传CSDN，朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【`保证100%免费`】

😝有需要的小伙伴，可以Vx扫描下方二维码免费领取🆓

MCP技术社区

欢迎加入 MCP 技术社区！与志同道合者携手前行，一同解锁 MCP 技术的无限可能！

更多推荐

大模型下半场，百度再次发起进攻！

当李彦宏宣布文心大模型4.5 Turbo和文心大模型X1 Turbo发布后，随即跟上的一系列AI新应用和新服务，证明了如今的百度，在AI领域已经是模型和应用双向出击，其所图并不仅仅是算法或大模型本身，更是在“技术饱和式攻击”之下，以“润物细无声”的方式进行AI生态布局。除此之外，此次大会上还发布了高说服力数字人、多智能体协作应用“心响”，代码智能体秒哒、沧舟画布OS、百度搜索的AI应用开放平台等多