docker部署大模型ollama,无法使用GPU

容器部署大模型,无法调用GPU

6699人浏览 · 2024-11-26 20:41:42

· 2024-11-26 20:41:42 发布

最近再部署大模型玩

1.问题出现

docker版本如下

创建文件docker-compose.yml文件如下

name: 'ollama'
services:
  ollama:
    #restart: always
    image: ollama/ollama
    container_name: ollama13
    runtime: nvidia
    environment:
      - TZ=Asia/Shanghai
      - NVIDIA_VISIBLE_DEVICES=all
    networks:
      - ai-tier
    ports:
      - "11745:11434"
    volumes:
      - ./data:/root/.ollama
networks:
  ai-tier:
    name: ai-tier
    driver: bridge

启动容器

docker compose up -d

报错:no compatible GPUs were discovered

no nvidia devices detected by library /usr/lib/x86 64-linux-gnu/libcuda.so.550.135

2.测试宿主机

curl -fsSL https://ollama.com/install.sh | sh
# 下载完成之后执行
ollama run llama3.2

在宿主机启动容器测试,可以正常调动GPU,说明驱动没有问题

3. 排查问题

测试能否调用GPU

docker run --rm --gpus all  nvidia/cuda:12.0.1-runtime-ubuntu22.04 nvidia-smi

[root@worker1 ~]# docker run -it --rm --gpus all nvidia/cuda:12.4.0-base-ubuntu22.04 nvidia-smi
Unable to find image 'nvidia/cuda:12.4.0-base-ubuntu22.04' locally
12.4.0-base-ubuntu22.04: Pulling from nvidia/cuda
bccd10f490ab: Pull complete 
edd1dba56169: Pull complete 
e06eb1b5c4cc: Pull complete 
7f308a765276: Pull complete 
3af11d09e9cd: Pull complete 
Digest: sha256:80d4d9ac041242f6ae5d05f9be262b3374e0e0b8bb5a49c6c3e94e192cde4a44
Status: Downloaded newer image for nvidia/cuda:12.4.0-base-ubuntu22.04
Failed to initialize NVML: Unknown Error

根据报错

修改配置文件

vim /etc/nvidia-container-runtime/config.toml

将图中no-cgroups=true改成

no-cgroups=false

此参数对任务使用的资源（内存，CPU，磁盘等资源）总额进行限制

修改完成后,重启docker服务

systemctl restart docker

4.验证是否解决

docker run --rm --gpus all  nvidia/cuda:12.0.1-runtime-ubuntu22.04 nvidia-smi

至此问题解决

MCP技术社区

欢迎加入 MCP 技术社区！与志同道合者携手前行，一同解锁 MCP 技术的无限可能！

更多推荐

8种封装的1700V国产碳化硅(SiC)功率模块产品介绍及应用

MCP技术社区

（一篇入门）汽车电子电器之电机MCU控制器四

MCP技术社区

OpenCV C++ 入门实战：从基础操作到类封装全解析

Mat数据结构、图像读写、颜色空间转换、像素操作、算术运算和轨迹栏交互，以及面向对象封装思想。图像处理：学习滤波（高斯滤波、中值滤波）、边缘检测（Canny、Sobel）、形态学操作（腐蚀、膨胀）。目标检测：掌握轮廓提取（）、特征匹配（）、Haar 级联分类器。视频处理：使用读取视频，对帧进行实时处理。性能优化：学习多线程、GPU 加速（cv::cuda模块），提升处理速度。通过持续实践，可逐步掌

MCP技术社区

所有评论(0)

查看更多评论

@Awesome_py

已为社区贡献2条内容