模型部署 - docker

docker简介

Docker 是一种开源的容器化平台,允许开发者将应用程序及其依赖项打包到一个标准化的单元中,称为"容器"。这些容器可以在任何支持 Docker 的系统上运行,无需担心环境差异。

为什么需要 Docker?

在传统的开发中,不同的系统和环境可能导致应用程序运行时出现问题。例如,你在自己的电脑上开发了一个应用程序,运行得很好,但是当你将它部署到服务器上时,却出现了错误。这通常是因为两者的环境配置不同。

Docker 通过容器化技术解决了这个问题。容器包含了应用程序的所有必要组件(如代码、运行时、库、环境变量等),所以无论你把容器运行在哪台机器上,它的行为都是一致的。

Docker 的基本概念

  1. 镜像(Image): 镜像是一个只读的模板,包含了运行应用程序所需的一切。你可以把它看作是一个应用程序的快照。镜像可以从公共的 Docker Hub 上下载,也可以自己创建。

  2. 容器(Container): 容器是镜像的运行实例。你可以启动、停止、移动或删除容器,容器中的应用程序运行是隔离的,互不干扰。

  3. Dockerfile: 这是一个文本文件,定义了如何构建 Docker 镜像。你可以在 Dockerfile 中指定基础镜像、需要安装的依赖项、需要运行的命令等。

  4. Docker Hub: 这是一个公共的注册表,存储了大量预先构建好的镜像。你可以直接从 Docker Hub 上拉取镜像并运行。

Docker 的基本操作

  • 安装 Docker: 在 Linux、Windows 或 macOS 上安装 Docker 后,你可以通过命令行与 Docker 交互。

    bash 复制代码
    sudo apt-get update
    sudo apt-get install -y docker.io
  • 运行容器: 你可以使用 docker run 命令运行一个容器。例如,运行一个简单的 Hello World 容器:

    bash 复制代码
    docker run hello-world

    这个命令会从 Docker Hub 下载 hello-world 镜像,并在容器中运行它。运行成功后,你会看到容器输出 "Hello from Docker!" 的信息。

  • 构建镜像: 使用 Dockerfile,你可以构建自己的镜像。假设你有一个简单的 Python 应用程序,并且已经写好了 Dockerfile,你可以通过以下命令构建镜像:

    bash 复制代码
    docker build -t my-python-app .

    这里的 -t 参数用于为镜像命名,my-python-app 是镜像的名称,. 表示 Dockerfile 所在的目录。

  • 查看正在运行的容器: 你可以使用 docker ps 查看当前正在运行的容器。

    bash 复制代码
    docker ps
  • 停止容器: 使用 docker stop 命令可以停止一个运行中的容器。

    bash 复制代码
    docker stop <container_id>

    <container_id> 是容器的唯一标识符,你可以通过 docker ps 命令获取。

  • 删除容器: 使用 docker rm 可以删除一个停止的容器。

    bash 复制代码
    docker rm <container_id>

Docker 的优势

  • 环境一致性: 无论你在什么系统上运行 Docker 容器,应用程序的行为都是一致的。
  • 轻量级: Docker 容器共享主机操作系统的内核,启动速度快,资源消耗低。
  • 易于部署: 只需将镜像推送到 Docker Hub 或其他注册表,其他人就可以轻松拉取并运行你的应用。

如何将模型打包进docker

要在 Linux 上使用 Docker 部署大模型,涉及到将模型和其依赖项打包进 Docker 容器,然后在容器中运行模型服务。以下是完整的步骤,包含从环境准备到部署测试的详细流程。

1. 安装 Docker

首先,需要在 Linux 系统上安装 Docker。

bash 复制代码
# 更新系统的包列表
sudo apt-get update

# 安装 Docker 及相关组件
sudo apt-get install -y docker.io

# 启动 Docker 服务并设置为开机启动
sudo systemctl start docker
sudo systemctl enable docker

2. 安装 NVIDIA Docker(可选,如果使用 GPU 加速)

如果你的模型需要使用 GPU 加速,需要安装 NVIDIA Docker,以便在 Docker 容器中使用 GPU。

bash 复制代码
# 设置 NVIDIA Docker 仓库
distribution=$(. /etc/os-release;echo $ID$VERSION_ID)
curl -s -L https://nvidia.github.io/nvidia-docker/gpgkey | sudo apt-key add -
curl -s -L https://nvidia.github.io/nvidia-docker/$distribution/nvidia-docker.list | sudo tee /etc/apt/sources.list.d/nvidia-docker.list

# 更新包列表并安装 nvidia-docker2
sudo apt-get update
sudo apt-get install -y nvidia-docker2

# 重启 Docker 服务
sudo systemctl restart docker

3. 准备大模型及相关文件

确保你已经准备好了大模型文件、依赖项(如 requirements.txtenvironment.yml)、以及用于启动模型服务的脚本(如 app.py)。

示例 requirements.txt
plaintext 复制代码
numpy==1



## 如何在linux上部署
在 Linux 上使用 Docker 部署大模型需要进行以下几个步骤。以下是详细的步骤说明:

### 1. 安装 Docker
首先,需要在 Linux 系统上安装 Docker。

```bash
# 更新系统的包列表
sudo apt-get update

# 安装 Docker 及相关组件
sudo apt-get install -y docker.io

# 启动 Docker 服务并设置为开机启动
sudo systemctl start docker
sudo systemctl enable docker

2. 安装 NVIDIA Docker(可选,如果使用 GPU 加速)

如果你的模型需要使用 GPU 加速,你需要安装 NVIDIA Docker 以便在 Docker 容器中使用 GPU。

bash 复制代码
# 设置 NVIDIA Docker 仓库
distribution=$(. /etc/os-release;echo $ID$VERSION_ID)
curl -s -L https://nvidia.github.io/nvidia-docker/gpgkey | sudo apt-key add -
curl -s -L https://nvidia.github.io/nvidia-docker/$distribution/nvidia-docker.list | sudo tee /etc/apt/sources.list.d/nvidia-docker.list

# 更新包列表并安装 nvidia-docker2
sudo apt-get update
sudo apt-get install -y nvidia-docker2

# 重启 Docker 服务
sudo systemctl restart docker

3. 创建 Dockerfile

Dockerfile 是定义 Docker 镜像构建过程的文件。你可以通过这个文件指定基础镜像、安装依赖库、复制模型文件等。

Dockerfile 复制代码
# 使用官方的深度学习基础镜像
FROM nvidia/cuda:11.3.1-cudnn8-devel-ubuntu20.04

# 安装 Python 和 pip
RUN apt-get update && apt-get install -y python3 python3-pip

# 安装模型所需的 Python 库
COPY requirements.txt /app/requirements.txt
RUN pip3 install --no-cache-dir -r /app/requirements.txt

# 复制模型文件到容器中
COPY model /app/model

# 设置工作目录
WORKDIR /app

# 定义运行命令(例如,启动模型服务)
CMD ["python3", "app.py"]

4. 构建 Docker 镜像

使用 Dockerfile 构建镜像。

bash 复制代码
# 在 Dockerfile 所在目录下执行
docker build -t my_large_model .

5. 运行 Docker 容器

使用构建好的 Docker 镜像运行容器。

bash 复制代码
# 如果需要 GPU 加速,使用 --gpus 参数
docker run --gpus all -d --name my_model_container -p 8080:8080 my_large_model

6. 测试模型服务

容器启动后,模型服务会在指定的端口(例如 8080)上运行。你可以通过以下命令查看容器的运行状态:

bash 复制代码
docker ps

然后,可以通过浏览器或 curl 命令访问模型服务:

bash 复制代码
curl http://localhost:8080/predict -d '{"input": "sample input data"}'

7. 管理和更新容器

  • 查看日志:
bash 复制代码
docker logs my_model_container
  • 停止容器:
bash 复制代码
docker stop my_model_container
  • 重启容器:
bash 复制代码
docker start my_model_container
  • 删除容器:
bash 复制代码
docker rm my_model_container

8. 备份和恢复模型

你可以将模型文件保存在外部卷中,以便在容器重新启动时保留数据:

bash 复制代码
docker run --gpus all -d --name my_model_container -p 8080:8080 -v /path/to/model:/app/model my_large_model

这样模型文件就会保存在宿主机的 /path/to/model 目录中,并映射到容器中的 /app/model 目录。

通过这些步骤,你可以在 Linux 上使用 Docker 部署并运行大模型。如果模型或应用程序需要更新,只需更新 Dockerfile 并重新构建和启动容器即可。

相关推荐
李昊哲小课7 分钟前
deepin 安装 zookeeper
大数据·运维·zookeeper·debian·hbase
真真-真真24 分钟前
WebXR
linux·运维·服务器
一勺菠萝丶1 小时前
MongoDB 常用操作指南(Docker 环境下)
数据库·mongodb·docker
Mitch3111 小时前
【漏洞复现】CVE-2015-3337 Arbitrary File Reading
elasticsearch·网络安全·docker·漏洞复现
Mitch3111 小时前
【漏洞复现】CVE-2015-5531 Arbitrary File Reading
web安全·elasticsearch·网络安全·docker·漏洞复现
wanhengidc1 小时前
短视频运营行业该如何选择服务器?
运维·服务器
雨中rain2 小时前
Linux -- 从抢票逻辑理解线程互斥
linux·运维·c++
-KamMinG2 小时前
Centos7.9安装openldap+phpldapadmin+grafana配置LDAP登录最详细步骤 亲测100%能行
运维·grafana
Bessssss2 小时前
centos日志管理,xiao整理
linux·运维·centos
豆是浪个2 小时前
Linux(Centos 7.6)yum源配置
linux·运维·centos