模型部署 - docker

docker简介

Docker 是一种开源的容器化平台，允许开发者将应用程序及其依赖项打包到一个标准化的单元中，称为"容器"。这些容器可以在任何支持 Docker 的系统上运行，无需担心环境差异。

为什么需要 Docker？

在传统的开发中，不同的系统和环境可能导致应用程序运行时出现问题。例如，你在自己的电脑上开发了一个应用程序，运行得很好，但是当你将它部署到服务器上时，却出现了错误。这通常是因为两者的环境配置不同。

Docker 通过容器化技术解决了这个问题。容器包含了应用程序的所有必要组件（如代码、运行时、库、环境变量等），所以无论你把容器运行在哪台机器上，它的行为都是一致的。

Docker 的基本概念

镜像（Image）： 镜像是一个只读的模板，包含了运行应用程序所需的一切。你可以把它看作是一个应用程序的快照。镜像可以从公共的 Docker Hub 上下载，也可以自己创建。
容器（Container）： 容器是镜像的运行实例。你可以启动、停止、移动或删除容器，容器中的应用程序运行是隔离的，互不干扰。
Dockerfile： 这是一个文本文件，定义了如何构建 Docker 镜像。你可以在 Dockerfile 中指定基础镜像、需要安装的依赖项、需要运行的命令等。
Docker Hub： 这是一个公共的注册表，存储了大量预先构建好的镜像。你可以直接从 Docker Hub 上拉取镜像并运行。

Docker 的基本操作

安装 Docker： 在 Linux、Windows 或 macOS 上安装 Docker 后，你可以通过命令行与 Docker 交互。
bash 复制代码
```
sudo apt-get update
sudo apt-get install -y docker.io
```
运行容器： 你可以使用 docker run 命令运行一个容器。例如，运行一个简单的 Hello World 容器：
bash 复制代码
```
docker run hello-world
```
这个命令会从 Docker Hub 下载 hello-world 镜像，并在容器中运行它。运行成功后，你会看到容器输出 "Hello from Docker!" 的信息。
构建镜像： 使用 Dockerfile，你可以构建自己的镜像。假设你有一个简单的 Python 应用程序，并且已经写好了 Dockerfile，你可以通过以下命令构建镜像：
bash 复制代码
```
docker build -t my-python-app .
```
这里的 -t 参数用于为镜像命名，my-python-app 是镜像的名称，. 表示 Dockerfile 所在的目录。
查看正在运行的容器： 你可以使用 docker ps 查看当前正在运行的容器。
bash 复制代码
```
docker ps
```
停止容器： 使用 docker stop 命令可以停止一个运行中的容器。
bash 复制代码
```
docker stop <container_id>
```
<container_id> 是容器的唯一标识符，你可以通过 docker ps 命令获取。
删除容器： 使用 docker rm 可以删除一个停止的容器。
bash 复制代码
```
docker rm <container_id>
```

Docker 的优势

环境一致性： 无论你在什么系统上运行 Docker 容器，应用程序的行为都是一致的。
轻量级： Docker 容器共享主机操作系统的内核，启动速度快，资源消耗低。
易于部署： 只需将镜像推送到 Docker Hub 或其他注册表，其他人就可以轻松拉取并运行你的应用。

如何将模型打包进docker

要在 Linux 上使用 Docker 部署大模型，涉及到将模型和其依赖项打包进 Docker 容器，然后在容器中运行模型服务。以下是完整的步骤，包含从环境准备到部署测试的详细流程。

1. 安装 Docker

首先，需要在 Linux 系统上安装 Docker。

bash 复制代码

# 更新系统的包列表
sudo apt-get update

# 安装 Docker 及相关组件
sudo apt-get install -y docker.io

# 启动 Docker 服务并设置为开机启动
sudo systemctl start docker
sudo systemctl enable docker

2. 安装 NVIDIA Docker（可选，如果使用 GPU 加速）

如果你的模型需要使用 GPU 加速，需要安装 NVIDIA Docker，以便在 Docker 容器中使用 GPU。

bash 复制代码

# 设置 NVIDIA Docker 仓库
distribution=$(. /etc/os-release;echo $ID$VERSION_ID)
curl -s -L https://nvidia.github.io/nvidia-docker/gpgkey | sudo apt-key add -
curl -s -L https://nvidia.github.io/nvidia-docker/$distribution/nvidia-docker.list | sudo tee /etc/apt/sources.list.d/nvidia-docker.list

# 更新包列表并安装 nvidia-docker2
sudo apt-get update
sudo apt-get install -y nvidia-docker2

# 重启 Docker 服务
sudo systemctl restart docker

3. 准备大模型及相关文件

确保你已经准备好了大模型文件、依赖项（如 requirements.txt 或 environment.yml）、以及用于启动模型服务的脚本（如 app.py）。

示例 `requirements.txt`：

plaintext 复制代码

numpy==1



## 如何在linux上部署
在 Linux 上使用 Docker 部署大模型需要进行以下几个步骤。以下是详细的步骤说明：

### 1. 安装 Docker
首先，需要在 Linux 系统上安装 Docker。

```bash
# 更新系统的包列表
sudo apt-get update

# 安装 Docker 及相关组件
sudo apt-get install -y docker.io

# 启动 Docker 服务并设置为开机启动
sudo systemctl start docker
sudo systemctl enable docker

2. 安装 NVIDIA Docker（可选，如果使用 GPU 加速）

如果你的模型需要使用 GPU 加速，你需要安装 NVIDIA Docker 以便在 Docker 容器中使用 GPU。

bash 复制代码

# 设置 NVIDIA Docker 仓库
distribution=$(. /etc/os-release;echo $ID$VERSION_ID)
curl -s -L https://nvidia.github.io/nvidia-docker/gpgkey | sudo apt-key add -
curl -s -L https://nvidia.github.io/nvidia-docker/$distribution/nvidia-docker.list | sudo tee /etc/apt/sources.list.d/nvidia-docker.list

# 更新包列表并安装 nvidia-docker2
sudo apt-get update
sudo apt-get install -y nvidia-docker2

# 重启 Docker 服务
sudo systemctl restart docker

3. 创建 Dockerfile

Dockerfile 是定义 Docker 镜像构建过程的文件。你可以通过这个文件指定基础镜像、安装依赖库、复制模型文件等。

Dockerfile 复制代码

# 使用官方的深度学习基础镜像
FROM nvidia/cuda:11.3.1-cudnn8-devel-ubuntu20.04

# 安装 Python 和 pip
RUN apt-get update && apt-get install -y python3 python3-pip

# 安装模型所需的 Python 库
COPY requirements.txt /app/requirements.txt
RUN pip3 install --no-cache-dir -r /app/requirements.txt

# 复制模型文件到容器中
COPY model /app/model

# 设置工作目录
WORKDIR /app

# 定义运行命令（例如，启动模型服务）
CMD ["python3", "app.py"]

4. 构建 Docker 镜像

使用 Dockerfile 构建镜像。

bash 复制代码

# 在 Dockerfile 所在目录下执行
docker build -t my_large_model .

5. 运行 Docker 容器

使用构建好的 Docker 镜像运行容器。

bash 复制代码

# 如果需要 GPU 加速，使用 --gpus 参数
docker run --gpus all -d --name my_model_container -p 8080:8080 my_large_model

6. 测试模型服务

容器启动后，模型服务会在指定的端口（例如 8080）上运行。你可以通过以下命令查看容器的运行状态：

bash 复制代码

docker ps

然后，可以通过浏览器或 curl 命令访问模型服务：

bash 复制代码

curl http://localhost:8080/predict -d '{"input": "sample input data"}'

7. 管理和更新容器

查看日志：

bash 复制代码

docker logs my_model_container

停止容器：

bash 复制代码

docker stop my_model_container

重启容器：

bash 复制代码

docker start my_model_container

删除容器：

bash 复制代码

docker rm my_model_container

8. 备份和恢复模型

你可以将模型文件保存在外部卷中，以便在容器重新启动时保留数据：

bash 复制代码

docker run --gpus all -d --name my_model_container -p 8080:8080 -v /path/to/model:/app/model my_large_model

这样模型文件就会保存在宿主机的 /path/to/model 目录中，并映射到容器中的 /app/model 目录。

通过这些步骤，你可以在 Linux 上使用 Docker 部署并运行大模型。如果模型或应用程序需要更新，只需更新 Dockerfile 并重新构建和启动容器即可。

模型部署 - docker

docker简介

为什么需要 Docker？

Docker 的基本概念

Docker 的基本操作

Docker 的优势

如何将模型打包进docker

1. 安装 Docker

2. 安装 NVIDIA Docker（可选，如果使用 GPU 加速）

3. 准备大模型及相关文件

示例 requirements.txt：

2. 安装 NVIDIA Docker（可选，如果使用 GPU 加速）

3. 创建 Dockerfile

4. 构建 Docker 镜像

5. 运行 Docker 容器

6. 测试模型服务

7. 管理和更新容器

8. 备份和恢复模型

示例 `requirements.txt`：