使用Dockerfile构建一个包含NVIDIA的PyTorch和Detectron2的镜像

查看Dockerfile

以下是详细的解释:

Dockerfile 复制代码
# 使用更具体的标记来固定基础镜像版本,确保环境一致性
FROM nvcr.io/nvidia/pytorch:23.01-py3

# 设置工作目录和环境变量
WORKDIR /root
ENV DETECTRON2_PATH /root/detectron2

# 复制并安装 Detectron2
COPY detectron2 $DETECTRON2_PATH
RUN pip install --no-cache-dir -e $DETECTRON2_PATH

# 设置入口命令
CMD ["bash"]

这个Dockerfile定义了构建一个基于NVIDIA的PyTorch镜像的开发环境,同时安装和配置Detectron2。让我们逐行解析这个Dockerfile:

  1. 基础镜像:

    Dockerfile 复制代码
    # 使用更具体的标记来固定基础镜像版本,确保环境一致性
    FROM nvcr.io/nvidia/pytorch:23.01-py3
    • FROM 指令指定了构建这个镜像所基于的基础镜像。
    • 在这里,基础镜像来自 nvcr.io/nvidia/pytorch,版本为 23.01-py3。这意味着已经安装了PyTorch的NVIDIA优化版,且基于Python 3。
  2. 设置工作目录和环境变量:

    Dockerfile 复制代码
    # 设置工作目录和环境变量
    WORKDIR /root
    ENV DETECTRON2_PATH /root/detectron2
    • WORKDIR /root:设置工作目录为 /root。后续的所有命令都会在这个目录下执行。
    • ENV DETECTRON2_PATH /root/detectron2:定义一个环境变量 DETECTRON2_PATH,其值为 /root/detectron2,方便在后续命令中引用这个路径。
  3. 复制并安装 Detectron2:

    Dockerfile 复制代码
    # 复制并安装 Detectron2
    COPY detectron2 $DETECTRON2_PATH
    RUN pip install --no-cache-dir -e $DETECTRON2_PATH
    • COPY detectron2 $DETECTRON2_PATH:将本地主机的 detectron2 目录复制到镜像内部的 $DETECTRON2_PATH(即 /root/detectron2)目录下。
    • RUN pip install --no-cache-dir -e $DETECTRON2_PATH:运行 pip install 命令以"可编辑模式"安装 detectron2--no-cache-dir 选项用于避免pip缓存安装包,以减少镜像体积。
  4. 设置入口命令:

    Dockerfile 复制代码
    # 设置入口命令
    CMD ["bash"]
    • CMD ["bash"]:指定容器启动时的默认命令,这里是启动一个Bash shell。这使得容器在启动后进入Bash环境,用户可以在这个环境中继续运行其他命令。

综述:

  • 基础镜像:选择了一个已经包含PyTorch的镜像,减少了安装PyTorch的时间。
  • 工作目录 :设置为 /root,简化路径配置。
  • 环境变量:增加了灵活性和可读性。
  • 复制文件 :将本地的 detectron2 目录复制到镜像中。
  • 安装Detectron2:确保应用在容器中可以运行。
  • 入口命令:启动时默认进入Bash shell,便于进一步交互和开发。

通过这些步骤,这个Dockerfile创建了一个既包含PyTorch又配置了Detectron2的开发环境,使得用户可以在容器内进行计算机视觉的开发和实验。

构建Docker镜像

这段内容展示了构建一个Docker镜像的过程,并且执行了一些相关的命令。通过逐行分析可以更好地了解发生了什么。

  1. 查看构建目录内容:

    bash 复制代码
    [root@cityvisual-gpu011162126120 docker]# ls
    detectron2  Dockerfile
    • 这里显示当前目录下有两个项:一个是detectron2目录,另一个是Dockerfile文件。
  2. 构建镜像命令

    bash 复制代码
    [root@cityvisual-gpu011162126120 docker]# docker build -t detectron2_env .
    • 使用docker build命令来构建Docker镜像。
    • -t detectron2_env:指定新镜像的标签为detectron2_env
    • .:指定构建上下文为当前目录,包含Dockerfile和detectron2子目录。
  3. 镜像构建过程

    • Step 1/5:选择基础镜像

      text 复制代码
      Step 1/5 : FROM nvcr.io/nvidia/pytorch:23.01-py3
       ---> 9eda6061497d
      • 选择nvcr.io/nvidia/pytorch:23.01-py3作为基础镜像。
    • Step 2/5 :复制detectron2目录

      text 复制代码
      Step 2/5 : COPY detectron2 /root/detectron2
       ---> 9c46a77f6793
      • 将本地的detectron2目录复制到镜像内的/root/detectron2目录。
    • Step 3/5 :安装detectron2

      text 复制代码
      Step 3/5 : RUN pip install -e /root/detectron2
       ---> Running in 996c4b8eb01d
      • 在镜像内以可编辑模式安装detectron2库。
      • 输出显示了安装过程中下载和安装的依赖包,如pycocotools, termcolor, yacs, tabulate, fvcore, iopath, omegaconf, hydra-core, black等。
      • 安装完成,并成功构建了必要的wheel文件。
      text 复制代码
      Successfully installed antlr4-python3-runtime-4.9.3 black-24.4.2 detectron2-0.6 fvcore-0.1.5.post20221221 hydra-core-1.3.2 iopath-0.1.9 mypy-extensions-1.0.0 omegaconf-2.3.0 pathspec-0.12.1 portalocker-2.10.1 pycocotools-2.0.7 tabulate-0.9.0 termcolor-2.4.0 yacs-0.1.8
      • 有两个警告:
        • 建议使用虚拟环境。
        • 建议升级pip
      text 复制代码
      WARNING: Running pip as the 'root' user can result in broken permissions and conflicting behaviour with the system package manager. It is recommended to use a virtual environment instead: https://pip.pypa.io/warnings/venv
      WARNING: You are using pip version 21.2.4; however, version 24.2 is available.
      You should consider upgrading via the '/usr/bin/python -m pip install --upgrade pip' command.
    • Step 4/5:设置工作目录

      text 复制代码
      Step 4/5 : WORKDIR /root
       ---> Running in ac297733d7cb
      • 设置工作目录为/root
    • Step 5/5:设置入口命令

      text 复制代码
      Step 5/5 : CMD ["bash"]
       ---> Running in a245bd0213c6
      • 设置默认入口命令为bash,即启动容器时进入Bash shell。
    • 镜像构建成功

      text 复制代码
      Successfully built aafcb4714270
      Successfully tagged detectron2_env:latest
      • 镜像成功构建并打上了标签detectron2_env:latest
  4. 查看Docker镜像

    bash 复制代码
    [root@cityvisual-gpu011162126120 docker]# docker images
    • 列出了当前系统中的Docker镜像。
    text 复制代码
    REPOSITORY               TAG                              IMAGE ID       CREATED          SIZE
    detectron2_env           latest                           aafcb4714270   42 minutes ago   20.7GB
    <none>                   <none>                           3f45d1c9166a   2 days ago       20.7GB
    nvcr.io/nvidia/pytorch   20.12-py3                        f59272c7f361   2 months ago     15.2GB
    <none>                   <none>                           4f31e57b31d2   2 months ago     15.1GB
    cuda                     10.2-devel-ubuntu18.04-compile   a8f1a999f299   3 months ago     4.6GB
    nvcr.io/nvidia/pytorch   23.01-py3                        9eda6061497d   18 months ago    20.5GB
    nvcr.io/nvidia/pytorch   <none>                           ad0f29ddeb63   3 years ago      14.2GB
    • 可以看到多个镜像,包括刚刚构建的detectron2_env:latestIMAGE IDaafcb4714270,大小为20.7GB)。
  5. 保存Docker镜像为文件

    bash 复制代码
    [root@cityvisual-gpu011162126120 docker]# docker save -o detectron2_env.tar detectron2_env:latest
    • 使用docker save命令将镜像保存为一个tar文件,文件名为detectron2_env.tar,来源镜像为detectron2_env:latest
  6. 查看目录内容

    bash 复制代码
    [root@cityvisual-gpu011162126120 docker]# ls
    • 列出当前目录内容,显示新增了detectron2_env.tar文件。
    text 复制代码
    detectron2  detectron2_env.tar  Dockerfile
    • 现在目录中有三个项:detectron2(目录),detectron2_env.tar(镜像文件)和Dockerfile

总结

  • 构建镜像 :基于指定的Dockerfile和上下文(包括detectron2目录),构建并标签为detectron2_env
  • 查看镜像 :构建成功的镜像大小为20.7GB
  • 保存镜像 :将镜像保存为detectron2_env.tar文件,便于分发和备份。

这样通过这些步骤,用户可以构建、查看和保存一个包含Detectron2的Docker镜像。这个过程详细展示了每一步的执行和输出,对于理解Docker操作和镜像管理具有很好的参考价值。

这一段内容说明了如何使用docker run命令来启动一个包含Detectron2环境的Docker容器,并查看正在运行的容器。以下是详细解析:

启动Docker容器

  1. 启动命令

    bash 复制代码
    docker run --gpus all -d --name detectron2_env -v /data/dw/Detectron2:/liveguard -w /liveguard detectron2_env:latest   tail -f /dev/null
    • docker run:运行一个新的容器。

    • --gpus all:启用容器对GPU的访问,这里表示让容器能够使用所有的GPU。这个参数要求Docker支持GPU加速。

    • -d:表示以后台模式运行容器。

    • --name detectron2_env:为新的容器指定一个名字为detectron2_env

    • -v /data/dw/Detectron2:/liveguard:将本地目录/data/dw/Detectron2挂载到容器内的/liveguard目录。这样,主机上的数据可以直接在容器中访问,并与容器内的软件共享。

    • -w /liveguard:设置容器的工作目录为/liveguard,即运行任何命令之前将该目录作为当前目录。

    • detectron2_env:latest:指定要运行的镜像,这里是之前构建并标记为latest版本的detectron2_env镜像。

    • tail -f /dev/null:在容器中运行阻塞命令tail -f /dev/null,保持容器持续运行。这是一种保持容器"活着"的简单方法,特别是当没有其他长时间运行的命令时。

查看正在运行的容器

  1. 查看容器状态

    bash 复制代码
    [root@cityvisual-gpu011162126120 Detectron2]# docker ps
    • docker ps:显示当前正在运行的容器。

    • 输出内容如下:

      text 复制代码
      CONTAINER ID   IMAGE                COMMAND                   CREATED          STATUS          PORTS                   NAMES
      a7863c2c7604   detectron2_env:latest "/opt/nvidia/nvidia_..."   10 minutes ago   Up 10 minutes   6006/tcp, 8888/tcp      detectron2_env
    • 解析:

      • CONTAINER ID:容器的唯一标识符,例如a7863c2c7604
      • IMAGE:容器使用的镜像名称,这里是detectron2_env:latest
      • COMMAND:容器中正在运行的命令,在这里显示为简略的命令"/opt/nvidia/nvidia_..."
      • CREATED:容器创建的时间,这里是10 minutes ago
      • STATUS:容器的状态,这里是Up 10 minutes,表示容器已运行10分钟。
      • PORTS:容器暴露的端口,这里显示为6006/tcp, 8888/tcp,但没有映射到主机的端口。
      • NAMES:容器的名称,这里是detectron2_env,与启动容器时指定的名称一致。

总结

  • docker run命令:启动了一个新的容器,并启用了GPU支持,以后台模式运行,并指定了容器名称、目录挂载和初始工作目录。

  • docker ps命令:显示了当前正在运行的容器及其相关信息,包括容器ID、镜像、命令、创建时间、状态、暴露端口和名称。

通过这些操作,用户已经成功启动并管理一个包含Detectron2环境的Docker容器,并能够通过挂载的目录在容器和主机之间共享数据。

这段内容展示了在一个运行中的Docker容器中执行一个Python脚本以进行图像推理的过程。以下是具体步骤的解析:

进入容器

  1. 进入容器

    bash 复制代码
    docker exec -it detectron2_env bash
    • docker exec -it detectron2_env bash 让你进入名为 detectron2_env 的运行中的Docker容器,并启动交互式的Bash shell。

    进入容器后,你的提示符会变成容器内部的提示符,例如:

    bash 复制代码
    root@a7863c2c7604:/liveguard#
    • 其中,a7863c2c7604 是容器的ID。当前工作目录是 /liveguard

运行推理脚本

  1. 运行Python推理脚本

    bash 复制代码
    python3 detectron2_inference.py --input ./input.jpg --output ./outputs/ --model-name COCO-InstanceSegmentation/mask_rcnn_R_50_FPN_3x.yaml --cache-dir ./models/
    • 这条命令使用Python解释器 python3 来运行 detectron2_inference.py 脚本,并传递一些参数:
      • --input ./input.jpg:待处理的输入图像,路径为 ./input.jpg
      • --output ./outputs/:处理后的输出结果将保存到 ./outputs/ 目录。
      • --model-name COCO-InstanceSegmentation/mask_rcnn_R_50_FPN_3x.yaml:指定使用的模型配置,这里是COCO实例分割模型mask_rcnn_R_50_FPN_3x
      • --cache-dir ./models/:指定模型缓存目录为 ./models/

执行推理

  1. 执行过程及输出

    • 执行脚本时,检测到使用的设备是 cuda, 表示GPU加速。
    bash 复制代码
    Using device: cuda
    • 脚本加载预训练模型:
    bash 复制代码
    [08/01 10:44:53 d2.checkpoint.detection_checkpoint]: [DetectionCheckpointer] Loading from https://dl.fbaipublicfiles.com/detectron2/COCO-InstanceSegmentation/mask_rcnn_R_50_FPN_3x/137849600/model_final_f10217.pkl ...
    • 加载过程中,TORCH发出警告,提示未来版本中会需要传递 indexing 参数:
    bash 复制代码
    /usr/local/lib/python3.8/dist-packages/torch/functional.py:504: UserWarning: torch.meshgrid: in an upcoming release, it will be required to pass the indexing argument. (Triggered internally at /opt/pytorch/pytorch/aten/src/ATen/native/TensorShape.cpp:3435.)
      return _VF.meshgrid(tensors, **kwargs)  # type: ignore[attr-defined]
    • 处理完成后,输出结果保存到指定位置:
    bash 复制代码
    Output saved to ./outputs/input_mask_rcnn_R_50_FPN_3x.jpg

总结

  • 进入容器 :使用 docker exec -it detectron2_env bash 进入运行中的容器,并获得一个交互式终端。
  • 运行推理脚本 :在容器内运行 detectron2_inference.py 脚本,指定输入图像、输出目录、模型配置和缓存目录。
  • 加载模型 :从预定义的网址加载指定的COCO-Instance-Segmentation模型 mask_rcnn_R_50_FPN_3x
  • 进行处理:检测到使用GPU设备(CUDA),并发出一些预处理警告。
  • 保存结果 :处理完成后,输出结果图像保存在 ./outputs 目录。

这一步操作说明了如何在容器内部执行复杂的推理任务,并充分利用容器环境提供的依赖和库。这样,不仅可以确保一致的执行环境,还便于开发和调试机器学习模型。

有任何问题评论区留言

测试代码

这个代码是一个用于图像推理的脚本,使用Detectron2库进行图像实例分割、目标检测等任务。

python 复制代码
# 导入必要的库
import argparse
import cv2
import os
import torch
from detectron2.utils.logger import setup_logger
from detectron2 import model_zoo
from detectron2.engine import DefaultPredictor
from detectron2.config import get_cfg
from detectron2.utils.visualizer import Visualizer
from detectron2.data import MetadataCatalog

# 定义主函数
def main(args):
    # 初始化日志记录器
    setup_logger()

    # 设置FVCORE_CACHE环境变量
    os.makedirs(args.cache_dir, exist_ok=True)
    os.environ["FVCORE_CACHE"] = args.cache_dir

    # 检查设备(CPU或CUDA)
    device = 'cuda' if torch.cuda.is_available() else 'cpu'
    print(f"Using device: {device}")

    # 加载输入图像
    im = cv2.imread(args.input)

    # 创建配置
    cfg = get_cfg()
    cfg.merge_from_file(model_zoo.get_config_file(args.model_name))
    cfg.MODEL.ROI_HEADS.SCORE_THRESH_TEST = 0.5  # 设置置信度阈值
    cfg.MODEL.WEIGHTS = model_zoo.get_checkpoint_url(args.model_name)  # 加载模型权重
    cfg.MODEL.DEVICE = device  # 设置设备

    # 创建预测器
    predictor = DefaultPredictor(cfg)

    # 进行预测
    outputs = predictor(im)

    # 可视化预测结果
    v = Visualizer(im[:, :, ::-1],  # BGR到RGB转换
                   MetadataCatalog.get(cfg.DATASETS.TRAIN[0]), 
                   scale=1.2)
    out = v.draw_instance_predictions(outputs["instances"].to("cpu"))

    # 生成输出路径
    input_filename = os.path.splitext(os.path.basename(args.input))[0]
    model_filename = os.path.splitext(os.path.basename(args.model_name))[0]
    output_filename = f"{input_filename}_{model_filename}.jpg"
    output_path = os.path.join(args.output, output_filename)

    # 保存输出图像到文件
    output_image = out.get_image()[:, :, ::-1]  # RGB到BGR转换
    cv2.imwrite(output_path, output_image)

    print(f"Output saved to {output_path}")

# 如果脚本是直接执行(而不是作为模块导入),则运行下面的代码
if __name__ == "__main__":
    # 定义命令行参数解析器
    parser = argparse.ArgumentParser(
        description="Detectron2 Inference Script"
    )
    parser.add_argument("--input", required=True, help="Path to the input image")
    parser.add_argument("--output", required=True, help="Path to the output directory")
    parser.add_argument("--model-name", required=True, 
                        help="Name of the model in Detectron2 Model Zoo")
    parser.add_argument("--cache-dir", required=True, 
                        help="Path to the cache directory")
    
    # 解析命令行参数
    args = parser.parse_args()

    # 运行主函数
    main(args)

主要功能解释

1. 设置日志和缓存目录
  • setup_logger(): 初始化日志记录,以便在控制台输出信息。
  • os.environ["FVCORE_CACHE"] = args.cache_dir: 设置环境变量 FVCORE_CACHE 指向给定的缓存目录(如果目录不存在则创建)。
2. 检查计算设备
  • 检测是否有CUDA支持,并使用GPU(如果可用);否则使用CPU。
3. 加载和预处理输入图像
  • 使用OpenCV(cv2)读取输入图像文件。
4. 创建和配置模型
  • 使用Detectron2的 get_cfg()model_zoo 配置文件来创建模型配置。
  • 设置模型的阈值和权重路径。
  • 将模型配置为在检测到的设备上运行。
5. 创建预测器并进行推理
  • 使用 DefaultPredictor 创建基于配置的预测器。
  • 使用预测器对输入图像进行推理。
6. 可视化和保存结果
  • 使用 Visualizer 将预测结果绘制到输入图像上。
  • 生成输出路径和文件名,并将可视化的输出图像保存到指定的输出目录。
7. 命令行参数解析和启动
  • 使用 argparse 来解析命令行参数,确保输入图像路径、输出目录、模型名称和缓存目录都是必需的。
  • 当脚本直接运行时,调用 main(args) 函数进行推理。

这个脚本的主要功能是读取一张输入图像,使用指定的检测模型进行实例分割或目标检测,并可视化和保存预测结果图像。通过命令行参数指定模型、输入和输出路径,使得脚本高度可配置和灵活,用于不同的检测任务和数据集上。

有任何问题评论区留言,更多应用体验查看下面内容

一键体验Detectron2框架中的所有预训练模型
在自定义数据集上训练现有的Detectron2模型

相关推荐
bryant_meng1 分钟前
【python】OpenCV—Image Moments
开发语言·python·opencv·moments·图片矩
车载诊断技术23 分钟前
电子电气架构 --- 什么是EPS?
网络·人工智能·安全·架构·汽车·需求分析
KevinRay_27 分钟前
Python超能力:高级技巧让你的代码飞起来
网络·人工智能·python·lambda表达式·列表推导式·python高级技巧
跃跃欲试-迪之32 分钟前
animatediff 模型网盘分享
人工智能·stable diffusion
Captain823Jack1 小时前
nlp新词发现——浅析 TF·IDF
人工智能·python·深度学习·神经网络·算法·自然语言处理
被制作时长两年半的个人练习生1 小时前
【AscendC】ReduceSum中指定workLocal大小时如何计算
人工智能·算子开发·ascendc
资源补给站1 小时前
大恒相机开发(2)—Python软触发调用采集图像
开发语言·python·数码相机
Captain823Jack2 小时前
w04_nlp大模型训练·中文分词
人工智能·python·深度学习·神经网络·算法·自然语言处理·中文分词
Black_mario2 小时前
链原生 Web3 AI 网络 Chainbase 推出 AVS 主网, 拓展 EigenLayer AVS 应用场景
网络·人工智能·web3
Wishell20152 小时前
Pytorch文件夹结构
pytorch