关于docker-Engine使用的存储驱动devicemapper的常识

缘起:

今天值班的兄弟找我说PAAS节点扩容后有个 docker-container 创建一直失败,看不懂输出的报文信息。

看值班给出的投屏发现和storage-driver有关,提示信息如下:

Error running DeviceCreate (createSnapDevice) dm_task_run failed

查看了下

docker版本是 docker-Engine 20;

OS 的版本是 centos 6

Kernel的版本是 3.10

又查看了下 /etc/docker/daemon.json 发现storage-driver是devicemapper

再查看docker的log信息,发现有这样一条消息:

statusCode=500 Error running DeviceCreate (createSnapDevice) dm_task_run failed

唔,大概是docker链接的后端存储资源不足了。

因为 http 协议中 产生 500 状态码的一个可能性原因是服务端资源不足,再结合DeviceCreate任务失败,可以确认排查方向应该是 devicemapper驱动下的存储资源状态。

devicemapper本质上是Linux-Kernel级别的块设备存储驱动,依赖于LVM工具包支持。在逻辑卷管理中,除了LVM服务运行异常外,能够影响到数据写操作的就是存储空间和元数据两个item了。

执行 vgdisplay ,可以查看到回显信息说明 LVM服务运行无异常;

执行 dmsetup status 和 dmsetp info,可以查看到有充盈的存储空间;

好吧,看来是扩容完后有人在没有正常stop点docker-Engine的情况下强制对服务器进行了上下电操作,在某种原因下导致 devicemapper的元数据出现了错误。

修复方式:

Step1 systemctl stop docker.service

Step 2 thin_check /var/lib/docker/devicemapper/devicemapper/metadata

thin_check --clear-needs-check-flag /var/lib/docker/devicemapper/devicemapper/metadata

Step 3 systemctl start docker.service

Step 4 重新 run 容器

**************************************************

devicemapper已经是一个被放弃的存储驱动了,场内发布的主流生产应用都已经切换到 overlay2存储驱动了,看来打包OS装机镜像的研发又没有更新docker的配置项呀。

docker-devicemapper由RedHat公司联合docker公司开发而成,用于在RHEL系列操作系统上运行docker[ docker-devicemapper存储驱动出现前,docker只支持运行在以AUFS为存储后端的Debian系列OS上。],是对Linux-Kernel-Device-Mapper的简化。Device Mapper是一种强化Linux中高级卷管理技术的内核级框架,docker-devicemapper集成了它的精简置备、拷写同步和快照功能、依赖于Linux-Kernel的支持。docker-devicemapper使用设备块(block)存储数据,将docker镜像或docker容器数据存储在虚拟块设备上。在operating system (OS)使用docker-devicemapper driver需要安装lvm2等包,当前CentOS、Fedora、SLES 15、Ubuntu、 Debian或RHEL这些发行版都支持Docker Engine使用docker-devicemapper driver作为存储驱动。

docker-devicemapper driver提供两种工作模式:loop-lvm模式和direct-lvm模式。从工作机制上讲,loop-lvm模式本质是上一种文件级别(file level)的存储驱动模式,存在I/O操作缓慢的性能问题。因此在实际业务环境中,建议配置为direct-lvm模式。相比较而言,direct-lvm模式直接读写的是挂载到宿主机OS(Host-OS)中的块设备,读写较高、且可以便捷地按需扩容存储。此外,direct-lvm模式支持多个块设备配置[ multiple block devices,也可称之为多存储路径配置。]。

docker-devicemapper作为docker的后端存储驱动,已经于 version 18.09中弃用、version 23.0中禁用、将于version 25 中移除掉。

在检查了本次扩容的40台服务器后,发现docker的devicemapper驱动模式竟然是loop-lvm模式,看来天天趾高气昂的产品研发没有做产品封板前的检查呀,真不知道这产品质量测试时怎么通过压力测试的 。。。

世界破破烂烂,草台班子缝缝补补呀。。。

干工作,责任心太强了就只能自我驱动加班了。。。今晚注定又睡不成囫囵觉了。。。

相关推荐
布吉岛的石头10 分钟前
Docker Compose编排实战:多容器应用从开发到生产
运维·docker·容器
身如柳絮随风扬20 分钟前
Nginx 完全指南:核心用途、配置文件详解与动态配置实践
运维·nginx
2601_9561394232 分钟前
广州VI设计公司哪家强
linux·运维·服务器·python
@encryption44 分钟前
RHCE --- 第三节
运维
Vinton_Liu1 小时前
NAT 类型详解:四种 NAT 的数据流与原理解析
运维·服务器
一个处女座的程序猿O(∩_∩)O1 小时前
如何保持nginx配置与前端打包dist的路径保持一致、解决页面刷新白屏以及页面跳转问题
运维·前端·nginx
想唱rap1 小时前
五种IO模型和非阻塞IO
linux·运维·服务器·网络·数据库·tcp/ip
环流_1 小时前
nacos:负载均衡 3大核心操作
运维·nacos·负载均衡
阿洛学长2 小时前
CSDN、掘金、简书博客文章如何转为Markdown?
运维·数据库·架构·php·持续部署
方安乐2 小时前
交换机的自学机制
运维·服务器·网络