快捷:通过胶水语言实现工作中测试流程并行、加速

通过胶水语言实现工作中测试流程并行、加速

通过胶水语言实现工作中测试流程并行、加速

尽可能自动化是计算机思维之一。一切事务尽可能pipeline化,然后再将pipeline中的环节尽可能自动化,这样在我看来就是在实践计算机思维,这种思维的养成是重要的。本篇文章是对近期工作中的一次有意思尝试的记录。

工作场景(背景)

近期遇到一个问题是工作中有一测试环节,测试周期为18个小时,且该测试动作频率较高。因此如果能够缩短测试周期,就能够更快的得到反馈和结论,为下一步动作提供数据支撑。

问题抽象(挑战)

正如优雅:从系统环境到依赖包的管理文章中提到,由于docker的便利性,开发、部署以及测试都转向了docker。此次所涉及到的测试环节,对应内涵:日常工作中docker的常用知识中的双(多)docker使用场景。

可以用下图来展示服务程序和测试程序的关系:

如何做(行动)

思想是简单的,伪代码如下:

  • 将测试服务启动n个实例,测试主调也启动n个实例,测试数据也划分为n份;
  • 上述操作通过胶水语言shell脚本借助tmux窗口工具实现;

基于伪代码的设计框图如下:

基于设计图,开发的对应的脚本代码,分为测试服务端和测试主调端:

bash 复制代码
# 该脚本功能为启动多个测试服务
container_name_base=sub-service
network_name=test-network
image_name=xxx  # 这里要根据实际来填写
gpu_ids=(0 1)  # 该测试服务需要gpu,每一个服务对应一块gpu
ports=(30006 30007)

docker network create ${network_name}  # 建立一个局域网,为测试服务容器和测试主调容器使用

for i in "${!gpu_ids[@]}";do
  gpu_id=${gpu_ids[i]}
  port=${ports[i]}
  container_name=${container_name_base}-${port}
  
  session_name=${container_name_base}-${port}
  tmux new-session -d -s "${session_name}"
  tmux send-keys -t "${session_name}" "docker run -ti --gpus al -p ${port}:${port} --name=${container_name} \
        -e PORT=${port} -e CUDA_VISIBLE_DEVICES=${gpu_id} --network=${network_name} --ipc=host \
        -v /models:/models \
        -v /data:/data \
        -v /code:/code \
        ${image_name}" C-m
done
bash 复制代码
# 该脚本功能为启动多个测试主调服务
sub_service_name_base=sub-service # 这个要和上一个脚本中的名字对应起来
call_service_name_base=call-service
network_name=test-network  # 这个要和上一个脚本中的名字对应起来
image_name=yyy  # 填写对应的镜像名称

test_data_root=/test_data  # 测试数据路径
dst_root=/dst  # 测试结果保存路径

ports=(30006 30007)  # 这个要和上一个脚本中的port号对应起来

total_num=$(ls -l "$src_root" | wc -l)
worker_num=${#ports[@]}
worker_size=$(((total_num + worker_num - 1) / worker_num))

for i in "${!ports[@]}"; do
  port=${ports[i]}
  sub_service_name=${sub_service_name_base}-${port}
  session_name=${call_service_name_base}-${port}
  tmux new-session -d -s "${session_name}"
  
  start_id=$((i * batch_size))
  end_id=$(((i + 1) * batch_size))
  if [ "$end_id" -gt "$total_num" ]; then
  	end_id=$total_num
  fi
  tmux send-keys -t "${session_name}" "docker run -ti \
  	-v ${test_data_root}:/test_data \
  	--network=${network_name} \
  	--entrypoint=/bin/bash ${image_name} \
  	-c 'python test.py --src /test_data --dst ${dst_root} \
  	--start_idx ${start_id} --end_idx ${end_id}'" C-m
done

获得了什么(结果)

获得n倍的测试加速比,例如在A10机器上(有16张gpu卡)将上述脚本中的worker_num设置为6,那么测试周期会从18h下降至3h。这样就可以实现当天编写代码,当天测试完毕,当天得到测试反馈。

后记

最近的一个感悟是在软件或算法开发中,应该降低编码的比重,提升需求沟通、分析、设计、建模和测试的比重。这里的比重是指重要程度,而不应简单的理解为时间。例如对于测试,其重视程度应该被重视,但应尽可能的想办法缩短测试周期。

相关资源

文章图片绘制原始drawio文件:

相关推荐
杨浦老苏2 小时前
开源音乐管理软件Melody
docker·群晖·多媒体
杨浦老苏4 小时前
面向npm的实时仪表板Dashly
网络·docker·群晖·导航
JunLan~5 小时前
Docker 部署 GLPI(IT 资产管理软件系统)
运维·docker·容器
特立独行的猫a7 小时前
使用 Docker(Podman) 部署 MongoDB 数据库及使用详解
数据库·docker·podman
LUCIAZZZ9 小时前
基于Docker以KRaft模式快速部署Kafka
java·运维·spring·docker·容器·kafka
特立独行的猫a12 小时前
Golang 应用的 Docker 部署方式介绍及使用详解
开发语言·docker·golang
康世行14 小时前
Windows环境下MaxKB大模型 Docker部署图文指南
windows·docker·容器
程序员石磊1 天前
学术总结Ai Agent中firecrawl(大模型爬虫平台)的超简单的docker安装方式教程
人工智能·爬虫·docker
司江龙2 天前
centos7 配置国内镜像源安装 docker
运维·docker·容器
西木Qi2 天前
Docker之Dockerfile
docker