shell脚本拉取mysql数据

需求:假设有一个mysql数据库,用户名密码为test,有一个test库,test库下有128个表,表名依次为test_1,...,test_128,表字段都一样,有一个uid为主键。现在给你一个uid.csv文件,里面只有一个字段uid,数据可能有上万行。写一个shell脚本,连接到mysql,根据uid查询到对应的数据并返回。注意每个uid对应的表名可能不一样,应先用uid对128求余,然后作为test_的后缀为表名。

以下是用gemini生成的代码

bash 复制代码
#!/bin/bash

# 定义数据库连接信息
HOST="localhost"
USERNAME="root"
PASSWORD="password"

# 读取 uid.csv 文件
while read uid; do
    # 计算表名后缀
    table_suffix=$((uid % 128 + 1))
    table_name="test_$table_suffix"

    # 查询数据
    data=$(mysql -h $HOST -u $USERNAME -p$PASSWORD test -e "SELECT * FROM $table_name WHERE uid = $uid")

    # 处理数据
    if [[ -n $data ]]; then
        echo "UID: $uid"
        echo "Data: $data"
    else
        echo "UID $uid not found."
    fi
done < uid.csv

最后它也给出了优化建议:

但是要求根据优化建议来修改脚本时,给出的是把查询结果不尽人意。

优化原则:

  1. mysql连接复用,给出的代码是一次查询执行一次mysql命令,即会建立一次连接。
  2. 并发执行,每次并发操作可读取1000行数据。

对于1,mysql命令可以接收一个sql文件作为参数,因此可以先把要查询的sql先写入一个文件,然后再传入mysql命令;由于数据太多,因此输出也写入一个文件。 对于2,应该把一次查询操作写成一个函数,函数每次执行1000行的查询;并在上层并发调用。

封装一个query函数:

bash 复制代码
query() {
  # 参数1:文件id
    fileId=$1
    # 参数2:查询的行数
    qureyNum=$2
    start=$((($fileId-1) * 2000 + 1))
    end=$(($start + $qureyNum - 1))
    sedpar="$start,$(($end))p"
    select="*"
    echo "查询第 $start 到 $end 行"
    # 先sql清空文件
    echo "" > $fileId.sql
    for i in $(sed -n $sedpar uid.csv); do
      # 追加到sql文件
      let tableId=$((i%128))
      echo "select $select from test_$tableId where uid=$i;" >> $fileId.sql
    done
    # 传入sql文件执行
    mysql -h $HOST -u $USERNAME -p$PASSWORD test < $fileId.sql > $fileId.result.csv
    echo "第 $fileId 文件查询完成"
}

读取uid文件,并发调用query,每次执行1000个uid的查询: 注意:因为是并发,所以每次query写入的文件不一样,可以在最后合并成一个文件。

bash 复制代码
totalLine=$(wc -w uid.csv | awk '{print $1}')
echo "总行数:$totalLine"
curFileId=1
for ((i=1; i < $totalLine; i+=1000)); do
  echo "处理第 $curFileId 个文件.........."
  query $curFileId 1000 & # 并发查询
  curFileId=$(($curFileId+1))
done

# 等待所有查询结束
wait

# 合并文件。。。

全部代码:

bash 复制代码
#!/bin/bash

# 定义数据库连接信息
HOST="localhost"
USERNAME="root"
PASSWORD="password"

query() {
  # 参数1:文件id
    fileId=$1
    # 参数2:查询的行数
    qureyNum=$2
    start=$((($fileId-1) * 2000 + 1))
    end=$(($start + $qureyNum - 1))
    sedpar="$start,$(($end))p"
    select="*"
    echo "查询第 $start 到 $end 行"
    # 先sql清空文件
    echo "" > $fileId.sql
    for i in $(sed -n $sedpar uid.csv); do
      # 追加到sql文件      
      # 计算表名后缀 
      table_suffix=$((i % 128 + 1))     
      table_name="test_$table_suffix"
      echo "select $select from $table_name where uid=$i;" >> $fileId.sql
    done
    # 传入sql文件执行
    mysql -h $HOST -u $USERNAME -p$PASSWORD test < $fileId.sql > $fileId.result.csv
    echo "第 $fileId 文件查询完成"
}

# 读取 uid.csv 文件
totalLine=$(wc -w uid.csv | awk '{print $1}')
echo "总行数:$totalLine"
curFileId=1
for ((i=1; i < $totalLine; i+=1000)); do
  echo "处理第 $curFileId 个文件.........."
  query $curFileId 1000 & # 并发查询
  curFileId=$(($curFileId+1))
done

# 等待所有查询结束
wait

# 合并文件。。。
相关推荐
野犬寒鸦23 分钟前
从零起步学习MySQL || 第九章:从数据页的角度看B+树及MySQL中数据的底层存储原理(结合常见面试题深度解析)
java·服务器·数据库·后端·mysql·oracle·1024程序员节
热爱运维的小七27 分钟前
从传统架构到云原生,如何应对数据增长挑战?
数据库·it运维·devops·1024程序员节
Coding_Doggy44 分钟前
苍穹外卖是如何从0搭建一个标准的 Maven 多模块项目的?
java·数据库·maven
方二华2 小时前
5 mysql源码中B+树的构建
数据库·mysql·1024程序员节
望获linux4 小时前
【Linux基础知识系列:第一百五十九篇】磁盘健康监测:smartctl
linux·前端·数据库·chrome·python·操作系统·软件
西部风情4 小时前
聊聊并发、在线、TPS
android·java·数据库
清风6666667 小时前
基于单片机的水塔液位检测与智能调节报警系统设计
数据库·单片机·嵌入式硬件·毕业设计·课程设计·期末大作业
gplitems1238 小时前
Technox – IT Solutions & Services WordPress Theme: A Practical
linux·服务器·数据库
不剪发的Tony老师8 小时前
MySQL 9.5创新版发布,有哪些新功能?
数据库·mysql