一个用SQL处理excel和跨库查询的开源工具分享

简介

项目地址: github.com/WenchaoZeng...

一个基于sql的数据处理工具, 可以通过写sql的方式对excel, csv, 跨库mysql表等进行数据处理和加工.

用途

  1. 使用SQL分析处理excel或csv文件.
  2. 在excel和各个跨库数据库(比如mysql)之间, 进行跨库数据分析.
  3. excel数据导入导出.

下载和运行

  1. releases 里面下载最新的zip包, 解压到一个特定目录.
  2. 准备一个测试的sql文件, 内容为:
sql 复制代码
# h2
select 1 as a;
  1. 从命令行进入目录, 执行下面命令:
bash 复制代码
./start.sh /你的sql文件路径/文件名称.sql

如果是windows命令行的话, 则是:

bash 复制代码
start.bat C:\你的sql文件路径\文件名称.sql

正常执行的话, 显示结果类似这样:

javascript 复制代码
~/xxxx$ ./start.sh /Users/xxx/test.sql
执行:  /Users/xxx/test.sql
==============================
SQL: h2
select 1 as a;

结果集: table, 行数: 1, 耗时: 149毫秒
==============================
导出结果集table
导出文件路径为: /Users/xxx/SqlDataProcessor/./output/./table.csv

正常情况下结果文件会自动打开的. 如果没有自动打开的话, 可以手动进入output目录, 然后双击里面的csv文件看是不是没有设置默认打开方式. 设置好默认打开方式后, 后续再执行就会自动打开了.

几个使用场景示例

场景1: 分析excel数据

sql 复制代码
# import /Users/wenchaozeng/Documents/文档资料/测试excel.xlsx

# h2
select
    count(*) as 有效数据数量
from $table temp
where
    字 is not null
    and 字 != '';

场景2: 使用excel生成sql

ini 复制代码
# import /Users/wenchaozeng/Documents/文档资料/字库修正/工作表2-表格 1.csv

# local
select
    *,
    concat('update word set phrase = ''', phrase ,''', sentence = ''', sentence ,''' where course = ''word'' and word = ''', word ,''';') as sql_text
from $table temp;

场景3: 导入excel数据到数据库

sql 复制代码
# import /Users/wenchaozeng/Documents/文档资料/测试excel.xlsx

# local_yuyi
insert into word(word, course)
select
    字, 'ENGLISH'
from$table temp;

场景4: excel和mysql联合分析

sql 复制代码
# import /Users/wenchaozeng/Documents/文档资料/测试excel.xlsx

# local_yuyi
select
    word.word,
    word.course
from $table temp
left join word on word.word = 字
where
    length(word.sentence) > 10
;

场景4: mysql跨库数据分析

sql 复制代码
# local_yuyi
select
    word as 本地word,
    sentence as 本地sentence
from word
where
    word in ('你', '好')
;

# prod_yuyi
select
    temp.*,
    word as 线上word,
    sentence as 线上sentence
from $table temp
left join word on word.word = 本地word
;

结语

这个工具目的不在于生产环境上的数据分析, 目的更多的是作为程序员的个人日常工具, 方便在本地进行数据查询和快速分析, 上手快, 无须搭建平台或数据分析环境.

感兴趣的朋友们, 欢迎试用和评论反馈 (记得给个star哟 :D).

相关推荐
程序员岳焱42 分钟前
Java 与 MySQL 性能优化:Java 实现百万数据分批次插入的最佳实践
后端·mysql·性能优化
麦兜*1 小时前
Spring Boot启动优化7板斧(延迟初始化、组件扫描精准打击、JVM参数调优):砍掉70%启动时间的魔鬼实践
java·jvm·spring boot·后端·spring·spring cloud·系统架构
大只鹅2 小时前
解决 Spring Boot 对 Elasticsearch 字段没有小驼峰映射的问题
spring boot·后端·elasticsearch
ai小鬼头2 小时前
AIStarter如何快速部署Stable Diffusion?**新手也能轻松上手的AI绘图
前端·后端·github
IT_10242 小时前
Spring Boot项目开发实战销售管理系统——数据库设计!
java·开发语言·数据库·spring boot·后端·oracle
bobz9652 小时前
动态规划
后端
stark张宇3 小时前
VMware 虚拟机装 Linux Centos 7.9 保姆级教程(附资源包)
linux·后端
亚力山大抵4 小时前
实验六-使用PyMySQL数据存储的Flask登录系统-实验七-集成Flask-SocketIO的实时通信系统
后端·python·flask
超级小忍4 小时前
Spring Boot 中常用的工具类库及其使用示例(完整版)
spring boot·后端
CHENWENFEIc4 小时前
SpringBoot论坛系统安全测试实战报告
spring boot·后端·程序人生·spring·系统安全·安全测试