基于 Datasheet 二次开发:一个纯浏览器端的 PostgreSQL 数据分析工具

一款无需安装、直接在浏览器中运行的数据管理工具,让 SQL 查询和数据可视化触手可及

缘起:积分统计的烦恼

最近我一直在使用 CodeBuddy 和 WorkBuddy 辅助日常开发工作。每次对话都会生成详细日志,记录着使用了哪些模型、消耗了多少积分、调用时间。这些数据被导出为一个 Excel 文件,按理说用 Excel 做统计分析应该很轻松------但现实总是不那么理想。

我对 Excel 的使用并不算精通,复杂的数据透视表、公式统计常常把我绕晕。每次想统计"某月各模型的使用次数与积分消耗"或"某月每天的积分使用趋势"时,我都得在 Excel 里折腾半天,结果还常常出错。

更理想的方式是什么呢?把数据导入数据库,用 SQL 查询------这才是我最顺手的方式。但每次都要启动本地数据库、写导入脚本,实在太麻烦了。我想要的是一款工具:

  • 无需安装,打开浏览器就能用
  • 支持 SQL 查询,用我最熟悉的方式分析数据
  • 数据持久化,刷新页面不会丢失
  • 最好还能有一些可视化能力,让数据更直观

正好,我在 GitHub 上刷到了一个很有意思的开源项目------Datasheet。它基于 PGlite 在浏览器中运行完整的 PostgreSQL 数据库,数据存储在 IndexedDB 中,完美满足了我"浏览器内 SQL 分析"的需求。

于是我 Fork 了这个项目,在使用过程中修复了一些 Bug,根据实际需求新增了不少功能。现在把我的修改记录下来,希望能帮到有类似需求的朋友。

项目地址github.com/xiuji008/da...

在线体验xiuji008.github.io/datasheet/

什么是 Datasheet?

Datasheet 是一个基于浏览器的 PostgreSQL 数据管理工具,核心技术是 PGlite------一个将 PostgreSQL 编译为 WebAssembly 的方案,可以在浏览器中直接运行完整的 PG 数据库。

原项目的核心特性

  • 浏览器内 PostgreSQL:无需安装数据库,数据持久化到 IndexedDB
  • 多工作区管理:通过 Schema 隔离,支持创建/切换/删除工作区
  • SQL 编辑器:基于 CodeMirror,支持语法高亮、智能提示
  • 数据导入:从 Excel/CSV 导入数据,可视化配置映射关系
  • 表结构浏览:左侧栏展示数据库表列表
  • 查询结果编辑:表格形式展示,支持直接编辑并保存

我做了哪些修改?

说明:此项目基于开源项目 Datasheet 二次开发,在原作基础上修复了若干 Bug 并新增了大量功能。感谢原作者的开源贡献。

Bug 修复

1. 数据导入表头错误

问题:导入 Excel 时,表头被当作数据行一起导入。

原因ImportDialog.vue 中获取数据行时使用了错误的切片起点。原代码用 headerRow 作为切片起点,实际上应该用 dataStartRow

修复后:数据从正确的行开始读取,表头独立映射为列名。

2. 查询结果首行缺失

问题 :执行 SELECT 查询后,结果集的首行数据不显示。

原因index.vue 中对查询结果做了 rows.slice(1) 处理,原本可能用于跳过表头,但这导致真正的数据行被错误跳过。对于聚合查询(如 SUMCOUNT),结果只有一行时会直接不显示。

修复后:不再对查询结果进行切片,完整显示所有行。

3. 类型推断精度不足

问题 :导入数据时,如果数值列后续行有大数值,会报 numeric field overflow 错误。

原因useImport.ts 中类型推断只采样了前 10 行数据来判断列类型,如果前 10 行都是小数,但后面有大整数,会导致类型设置过小。

修复后:改为扫描全部数据行进行类型推断,确保精度足够。

4. 日期时间类型丢失时间部分

问题 :包含时间的日期列导入后被推断为 DATE 类型,丢失了时间部分。

原因 :日期和日期时间都被检测为 DATE 类型。

修复后 :增加时间检测逻辑,区分 DATE(仅日期)和 TIMESTAMP(日期+时间),并在导入时格式化为标准格式。

新增功能

1. AI SQL 生成

这是我最喜欢的新功能。接入兼容 OpenAI 格式的大模型 API,用自然语言描述需求,AI 自动生成 SQL。

支持的平台

  • DeepSeek
  • OpenAI
  • 通义千问
  • Moonshot
  • SiliconFlow

配置项

  • API 地址、Key、模型自定义
  • 系统提示词可调整
  • 支持选择表结构作为上下文,减少 Token 消耗
  • 可配置是否携带对话历史及轮数

2. 数据可视化

查询结果可以一键生成图表,这对于数据分析来说太实用了。

支持的图表类型

  • 柱状图
  • 折线图
  • 饼图

特色

  • 多选数值列,多 Y 轴交替左右分布
  • 不同颜色区分数据系列
  • 图例支持点击开关
  • AI 根据 SQL 自动生成图表标题
  • 图表下载为 PNG 图片
  • 双饼图合并导出

柱状图的细节优化

  • 自适应宽度,横坐标过长时斜 45° + 省略号截断
  • 网格边距防遮挡

3. 表结构查看

在左侧 TABLES 树中右键点击表名,弹出菜单选择"查看表结构"。

展示信息

  • 字段名
  • 数据类型
  • 是否可空
  • 主键标识
  • 默认值
  • 字段备注
  • 索引信息

一键复制为 Markdown:方便在文档中记录表结构,或作为 AI 生成 SQL 的上下文。

4. SQL 收藏

常用 SQL 可以保存下来,方便随时复用。

  • 保存时填写标题、SQL 内容、描述
  • 左侧 SAVED SQL 列表展示所有收藏
  • 点击即可加载到编辑器
  • 支持编辑和删除

5. 标签页增强

多标签页管理更加顺手:

  • 右键菜单:关闭其它标签、关闭左侧标签、关闭右侧标签
  • "新建查询"按钮重新设计为青绿色渐变样式,更加醒目

6. 删除功能完善

补充了原来缺失的删除操作:

  • 删除表:表行末固定显示删除按钮
  • 删除工作区(非 default):工作区列表行末显示删除按钮
  • 删除文件:侧边栏、对话框、详情页均添加删除按钮

7. 日期格式化显示

所有查询结果中的 Date 对象统一显示为 yyyy-MM-dd HH:mm:ss 格式,让时间数据一目了然。

8. 列宽拖拽 ↔️

查询结果表格支持鼠标拖拽调整列宽,列头右侧显示蓝色拖拽手柄,方便查看长文本内容。

9. GitHub Pages 自动部署

新增 deploy.yml GitHub Actions 工作流,push 到 main 分支自动构建并部署到 GitHub Pages。

项目技术栈

如何使用

在线体验

直接访问:xiuji008.github.io/datasheet/

本地开发

bash 复制代码
# 安装依赖
pnpm install

# 启动开发服务器
pnpm dev

# 构建生产版本
pnpm build

# 静态生成(用于 GitHub Pages 部署)
pnpm generate

Github Pages 部署

直接fork 本项目后设置 Pages, 然后在Actions执行 完成即可访问

Docker部署

  1. 创建部署目录 mkdir datasheet
  2. 创建docker-compose.yml 文件,内容如下:
yaml 复制代码
services:
  datasheet:
    image: registry.cn-hangzhou.aliyuncs.com/xj_lew/datasheet:1.0.0 
    container_name: datasheet
    ports:
      - '3000:3000'
    restart: unless-stopped
  1. 启动容器
shell 复制代码
docker-compose up -d 
  1. 访问项目

在浏览器中打开部署地址即可访问

使用场景

场景一:积分统计与分析

回到我最初的需求------把 CodeBuddy/WorkBuddy 的日志 Excel 导入 Datasheet:

  1. 点击"导入数据",选择 Excel 文件
  2. 自动识别表头和数据,映射到表中
  3. 在 SQL 编辑器中写查询:
sql 复制代码
SELECT 
    TO_CHAR(use_time, 'YYYY-MM-DD') AS "日期",
    SUM(points) AS "积分使用数量",
    COUNT(requestid) AS "积分使用次数"
FROM 
    "request_usage_2026_06_28"
WHERE 
    EXTRACT(MONTH FROM use_time) = 6 AND EXTRACT(YEAR FROM use_time) = 2026
GROUP BY 
    "日期";
  1. 点击"图表",选择柱状图,选择日期作为 X 轴,使用次数和积分作为 Y 轴
  2. 分析结果一目了然

场景二:AI 辅助 SQL 生成

不熟悉 SQL 语法也没关系:

  1. 点击「✨ AI 生成 SQL」按钮
  2. 用自然语言描述:统计6月份各个时间段(上午,下午,晚上 )的积分使用情况(次数和数量)
  3. AI 自动生成 SQL,点击"回填并执行"即可

场景三:数据探索与可视化

导入任意数据后:

  • 左侧查看所有表结构
  • 写 SQL 探索数据
  • 一键生成图表
  • 保存常用查询,下次一键复用

与原项目对比

功能 原版 Datasheet 修改版
SQL 编辑器
数据导入 ✅(修复表头错误、类型推断)
多工作区 ✅(增加删除功能)
表结构查看 基础 ✅ 右键弹窗 + Markdown 复制
SQL 收藏
AI 生成 SQL
数据可视化 ✅(柱状/折线/饼图)
列宽拖拽
日期格式化
标签页管理 基础 ✅ 右键关闭其它/左侧/右侧

写在最后

这个项目目前还在持续迭代中,作为一个纯前端工具,它很好地解决了"在浏览器中分析数据"这个需求。如果你也有类似的使用场景------比如分析日志数据、探索数据集、或者单纯想在浏览器里用 SQL 分析 Excel 数据------不妨试试这个工具。

开源项目最有趣的地方就在于:你可以根据自己的需求去修改它、扩展它,让它真正为你所用。

项目地址github.com/xiuji008/da...

在线体验xiuji008.github.io/datasheet/

相关推荐
冬奇Lab1 天前
每日一个开源项目(第144篇):ai-website-cloner-template - 一条命令、多 Agent 并行,把任意网站逆向成 Next.js 代码
前端·人工智能·开源
冬奇Lab2 天前
每日一个开源项目(第142篇):android/skills - Google 官方 Android 开发 AI Skill 库
人工智能·开源·资讯
冬奇Lab2 天前
Skill 系列(06):Skill 工程化与治理——路由准确率 38%、压缩节省 76%
人工智能·开源·agent
冬奇Lab3 天前
Skill 系列(05):Skill 工作流串联——4 种模式实测,并发加速 1.5x
人工智能·开源
冬奇Lab3 天前
每日一个开源项目(第141篇):hiring-agent - HackerRank 开源了他们的简历评分系统,你的简历能得几分?
人工智能·面试·开源
喝拿铁写前端4 天前
我替你试了:GitNexus 不是更强的搜索框
开源·资讯
Tigger4 天前
受不了 ¥98/年的订阅,我用 Vibe Coding 自己写了个剪贴板工具
人工智能·开源·mac
冬奇Lab5 天前
每日一个开源项目(第140篇):AgentScope 2.0 - 阿里开源的生产级 Agent 框架
人工智能·开源·agent
冬奇Lab5 天前
Skill 系列(04):Skill 指标体系——L1/L2/L3 三层监控,让质量下降有据可查
人工智能·开源·llm