使用 SQL 和表格数据进行问答和 RAG(1)—数据库准备

一. 从 .sql/csv/xlsx 文件创建 sqlite 数据库

  1. 要从.sql文件准备 SQL DB,这里会将创建数据库的代码放到了,将文件复制到data/sql目录中,然后在终端中的项目文件夹中执行:

    pip install sqlite3

  2. 现在创建一个名为sqldb的数据库:

    sqlite3 data/sqldb.db

注意:这里进入 SQLite 命令行后,就不需要再使用 sqlite3 命令

  1. 使用 .read 命令加载 SQL 文件:

    .read data/sql/<name of your sql database>.sql

比如:

复制代码
.read data/sql/Chinook_Sqlite.sql
  1. 执行 SQL 查询验证是否成功创建了数据库,直接输入 SQL 语句:

    SELECT * FROM <any Table name in your sql database> LIMIT 10;

比如:

复制代码
SELECT * FROM Artist LIMIT 10;

输出:

二. 从 CSV 和 XLSX 文件中准备 SQL 数据库,请先将文件复制到data/csv_xlsx中,并在终端中从项目文件夹中执行:

复制代码
python src/prepare_csv_xlsx_sqlitedb.py

此命令将在data目录中创建一个名为csv_xlsx_sqldb.db的 SQL 数据库。

三. 从 CSV 和 XLSX 文件准备 vectorDB,请将文件复制到data/for_upload中,并在终端中从项目文件夹中执行

复制代码
python src/prepare_csv_xlsx_vectordb.py
相关推荐
MobiCetus39 分钟前
如何一键安装所有Python项目的依赖!
开发语言·jvm·c++·人工智能·python·算法·机器学习
宋发元1 小时前
面向对象——开闭原则(Open-Closed Principle, OCP)
人工智能·开闭原则
拓端研究室1 小时前
2025年数智化电商产业带发展研究报告260+份汇总解读|附PDF下载
人工智能
小白天下第一1 小时前
jdk21使用Vosk实现语音文字转换,免费的语音识别
java·人工智能·语音识别
大模型任我行1 小时前
上财:LLM通过强化学习进行金融推理
人工智能·语言模型·自然语言处理·论文笔记
gs801402 小时前
FastBlock是一个专为全闪存场景设计的高性能分布式块存储系统
人工智能
自由鬼2 小时前
Google开源机器学习框架TensorFlow探索更多ViT优化
人工智能·python·深度学习·机器学习·tensorflow·机器训练
青花瓷2 小时前
Yolo_v8的安装测试
人工智能·python·yolo
-一杯为品-2 小时前
【动手学深度学习】#6 卷积神经网络
人工智能·深度学习·cnn
tzc_fly2 小时前
TextGrad:案例
人工智能