使用 SQL 和表格数据进行问答和 RAG(1)—数据库准备

一. 从 .sql/csv/xlsx 文件创建 sqlite 数据库

  1. 要从.sql文件准备 SQL DB,这里会将创建数据库的代码放到了,将文件复制到data/sql目录中,然后在终端中的项目文件夹中执行:

    pip install sqlite3

  2. 现在创建一个名为sqldb的数据库:

    sqlite3 data/sqldb.db

注意:这里进入 SQLite 命令行后,就不需要再使用 sqlite3 命令

  1. 使用 .read 命令加载 SQL 文件:

    .read data/sql/<name of your sql database>.sql

比如:

复制代码
.read data/sql/Chinook_Sqlite.sql
  1. 执行 SQL 查询验证是否成功创建了数据库,直接输入 SQL 语句:

    SELECT * FROM <any Table name in your sql database> LIMIT 10;

比如:

复制代码
SELECT * FROM Artist LIMIT 10;

输出:

二. 从 CSV 和 XLSX 文件中准备 SQL 数据库,请先将文件复制到data/csv_xlsx中,并在终端中从项目文件夹中执行:

复制代码
python src/prepare_csv_xlsx_sqlitedb.py

此命令将在data目录中创建一个名为csv_xlsx_sqldb.db的 SQL 数据库。

三. 从 CSV 和 XLSX 文件准备 vectorDB,请将文件复制到data/for_upload中,并在终端中从项目文件夹中执行

复制代码
python src/prepare_csv_xlsx_vectordb.py
相关推荐
aircrushin27 分钟前
国产大模型工业化转型:豆包2.0如何定义“数字员工”新范式
人工智能
AI浩28 分钟前
EFSI-DETR:用于无人机图像实时小目标检测的高效频域 - 语义集成方法
人工智能·目标检测·无人机
上进小菜猪31 分钟前
基于 YOLOv8 的无人机位置捕捉与识别检测系统 [目标检测完整源码]
人工智能
cyforkk34 分钟前
YAML 配置文件中的常见陷阱:内联字典与块映射混用
人工智能·深度学习·机器学习
Testopia34 分钟前
人脸检测:OpenVINO在计算机视觉中的应用
人工智能·计算机视觉·openvino
heimeiyingwang34 分钟前
企业级知识库构建:从数据清洗到向量检索
大数据·人工智能·机器学习
globaldomain38 分钟前
立海世纪:.com和.net域名哪个更适合你的网站
大数据·前端·人工智能·新媒体运营·国外域名·域名注册
小小工匠42 分钟前
大模型开发 - 手写Manus之Tavily搜索工具:04 让AI Agent接入互联网
人工智能·搜索·tavily
TMT星球42 分钟前
豆包除夕AI互动19亿次,Seedance2.0为春晚提供技术支持
人工智能
爱编程的Zion44 分钟前
小白AI学习笔记---第一章,如何正确使用
人工智能·笔记·学习