Vanna Text2SQL数据库平权

最近都在面试,拿了些offer保底,别人寒假的时候我努力,竞争的人不多,各位老板也可以投投试试。

开年的股市就是个笑话,明年春招难搞!自己还是很想去抖音、拼多多等大厂的,走传统前/后端跟一群大佬去厮杀少量的HC,还不如另辟蹊径...

最近看牛客、Boss直聘上AIGC前端方向,有些大厂的招聘信息。这可能是条去大厂发财的好路子,开搞!

前言

前端搞全栈,复杂SQL是个难点。我之前写过一篇LangChain实战: 老喻干货店TextToSql,今天跟大家分享Vanna, 一款基于RAG的自然语言生成SQL的工具。

Vanna

激动的心,颤抖的手,点击右上角Get Start for Free,试用一下。经过邮箱认证后,我们会拿到如下的API:

我们来看下官方给的Demo:

python 复制代码
# 安装vanna 
!pip install vanna
# vanna.remote 提供访问远程的数据库,这个很实用
from vanna.remote import VannaDefault
# 返回vn 实例  
vn = VannaDefault(model='chinook', api_key='****')
# 连接数据库  
vn.connect_to_sqlite('https://vanna.ai/Chinook.sqlite')
# 销售额排名前十的艺术家是?
vn.ask('What are the top 10 artists by sales?')
# 执行
from vanna.flask import VannaFlaskApp
VannaFlaskApp(vn).run()

从代码看,vanna还是很强大的。首先,它有VannaFlaskApp,把Text2SQL提升到App的高度,看来我们使用vanna给全公司搭个TextToSql应用很方便了。从名字看,VannaFlaskApp,底层以来Flask。其次,远程连接数据库的能力非常nice,实例化VannaDefault,传递给它模型和api_key,就可以连接远程数据库。最后,实例上的ask方法可以进行自然语言数据查询。这比我之前看在的Text2SQL 在工程化完备程度上好太多了。

您先按这个地址将sqlite数据库下载下来,并使用vscode(sqlite viewer插件)打开。  销售额排名前十的艺术家这个查询关联Artist、Album、Track、InvoiceLine三个表。截图我就不一一给出,大家可以自己看。

sql 复制代码
# 生成的SQL, 挺复杂的
SELECT a.ArtistId, a.Name, SUM(il.Quantity) AS TotalSales
FROM Artist a
INNER JOIN Album al ON a.ArtistId = al.ArtistId
INNER JOIN Track t ON al.AlbumId = t.AlbumId
INNER JOIN InvoiceLine il ON t.TrackId = il.TrackId
GROUP BY a.ArtistId, a.Name
ORDER BY TotalSales DESC
LIMIT 10;
yaml 复制代码
# 查询结果
 ArtistId                     Name  TotalSales
0        90              Iron Maiden         140
1       150                       U2         107
2        50                Metallica          91
3        22             Led Zeppelin          87
4       113  Os Paralamas Do Sucesso          45
5        58              Deep Purple          44
6        82            Faith No More          42
7       149                     Lost          41
8        81             Eric Clapton          40
9       124                   R.E.M.          39

Artist 表是艺术家表,有ArtistId 和 Name(艺术家名字)两个字段。除此之外我们还需要排名取前十位,并计算销售额。

InvoiceLine是销售记录表,invoice是发票的意思。InvoiceLine里有一个TrackId字段指向Track表。

Track表包含AlbumId字段,指向Album 艺术品表。

找到了AlbumId, 通过Album表就可以找到ArtistId

天啊,这个表分的真够细!但这才是真正线上中大型项目的真实情况。而我们要做的Text2SQL 企业版,要在技术、运营、小编、用户等都可以用起来,Vanna展示了它的强大!

AI工具更新换代很快,很开心今天与Vanna的相见。就到这里,休息一下!下次再与大家一起深入越野Vanna的领地越野。

总结

  • Vanna官网
  • Vanna 基于LLM,基于RAG
  • 数据库不再是技术的专利,Text2SQL语义化查询带来数据库平权!Vanna好像可以投入生产。

参考资料

相关推荐
tiger1199 分钟前
FPGA在AI时代的定位?
人工智能·fpga开发
EMQX11 分钟前
ESP32 + MCP over MQTT:实现智能设备语音交互
人工智能·mqtt·语言模型·智能硬件
DisonTangor2 小时前
MiniMax 开源一个为极致编码与智能体工作流打造的迷你模型——MiniMax-M2
人工智能·语言模型·开源·aigc
Giser探索家4 小时前
无人机桥梁巡检:以“空天地”智慧之力守护交通生命线
大数据·人工智能·算法·安全·架构·无人机
不会学习的小白O^O4 小时前
双通道深度学习框架可实现从无人机激光雷达点云中提取橡胶树冠
人工智能·深度学习·无人机
恒点虚拟仿真4 小时前
虚拟仿真实训破局革新:打造无人机飞行专业实践教学新范式
人工智能·无人机·ai教学·虚拟仿真实训·无人机飞行·无人机专业虚拟仿真·无人机飞行虚拟仿真
鲜枣课堂5 小时前
华为最新光通信架构AI-OTN,如何应对AI浪潮?
人工智能·华为·架构
格林威6 小时前
AOI在新能源电池制造领域的应用
人工智能·数码相机·计算机视觉·视觉检测·制造·工业相机
dxnb226 小时前
Datawhale25年10月组队学习:math for AI+Task5解析几何
人工智能·学习
DooTask官方号6 小时前
DooTask 1.3.38 版本更新:MCP 服务器与 AI 工具深度融合,开启任务管理新体验
运维·服务器·人工智能·开源软件·dootask