花了一小时,拿python手搓了一个考研背单词软件

听说没有好用的电脑端背单词软件?只好麻烦一下,花了一小时,拿python手搓了一个考研背单词软件。

代码已经开源在我的github上,欢迎大家STAR!

其中,数据是存放在sqlite中,形近词跳转是根据jaro winkler距离得到最近单词的,近义词跳转是使用huggingface上的bert-base-uncased模型得到的词嵌入向量,然后计算cosine相似距离得到的。这部分代码没有开源,大家可以自行实现,开源项目中包含了6646个考研必备单词及索引,可以正常使用检索功能。

数据库的建表语句如下,下载之后可以自己导出数据,获得完整单词库。

sql 复制代码
c.execute('''DROP TABLE IF exists process;''')
c.execute("CREATE TABLE process(id INTEGER);")
c.execute('''DROP TABLE IF exists words;''')
c.execute('''CREATE TABLE IF NOT EXISTS words(id INTEGER PRIMARY KEY AUTOINCREMENT, word TEXT, en TEXT, us TEXT, meaning TEXT, count INTEGER)''')

以后有空再来补充一些具体做法!

相关推荐
AI 嗯啦3 分钟前
机器学习 —— 决策树
python·机器学习
睿思达DBA_WGX18 分钟前
Python 程序设计讲义(36):字符串的处理方法——去除字符串头尾字符:strip() 方法、lstrip() 方法与rstrip() 方法
开发语言·python
阿蒙Amon38 分钟前
详解Python标准库之互联网数据处理
网络·数据库·python
淦暴尼38 分钟前
每日五个pyecharts可视化图表-bars(1)
python·信息可视化·echarts
啊哈哈哈哈哈啊哈哈2 小时前
G9打卡——ACGAN
python·生成对抗网络·gan
ALLSectorSorft2 小时前
相亲小程序用户注册与登录系统模块搭建
java·大数据·服务器·数据库·python
caisexi3 小时前
Windows批量启动java服务bat脚本
java·windows·python
斜月4 小时前
Python Asyncio以及Futures并发编程实践
后端·python
No0d1es4 小时前
第15届蓝桥杯Pthon青少组_国赛_中/高级组_2024年9月7日真题
python·青少年编程·蓝桥杯·国赛·中高组
talented_pure5 小时前
Python打卡Day30 模块和库的导入
开发语言·python