花了一小时,拿python手搓了一个考研背单词软件

听说没有好用的电脑端背单词软件?只好麻烦一下,花了一小时,拿python手搓了一个考研背单词软件。

代码已经开源在我的github上,欢迎大家STAR!

其中,数据是存放在sqlite中,形近词跳转是根据jaro winkler距离得到最近单词的,近义词跳转是使用huggingface上的bert-base-uncased模型得到的词嵌入向量,然后计算cosine相似距离得到的。这部分代码没有开源,大家可以自行实现,开源项目中包含了6646个考研必备单词及索引,可以正常使用检索功能。

数据库的建表语句如下,下载之后可以自己导出数据,获得完整单词库。

sql 复制代码
c.execute('''DROP TABLE IF exists process;''')
c.execute("CREATE TABLE process(id INTEGER);")
c.execute('''DROP TABLE IF exists words;''')
c.execute('''CREATE TABLE IF NOT EXISTS words(id INTEGER PRIMARY KEY AUTOINCREMENT, word TEXT, en TEXT, us TEXT, meaning TEXT, count INTEGER)''')

以后有空再来补充一些具体做法!

相关推荐
Dreams°12316 分钟前
【大数据测试Flume:从 0-1详细教程】
大数据·python·单元测试·自动化·flume
stormsha33 分钟前
go-rod vs Selenium:自动化测试工具的比较与选择
python·selenium·测试工具·golang
逝去的紫枫35 分钟前
Python Selenium:Web自动化测试与爬虫开发
开发语言·python·selenium
平头哥在等你1 小时前
python特殊字符序列
开发语言·python·正则表达式
星光樱梦2 小时前
02. Python基础知识
python
亚图跨际2 小时前
MATLAB和C++及Python流式细胞术
c++·python·matlab·流式细胞术
steamedobun2 小时前
【爬虫】Firecrawl对京东热卖网信息爬取(仅供学习)
爬虫·python
右恩2 小时前
Docker 实践与应用举例
python·docker
凤枭香2 小时前
Python Scikit-learn简介(二)
开发语言·python·机器学习·scikit-learn
湫ccc10 小时前
《Python基础》之字符串格式化输出
开发语言·python