花了一小时,拿python手搓了一个考研背单词软件

听说没有好用的电脑端背单词软件?只好麻烦一下,花了一小时,拿python手搓了一个考研背单词软件。

代码已经开源在我的github上,欢迎大家STAR!

其中,数据是存放在sqlite中,形近词跳转是根据jaro winkler距离得到最近单词的,近义词跳转是使用huggingface上的bert-base-uncased模型得到的词嵌入向量,然后计算cosine相似距离得到的。这部分代码没有开源,大家可以自行实现,开源项目中包含了6646个考研必备单词及索引,可以正常使用检索功能。

数据库的建表语句如下,下载之后可以自己导出数据,获得完整单词库。

sql 复制代码
c.execute('''DROP TABLE IF exists process;''')
c.execute("CREATE TABLE process(id INTEGER);")
c.execute('''DROP TABLE IF exists words;''')
c.execute('''CREATE TABLE IF NOT EXISTS words(id INTEGER PRIMARY KEY AUTOINCREMENT, word TEXT, en TEXT, us TEXT, meaning TEXT, count INTEGER)''')

以后有空再来补充一些具体做法!

相关推荐
MoRanzhi12031 小时前
2. Pandas 核心数据结构:Series 与 DataFrame
大数据·数据结构·人工智能·python·数据挖掘·数据分析·pandas
小钱c71 小时前
Python利用ffmpeg实现rtmp视频拉流和推流
python·ffmpeg·音视频
合作小小程序员小小店2 小时前
桌面预测类开发,桌面%性别,姓名预测%系统开发,基于python,scikit-learn机器学习算法(sklearn)实现,分类算法,CSV无数据库
python·算法·机器学习·scikit-learn·sklearn
Q26433650232 小时前
【有源码】基于Hadoop+Spark的豆瓣电影数据分析与可视化系统-基于大数据的电影评分趋势分析与可视化系统
大数据·hadoop·python·数据分析·spark·毕业设计·课程设计
天特肿瘤电场研究所3 小时前
靠谱的肿瘤电场疗法公司
人工智能·python
闲人编程4 小时前
2025年,如何选择Python Web框架:Django, Flask还是FastAPI?
前端·后端·python·django·flask·fastapi·web
python开发笔记4 小时前
python(77) python脚本与jenkins pipeline交互的5种方式
python·jenkins·交互
vx_dmxq2114 小时前
免费领源码-Spring boot的物流管理系统 |可做计算机毕设Java、Python、PHP、小程序APP、C#、爬虫大数据、单片机、文案
java·大数据·python·jupyter·课程设计
飞翔的佩奇4 小时前
【完整源码+数据集+部署教程】鸡只与养殖场环境物品图像分割: yolov8-seg等50+全套改进创新点发刊_一键训练教程_Web前端展示
python·yolo·计算机视觉·数据集·yolov8·yolo11·鸡只与养殖场环境物品图像分割
自我陶醉@4 小时前
计算机网络---应用层
网络·计算机网络·考研·学习方法·408·王道