【自然语言处理系列】手动安装和测试Spacy中en_core_web_sm模型的详细教程

摘要:本教程旨在为自然语言处理(NLP)初学者提供一个详细的指南,用于手动安装流行的NLP库Spacy及其英语模型en_core_web_sm。文章将逐步指导您如何安装Spacy库、查看其版本,确定并下载适合的en_core_web_sm模型版本,以及如何正确安装并测试这些组件确保它们正常工作。完成本教程后,您将能够使用Spacy进行基本的NLP任务,例如分词、命名实体识别和依赖关系解析。

目录

一、安装Spacy

二、查看本地的spacy版本

[三、确定要下载的 en_core_web_sm版本](#三、确定要下载的 en_core_web_sm版本)

[四、手动下载 en_core_web_sm文件](#四、手动下载 en_core_web_sm文件)

五、安装en_core_web_sm文件

六、测试是否成功安装


一、安装Spacy

复制代码
pip install -U spacy -i https://pypi.tuna.tsinghua.edu.cn/simple

二、查看本地的spacy版本

通过pip list查看本地的spacy版本,这一步很重要,因为安装的en_core_web_sm要和spaCy版本兼容。

下方是我电脑上本地的spacy版本,版本为3.-7.5

三、确定要下载的 en_core_web_sm版本

进入下方链接,找到与自己scpay版本对应的en_core_web_sm版本

en_core_web_sm · Releases · explosion/spacy-models (github.com)

笔者本地的Spcay版本是3.7.5,故选择其兼容的3.7.0版本的en_core_web_sm

怎么判断兼容不兼容呢?看下方图片红色框框圈起来的部分,这部分提示这个3.7.0版本的en_core_web_sm适用于3.7.0到3.8.0之间的spaCy。

四、手动下载 en_core_web_sm文件

分别点击下方的这两个downloads,分别下载.gz文件和.whl文件。

五、安装en_core_web_sm文件

确定好.gz文件和.whl文件这两个文件所在的路径,比如我这里的路径是:D:\spacy中的en_core_web_sm。那么就打开cmd,通过cd命令进入到这个路径(目录)下,如下图:

然后输入如下代码:

注意不要完全照抄下方代码,要把en_core_web_sm对应的版本号修改一下,比方你是3.6.0版本的en_core_web_sm,就改成pip install en_core_web_sm-3.6.0.tar.gz

复制代码
pip install en_core_web_sm-3.7.0.tar.gz

安装之后,显示如下图就是安装成功了!

六、测试是否成功安装

输入如下代码,如果正常运行,就再次验证安装成功了!

复制代码
import spacy
nlp = spacy.load("en_core_web_sm")#读进英文模型
doc = nlp('Weather is good, very windy and sunny. We have no classes in the afternoon.')
# 分词
for token in doc:
    print (token)

运行结果如下:

相关推荐
卖个几把萌4 小时前
【16】Selenium+Python 接管已打开谷歌浏览器
python·selenium·测试工具
像风一样的男人@5 小时前
python --两个文件夹文件名比对(yolo 图和label标注比对检查)
windows·python·yolo
lllsure5 小时前
【Python】Dict(字典)
开发语言·python
zskj_zhyl5 小时前
智慧康养新篇章:七彩喜如何重塑老年生活的温度与尊严
大数据·人工智能·科技·物联网·生活
tianyuanwo6 小时前
Rust开发完全指南:从入门到与Python高效融合
开发语言·python·rust
如何原谅奋力过但无声6 小时前
TensorFlow 2.x常用函数总结(持续更新)
人工智能·python·tensorflow
程序员-小李6 小时前
基于 Python + OpenCV 的人脸识别系统开发实战
开发语言·python·opencv
苗壮.7 小时前
「个人 Gitee 仓库」与「企业 Gitee 仓库」同步的几种常见方式
大数据·elasticsearch·gitee
万粉变现经纪人7 小时前
如何解决 pip install 安装报错 [WinError 32] 文件被占用(杀毒/占用进程)问题
python·pycharm·flask·beautifulsoup·bug·pandas·pip
qyresearch_7 小时前
大语言模型训推一体机:AI算力革命的“新引擎”,2031年市场规模突破123亿的黄金赛道
人工智能·语言模型·自然语言处理