1.文本方块方法(Spacy Text Splitter 方法)Can‘t find model ‘zh_core_web_sm‘

一、概述

执行如下:

python 复制代码
def split_spacy(text):
    import spacy
    nlp = spacy.load( "zh_core_web_sm" ) 
    doc = nlp(text) 
    for s in doc.sents: 
        print(s)
# d:\programdata\anaconda3\envs\python310\lib\site-packages
if __name__=="__main__":
    text = "我是一个名为 ChatGLM3-6B 的人工智能助手,是基于清华大学 KEG 实验室和智谱 AI公司于 2023 年共同训练的语言模型开发的。我的目标是通过回答用户提出的问题来帮助他们解决问题。由于我是一个计算机程序,所以我没有实际的存在,只能通过互联网来与用户交流。"
    # split_normal(text)
    # sp=split_sentences_with_delimiters(text)
    # print(f"sp:{sp}")
    split_spacy(text)

报:

E050\] Can't find model 'zh_core_web_sm'. It doesn't seem to be a Python package or a valid path to a data directory. ### 二、解决方案 (1)前提条件: ****spacy必须是3.7.0版本**** ****![](https://i-blog.csdnimg.cn/direct/68dd112a41e64e358cb6f7a31a07a350.png)**** (2)操作方式: 1.从[spacy/zh_core_web_sm at main](https://hf-mirror.com/spacy/zh_core_web_sm/tree/main "spacy/zh_core_web_sm at main")下载zh_core_web_sm-any-py3-none-any.whl 2.安装pip install zh_core_web_sm-any-py3-none-any.whl 3再运行,就能正确输出内容。 ![](https://i-blog.csdnimg.cn/direct/e7d5a0bc450f4f449d3cdef913ab3061.png)

相关推荐
WJX_KOI4 小时前
Open Notebook 一个开源的结合AI的记笔记软件
python
0思必得05 小时前
[Web自动化] 反爬虫
前端·爬虫·python·selenium·自动化
2301_822382766 小时前
Python上下文管理器(with语句)的原理与实践
jvm·数据库·python
喵手6 小时前
Python爬虫实战:从零搭建字体库爬虫 - requests+lxml 实战采集字体网字体信息数据(附 CSV 导出)!
爬虫·python·爬虫实战·零基础python爬虫教学·csv导出·采集字体库数据·字体库字体信息采集
2301_790300966 小时前
Python深度学习入门:TensorFlow 2.0/Keras实战
jvm·数据库·python
程序员敲代码吗8 小时前
用Python生成艺术:分形与算法绘图
jvm·数据库·python
Yyyyy123jsjs8 小时前
如何通过免费的外汇API轻松获取实时汇率数据
开发语言·python
喵手8 小时前
Python爬虫实战:GovDataMiner —— 开放数据门户数据集元数据采集器(附 CSV 导出)!
爬虫·python·爬虫实战·python爬虫工程化实战·零基础python爬虫教学·open data·开放数据门户数据集列表
历程里程碑8 小时前
滑动窗口---- 无重复字符的最长子串
java·数据结构·c++·python·算法·leetcode·django