1.文本方块方法(Spacy Text Splitter 方法)Can‘t find model ‘zh_core_web_sm‘

一、概述

执行如下:

python 复制代码
def split_spacy(text):
    import spacy
    nlp = spacy.load( "zh_core_web_sm" ) 
    doc = nlp(text) 
    for s in doc.sents: 
        print(s)
# d:\programdata\anaconda3\envs\python310\lib\site-packages
if __name__=="__main__":
    text = "我是一个名为 ChatGLM3-6B 的人工智能助手,是基于清华大学 KEG 实验室和智谱 AI公司于 2023 年共同训练的语言模型开发的。我的目标是通过回答用户提出的问题来帮助他们解决问题。由于我是一个计算机程序,所以我没有实际的存在,只能通过互联网来与用户交流。"
    # split_normal(text)
    # sp=split_sentences_with_delimiters(text)
    # print(f"sp:{sp}")
    split_spacy(text)

报:

E050\] Can't find model 'zh_core_web_sm'. It doesn't seem to be a Python package or a valid path to a data directory. ### 二、解决方案 (1)前提条件: ****spacy必须是3.7.0版本**** ****![](https://i-blog.csdnimg.cn/direct/68dd112a41e64e358cb6f7a31a07a350.png)**** (2)操作方式: 1.从[spacy/zh_core_web_sm at main](https://hf-mirror.com/spacy/zh_core_web_sm/tree/main "spacy/zh_core_web_sm at main")下载zh_core_web_sm-any-py3-none-any.whl 2.安装pip install zh_core_web_sm-any-py3-none-any.whl 3再运行,就能正确输出内容。 ![](https://i-blog.csdnimg.cn/direct/e7d5a0bc450f4f449d3cdef913ab3061.png)

相关推荐
豌豆花下猫17 分钟前
Python 潮流周刊#110:JIT 编译器两年回顾,AI 智能体工具大爆发(摘要)
后端·python·ai
June bug1 小时前
【Python基础】变量、运算与内存管理全解析
开发语言·python·职场和发展·测试
蹦蹦跳跳真可爱5891 小时前
Python----OpenCV(几何变换--图像平移、图像旋转、放射变换、图像缩放、透视变换)
开发语言·人工智能·python·opencv·计算机视觉
蹦蹦跳跳真可爱5891 小时前
Python----循环神经网络(Transformer ----Layer-Normalization(层归一化))
人工智能·python·rnn·transformer
m0_625686551 小时前
Day58
python
夜阳朔2 小时前
Conda环境激活失效问题
人工智能·后端·python
m0_723140232 小时前
Python训练营-Day49
开发语言·python
北风toto2 小时前
python学习DataFrame数据结构
数据结构·python·学习
亿牛云爬虫专家2 小时前
微服务化采集平台:可扩展性与容错机制
python·微服务·架构·爬虫代理·扩展性·新浪财经·财经新闻
傻啦嘿哟3 小时前
Python爬虫动态IP代理报错全解析:从问题定位到实战优化
爬虫·python·tcp/ip