1.文本方块方法(Spacy Text Splitter 方法)Can‘t find model ‘zh_core_web_sm‘

一、概述

执行如下:

python 复制代码
def split_spacy(text):
    import spacy
    nlp = spacy.load( "zh_core_web_sm" ) 
    doc = nlp(text) 
    for s in doc.sents: 
        print(s)
# d:\programdata\anaconda3\envs\python310\lib\site-packages
if __name__=="__main__":
    text = "我是一个名为 ChatGLM3-6B 的人工智能助手,是基于清华大学 KEG 实验室和智谱 AI公司于 2023 年共同训练的语言模型开发的。我的目标是通过回答用户提出的问题来帮助他们解决问题。由于我是一个计算机程序,所以我没有实际的存在,只能通过互联网来与用户交流。"
    # split_normal(text)
    # sp=split_sentences_with_delimiters(text)
    # print(f"sp:{sp}")
    split_spacy(text)

报:

E050\] Can't find model 'zh_core_web_sm'. It doesn't seem to be a Python package or a valid path to a data directory. ### 二、解决方案 (1)前提条件: ****spacy必须是3.7.0版本**** ****![](https://i-blog.csdnimg.cn/direct/68dd112a41e64e358cb6f7a31a07a350.png)**** (2)操作方式: 1.从[spacy/zh_core_web_sm at main](https://hf-mirror.com/spacy/zh_core_web_sm/tree/main "spacy/zh_core_web_sm at main")下载zh_core_web_sm-any-py3-none-any.whl 2.安装pip install zh_core_web_sm-any-py3-none-any.whl 3再运行,就能正确输出内容。 ![](https://i-blog.csdnimg.cn/direct/e7d5a0bc450f4f449d3cdef913ab3061.png)

相关推荐
deephub2 小时前
机器学习特征工程:分类变量的数值化处理方法
python·机器学习·特征工程·分类变量
Pyeako3 小时前
深度学习--卷积神经网络(下)
人工智能·python·深度学习·卷积神经网络·数据增强·保存最优模型·数据预处理dataset
OPEN-Source3 小时前
大模型实战:搭建一张“看得懂”的大模型应用可观测看板
人工智能·python·langchain·rag·deepseek
廖圣平3 小时前
从零开始,福袋直播间脚本研究【七】《添加分组和比特浏览器》
python
B站_计算机毕业设计之家3 小时前
豆瓣电影数据可视化分析系统 | Python Flask框架 requests Echarts 大数据 人工智能 毕业设计源码(建议收藏)✅
大数据·python·机器学习·数据挖掘·flask·毕业设计·echarts
mr_LuoWei20093 小时前
python工具:python代码知识库笔记
数据库·python
weixin_395448913 小时前
cursor日志
人工智能·python·机器学习
天天爱吃肉82183 小时前
【跨界封神|周杰伦×王传福(陶晶莹主持):音乐创作与新能源NVH测试,底层逻辑竟完全同源!(新人必看入行指南)】
python·嵌入式硬件·算法·汽车
岱宗夫up4 小时前
Python 数据分析入门
开发语言·python·数据分析
码界筑梦坊4 小时前
325-基于Python的校园卡消费行为数据可视化分析系统
开发语言·python·信息可视化·django·毕业设计