文本预处理——文本处理的基本方法

目录

什么是分词

jieba分词特性

精确模式分词

python 复制代码
import jieba
content='工信处女干事每月经过下属科室都要亲口交代24口交换机等技术性器件的安装工作'
print(jieba.lcut(content,cut_all=False))

全模式分词

python 复制代码
import jieba
content='工信处女干事每月经过下属科室都要亲口交代24口交换机等技术性器件的安装工作'
print(jieba.lcut(content,cut_all=True))

搜索引擎模式分词

python 复制代码
import jieba
content='工信处女干事每月经过下属科室都要亲口交代24口交换机等技术性器件的安装工作'
print(jieba.lcut_for_search(content))

使用用户自定义词典



命名实体识别

词性标注


python 复制代码
import jieba.posseg as pseg
pseg.lcut('我爱北京天安门')
相关推荐
萱仔学习自我记录1 天前
常用大语言模型简单介绍
人工智能·python·自然语言处理·nlp
龙的爹23331 天前
论文翻译 | LLaMA-Adapter :具有零初始化注意的语言模型的有效微调
人工智能·gpt·语言模型·自然语言处理·nlp·prompt·llama
爱敲代码的小崔1 天前
NLP自然语言处理
人工智能·自然语言处理·nlp
OptimaAI3 天前
【LLM论文日更】| 通过指令调整进行零样本稠密检索的无监督文本表示学习
人工智能·深度学习·语言模型·自然语言处理·nlp
龙的爹23333 天前
论文翻译 | ReWOO: 高效增强语言模型的解耦推理
人工智能·语言模型·自然语言处理·nlp·prompt·agi
Ven%4 天前
深度学习速通系列:强大的中文自然语言处理工具之Pyltp的使用
人工智能·python·深度学习·自然语言处理·nlp
源大模型6 天前
源2.0全面适配百度PaddleNLP,大模型开发开箱即用
人工智能·语言模型·开源·nlp·源大模型
桂花很香,旭很美7 天前
AgentScope中带有@功能的多Agent组对话
nlp
Milkha7 天前
论文速读记录 - 202409
nlp·论文笔记·排序
龙的爹23338 天前
论文 | Reframing Instructional Prompts to GPTk’s Language
人工智能·深度学习·语言模型·自然语言处理·chatgpt·nlp