使用python进行自然语言处理的示例

程序功能

分词:将输入句子拆分为单词。

词性标注:为每个单词标注其词性。

命名实体识别:识别命名实体(如人名、地名、组织等)。

这段代码展示了如何用 nltk 进行基础的 NLP 任务,包括分词、词性标注和命名实体识别。

代码

python 复制代码
import nltk
from nltk.tokenize import word_tokenize
from nltk.tag import pos_tag
from nltk.chunk import ne_chunk

# 下载nltk需要的资源
nltk.download('punkt')
nltk.download('averaged_perceptron_tagger')
nltk.download('maxent_ne_chunker')
nltk.download('words')

# 输入的示例句子
sentence = "Sun Wukong, the Monkey King, traveled from China to India with Tang Sanzang."

# 1. 分词
tokens = word_tokenize(sentence)
print("分词结果:", tokens)

# 2. 词性标注
tagged = pos_tag(tokens)
print("词性标注结果:", tagged)

# 3. 命名实体识别
entities = ne_chunk(tagged)
print("命名实体识别结果:")
print(entities)
相关推荐
前进的程序员15 分钟前
2026年IT行业技术发展前瞻性见解
人工智能
汽车仪器仪表相关领域16 分钟前
MTX-A 模拟废气温度(EGT)计 核心特性与车载实操指南
网络·人工智能·功能测试·单元测试·汽车·可用性测试
GeeLark22 分钟前
#请输入你的标签内容
大数据·人工智能·自动化
番茄大王sc23 分钟前
2026年科研AI工具深度测评:文献调研与综述生成领域
论文阅读·人工智能·学习方法·论文笔记
让学习成为一种生活方式26 分钟前
酿酒葡萄VvOMTs基因家族鉴定及启动子功能分析--文献精读201
人工智能
运维小欣30 分钟前
博睿数据:以Agentic AI驱动智能运维未来
运维·人工智能
康康的AI博客1 小时前
AI大模型API中转站全方位解析
人工智能
深圳博众测控1 小时前
博众测控 | ISO 16750-2:2023汽车电气测试新标准解读:关键变化与测试设备选型
人工智能·测试工具·汽车
Dfreedom.1 小时前
图像灰度处理与二值化
图像处理·人工智能·opencv·计算机视觉
老兵发新帖2 小时前
关于ONNX和pytorch,我们应该怎么做?结合训练和推理
人工智能