使用python进行自然语言处理的示例

程序功能

分词:将输入句子拆分为单词。

词性标注:为每个单词标注其词性。

命名实体识别:识别命名实体(如人名、地名、组织等)。

这段代码展示了如何用 nltk 进行基础的 NLP 任务,包括分词、词性标注和命名实体识别。

代码

python 复制代码
import nltk
from nltk.tokenize import word_tokenize
from nltk.tag import pos_tag
from nltk.chunk import ne_chunk

# 下载nltk需要的资源
nltk.download('punkt')
nltk.download('averaged_perceptron_tagger')
nltk.download('maxent_ne_chunker')
nltk.download('words')

# 输入的示例句子
sentence = "Sun Wukong, the Monkey King, traveled from China to India with Tang Sanzang."

# 1. 分词
tokens = word_tokenize(sentence)
print("分词结果:", tokens)

# 2. 词性标注
tagged = pos_tag(tokens)
print("词性标注结果:", tagged)

# 3. 命名实体识别
entities = ne_chunk(tagged)
print("命名实体识别结果:")
print(entities)
相关推荐
m0_6501082410 小时前
Gemini 2.5:重塑多模态 AI 边界的全面解读
论文阅读·人工智能·多模态大模型·gemini 2.5·跨模态融合
wuk99811 小时前
基于Matlab的彩色图像特征提取实现
人工智能·计算机视觉·matlab
GEO_NEWS11 小时前
2025下半年GEO服务商技术革命:万数科技以AI全链路优化定义行业标杆
人工智能
说私域11 小时前
智能名片链动2+1模式S2B2C商城小程序:构建私域生态“留”量时代的新引擎
大数据·人工智能·小程序
说私域11 小时前
基于开源AI大模型与AI智能名片S2B2C商城小程序的直播简介引流策略研究——以B站直播为例
人工智能·小程序
金紫火11 小时前
AiPPT 新功能体验:从“一键生成”到更智能的演示制作
人工智能·ppt
Dev7z11 小时前
基于计算机视觉与机器学习的课堂坐姿智能监测与预警系统
人工智能·机器学习·计算机视觉
水如烟11 小时前
孤能子视角:“多劳多得”原则在知识经济时代的失效危机分析
人工智能
钟屿11 小时前
Back to Basics: Let Denoising Generative Models Denoise 论文阅读学习
论文阅读·人工智能·笔记·学习·计算机视觉
张较瘦_11 小时前
[论文阅读] AI + 数据库 | 拆解智能数据库:交互、管理、内核三层革新,AI 如何重塑数据处理
数据库·论文阅读·人工智能