使用python进行自然语言处理的示例

程序功能

分词:将输入句子拆分为单词。

词性标注:为每个单词标注其词性。

命名实体识别:识别命名实体(如人名、地名、组织等)。

这段代码展示了如何用 nltk 进行基础的 NLP 任务,包括分词、词性标注和命名实体识别。

代码

python 复制代码
import nltk
from nltk.tokenize import word_tokenize
from nltk.tag import pos_tag
from nltk.chunk import ne_chunk

# 下载nltk需要的资源
nltk.download('punkt')
nltk.download('averaged_perceptron_tagger')
nltk.download('maxent_ne_chunker')
nltk.download('words')

# 输入的示例句子
sentence = "Sun Wukong, the Monkey King, traveled from China to India with Tang Sanzang."

# 1. 分词
tokens = word_tokenize(sentence)
print("分词结果:", tokens)

# 2. 词性标注
tagged = pos_tag(tokens)
print("词性标注结果:", tagged)

# 3. 命名实体识别
entities = ne_chunk(tagged)
print("命名实体识别结果:")
print(entities)
相关推荐
深度学习lover几秒前
<数据集>yolo航拍军事目标识别<目标检测>
人工智能·python·yolo·目标检测·计算机视觉·航拍军事目标识别
架构师老Y几秒前
002、Prompt基础:大模型交互的第一性原理
人工智能·python·prompt
不懂的浪漫1 分钟前
如何给 AI 一个高质量的新功能开发 Prompt:用 Superpower Skill 驱动完整开发流程
人工智能·prompt·vibe coding
架构师老Y1 分钟前
004、少样本与零样本Prompt:何时用、怎么用
大数据·人工智能·prompt
Hody917 分钟前
【XR硬件介绍】华为AI眼镜技术拆解:当鸿蒙AI遇上轻量化眼镜,开启第一视角智能时代
人工智能
做个文艺程序员8 分钟前
性能基准横评:DeepSeek V4 vs GPT-5.5,谁在哪个赛道领跑?
人工智能·gpt
Godspeed Zhao12 分钟前
具身智能中的传感器技术36——RGB-D相机1
人工智能·机器学习·深度相机·具身智能
sunneo12 分钟前
专栏B-产品心理学深度-05-伦理边界
人工智能·产品运营·产品经理·ai编程·ai-native
神仙别闹13 分钟前
基于GAN的恶意软件对抗样本生成
人工智能·神经网络·生成对抗网络
这张生成的图像能检测吗13 分钟前
(论文速读)结合噪声制导和全局特征的生成对抗网络生成了高质量的缺陷样本
人工智能·深度学习·神经网络·生成对抗网络·计算机视觉