使用python进行自然语言处理的示例

程序功能

分词:将输入句子拆分为单词。

词性标注:为每个单词标注其词性。

命名实体识别:识别命名实体(如人名、地名、组织等)。

这段代码展示了如何用 nltk 进行基础的 NLP 任务,包括分词、词性标注和命名实体识别。

代码

python 复制代码
import nltk
from nltk.tokenize import word_tokenize
from nltk.tag import pos_tag
from nltk.chunk import ne_chunk

# 下载nltk需要的资源
nltk.download('punkt')
nltk.download('averaged_perceptron_tagger')
nltk.download('maxent_ne_chunker')
nltk.download('words')

# 输入的示例句子
sentence = "Sun Wukong, the Monkey King, traveled from China to India with Tang Sanzang."

# 1. 分词
tokens = word_tokenize(sentence)
print("分词结果:", tokens)

# 2. 词性标注
tagged = pos_tag(tokens)
print("词性标注结果:", tagged)

# 3. 命名实体识别
entities = ne_chunk(tagged)
print("命名实体识别结果:")
print(entities)
相关推荐
盘古信息IMS1 分钟前
MES最佳实践|盘古信息IMS赋能傲佑科技打造PCBA一站式电子智造新标杆
大数据·人工智能·科技
ok_hahaha1 分钟前
AI从头开始-黑马LongChain-Agent智能体项目-扫地机器人
人工智能
LaughingZhu2 分钟前
Product Hunt 每日热榜 | 2026-04-20
前端·数据库·人工智能·经验分享·神经网络
2301_780789665 分钟前
游戏盾是如何防护各个重要的游戏端口呢
服务器·网络·人工智能·游戏·架构·零信任
lusasky6 分钟前
Vercel生态全家桶及其竞品
人工智能
Lethehong7 分钟前
构建高精度智能财经分析工作流:基于 Dify、蓝耘 GLM-5.1 与 Tavily 的实践指南
人工智能·dify·glm·蓝耘元生代·蓝耘maas
IT观测8 分钟前
移动检测新选择 浙江润鑫便携式汽车轮重仪便捷高效
人工智能·汽车
Leo.yuan8 分钟前
数据分析指标是什么?数据分析指标都有哪些?
人工智能
Allen_LVyingbo9 分钟前
机器伦理层级跃迁的逻辑结构、哲学意涵与形式化建模(上)
开发语言·人工智能·python·数学建模·量子计算