使用python进行自然语言处理的示例

程序功能

分词:将输入句子拆分为单词。

词性标注:为每个单词标注其词性。

命名实体识别:识别命名实体(如人名、地名、组织等)。

这段代码展示了如何用 nltk 进行基础的 NLP 任务,包括分词、词性标注和命名实体识别。

代码

python 复制代码
import nltk
from nltk.tokenize import word_tokenize
from nltk.tag import pos_tag
from nltk.chunk import ne_chunk

# 下载nltk需要的资源
nltk.download('punkt')
nltk.download('averaged_perceptron_tagger')
nltk.download('maxent_ne_chunker')
nltk.download('words')

# 输入的示例句子
sentence = "Sun Wukong, the Monkey King, traveled from China to India with Tang Sanzang."

# 1. 分词
tokens = word_tokenize(sentence)
print("分词结果:", tokens)

# 2. 词性标注
tagged = pos_tag(tokens)
print("词性标注结果:", tagged)

# 3. 命名实体识别
entities = ne_chunk(tagged)
print("命名实体识别结果:")
print(entities)
相关推荐
冬哥聊AI2 分钟前
多模态诅咒:给大模型装上眼睛,文本推理为什么反而变笨了?
人工智能
东风破_3 分钟前
LLM 是怎么预测下一个词的?从 Token 到 Transformer 的完整过程
人工智能
日是故乡明5 分钟前
Claude Code 正在用隐写术标记请求
人工智能
网易云信8 分钟前
Anthropic研究百万对话,情感陪伴AI正在成为基础设施
人工智能·aigc·agent
掘金一周11 分钟前
对车完全小白,不知买油买电还是买混动,求建议| 沸点周刊 7.2
前端·人工智能·后端
转转技术团队27 分钟前
从神经元到大语言模型,回顾机器学习发展史
人工智能
天风之翼1 小时前
搭建一个轻量 Agent Harness——让 AI Agent 安全地执行命令、读写文件
人工智能
雪隐2 小时前
个人电脑玩AI-09让5060 Ti给你打工——让 AI 读懂你的资料
人工智能·后端
大模型真好玩2 小时前
LangChain DeepAgents 速通指南(十)—— DeepAgents Code 智能体服务核心源码解读
人工智能·langchain·agent
网易云信2 小时前
「帝王蟹」企业AI落地实战营西安站落幕:共探“人工智能+”落地深水区
人工智能·agent·产品