自然语言处理

自然语言处理NLP,目标就是让计算机理解人类的语言。

循环神经网络

如何让计算机理解人类语言呢?历史演进

1.基于同义词词典的方法

具有相同或类似含义的单词,可以归到同一个类别中,而根据单词"整体-部分"或者"上位-下位"关系,可以构建出层级的树状图。这样,就可以构成一个庞大的"单词网络",用它就可以教会计算机单词之间的关系,从而计算出单词的"相似度"。

2.基于计数的方法

大量的文本数据,构成了语料库。我们的目的,就是从语料库中,自动且高效的提取出语言的本质,最简单的做法,就是统计词频。

分词:对文本内容进行切分,找出一个个基本单元

词关联ID:给单词标上一个ID,构建单词和ID的关联字典(称为"词表")

词向量化:用于一个固定长度的向量来表示单词,也称为词的"分布式表示"

对每一个词,可以统计它周围出现了什么单词,出现了多少次,把这些词频统计出来,就构成了一个向量,

相关推荐
ZHW_AI课题组12 分钟前
腾讯云调用IP定位
人工智能·python·机器学习
Wch1G0z8A24 分钟前
Google 开源了啥,让 AI Agent 碰数据库不再是定时炸弹
数据库·人工智能·开源
武子康26 分钟前
调查研究-151 Slack vs Jira:区别、使用指南与团队选择方法
人工智能·科技·深度学习·ai·职场和发展·jira·slack
米小虾28 分钟前
黄仁勋GTC 2026宣告Agent AI时代:从生成式到代理式的范式转移
人工智能·aigc·agent
IT_陈寒29 分钟前
Python闭包里藏的这个坑,差点让我加班到凌晨
前端·人工智能·后端
IT_陈寒29 分钟前
Java注解空指针?这个坑我踩得莫名其妙
前端·人工智能·后端
暴躁小师兄数据学院40 分钟前
【AI大数据工程师特训笔记】第14讲:Linux操作系统与shell脚本
大数据·人工智能·笔记
tedcloud1231 小时前
cc-switch评测:多AI Coding Agent管理工具详解
数据库·人工智能·sql·学习·自动化
高洁011 小时前
大模型落地行业第一线
人工智能·数据挖掘·transformer·virtualenv·知识图谱