深度学习100问3-什么是共现矩阵及其作用

一、看词和词的关系

共现矩阵就像一个表格,能让我们清楚地看到不同的词在一些文本里出现的关联情况。要是两个词经常一起出现,那在这个矩阵里对应的地方数字就会比较大,说明这两个词关系很紧密。比如在科技文章里,"人工智能"和"机器学习"可能老一起出现,那就说明它们在这个领域关系近。

二、帮着做词向量

在做词向量的时候,共现矩阵可是重要的基础呢。用一些方法处理共现矩阵,比如奇异值分解,就能把词变成高维空间里的向量。这些向量能抓住词和词之间的语义关系,后面做文本分类、找信息啥的任务就更方便了。比如说,意思差不多的词在向量空间里就会离得近,这样我们就能更好地理解和处理文本啦。

三、做文本分类和聚类

做文本分类的时候,共现矩阵能提供词的特征信息。看看不同类别的文本里词的共现情况,就能找到对分类有用的特点。比如体育新闻和财经新闻里,不同的词组合有不同的共现模式,用这些模式就能训练分类器,把新的文本分到合适的类别里。在文本聚类的时候,共现矩阵也能帮忙看文本之间像不像,把像的文本聚到一起。

四、找信息和推荐东西

在找信息的时候,共现矩阵能扩大查询词的范围。用户输入一个查询词,系统可以根据共现矩阵找到和它相关的其他词,这样找相关的文档就更准了。比如用户查"手机",系统就能根据共现矩阵找到"智能手机""品牌""功能"这些经常和"手机"一起出现的词,然后找包含这些词的文档。在推荐系统里呢,共现矩阵可以根据用户看过或买过的东西对应的词,找到和它们经常一起出现的其他东西的词,给用户推荐相关的产品或内容。

相关推荐
FL1623863129几秒前
[数据集][目标检测]血细胞检测数据集VOC+YOLO格式2757张4类别
人工智能·yolo·目标检测
jndingxin几秒前
OpenCV结构分析与形状描述符(21)计算包围给定点集的最小面积三角形函数minEnclosingTriangle()的使用
人工智能·opencv·计算机视觉
Q83431581915 分钟前
海思SD3403(21AP10, 108DC2910 )4K60 的 ISP 图像处理能力,4Tops INT8算力
linux·图像处理·人工智能·嵌入式硬件·视觉检测·视频编解码
机器不会学习CL20 分钟前
分类预测|基于麻雀优化支持向量机的Adaboost集成的数据分类预测Matlab程序SSA-SVM-Adaboost
人工智能·算法·机器学习·支持向量机·matlab·分类
科技资讯快报40 分钟前
容联云容犀Copilot&Agent入选《中国 AI Agent 产品罗盘》
大数据·人工智能·copilot
爱研究的小牛1 小时前
ESRGAN——老旧照片、视频帧的修复和增强,提高图像的分辨率
人工智能·深度学习·自动化·aigc·音视频
Fetters041 小时前
✨机器学习笔记(三)—— 多元线性回归、特征缩放、Scikit-Learn
笔记·机器学习·线性回归
ClonBrowser1 小时前
社交媒体的未来:Facebook如何通过AI技术引领潮流
人工智能·媒体·facebook
chiikawa&q1 小时前
(不用互三)解密AI创作:提升Prompt提示词的提问技巧
人工智能·prompt
E___V___E1 小时前
yolov1到yolov5的发展
人工智能·yolo·目标跟踪