信息检索与数据挖掘 |(一)介绍

文章目录

📚信息检索

🐇概念

  • 信息检索是从大型集合 (通常存储在计算机上)中寻找非结构化 (通常是文本)的材料(通常是文档),以满足信息需求。

🐇结构化与非结构化数据

  • 结构化数据 倾向于引用"表格"中的信息,通常允许数值范围和精确匹配查询。
  • 非结构化数据通常引用自由文本,允许关键字查询(包括操作符)以及更复杂的"概念"查询。它是文本文档检索的经典模型。
  • 结构化数据即行数据,存储在数据库里,可以用二维表结构来逻辑表达实现的数据。
  • 非结构化数据是相对于结构化数据而言的,不方便用数据库二维逻辑表来表现的数据。

🐇信息检索的基本假设

  • 集合:一组文档(假设它目前是静态集合)。
  • 目标:检索与用户信息需求相关的文档,并帮助用户完成任务。
  • 经典搜索模型

🐇信息检索小结


🐇附:IR新课题







📚数据挖掘

🐇定义

🐇数据挖掘 vs 机器学习

  • AI说:
    • 数据挖掘和机器学习都是处理大数据的方法,它们之间的区别在于目的和方法。
    • 数据挖掘旨在寻找数据中的模式、规律和关系,以从中提取有价值的信息。数据挖掘的方法是使用各种技术和算法,例如聚类、分类、关联规则挖掘等。
    • 机器学习则是一种人工智能技术,在某种程度上可以看做是数据挖掘的一种扩展。机器学习旨在让计算机根据数据自主学习,建立模型,从而预测、分类或识别未来的数据。机器学习的方法包括监督学习、无监督学习和半监督学习等。

  • 数据挖掘是用来理解事物的。

  • 机器学习是用来预测事物的。

  • 人工智能是用来生成行动的。


  • Data contains value and knowledge.
  • Data mining around us.

🔥分类


🔥聚类
🔥降维

相关推荐
牛客企业服务12 分钟前
2025年AI面试推荐榜单,数字化招聘转型优选
人工智能·python·算法·面试·职场和发展·金融·求职招聘
视觉语言导航42 分钟前
RAL-2025 | 清华大学数字孪生驱动的机器人视觉导航!VR-Robo:面向视觉机器人导航与运动的现实-模拟-现实框架
人工智能·深度学习·机器人·具身智能
IT项目管理1 小时前
达梦数据库DMHS介绍及安装部署
linux·数据库
**梯度已爆炸**1 小时前
自然语言处理入门
人工智能·自然语言处理
你都会上树?1 小时前
MySQL MVCC 详解
数据库·mysql
大春儿的试验田1 小时前
高并发收藏功能设计:Redis异步同步与定时补偿机制详解
java·数据库·redis·学习·缓存
ctrlworks1 小时前
楼宇自控核心功能:实时监控设备运行,快速诊断故障,赋能设备寿命延长
人工智能·ba系统厂商·楼宇自控系统厂家·ibms系统厂家·建筑管理系统厂家·能耗监测系统厂家
Ein hübscher Kerl.1 小时前
虚拟机上安装 MariaDB 及依赖包
数据库·mariadb
BFT白芙堂2 小时前
睿尔曼系列机器人——以创新驱动未来,重塑智能协作新生态(上)
人工智能·机器学习·机器人·协作机器人·复合机器人·睿尔曼机器人
Brduino脑机接口技术答疑2 小时前
脑机新手指南(二十一)基于 Brainstorm 的 MEG/EEG 数据分析(上篇)
数据挖掘·数据分析