数据挖掘笔记part one (认识数据挖掘)

定义

从大量的,不完全的,有噪音的,模糊的,随机的数据中提取出存在潜在价值信息和知识的过程。

数据,信息,知识的关系

数据>信息>情报>知识>智慧(越小越精炼,越牛)

数据挖掘流程

数据--(筛选)--目标数据--(预处理)--已处理数据--(变换)--变换后数据--(数据挖掘)--模式

关联规则挖掘

通过样本数据来预测-------买面包后是否买牛奶的问题

分类和聚类

分类:有标签的学习(有对数据的明确定义,然后在对数据贴标签)

聚类:有学习的标签(先对数据进行学习,后面在判断并贴上标签)

eg:人的认识是从聚类到分类的过程

相关推荐
夜瞬6 小时前
NLP学习笔记01:文本预处理详解——从清洗、分词到词性标注
笔记·学习·自然语言处理
耿雨飞6 小时前
第三章:LangChain Classic vs. 新版 LangChain —— 架构演进与迁移指南
人工智能·架构·langchain
BizViewStudio6 小时前
甄选 2026:AI 重构新媒体代运营行业的三大核心变革与落地路径
大数据·人工智能·新媒体运营·媒体
俊哥V6 小时前
AI一周事件 · 2026年4月8日至4月14日
人工智能·ai
中屹指纹浏览器6 小时前
指纹浏览器内核级渲染伪造技术:Canvas/WebGL/AudioContext深度伪造与检测绕过实战
经验分享·笔记
GitCode官方6 小时前
G-Star Gathering Day 杭州站回顾
人工智能·开源·atomgit
-Springer-7 小时前
STM32 学习 —— 个人学习笔记11-1(SPI 通信协议及 W25Q64 简介 & 软件 SPI 读写 W25Q64)
笔记·stm32·学习
LN花开富贵7 小时前
【ROS】鱼香ROS2学习笔记一
linux·笔记·python·学习·嵌入式·ros·agv
宇擎智脑科技7 小时前
开源 AI Agent 架构设计对比:Python 单体 vs TypeScript 插件化
人工智能·openclaw·hermes agent
冷色系里的一抹暖调8 小时前
OpenClaw Docker部署避坑指南:服务启动成功但网页打不开?
人工智能·docker·容器·openclaw