【数据挖掘】课程大纲

第1章 数据挖掘基础

1.1 某知名连锁餐饮企业的困惑

1.2 从餐饮服务到数据挖掘

1.3 数据挖掘的基本任务

1.4 数据挖掘建模过程

1.4.1 定义挖掘目标

1.4.2 数据取样

1.4.3 数据探索

1.4.4 数据预处理

1.4.5 挖掘建模

1.4.6 模型评价

1.5 常用数据挖掘建模工具

1.6 小结


第2章 R语言简介

2.1 R安装

2.2 R使用入门

2.2.1 R操作界面

2.2.2 RStudio窗口介绍

2.2.3 R常用操作

2.3 R数据分析包

2.4 配套附件使用设置

2.5 小结


第2.5章 数据管理

1 变量的重命名

2 缺失值分析

3 数据排序

4 随机抽样

5 数值运算函数

6 字符串处理

7 文本分词

8 apply函数族

9 数据整合

10 控制流

11 函数的编写

12 小结


第3章 数据探索

3.1 数据质量分析

3.1.1 缺失值分析

3.1.2 异常值分析

3.1.3 一致性分析

3.2 数据特征分析

3.2.1 分布分析

3.2.2 对比分析

3.2.3 统计量分析

3.2.4 周期性分析

3.2.5 贡献度分析

3.2.6 相关性分析

3.3 R语言主要数据探索函数

3.3.1 统计特征函数

3.3.2 统计作图函数

3.4 小结


第4章 数据预处理

4.1 数据清洗

4.1.1 缺失值处理

4.1.2 异常值处理

4.2 数据集成

4.2.1 实体识别

4.2.2 冗余属性识别

4.3 数据变换

4.3.1 简单函数变换

4.3.2 规范化

4.3.3 连续属性离散化

4.3.4 属性构造

4.3.5 小波变换

4.4 数据规约

4.4.1 属性规约

4.4.2 数值规约

4.5 R语言主要数据预处理函数

4.6 小结


第4.5章 图形探索

4.1 图形元素

4.1.1 颜色

4.1.2 点

4.1.3 文本

4.1.4 线条

4.1.5 图例

4.1.6 坐标轴

4.2 图形组合

4.3 图形保存

4.4 图形函数

4.5 小结

4.6 上机实验


第5章 高级绘图工具 (扩展)

5.1 lattice包绘图工具

5.1.1 绘图特色

5.1.2 基本图形

5.2 ggplot2包绘图工具

5.2.1 从qplot开始

5.2.2 ggplot作图

5.3 交互式绘图工具简介

5.3.1 rCharts包

5.3.2 recharts包

5.3.3 googleVis包

5.3.4 htmlwidgets包

5.3.5 shiny包

5.4 小结


第5.5章 挖掘建模

5.1 分类与预测

5.1.1 实现过程

5.1.2 常用的分类与预测算法

5.1.3 回归分析

5.1.4 决策树

5.1.5 人工神经网络

5.1.6 分类与预测算法评价

5.1.7 R语言主要分类与预测算法函数

5.2 聚类分析

5.2.1 常用聚类分析算法

5.2.2 KMeans聚类算法

5.2.3 聚类分析算法评价

5.2.4 R语言主要聚类分析算法函数

5.3 关联规则

5.3.1 常用关联规则算法

5.3.2 Apriori算法

5.4 时序模式

5.4.1 时间序列算法

5.4.2 时间序列的预处理

5.4.3 平稳时间序列分析

5.4.4 非平稳时间序列分析

5.4.5 R语言主要时序模式算法函数

5.5 离群点检测

5.5.1 离群点检测方法

5.5.2 基于模型的离群点检测方法

5.5.3 基于聚类的离群点检测方法

5.6 小结

相关推荐
IT古董13 分钟前
【深度学习】常见模型-Transformer模型
人工智能·深度学习·transformer
沐雪架构师1 小时前
AI大模型开发原理篇-2:语言模型雏形之词袋模型
人工智能·语言模型·自然语言处理
python算法(魔法师版)2 小时前
深度学习深度解析:从基础到前沿
人工智能·深度学习
kakaZhui2 小时前
【llm对话系统】大模型源码分析之 LLaMA 位置编码 RoPE
人工智能·深度学习·chatgpt·aigc·llama
struggle20253 小时前
一个开源 GenBI AI 本地代理(确保本地数据安全),使数据驱动型团队能够与其数据进行互动,生成文本到 SQL、图表、电子表格、报告和 BI
人工智能·深度学习·目标检测·语言模型·自然语言处理·数据挖掘·集成学习
佛州小李哥3 小时前
通过亚马逊云科技Bedrock打造自定义AI智能体Agent(上)
人工智能·科技·ai·语言模型·云计算·aws·亚马逊云科技
云空4 小时前
《DeepSeek 网页/API 性能异常(DeepSeek Web/API Degraded Performance):网络安全日志》
运维·人工智能·web安全·网络安全·开源·网络攻击模型·安全威胁分析
AIGC大时代4 小时前
对比DeepSeek、ChatGPT和Kimi的学术写作关键词提取能力
论文阅读·人工智能·chatgpt·数据分析·prompt
山晨啊85 小时前
2025年美赛B题-结合Logistic阻滞增长模型和SIR传染病模型研究旅游可持续性-成品论文
人工智能·机器学习
一水鉴天6 小时前
为AI聊天工具添加一个知识系统 之77 详细设计之18 正则表达式 之5
人工智能·正则表达式