数据分析的具体流程

1.导入
  • 表格导入数据时要注意数据的格式问题
  • 非表格导入

可以先将文档放入word中

将换行符(^p)替换为|||,选择特殊格式中的段落标记

进行全部替换

以每一列最后的数据/平,作为换行的标志

将所整理的信息导入excel,对数据进行分列

选择分隔符合

因为是多个|,所以要勾选连续

选择分列的时候,要在后面新插入一列,否则会把后面的数据覆盖掉

或者可以选择固定的宽度进行分列

2.清洗
  • 清洗的对象
  • 合并的单元格

如果是整列的空值并且填充(ctrl+g)

选择空值

输入等号选择K2

ctrl+enter(填充完成)

取消零散的合并的单元格ctrl+f

查找替换,选择选项

选择对齐-选合并的单元格

  • 空值或空行ctrl+g

直接用空值定位,用其余的颜色表示

使用counta( )函数,统计非空单元格个数(ctrl+enter)查看个数

进行筛选,选择非总数的个数

  • 重复值

1.利用提亮的方式判断数据是否一致

提亮重复值

2.直接删除重复值

  • 脏数据(图片,批注,空格,对齐方式)

上面是空格,下面什么也没有,将空格进行提亮(ctrl+h)

有这个样子的批注信息

清除批注

有一些杂乱的图片信息(ctrl+g)选择对象 ctrl+x直接删除图片

  • 数据的提取

1.直接提取信息

提取生日,尽量使用文本,因为日期的省略零 的位数不同,后面生不成

选中生日这一列,然后ctrl+e智能识别点击确定

点击数据分列,转换为日期

2.直接通过分列进行提取

直接进行分列

需要中间这部分,将数据类型改为日期

  • 数据的分离

vlookup分离

  • 数据的校验

检查错误的和空格用颜色提亮标出(ctrl+g)

计数或数值计数(有助于发现错误)

  • 数据验证功能
3.处理
4.展现

1.子表格(sheet1 )重命名

2.想让别人看到哪里就在哪里保存退出

3.行高列宽要好看(直接双击上面的边缘)

4.表头配色,冻结首行,进行筛选

5.条件格式(突出显示、数据条、图标集、色阶)

6.筛选和排序

文本筛选,数字筛选,日期筛选

自定义筛选和多条件筛选

?代表单个的任意字符*代表任意多个字符

自定义排序

相关推荐
Lun3866buzha10 小时前
YOLOv8-SEG-FastNet-BiFPN实现室内物品识别与分类:背包、修正带、立方体和铅笔盒检测指南
yolo·分类·数据挖掘
Faker66363aaa11 小时前
基于YOLOv8-GhostHGNetV2的绝缘子破损状态检测与分类系统实现
yolo·分类·数据挖掘
说私域12 小时前
日本零售精髓赋能下 链动2+1模式驱动新零售本质回归与发展格局研究
人工智能·小程序·数据挖掘·回归·流量运营·零售·私域运营
墨理学AI12 小时前
一文学会一点python数据分析-小白原地进阶(mysql 安装 - mysql - python 数据分析 - 学习阶段梳理)
python·mysql·数据分析
databook13 小时前
像搭积木一样思考:数据科学中的“自下而上”之道
python·数据挖掘·数据分析
wang_yb13 小时前
像搭积木一样思考:数据科学中的“自下而上”之道
数据分析·databook
啊阿狸不会拉杆13 小时前
《机器学习导论》第 9 章-决策树
人工智能·python·算法·决策树·机器学习·数据挖掘·剪枝
玄同76514 小时前
机器学习中的三大距离度量:欧式距离、曼哈顿距离、切比雪夫距离详解
人工智能·深度学习·神经网络·目标检测·机器学习·自然语言处理·数据挖掘
Katecat9966314 小时前
蚊子幼虫与蛹的自动检测与分类-VFNet_R101_FPN_MS-2x_COCO实现详解
人工智能·数据挖掘
Liue612312311 天前
YOLO11-C3k2-MBRConv3改进提升金属表面缺陷检测与分类性能_焊接裂纹气孔飞溅物焊接线识别
人工智能·分类·数据挖掘