《数据思维》之数据可视化_读书笔记

文章目录


前言

数据之道,路漫漫其修远兮,吾将上下而求索。


一、数据可视化

最基础的数据可视化方法就是统计图。一个好的统计图应该满足四个标准:准确、有效、简洁、美观!由此对应的就是统计图的"实力派"(准确+有效)和"偶像派"(简洁+美观)。

实力派:准确+有效

准确是统计图最基本的要求,即要使用正确的统计图区描述不同类型的数据。比如,对于离散型变量(性别,职业等),可以画饼状图或者柱状图;对于连续型变量(年龄、工资),可以画直方图或者箱线图;对于时间序列变量(GDP、CPI等),可以画折线图。这就好比不同的季节穿不同的衣服。

偶像派:简洁+美观

一个美观的统计图应该同时满足准确、有效和简洁的标准。

二、图例

柱状图:

柱状图是针对离散型变量(比如性别)所做的图。每根柱子代表一个类别(男性或者女性),柱子的高度是此类别的频数。作图后要有适当的评述。

注意:

  1. 作图后要有适当的评述。

2.当出现《题西林壁》中的"远近高低各不同",有两个解决办法:一种是将特别少的归为其他,然后将柱子安装从高到低的顺序排列(能让你的图美观很多);二是干脆就只画具有可比性的三个信用等级,然后文字说明一下其他等级的频数特别少。

3.距离产生美,柱子间要留出空隙,让人喘口气。

三、折线图

折线图的三大特点:

第一,看趋势。指标随时间的变化,呈递增、递减还是持平的趋势。

第二,看周期。指标的取值是都呈现一定的周期规律。

第三,看突发事件。某个事件的发生,出现波峰或者波谷。

第四,对比多个指标的变化。

注意:经济指标的变化趋势惯用柱状图,而非折线图。

三、散点图

散点图是用于展示两个(连续型)变量的一种常用统计图。散点图中的每一个点,由横纵两个坐标值组成。从散点图可以解读两个变量的相关关系:正线性相关、负线性相关、非线性相关、不相关。

注意:相关关系不等于因果关系,人们渴求因果关系,但常用的许多统计工具(回归分析等),探求的只是相关关系。

除了已知的两个变量,当数据中还有其他变量信息时,可以通过修改变"点"的颜色、形状和大小来传递更多信息。

四、茎叶图

茎叶图可以同时展示原始数据和分布的形状,图形由"茎"和"叶"两部分组成。通常以数据的高位数字作为树茎,低位数字作为树叶。


总结

相关推荐
一晌小贪欢2 小时前
【Html模板】电商运营可视化大屏模板 Excel存储 + 一键导出(已上线-可预览)
前端·数据分析·html·excel·数据看板·电商大屏·大屏看板
毕设源码-朱学姐5 小时前
【开题答辩全过程】以 海水水质监测大数据分析为例,包含答辩的问题和答案
数据挖掘·数据分析
B站_计算机毕业设计之家8 小时前
深度血虚:Django水果检测识别系统 CNN卷积神经网络算法 python语言 计算机 大数据✅
python·深度学习·计算机视觉·信息可视化·分类·cnn·django
工会主席-阿冰8 小时前
数据索引是无序时,直接用这个数据去画图的话,显示的图是错误的
开发语言·python·数据挖掘
码界筑梦坊13 小时前
240-基于Python的医疗疾病数据可视化分析系统
开发语言·python·信息可视化·数据分析·毕业设计·echarts
Altair澳汰尔14 小时前
新闻速递丨Altair RapidMiner 数据分析和 AI 平台助力企业加速智能升级:扩展智能体 AI 及分析生态系统
人工智能·ai·数据分析·仿真·cae·rapidminer·数据自动化
图灵信徒14 小时前
R语言绘图与可视化第六章总结
python·数据挖掘·数据分析·r语言
码界筑梦坊15 小时前
243-基于Django与VUE的笔记本电脑数据可视化分析系统
vue.js·python·信息可视化·数据分析·django·毕业设计·echarts
B站_计算机毕业设计之家16 小时前
大数据YOLOv8无人机目标检测跟踪识别系统 深度学习 PySide界面设计 大数据 ✅
大数据·python·深度学习·信息可视化·数据挖掘·数据分析·flask
罗不丢17 小时前
自回归模型例题(AR)与ACF/PACF图绘制
数据挖掘·回归·ar·acf·pacf