tableau基础学习2:时间序列数据预处理与绘图

文章目录

  • 数据预处理
    • [1. 原始数据](#1. 原始数据)
    • [2. 合并数据集](#2. 合并数据集)
    • [2. 创建计算字段](#2. 创建计算字段)
  • 绘图分析
    • [1. 趋势分析](#1. 趋势分析)
    • [2. 计算字段趋势分析](#2. 计算字段趋势分析)

这一部分,我们记录一些分析时序趋势的分析步骤

数据预处理

1. 原始数据

原始数据是excel表格,其中包含三个Sheet页,

这里我们选择两家公司的股票,作为时序数据进行对比:恩捷股份与科大讯飞

2. 合并数据集

  1. 首先打开下面的【已使用数据解释器清理】,这里可以自动剔除一部分无用行,以保留需要分析的数据

  2. 在tableau中,在左侧【工作表】中双击,即可将这两个添加进来,并自动合并

  1. 手动调整链接关系,选择日期,即可将左侧表(科大讯飞表)的日期列,与右侧表(恩捷股份)的日期列中,相同的日期数据合并成一行,并取交集

这里有四个合并方式:

  • 内部:取交集
  • 左侧:取左边表有的,如果右边表有则合并,右边表没有则为空值(null)
  • 右侧:取右边表有的,如果左边表有则合并,左边表没有则为空值(null)
  • 完全外部:取并集

2. 创建计算字段

在下面的表格标题部分右键,选择【创建计算字段】,即可得到通过计算新添加新的列,这个操作与excel在新的列输入=公式(xxxx)一样,比如添加一列称为"收盘价价差"的列,得到如下结果:

这样就额外添加了一列,用于后续分析

绘图分析

1. 趋势分析

两个表的每个相同的数据项都可以对变化趋势进行分析,这里我们分析收盘价走势的相关性:

  1. 在【标记】区域选择密度,我们使用密度图进行分析
  2. 将一个表的【收盘价】拖到【列】上
  3. 将另一个表的【收盘价】拖到【行】上
  4. 将日期右键,选择天(这里默认是年,导致只有一个点)

    这样画出的图中,每一个点都是一天的数据

然后我们进行微调:

  1. 首先左击【大小】,将大小向右拖动
  2. 然后再选择颜色,选一个自己觉得OK的颜色:
  3. 在表格中右键选择【趋势线】->【显示趋势线】

    于是我们就可以看到趋势分析结果:

    ps:可以额外添加一个筛选器,通过对时间区间的选择,趋势线会自动变化拟合选定的时间区间

2. 计算字段趋势分析

我们使用计算字段额外计算两个字段:

  • 最高价之差
  • 最低价之差

注意:由于使用了交集数据,因此这个指标将不再区分不同的股票代码,而是直接得到两者的计算结果

然后绘图,即可得到如下可视化效果:

根据可视化的效果,可以看出,这两个股票的最高价与最低价之差走势逐渐分化,这就实现了对组合数据(计算字段)的分析

相关推荐
程序员东岸1 小时前
避坑修链表:从顺序表到单链表的那点事儿(含可跑示例与小项目串联)
数据结构·笔记·学习·程序人生·链表
future14121 小时前
C++ 学习日记
开发语言·c++·学习
禁默1 小时前
机器学习基础入门(第五篇):半监督学习与强化学习
人工智能·学习·机器学习
懒羊羊不懒@1 小时前
算法入门数学基础
c语言·数据结构·学习·算法
zhonghaoxincekj1 小时前
晶体管的定义,晶体管测量参数和参数测量仪器
功能测试·单片机·学习·测试工具·单元测试·制造
从前慢,现在也慢2 小时前
(3)Bug篇
学习·bug·测试
努力努力再nuli2 小时前
学习华为昇腾AI教材图像处理原理与应用部分Day1
图像处理·人工智能·学习
Freya冉冉2 小时前
【PYTHON学习】推断聚类后簇的类型DAY18
python·学习·聚类
壹号用户3 小时前
python学习之可迭代对象&迭代器对象
python·学习
虚行3 小时前
Python学习入门
开发语言·python·学习