数据可视化——根据提供的数据,将数据经过处理后以折线图的形式展现

文章目录

前言

前面我们学习了如何使用 pyecharts 模块绘制简单的折线图,那么今天我将为大家分享,如何根据提供的数据将数据进行处理并以折线图的形式展示出来。

处理数据

这是2020年美国、印度、日本三个国家的新冠确诊、治愈、死亡、新增确诊人数的数据。我会将这些数据上传到我的资源中,大家有需要可以去下载。

当我们看见这样的数据时会不会觉得顿时就不想看了,但是不急,其实只要我们细心,我们是能看出来里面的层次的。还有就是我们可以借助工具将数据的视图给展示出来以便我们更好的理解。

获取数据

我们首先需要使用文件操作拿到这三个文件中的数据。

python 复制代码
# 打开我们的测试数据
f_us = open("D:/桌面/美国.txt", 'r', encoding='UTF8') 
f_jp = open("D:/桌面/日本.txt", 'r', encoding='UTF8')
f_in = open("D:/桌面/印度.txt", 'r', encoding='UTF8')

# 读取数据
us_data = f_us.read()
jp_data = f_jp.read()
in_data = f_in.read()

因为我们的数据中有中文,所以我们需要明确读取的格式 UTF_8

筛选数据

当我们拿到这些数据的时候,我们需要对数据进行处理。我们都知道 { } [ ] 数据代表的是 JSON 数据,但是文件中还有一些不属于 JSON 的数据,所以我们需要将他们给处理掉,并且我们只绘制2020年的数据,所以我们需要筛选掉没用的数据。

python 复制代码
# 处理数据
us_data = us_data.replace('jsonp_1629344292311_69436(','')  # 用空字符串来替换这些多余的数据
jp_data = jp_data.replace('jsonp_1629350871167_29498(','')
in_data = in_data.replace('jsonp_1629350745930_63180(','')
us_data = us_data[:-2]  # 截取掉后面的 );
jp_data = jp_data[:-2]
in_data = in_data[:-2]

将JSON数据转换为Python数据

当我们过滤掉这些多余数据之后,我们需要将这些 JSON 数据转换为 python 数据。

python 复制代码
# 将json数据转换为python数据
us_dict = json.loads(us_data)
jp_dict = json.loads(jp_data)
in_dict = json.loads(in_data)

别忘了,我们使用 json.loads() 函数的时候,需要导入 json 模块。

筛选出横坐标数据和纵坐标数据

先获取到 trend 里面的数据。

python 复制代码
us_trend = us_dict['data'][0]['trend']
jp_trend = jp_dict['data'][0]['trend']
in_trend = in_dict['data'][0]['trend']

获取横坐标日期updateDate数据

python 复制代码
x_data = us_trend['updateDate'][:314]  # 前314个数据表示2020年数据

获取纵坐标data数据

python 复制代码
us_y_data = us_trend['list'][0]['data'][:314]
jp_y_data = jp_trend['list'][0]['data'][:314]
in_y_data = in_trend['list'][0]['data'][:314]

根据处理后的数据绘制折线图

先创建一个空白的折线图

python 复制代码
from pyecharts.charts import Line

# 创建折线图
line = Line()

为空白折线图添加横纵坐标数据。

python 复制代码
# 添加横纵坐标数据
line.add_xaxis(x_data)
line.add_yaxis('美国确诊人数',us_y_data)
line.add_yaxis('日本确诊人数',jp_y_data)
line.add_yaxis('印度确诊人数',in_y_data)

添加全局配置选项

python 复制代码
from pyecharts.options import TitleOpts,LegendOpts,ToolboxOpts,VisualMapOpts

# 设置全局配置项
line.set_global_opts(title_opts=TitleOpts(title='2020年美国确诊人数',pos_left='center',pos_bottom='1%'),
                     legend_opts=LegendOpts(is_show=True),
                     toolbox_opts=ToolboxOpts(is_show=True),
                     visualmap_opts=VisualMapOpts(is_show=True)
)

运行程序会生成一个 render,html 文件,我们运行它。

这里因为数据太多,看的图形很杂,我们可以设置系列配置选项来取消折线数据的显示。

python 复制代码
from pyecharts.options import TitleOpts,LegendOpts,ToolboxOpts,VisualMapOpts,LabelOpts

# 添加横纵坐标数据
line.add_xaxis(x_data)
line.add_yaxis('美国确诊人数',us_y_data,label_opts=LabelOpts(is_show=False))
line.add_yaxis('日本确诊人数',jp_y_data,label_opts=LabelOpts(is_show=False))
line.add_yaxis('印度确诊人数',in_y_data,label_opts=LabelOpts(is_show=False))

整体代码展示

python 复制代码
import json
from pyecharts.charts import Line
from pyecharts.options import TitleOpts,LegendOpts,ToolboxOpts,VisualMapOpts,LabelOpts

# 打开我们的测试数据
f_us = open("D:/桌面/美国.txt", 'r', encoding='UTF8')
f_jp = open("D:/桌面/日本.txt", 'r', encoding='UTF8')
f_in = open("D:/桌面/印度.txt", 'r', encoding='UTF8')

# 读取数据
us_data = f_us.read()
jp_data = f_jp.read()
in_data = f_in.read()

# 处理数据
us_data = us_data.replace('jsonp_1629344292311_69436(','')
jp_data = jp_data.replace('jsonp_1629350871167_29498(','')
in_data = in_data.replace('jsonp_1629350745930_63180(','')
us_data = us_data[:-2]
jp_data = jp_data[:-2]
in_data = in_data[:-2]

# 将json数据转换为python数据
us_dict = json.loads(us_data)
jp_dict = json.loads(jp_data)
in_dict = json.loads(in_data)

# 获取对应的横坐标与纵坐标数据
us_trend = us_dict['data'][0]['trend']
jp_trend = jp_dict['data'][0]['trend']
in_trend = in_dict['data'][0]['trend']

x_data = us_trend['updateDate'][:314]

us_y_data = us_trend['list'][0]['data'][:314]
jp_y_data = jp_trend['list'][0]['data'][:314]
in_y_data = in_trend['list'][0]['data'][:314]

# 创建折线图
line = Line()

# 添加横纵坐标数据
line.add_xaxis(x_data)
line.add_yaxis('美国确诊人数',us_y_data,label_opts=LabelOpts(is_show=False))
line.add_yaxis('日本确诊人数',jp_y_data,label_opts=LabelOpts(is_show=False))
line.add_yaxis('印度确诊人数',in_y_data,label_opts=LabelOpts(is_show=False))

# 设置全局配置项
line.set_global_opts(title_opts=TitleOpts(title='2020年美国确诊人数',pos_left='center',pos_bottom='1%'),
                     legend_opts=LegendOpts(is_show=True),
                     toolbox_opts=ToolboxOpts(is_show=True),
                     visualmap_opts=VisualMapOpts(is_show=True)
)

line.render()
相关推荐
咕噜咕噜啦啦1 分钟前
Java速通(应用程序)
java·开发语言
我是人机不吃鸭梨9 分钟前
Flutter AI 集成革命(2025版):从 Gemini 模型到智能表单验证器的终极方案
开发语言·javascript·人工智能·flutter·microsoft·架构
沐知全栈开发10 分钟前
服务定位器模式
开发语言
计算机徐师兄10 分钟前
Python基于Django的网络入侵检测系统(附源码,文档说明)
python·django·网络入侵检测·网络入侵检测系统·python网络入侵检测系统·网络入侵·python网络入侵检测
期待のcode13 分钟前
Java Object 类
java·开发语言
Wang's Blog19 分钟前
Lua: 协程编程详解之从基础到多任务处理与应用实战
开发语言·lua
大连好光景22 分钟前
socket.socket模块--网络通信
网络·python·网络协议
笙枫24 分钟前
LangGraph Agent 架构基础:从概念到第一个可运行的Agent
开发语言·架构·php
csbysj202042 分钟前
DOM 验证
开发语言
codists43 分钟前
《Grokking Concurrency》读后感
python