数据清洗-缺失值处理-缺失值可视化图(竖线)

目录

  • 一、安装所需的python包
  • 二、缺失值可视化分析
    • [2.1 代码(完整代码关注底部微信公众号获取)](#2.1 代码(完整代码关注底部微信公众号获取))
    • [2.2 以某个缺失值数据进行可视化实战](#2.2 以某个缺失值数据进行可视化实战)
      • [2.2.1 代码运行过程截屏:](#2.2.1 代码运行过程截屏:)
      • [2.2.2 缺失图可视化:](#2.2.2 缺失图可视化:)

感觉大家对原理性的东西不太感兴趣,那我就直接举例提供代码,以及详细的注释,大家自己对照改代码应用于你自己建立的模型吧。
完整代码关注博客底部微信公众号获得!
这些代码全部是我自己做数模竞赛时候自己用的代码。可以直接运行,记得修改文件路径。

一、安装所需的python包

python 复制代码
pip install xlrd
pip install openpyxl
pip install numpy
pip install missingno
pip install pandas
pip install matplotlib

二、缺失值可视化分析

注意代码需要把自己的数据文件格式转换为CSV文件,并且把路径修改为自己文件所在的路径,不会转换的参考我此教程文件格式转换:EXCEL和CSV文件格式互相转换
我知道大家对原理性的东西不感兴趣,我把他的原理介绍放在文末,需要写论文的同学自己拿去用,记得修改,否则查重率过不去。

2.1 代码(完整代码关注底部微信公众号获取)

python 复制代码
import codecs
import xlrd
import csv
import openpyxl
import shutil
import numpy as ny
import missingno as msno
import pandas as pd
from matplotlib import pyplot as plt

"""设置字体全局"""
from pylab import mpl
# 设置显示中文字体
mpl.rcParams["font.sans-serif"] = ["SimHei"]
# 设置正常显示符号
mpl.rcParams["axes.unicode_minus"] = False


# 读取文件
data = pd.read_csv('缺失值填充.csv',encoding='gbk')



#保存图片结果
plt.savefig("缺失图.png")
plt.show() #若显示,取消注释即可

注意:data = pd.read_csv('缺失值填充.csv',encoding='gbk')里面的缺失值填充.csv是你自己的缺失值的csv文件路径。

2.2 以某个缺失值数据进行可视化实战

注意:数据量较少,由自己构建,均有规律,

如下图:

构造缺失值,如下图:

运行代码查看填充后的数据怎么样,

运行代码如下图+填充后的截图:

2.2.1 代码运行过程截屏:

2.2.2 缺失图可视化:

接下来我将继续分享其他我参加数模时候常用的几种数据填充的代码,都是我自己调试跑通过的,大家直接复制粘贴使用。

相关推荐
yuan199979 分钟前
基于 MATLAB PSO 工具箱的函数寻优算法
开发语言·算法·matlab
YUANQIANG202413 分钟前
博弈论中势函数与势博弈构造:为什么看似 “先射箭后画靶”
算法·信息与通信
WBluuue22 分钟前
Codeforces 1096 Div3(ABCDEFGH)
c++·算法
汤米粥29 分钟前
python学习——核心语法三
java·python·学习
wanzehongsheng36 分钟前
基于天文算法的双轴太阳能追踪系统:从原理到工程实现
算法
basketball61638 分钟前
Kadane算法 C++实现
java·c++·算法
handler0138 分钟前
【C++】二叉搜索树详解及其模拟实现(代码)
开发语言·c++·算法·c··二叉搜索树·搜索树
luj_176840 分钟前
残熵算法的稳健防灾逻辑
c语言·开发语言·c++·经验分享·算法
玖釉-41 分钟前
二叉树基础详解:TreeNode、buildTree、deleteTree 与 printTree 的实现原理(C++)
c++·windows·算法
Severus_black41 分钟前
【初阶数据结构与算法】八大排序之非比较排序(计数排序),一次性讲清!
数据结构·算法·排序算法