Python(pandas库3)

函数

随机抽样

语法

  • n:要抽取的行数

  • frac:抽取的比例,比如 frac=0.5,代表抽取总体数据的50%

  • axis:示在哪个方向上抽取数据(axis=1 表示列/axis=0 表示行)

案例:

输出结果都为随机抽取。

空值处理

1 检测空值

isnull()用于检测 DataFrame 或 Series 中的空值,返回一个布尔值的 DataFrame 或 Series。

notnull()用于检测 DataFrame 或 Series 中的非空值,返回一个布尔值的 DataFrame 或 Series。

2 填充空值

fillna() 方法用于填充 DataFrame 或 Series 中的空值。

3 删除空值

dropna() 方法用于删除 DataFrame 或 Series 中的空值。

读取CSV文件

CSV(Comma-Separated Values,逗号分隔值,有时也称为字符分隔值,因为分隔字符也可以不是逗号),其文件以纯文本形式存储表格数据(数字和文本);

1、to_csv()

to_csv() 方法将 DataFrame 存储为 csv 文件

运行即可将DataFrame对象转化为csv文件。

默认存储在该python文件存储目录中

2、read_csv()

read_csv() 表示从 CSV 文件中读取数据,并创建 DataFrame 对象。

绘图

Pandas 在数据分析、数据可视化方面有着较为广泛的应用,Pandas 对 Matplotlib 绘图软件包的基础上单独封装了一个plot()接口,通过调用该接口可以实现常用的绘图操作;

Pandas 之所以能够实现了数据可视化,主要利用了 Matplotlib 库的 plot() 方法,它对 plot() 方法做了简单的封装,因此您可以直接调用该接口;

只用 pandas 绘制图片可能可以编译,但是不会显示图片,需要使用 matplotlib 库,调用 show() 方法显示图形。

首先调用Matplotlib,Pandas

饼图

相关推荐
BYSJMG11 分钟前
计算机毕设大数据方向:基于Spark+Hadoop的餐饮外卖平台数据分析系统【源码+文档+调试】
大数据·hadoop·分布式·python·spark·django·课程设计
狂奔的sherry26 分钟前
单例模式(巨通俗易懂)普通单例,懒汉单例的实现和区别,依赖注入......
开发语言·c++·单例模式
OC溥哥99939 分钟前
Flask论坛与个人中心页面开发教程完整详细版
后端·python·flask·html
Rhys..42 分钟前
python + Flask模块学习 2 接收用户请求并返回json数据
python·学习·flask
EnigmaCoder1 小时前
【C++】引用的本质与高效应用
开发语言·c++
Enougme1 小时前
python-虚拟试衣
python
zhangfeng11332 小时前
BiocManager下载失败 R语言 解决办法
开发语言·r语言
nightunderblackcat2 小时前
新手向:Python制作贪吃蛇游戏(Pygame)
python·游戏·pygame
CoderYanger2 小时前
MySQL数据库——3.2.1 表的增删查改-查询部分(全列+指定列+去重)
java·开发语言·数据库·mysql·面试·职场和发展
炮院李教员2 小时前
使用Qt Core模块(无GUI依赖),确保程序作为后台服务/daemon运行,与任何GUI完全无交互。
开发语言·qt