函数
随机抽样
语法:
![](https://i-blog.csdnimg.cn/direct/d7038d2cf47e419293bb422fde56ca6b.png)
-
n:要抽取的行数
-
frac:抽取的比例,比如 frac=0.5,代表抽取总体数据的50%
- axis:示在哪个方向上抽取数据(axis=1 表示列/axis=0 表示行)
案例:
![](https://i-blog.csdnimg.cn/direct/07db01037fca4f85b20c5eb4b10b6bb8.png)
![](https://i-blog.csdnimg.cn/direct/febff35134f640e6ad9cba0f1deebd44.png)
输出结果都为随机抽取。
空值处理
1 检测空值
isnull()用于检测 DataFrame 或 Series 中的空值,返回一个布尔值的 DataFrame 或 Series。
notnull()用于检测 DataFrame 或 Series 中的非空值,返回一个布尔值的 DataFrame 或 Series。
![](https://i-blog.csdnimg.cn/direct/7a7f46e829e64faa976d0cafceaea8b8.png)
2 填充空值
fillna() 方法用于填充 DataFrame 或 Series 中的空值。
![](https://i-blog.csdnimg.cn/direct/19ba1898f2cf4f44ad87131d73fc8485.png)
3 删除空值
dropna() 方法用于删除 DataFrame 或 Series 中的空值。
![](https://i-blog.csdnimg.cn/direct/1d93c24a7e5e4cd0afc666371b30b7bb.png)
读取CSV文件
CSV(Comma-Separated Values,逗号分隔值,有时也称为字符分隔值,因为分隔字符也可以不是逗号),其文件以纯文本形式存储表格数据(数字和文本);
1、to_csv()
to_csv() 方法将 DataFrame 存储为 csv 文件
![](https://i-blog.csdnimg.cn/direct/120321fe4f8147eaae89b321f46a226f.png)
运行即可将DataFrame对象转化为csv文件。
默认存储在该python文件存储目录中
2、read_csv()
read_csv() 表示从 CSV 文件中读取数据,并创建 DataFrame 对象。
![](https://i-blog.csdnimg.cn/direct/c3f3f4155b6043b194afff34059c81b1.png)
![](https://i-blog.csdnimg.cn/direct/1e3213eeca224f1fa095ca4b9aa521d6.png)
绘图
Pandas 在数据分析、数据可视化方面有着较为广泛的应用,Pandas 对 Matplotlib 绘图软件包的基础上单独封装了一个plot()
接口,通过调用该接口可以实现常用的绘图操作;
Pandas 之所以能够实现了数据可视化,主要利用了 Matplotlib 库的 plot() 方法,它对 plot() 方法做了简单的封装,因此您可以直接调用该接口;
只用 pandas 绘制图片可能可以编译,但是不会显示图片,需要使用 matplotlib 库,调用 show() 方法显示图形。
首先调用Matplotlib,Pandas
![](https://i-blog.csdnimg.cn/direct/eedcb72bd86943e49d29155a160ac2e5.png)
![](https://i-blog.csdnimg.cn/direct/b51301d71cf14b1fb21652f8f9612edf.png)
饼图
![](https://i-blog.csdnimg.cn/direct/961f4a6506fe4ebabac67a45f7e21766.png)
![](https://i-blog.csdnimg.cn/direct/29efd12abfc9450e950f383957af7fb8.png)