记录Python的pandas库详解

如何生成一个pd

import pandas as pd
df = pd.DataFrame([[1,2,3],[4,5,6]],index=['A','B'],columns=['C1','C2','C3'])

df
---------------------------------------------------------------------------
	C1	C2	C3
A	1	2	3
B	4	5	6

df.T
---------------------------------------------------------------------------
	A	B
C1	1	4
C2	2	5
C3	3	6

df.values
---------------------------------------------------------------------------
array([[1, 2, 3],
       [4, 5, 6]], dtype=int64)

df.index
---------------------------------------------------------------------------
Index(['A', 'B'], dtype='object')

df.columns
---------------------------------------------------------------------------
Index(['C1', 'C2', 'C3'], dtype='object')

df.shape
---------------------------------------------------------------------------
(3, 2)
#第一行
df.head(1)
---------------------------------------------------------------------------
	C1	C2	C3
A	1	2	3
#最后一行
df.tail(1)
---------------------------------------------------------------------------
	C1	C2	C3
B	4	5	6
#取出index列标识的所有值,比如这里取B列
df.loc['B']
---------------------------------------------------------------------------
C1    4
C2    5
C3    6
Name: B, dtype: int64

一、如何进行数据分析,我自己建了一个csv文件来解释数据长这样

通过pd来获取数据

broken_df = pd.read_csv('./data.csv')
broken_df

得到的数据长这样,这样的数据没法正常看。

通过数据分析,我们发现是以";"为数分隔的,

我们可以增加参数来处理

broken_df = pd.read_csv('./data.csv',sep=';', encoding='utf-8',parse_dates=['日期'],dayfirst=True,index_col='日期')
broken_df

选择某一列--广东

broken_df = pd.read_csv('./data.csv',sep=';', encoding='utf-8',parse_dates=['日期'],dayfirst=True,index_col='日期')
broken_df['广东']

选择前三列

broken_df.head(3)
broken_df[:3]
#这两个都可以用
broken_df = pd.read_csv('./data.csv',sep=';', encoding='utf-8',parse_dates=['日期'],dayfirst=True,index_col='日期')
broken_df['广东'].plot()

#在使用中,你可能会遇到missing from current font错误警告问题,处理方式给程序增加看得懂的编码
plt.rcParams['font.sans-serif'] = ['SimHei']
相关推荐
weixin_307779132 分钟前
在AWS上使用Flume搜集分布在不同EC2实例上的应用程序日志具体流程和代码
python·flask·云计算·flume·aws
山茶花开时。25 分钟前
[SAP ABAP] 静态断点的使用
开发语言·sap·abap
纠结哥_Shrek25 分钟前
Java 有很多常用的库
java·开发语言
sirius1234512334 分钟前
自定义数据集 ,使用朴素贝叶斯对其进行分类
python·分类·numpy
shanks661 小时前
【PyQt】学习PyQt进行GUI开发从基础到进阶逐步掌握详细路线图和关键知识点
python·pyqt
加油,旭杏2 小时前
【go语言】函数
开发语言·后端·golang
南玖yy2 小时前
C语言:结构体
c语言·开发语言
weixin_307779132 小时前
流媒体娱乐服务平台在AWS上使用Presto作为大数据的交互式查询引擎的具体流程和代码
大数据·python·音视频·aws
職場上的造物主3 小时前
高清种子资源获取指南 | ✈️@seedlinkbot
python·ios·php·音视频·视频编解码·视频
〖是♂我〗3 小时前
自定义数据集 使用scikit-learn中svm的包实现svm分类
开发语言·python