记录Python的pandas库详解

如何生成一个pd

复制代码
import pandas as pd
df = pd.DataFrame([[1,2,3],[4,5,6]],index=['A','B'],columns=['C1','C2','C3'])

df
---------------------------------------------------------------------------
	C1	C2	C3
A	1	2	3
B	4	5	6

df.T
---------------------------------------------------------------------------
	A	B
C1	1	4
C2	2	5
C3	3	6

df.values
---------------------------------------------------------------------------
array([[1, 2, 3],
       [4, 5, 6]], dtype=int64)

df.index
---------------------------------------------------------------------------
Index(['A', 'B'], dtype='object')

df.columns
---------------------------------------------------------------------------
Index(['C1', 'C2', 'C3'], dtype='object')

df.shape
---------------------------------------------------------------------------
(3, 2)
#第一行
df.head(1)
---------------------------------------------------------------------------
	C1	C2	C3
A	1	2	3
#最后一行
df.tail(1)
---------------------------------------------------------------------------
	C1	C2	C3
B	4	5	6
#取出index列标识的所有值,比如这里取B列
df.loc['B']
---------------------------------------------------------------------------
C1    4
C2    5
C3    6
Name: B, dtype: int64

一、如何进行数据分析,我自己建了一个csv文件来解释数据长这样

通过pd来获取数据

复制代码
broken_df = pd.read_csv('./data.csv')
broken_df

得到的数据长这样,这样的数据没法正常看。

通过数据分析,我们发现是以";"为数分隔的,

我们可以增加参数来处理

复制代码
broken_df = pd.read_csv('./data.csv',sep=';', encoding='utf-8',parse_dates=['日期'],dayfirst=True,index_col='日期')
broken_df

选择某一列--广东

复制代码
broken_df = pd.read_csv('./data.csv',sep=';', encoding='utf-8',parse_dates=['日期'],dayfirst=True,index_col='日期')
broken_df['广东']

选择前三列

复制代码
broken_df.head(3)
broken_df[:3]
#这两个都可以用
复制代码
broken_df = pd.read_csv('./data.csv',sep=';', encoding='utf-8',parse_dates=['日期'],dayfirst=True,index_col='日期')
broken_df['广东'].plot()

#在使用中,你可能会遇到missing from current font错误警告问题,处理方式给程序增加看得懂的编码
plt.rcParams['font.sans-serif'] = ['SimHei']
相关推荐
郝学胜-神的一滴3 分钟前
Linux下的阻塞与非阻塞模式详解
linux·服务器·开发语言·c++·程序人生·软件工程
yanqiaofanhua15 分钟前
C语言自学--预处理详解
c语言·开发语言
沐知全栈开发23 分钟前
Vue3 计算属性
开发语言
冰糖雪梨dd1 小时前
JS中new的过程发生了什么
开发语言·javascript·原型模式
川石课堂软件测试2 小时前
全链路Controller压测负载均衡
android·运维·开发语言·python·mysql·adb·负载均衡
喜欢吃豆2 小时前
微调高级推理大模型(COT)的综合指南:从理论到实践
人工智能·python·语言模型·大模型·微调·强化学习·推理模型
杨福瑞2 小时前
C语言⽂件操作讲解(总)
c语言·开发语言
喜欢吃豆2 小时前
从指令遵循到价值对齐:医疗大语言模型的进阶优化、对齐与工具集成综合技术白皮书
人工智能·python·语言模型·自然语言处理·大模型·强化学习·constitutional
Access开发易登软件3 小时前
Access调用Azure翻译:轻松实现系统多语言切换
后端·python·低代码·flask·vba·access·access开发
yumgpkpm3 小时前
CMP (类Cloudera) CDP7.3(400次编译)在华为鲲鹏Aarch64(ARM)信创环境中的性能测试过程及命令
大数据·hive·hadoop·python·elasticsearch·spark·cloudera