记录Python的pandas库详解

如何生成一个pd

复制代码
import pandas as pd
df = pd.DataFrame([[1,2,3],[4,5,6]],index=['A','B'],columns=['C1','C2','C3'])

df
---------------------------------------------------------------------------
	C1	C2	C3
A	1	2	3
B	4	5	6

df.T
---------------------------------------------------------------------------
	A	B
C1	1	4
C2	2	5
C3	3	6

df.values
---------------------------------------------------------------------------
array([[1, 2, 3],
       [4, 5, 6]], dtype=int64)

df.index
---------------------------------------------------------------------------
Index(['A', 'B'], dtype='object')

df.columns
---------------------------------------------------------------------------
Index(['C1', 'C2', 'C3'], dtype='object')

df.shape
---------------------------------------------------------------------------
(3, 2)
#第一行
df.head(1)
---------------------------------------------------------------------------
	C1	C2	C3
A	1	2	3
#最后一行
df.tail(1)
---------------------------------------------------------------------------
	C1	C2	C3
B	4	5	6
#取出index列标识的所有值,比如这里取B列
df.loc['B']
---------------------------------------------------------------------------
C1    4
C2    5
C3    6
Name: B, dtype: int64

一、如何进行数据分析,我自己建了一个csv文件来解释数据长这样

通过pd来获取数据

复制代码
broken_df = pd.read_csv('./data.csv')
broken_df

得到的数据长这样,这样的数据没法正常看。

通过数据分析,我们发现是以";"为数分隔的,

我们可以增加参数来处理

复制代码
broken_df = pd.read_csv('./data.csv',sep=';', encoding='utf-8',parse_dates=['日期'],dayfirst=True,index_col='日期')
broken_df

选择某一列--广东

复制代码
broken_df = pd.read_csv('./data.csv',sep=';', encoding='utf-8',parse_dates=['日期'],dayfirst=True,index_col='日期')
broken_df['广东']

选择前三列

复制代码
broken_df.head(3)
broken_df[:3]
#这两个都可以用
复制代码
broken_df = pd.read_csv('./data.csv',sep=';', encoding='utf-8',parse_dates=['日期'],dayfirst=True,index_col='日期')
broken_df['广东'].plot()

#在使用中,你可能会遇到missing from current font错误警告问题,处理方式给程序增加看得懂的编码
plt.rcParams['font.sans-serif'] = ['SimHei']
相关推荐
我命由我123459 分钟前
Java 并发编程 - Delay(Delayed 概述、Delayed 实现、Delayed 使用、Delay 缓存实现、Delayed 延迟获取数据实现)
java·开发语言·后端·缓存·java-ee·intellij-idea·intellij idea
HLJ洛神千羽10 分钟前
C++程序设计实验(黑龙江大学)
开发语言·c++·软件工程
kyle~15 分钟前
算法数学---差分数组(Difference Array)
java·开发语言·算法
曹牧16 分钟前
C#:三元运算符
开发语言·c#
Jonathan Star34 分钟前
MediaPipe 在Python中实现人体运动识别,最常用且高效的方案是结合**姿态估计**(提取人体关键点)和**动作分类**(识别具体运动)
开发语言·python·分类
滨HI01 小时前
C++ opencv拟合直线
开发语言·c++·opencv
沐浴露z1 小时前
详解JDK21新特性【虚拟线程】
java·开发语言·jvm
山顶听风1 小时前
分页条初始化
python
艾莉丝努力练剑1 小时前
【C++:红黑树】深入理解红黑树的平衡之道:从原理、变色、旋转到完整实现代码
大数据·开发语言·c++·人工智能·红黑树
l1t1 小时前
利用DeepSeek优化SQLite求解数独SQL用于DuckDB
开发语言·数据库·sql·sqlite·duckdb