记录Python的pandas库详解

如何生成一个pd

复制代码
import pandas as pd
df = pd.DataFrame([[1,2,3],[4,5,6]],index=['A','B'],columns=['C1','C2','C3'])

df
---------------------------------------------------------------------------
	C1	C2	C3
A	1	2	3
B	4	5	6

df.T
---------------------------------------------------------------------------
	A	B
C1	1	4
C2	2	5
C3	3	6

df.values
---------------------------------------------------------------------------
array([[1, 2, 3],
       [4, 5, 6]], dtype=int64)

df.index
---------------------------------------------------------------------------
Index(['A', 'B'], dtype='object')

df.columns
---------------------------------------------------------------------------
Index(['C1', 'C2', 'C3'], dtype='object')

df.shape
---------------------------------------------------------------------------
(3, 2)
#第一行
df.head(1)
---------------------------------------------------------------------------
	C1	C2	C3
A	1	2	3
#最后一行
df.tail(1)
---------------------------------------------------------------------------
	C1	C2	C3
B	4	5	6
#取出index列标识的所有值,比如这里取B列
df.loc['B']
---------------------------------------------------------------------------
C1    4
C2    5
C3    6
Name: B, dtype: int64

一、如何进行数据分析,我自己建了一个csv文件来解释数据长这样

通过pd来获取数据

复制代码
broken_df = pd.read_csv('./data.csv')
broken_df

得到的数据长这样,这样的数据没法正常看。

通过数据分析,我们发现是以";"为数分隔的,

我们可以增加参数来处理

复制代码
broken_df = pd.read_csv('./data.csv',sep=';', encoding='utf-8',parse_dates=['日期'],dayfirst=True,index_col='日期')
broken_df

选择某一列--广东

复制代码
broken_df = pd.read_csv('./data.csv',sep=';', encoding='utf-8',parse_dates=['日期'],dayfirst=True,index_col='日期')
broken_df['广东']

选择前三列

复制代码
broken_df.head(3)
broken_df[:3]
#这两个都可以用
复制代码
broken_df = pd.read_csv('./data.csv',sep=';', encoding='utf-8',parse_dates=['日期'],dayfirst=True,index_col='日期')
broken_df['广东'].plot()

#在使用中,你可能会遇到missing from current font错误警告问题,处理方式给程序增加看得懂的编码
plt.rcParams['font.sans-serif'] = ['SimHei']
相关推荐
花哥码天下9 分钟前
安装/卸载claude code和codex
开发语言·javascript·ecmascript
AsDuang9 分钟前
Python 3.12 MagicMethods - 28 - __rsub__
开发语言·python
李可以量化27 分钟前
用 KMeans 聚类寻找股票支撑位与压力位(上):基于 QMT 量化平台实现
python·量化 qmt ptrade
所谓伊人,在水一方33328 分钟前
【Python数据科学实战之路】第12章 | 无监督学习算法实战:聚类与降维的奥秘
python·sql·学习·算法·信息可视化·聚类
MoRanzhi120335 分钟前
Pillow 灰度化、二值化与阈值处理
图像处理·python·pillow·二值化·图像预处理·阈值处理·灰度化
饕餮争锋35 分钟前
Java泛型介绍
java·开发语言
飞Link1 小时前
告别复杂调参:Prophet 加法模型深度解析与实战
开发语言·python·数据挖掘
测试人社区—66791 小时前
当代码面临道德选择:VR如何为AI伦理决策注入“人性压力”
网络·人工智能·python·microsoft·vr·azure
独行soc1 小时前
2026年渗透测试面试题总结-36(题目+回答)
网络·python·安全·web安全·网络安全·渗透测试·安全狮
zh_xuan1 小时前
测试go语言函数和结构体
开发语言·golang