记录Python的pandas库详解

如何生成一个pd

复制代码
import pandas as pd
df = pd.DataFrame([[1,2,3],[4,5,6]],index=['A','B'],columns=['C1','C2','C3'])

df
---------------------------------------------------------------------------
	C1	C2	C3
A	1	2	3
B	4	5	6

df.T
---------------------------------------------------------------------------
	A	B
C1	1	4
C2	2	5
C3	3	6

df.values
---------------------------------------------------------------------------
array([[1, 2, 3],
       [4, 5, 6]], dtype=int64)

df.index
---------------------------------------------------------------------------
Index(['A', 'B'], dtype='object')

df.columns
---------------------------------------------------------------------------
Index(['C1', 'C2', 'C3'], dtype='object')

df.shape
---------------------------------------------------------------------------
(3, 2)
#第一行
df.head(1)
---------------------------------------------------------------------------
	C1	C2	C3
A	1	2	3
#最后一行
df.tail(1)
---------------------------------------------------------------------------
	C1	C2	C3
B	4	5	6
#取出index列标识的所有值,比如这里取B列
df.loc['B']
---------------------------------------------------------------------------
C1    4
C2    5
C3    6
Name: B, dtype: int64

一、如何进行数据分析,我自己建了一个csv文件来解释数据长这样

通过pd来获取数据

复制代码
broken_df = pd.read_csv('./data.csv')
broken_df

得到的数据长这样,这样的数据没法正常看。

通过数据分析,我们发现是以";"为数分隔的,

我们可以增加参数来处理

复制代码
broken_df = pd.read_csv('./data.csv',sep=';', encoding='utf-8',parse_dates=['日期'],dayfirst=True,index_col='日期')
broken_df

选择某一列--广东

复制代码
broken_df = pd.read_csv('./data.csv',sep=';', encoding='utf-8',parse_dates=['日期'],dayfirst=True,index_col='日期')
broken_df['广东']

选择前三列

复制代码
broken_df.head(3)
broken_df[:3]
#这两个都可以用
复制代码
broken_df = pd.read_csv('./data.csv',sep=';', encoding='utf-8',parse_dates=['日期'],dayfirst=True,index_col='日期')
broken_df['广东'].plot()

#在使用中,你可能会遇到missing from current font错误警告问题,处理方式给程序增加看得懂的编码
plt.rcParams['font.sans-serif'] = ['SimHei']
相关推荐
json{shen:"jing"}1 小时前
js收官总概述
开发语言·python
froginwe111 小时前
Java 文档注释
开发语言
Zsy_0510031 小时前
【C++】stack、queue、容器适配器
开发语言·c++
一起努力啊~1 小时前
算法刷题--栈和队列
开发语言·算法
双层吉士憨包1 小时前
Airbnb(爱彼迎)爬虫全流程解析:用 Python 抓取房源数据实战指南
python·ai·网络爬虫
万行1 小时前
SQL进阶&索引篇
开发语言·数据库·人工智能·sql
打工的小王1 小时前
java并发编程(六)CountDownLatch和回环屏障CyclicBarrier
java·开发语言
星火开发设计1 小时前
命名空间 namespace:解决命名冲突的利器
c语言·开发语言·c++·学习·算法·知识
小北方城市网1 小时前
RabbitMQ 生产级实战:可靠性投递、高并发优化与问题排查
开发语言·分布式·python·缓存·性能优化·rabbitmq·ruby