python-pandas基础学习

可参考:

pandas:http://pandas.pydata.org/docs/user_guide/10min.html

一、基础知识

DataFrame 方法,可以将一组数据(ndarray、series, map, list, dict 等类型)转化为表格型数据

python 复制代码
import pandas as pd
data = {'name': ['xx', 'zz', 'hh', 'aa'],
            'year': [2000, 2001, 2002, 2003],
            'age': [15, 16, 17, 18]}
df = pd.DataFrame(data)

输出全部数据

python 复制代码
print(df) 

获取某一列数据

python 复制代码
print(df['A'])

输出部分数据(切片)

python 复制代码
print(df[2:3])

条件筛选数据

输出满足条件的所有数据

python 复制代码
print(df[df['age']>15])

比较数据数据是否满足条件

python 复制代码
print(df['age']>15)

行和列结合筛选

python 复制代码
print(df[2:3][['name']])

删除指定行

python 复制代码
df = df.drop(0)
print(df)

head 默认输出前5列,head方法里传入几个参数,输出几行

python 复制代码
print(df.head())

tail 默认输出最后5行

python 复制代码
print(df,tail())
python 复制代码
import pandas as pd
import numpy as np
#(1)生成日期  给定一个日期 生产一组递增日期数据
data = pd.date_range('20240318',periods=6)
#生成一组6行4列的表格数据,表头为ABCD
df = pd.DataFrame(np.random.randn(6,4),index=data,columns=list('ABCD'))

生成日期 给定一个日期 生产一组递增日期数据

python 复制代码
print(data)

转置(行变成列,列变成行)

python 复制代码
print(df.transpose())

数据转化为numpy数据

index=False 表示不要index

python 复制代码
print(df.to_records(index=False))

排序sort_values 默认升序

python 复制代码
print(df.sort_values(by='B'))

按照索引获取数据

二、数据处理(分组)

(1) 对某一列元素进行分组求和处理

python 复制代码
import pandas as pd
import numpy as np
data = {'X':['B','B','A','A'],'Y':[1,2,3,4]}
df = pd.DataFrame(data)
python 复制代码
df = df.groupby(ele,sort=False).sum()
print(df)

(2)分组后得到某组的值

python 复制代码
df = df.groupby(ele,sort=False).get_group('A')
print(df)
相关推荐
一 乐13 小时前
智慧党建|党务学习|基于SprinBoot+vue的智慧党建学习平台(源码+数据库+文档)
java·前端·数据库·vue.js·spring boot·学习
海边夕阳200613 小时前
MVCC核心原理解密:从隐藏字段到版本链的完整解析
经验分享·学习·数据库架构·mvcc
林一百二十八13 小时前
Python实现手写数字识别
开发语言·python
Q264336502314 小时前
【有源码】基于Hadoop+Spark的起点小说网大数据可视化分析系统-基于Python大数据生态的网络文学数据挖掘与可视化系统
大数据·hadoop·python·信息可视化·数据分析·spark·毕业设计
woodykissme14 小时前
日内瓦传动装置?不就是我们叫的间歇结构吗?
学习·机械
YJlio14 小时前
PsSuspend(7.23):无损挂起与恢复指定进程——精准“冻住”故障现场
笔记·学习·安全
大叔_爱编程14 小时前
基于Python的历届奥运会数据可视化分析系统-django+spider
python·django·毕业设计·源码·课程设计·spider·奥运会数据可视化
Q_Q196328847515 小时前
python+django/flask基于协同过滤算法的理财产品推荐系统
spring boot·python·django·flask·node.js·php
高洁0115 小时前
面向强化学习的状态空间建模:RSSM的介绍和PyTorch实现(3)
人工智能·python·深度学习·神经网络·transformer
aloha_78915 小时前
测试开发工程师面经准备(sxf)
java·python·leetcode·压力测试