python的第三方模块pandas模块学习笔记

pandas模块是python的第三方模块

Pandas 是一个开源的第三方 Python 库,从 Numpy 和 Matplotlib 的基础上构建而来,享有数据分析"三剑客之一"的盛名(NumPy、Matplotlib、Pandas)。Pandas 已经成为 Python 数据分析的必备高级工具,它的目标是成为强大、灵活、可以支持任何编程语言的数据分析工具,本文主要是对pandas进行入门,通过本文你将系统性了解pandas的基本使用方法。

安装

pandas常常和numpy模块一起使用

html 复制代码
pip install numpy
pip install pandas

使用笔记

bash 复制代码
import pandas as pd
import numpy as np
from pandas import DataFrame


# df.T     返回一个转置(行列颠倒的df对象)
# df.reset_index()     重置行索引,默认为0123这种的,旧的行索引保留并且转换为第一列
# df.reset_index(drop=True)     重置行索引,默认为0123这种的,旧的行索引不保留
# df.values     将df对象转换成为numpy数组对象
# np.tolist()     将np对象转换成为二维的列表
# df.columns    返回df对象的列索引对象
# df.index    返回df对象的行索引对象


# dfobj = DataFrame().T.reset_index().values.tolist()



df = pd.DataFrame([('bird', 389.0),
                   ('bird', 24.0),
                   ('mammal', 80.5),
                   ('mammal', np.nan)],
                  index=['falcon', 'parrot', 'lion', 'monkey'],
                  columns=('class', 'max_speed'))

print(df)
#          class  max_speed
# falcon    bird      389.0
# parrot    bird       24.0
# lion    mammal       80.5
# monkey  mammal        NaN



df = pd.DataFrame([('bird', 389.0),
                   ('bird', 24.0),
                   ('mammal', 80.5),
                   ('mammal', np.nan)])

print(df)
#         0      1
# 0    bird  389.0
# 1    bird   24.0
# 2  mammal   80.5
# 3  mammal    NaN


print(df.T)
#       0     1       2       3
# 0  bird  bird  mammal  mammal
# 1   389    24    80.5     NaN



print(df.reset_index())
#    index       0      1
# 0      0    bird  389.0
# 1      1    bird   24.0
# 2      2  mammal   80.5
# 3      3  mammal    NaN



print(df.reset_index(drop=True))
#         0      1
# 0    bird  389.0
# 1    bird   24.0
# 2  mammal   80.5
# 3  mammal    NaN


print(df.values)
# [['bird' 389.0]
#  ['bird' 24.0]
#  ['mammal' 80.5]
#  ['mammal' nan]]



print(df.values.tolist())
# [['bird', 389.0], ['bird', 24.0], ['mammal', 80.5], ['mammal', nan]]




print(df.columns)
# RangeIndex(start=0, stop=2, step=1)


print(df.columns.tolist())
# [0, 1]


print(df.index)
# RangeIndex(start=0, stop=4, step=1)


print(df.index.tolist())
# [0, 1, 2, 3]


df = pd.DataFrame([(123, 389.0),
                   (432, 24.0),
                   (34, 80.5),
                   (54, 87)])
print(df / 1000)
#        0       1
# 0  0.123  0.3890
# 1  0.432  0.0240
# 2  0.034  0.0805
# 3  0.054  0.0870
相关推荐
Unbelievabletobe3 小时前
解决了股票api接口盘后数据更新慢的问题
大数据·开发语言·python
lpd_lt5 小时前
AI Coding的常用Prompt技巧
python·ai·ai编程
小江的记录本5 小时前
【JVM虚拟机】堆内存分代模型:年轻代(Eden+Survivor)、老年代、元空间Metaspace(附《思维导图》+《面试高频考点清单》)
java·前端·jvm·后端·python·spring·面试
在繁华处5 小时前
Java从零到熟练(三):流程控制
java·开发语言·python
sulikey5 小时前
个人Linux操作系统学习笔记6 - 操作系统与进程初识
linux·笔记·学习·操作系统·进程
asdzx675 小时前
使用 Python 快速提取 PDF 中的表格
python·pdf
无情的西瓜皮6 小时前
MCP协议实战:用Python从零搭建一个AI Agent工具服务器(保姆级教程)
服务器·人工智能·python·mcp
unicorn316 小时前
学习学习学习
学习
XGeFei6 小时前
【Fastapi学习笔记(3)】——资源的层级关系、安全性-幂等性、Field、工厂函数
笔记·学习·fastapi
岁月宁静6 小时前
驾驭 AI 这匹野马:深入解析智能体 Harness 工程
vue.js·python