python的第三方模块pandas模块学习笔记

pandas模块是python的第三方模块

Pandas 是一个开源的第三方 Python 库,从 Numpy 和 Matplotlib 的基础上构建而来,享有数据分析"三剑客之一"的盛名(NumPy、Matplotlib、Pandas)。Pandas 已经成为 Python 数据分析的必备高级工具,它的目标是成为强大、灵活、可以支持任何编程语言的数据分析工具,本文主要是对pandas进行入门,通过本文你将系统性了解pandas的基本使用方法。

安装

pandas常常和numpy模块一起使用

html 复制代码
pip install numpy
pip install pandas

使用笔记

bash 复制代码
import pandas as pd
import numpy as np
from pandas import DataFrame


# df.T     返回一个转置(行列颠倒的df对象)
# df.reset_index()     重置行索引,默认为0123这种的,旧的行索引保留并且转换为第一列
# df.reset_index(drop=True)     重置行索引,默认为0123这种的,旧的行索引不保留
# df.values     将df对象转换成为numpy数组对象
# np.tolist()     将np对象转换成为二维的列表
# df.columns    返回df对象的列索引对象
# df.index    返回df对象的行索引对象


# dfobj = DataFrame().T.reset_index().values.tolist()



df = pd.DataFrame([('bird', 389.0),
                   ('bird', 24.0),
                   ('mammal', 80.5),
                   ('mammal', np.nan)],
                  index=['falcon', 'parrot', 'lion', 'monkey'],
                  columns=('class', 'max_speed'))

print(df)
#          class  max_speed
# falcon    bird      389.0
# parrot    bird       24.0
# lion    mammal       80.5
# monkey  mammal        NaN



df = pd.DataFrame([('bird', 389.0),
                   ('bird', 24.0),
                   ('mammal', 80.5),
                   ('mammal', np.nan)])

print(df)
#         0      1
# 0    bird  389.0
# 1    bird   24.0
# 2  mammal   80.5
# 3  mammal    NaN


print(df.T)
#       0     1       2       3
# 0  bird  bird  mammal  mammal
# 1   389    24    80.5     NaN



print(df.reset_index())
#    index       0      1
# 0      0    bird  389.0
# 1      1    bird   24.0
# 2      2  mammal   80.5
# 3      3  mammal    NaN



print(df.reset_index(drop=True))
#         0      1
# 0    bird  389.0
# 1    bird   24.0
# 2  mammal   80.5
# 3  mammal    NaN


print(df.values)
# [['bird' 389.0]
#  ['bird' 24.0]
#  ['mammal' 80.5]
#  ['mammal' nan]]



print(df.values.tolist())
# [['bird', 389.0], ['bird', 24.0], ['mammal', 80.5], ['mammal', nan]]




print(df.columns)
# RangeIndex(start=0, stop=2, step=1)


print(df.columns.tolist())
# [0, 1]


print(df.index)
# RangeIndex(start=0, stop=4, step=1)


print(df.index.tolist())
# [0, 1, 2, 3]


df = pd.DataFrame([(123, 389.0),
                   (432, 24.0),
                   (34, 80.5),
                   (54, 87)])
print(df / 1000)
#        0       1
# 0  0.123  0.3890
# 1  0.432  0.0240
# 2  0.034  0.0805
# 3  0.054  0.0870
相关推荐
Ares-Wang12 分钟前
Flask》》 Flask-Bcrypt 哈希加密
后端·python·flask
nashane31 分钟前
HarmonyOS 6学习:旋转动画优化与长截图性能调优——打造丝滑交互体验的深度实践
学习·交互·harmonyos·harmonyos 5
kongba00741 分钟前
项目打包 Python Flask 项目发布与打包专家 提示词V1.0
开发语言·python·flask
华清远见IT开放实验室1 小时前
智能手表完整项目实现,比赛求职双向加分,基于嵌入式大赛推荐开发板(STM32U5)
stm32·单片机·嵌入式硬件·学习·智能手表·嵌入式大赛
belldeep1 小时前
介绍 遗传算法 与 TSP问题
python·遗传算法·ga·tsp问题
解救女汉子1 小时前
SQL触发器如何获取触发源应用名_利用APP_NAME函数追踪
jvm·数据库·python
炽烈小老头1 小时前
【 每天学习一点算法 2026/04/22】四数相加 II
学习·算法
uncle_ll1 小时前
LangChain基础学习笔记
笔记·学习·langchain·llm·rag
三品吉他手会点灯2 小时前
C语言学习笔记 - 14.C编程预备计算机专业知识 - 本讲内容概述
c语言·笔记·学习
Thanwind2 小时前
从0开始的机器学习之旅(二):监督学习,从线性回归说起
学习·机器学习·线性回归