【数据分析】有关DataFrame的知识(2)

DataFrame的属性,与Series非常相似。

DataFrame的3种常用属性如下:

  1. dtypes

  2. values

  3. index

即:

DataFrame的3种常用属性:

|-------------------------------------------------------------------------------------------------------------|-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|
| dtypes 我们知道,DataFrame对象有多列数据,数据类型也是:字符串型、整型、浮点型、布尔型。 我们访问DataFrame对象的dtypes属性,会返回DataFrame对象每一列的数据类型。 | 在 Pandas 中,dtype(数据类型)用于描述 SeriesDataFrame 中数据的类型。Objectdtype 中表示该列或 Series 中的数据类型是通用的 Python 对象。这通常意味着该列可以包含各种不同的数据类型(例如字符串、数字、列表、甚至其他自定义对象)。 |
| 示例: 我们通过访问DataFrame对象的dtypes属性,返回了变量df的****每一列数据的数据类型 ,将其输出。 根据输出可以看到,变量df的'rank'和'GDP'两列的数据类型都为整型。 | import pandas as pd # 定义一个字典和一个列表 data = {'rank':1, 2, 3, 4,'GDP':80855, 77388, 68024, 47251} city = 'GD','JS','SD','ZJ' # 使用DataFrame构造函数,传入参数:字典data作为values和columns,列表city作为index # 构造出的DataFrame赋值给df df = pd.DataFrame(data, index=city) # 用print输出变量df的每一列数据的数据类型 print( df.dtypes ) |

DataFrame一般有多列数据,所以返回DataFrame对象的数据类型的后缀:.dtypes

|----------------------------------------------------------------------------------------------------------------------------|------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|
| values 我们访问DataFrame对象的values属性,会以数组的形式返回DataFrame对象的值values。 | |
| 示例中: 我们通过访问DataFrame对象的values属性,返回了变量df的值values,并将其输出。 根据输出可以看到,以数组的形式返回了变量df的值values。 注意: DataFrame是二维的数据结构,所以返回二维数组。 | import pandas as pd # 定义一个字典和一个列表 data = {'rank':1, 2, 3, 4,'GDP':80855, 77388, 68024, 47251} city = 'GD','JS','SD','ZJ' # 使用DataFrame构造函数,传入参数:字典data作为values和columns,列表city作为index # 构造出的DataFrame赋值给df df = pd.DataFrame(data, index=city) # 用print输出变量df的每一列数据的值 print(df.values) |

返回DataFrame对象的值values的后缀:.values

|------------------------------------------------------------------------------------------------|----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|
| index 同理,我们访问DataFrame的index属性,可以获取它的行索引index。 | |
| 示例: 我们通过访问DataFrame对象的index属性,返回了变量df的行索引index,将其输出。 根据输出可以看到,返回了变量df的索引index,即变量city所存储的列表的值。 | import pandas as pd data = {'rank':1, 2, 3, 4,'GDP':80855, 77388, 68024, 47251} city = 'GD','JS','SD','ZJ' df = pd.DataFrame(data, index=city) #用print输出变量df的行索引 print(df.index) 结果: Index('GD', 'JS', 'SD', 'ZJ', dtype='object') |
| 返回DataFrame对象的行索引index的后缀:.index | |
| | |
| 修改index 在使用index属性获取到一个对象的index后,我们可以通过对其值,来改变它的index。 示例中,df的index传入了列表city,将df输出进行查看; 然后,将df的index改为列表city_CN的值,并将此时的df输出进行查看: ||
| import pandas as pd # 定义一个字典和一个列表 data= {'rank':1, 2, 3, 4,'GDP':80855, 77388, 68024, 47251} city= 'GD','JS','SD','ZJ' # 使用DataFrame构造函数,传入参数:字典data作为values和columns,列表city作为index # 构造出的DataFrame赋值给df df= pd.DataFrame(data, index=city) # 定义一个新的列表city_CN city_CN = '广东','江苏','山东','浙江' # TODO 将新列表city_CN赋值给df的index df.index = city_CN # 用print输出此时的df print(df) ||
| ||

因为DataFrame是一个二维的数据结构。因此,它有一个新的属性:轴(axis)。

DataFrame 的轴

|--------------------------------------------------------------------------------------------------------------------------------------------|----------------------------------------------------------------------------------------------------------------------------------------------|
| 轴(axis),是用来为超过一维的数组定义属性。 二维数组有两个轴,三维数组有三个轴,以此类推。 | 对于DataFrame而言: 第0轴垂直向下,即axis=0是垂直方向进行操作; 第1轴水平向右,即axis=1是水平方向进行操作。 |
| 举一个例子: 如果要按行或者按列来对DataFrame内的数据进行求和,可以使用sum()函数。 那么在sum()函数中,就可以使用axis参数来指定求和的方向。 右侧展示了: 当axis=0时,是在垂直的方向上进行求和操作; 当axis=1时,是在水平的方向上进行求和操作。 | |
| DataFrame进行df.mean(axis=0)操作的运行结果 | axis=0是垂直方向进行处理,处理后是浮点数的数据类型,dtype是float64。 |

相关推荐
千瓜11 小时前
运动生活方式洞察 | 从“动起来”到“活过来”
大数据·人工智能·数据分析·生活·新媒体
一晌小贪欢11 小时前
第22节:相关性分析——协方差、相关系数与热力图解读
开发语言·python·数据分析·pandas·数据可视化
郑洁文1 天前
音乐数据分析研究与应用
大数据·数据挖掘·数据分析·音乐数据分析
陆水A1 天前
【实时数仓·3】Flink多表JOIN状态爆炸——Event Time Temporal JOIN + TTL分层治理
大数据·数据仓库·数据分析·flink·数据库开发·bigdata
babe小鑫1 天前
2026会计专业学数据分析的价值
数据挖掘·数据分析
镜舟科技1 天前
镜舟科技出席 HPE 新品发布会,携手打造“Lakehouse + AI”智能数据底座
starrocks·数据分析·ai agent·lakehouse·hpe
Aloudata1 天前
传统 BI 指标向语义层迁移实操指南与避坑详解
数据分析·agent·bi·语义层·语义编织
不剪发的Tony老师1 天前
DataPallas:一个免费开源的全栈式BI与报表平台
数据分析·bi
wayz111 天前
Overlap:SLOPE(线性回归斜率)技术指标详解
算法·金融·数据分析·回归·线性回归·量化交易·特征工程
wayz111 天前
Momentum:RVGI(相对活力指数)技术指标详解
算法·金融·数据分析·量化交易·特征工程