数据的简单处理——pandas模块——数据结构（Series和DataFrame对象）

复制代码

pandas模块是基于Numpy模块开发的。在pandas模块中有两个重要的数据结构对象------Series和DataFrame。使用这两个对象可以在计算机的内存中构建虚拟的数据库。对于++Series和DataFrame++ 对象主要有三类，都是包括普通默认的方式、添加行列标签的方式、采用字典创建数据结构的方式。DataFarme是一种二维的数据结构对象，用该对象创建的数据结构在形式上类似与Excel表格。相比于Series对象，DateFarme对象在实际的工作中的应用更加广泛。

python 复制代码

##############################
##作者：白雪公主的后妈
##时间：2024年12月29日
##主题：数据的简单处理------pandas模块------数据结构
##############################
#1、数据结构
'''
    pandas模块是基于Numpy模块开发的。在pandas模块中有两个重要的数据结构对象------Series和DataFrame。使用这两个对象可以
    在计算机的内存中构建虚拟的数据库。
'''
#1.1    Series对象
#与一维数组不同的是不仅包含数据元素，还包含数组元素的标签。
import pandas as pd
s=pd.Series(["短裤","毛衣","连衣裙","牛仔裤"])
print(s)
'''
运行结果：
0     短裤
1     毛衣
2    连衣裙
3    牛仔裤
dtype: object
'''
####################################
#以上是系统定义的标签，如果想要自定义标签时，可以使用Series对象中参数index传入元素的行标签列表
s1=pd.Series(["短裤","毛衣","连衣裙","牛仔裤"],index=["a001","a002","a003","a004"])
print(s1)
'''
运行结果：
a001     短裤
a002     毛衣
a003    连衣裙
a004    牛仔裤
dtype: object
'''
####################################
#Series对象还可以基于字典创建数据结构
s2=pd.Series({"a001":"短裤","a002":"毛衣","a003":"连衣裙","a004":"牛仔裤"})
print(s2)
'''
运行结果：
a001     短裤
a002     毛衣
a003    连衣裙
a004    牛仔裤
dtype: object
'''
#1.2    DataFarme对象
'''
DataFarme是一种二维的数据结构对象，用该对象创建的数据结构在形式上类似与Excel表格。
相比于Series对象，DateFarme对象在实际的工作中的应用更加广泛。
'''
import pandas as pd
df=pd.DataFrame([["短裤",45],["毛衣",69],["连衣裙",119],["牛仔裤",99]])
print(df)
'''
运行结果：
     0    1
0   短裤   45
1   毛衣   69
2  连衣裙  119
3  牛仔裤   99
'''
import pandas as pd
df1 = pd.DataFrame([["短裤", 45], ["毛衣", 69], ["连衣裙", 119], ["牛仔裤", 99]],columns=["产品","单价"],index=["a001","a002","a003","a004"])
print(df1)
'''
运行结果：使用columns和index定义行标签和列标签
       产品   单价
a001   短裤   45
a002   毛衣   69
a003  连衣裙  119
a004  牛仔裤   99
'''
#######################采用字典的方式
import pandas as pd
df2 = pd.DataFrame({"产品":["短裤", "毛衣","连衣裙","牛仔裤"],"单价":[45,69,119,99]},index=["a001","a002","a003","a004"])
print(df2)