python
复制代码
##############################
##作者:白雪公主的后妈
##时间:2024年12月29日
##主题:数据的简单处理------pandas模块------数据结构
##############################
#1、数据结构
'''
pandas模块是基于Numpy模块开发的。在pandas模块中有两个重要的数据结构对象------Series和DataFrame。使用这两个对象可以
在计算机的内存中构建虚拟的数据库。
'''
#1.1 Series对象
#与一维数组不同的是不仅包含数据元素,还包含数组元素的标签。
import pandas as pd
s=pd.Series(["短裤","毛衣","连衣裙","牛仔裤"])
print(s)
'''
运行结果:
0 短裤
1 毛衣
2 连衣裙
3 牛仔裤
dtype: object
'''
####################################
#以上是系统定义的标签,如果想要自定义标签时,可以使用Series对象中参数index传入元素的行标签列表
s1=pd.Series(["短裤","毛衣","连衣裙","牛仔裤"],index=["a001","a002","a003","a004"])
print(s1)
'''
运行结果:
a001 短裤
a002 毛衣
a003 连衣裙
a004 牛仔裤
dtype: object
'''
####################################
#Series对象还可以基于字典创建数据结构
s2=pd.Series({"a001":"短裤","a002":"毛衣","a003":"连衣裙","a004":"牛仔裤"})
print(s2)
'''
运行结果:
a001 短裤
a002 毛衣
a003 连衣裙
a004 牛仔裤
dtype: object
'''
#1.2 DataFarme对象
'''
DataFarme是一种二维的数据结构对象,用该对象创建的数据结构在形式上类似与Excel表格。
相比于Series对象,DateFarme对象在实际的工作中的应用更加广泛。
'''
import pandas as pd
df=pd.DataFrame([["短裤",45],["毛衣",69],["连衣裙",119],["牛仔裤",99]])
print(df)
'''
运行结果:
0 1
0 短裤 45
1 毛衣 69
2 连衣裙 119
3 牛仔裤 99
'''
import pandas as pd
df1 = pd.DataFrame([["短裤", 45], ["毛衣", 69], ["连衣裙", 119], ["牛仔裤", 99]],columns=["产品","单价"],index=["a001","a002","a003","a004"])
print(df1)
'''
运行结果:使用columns和index定义行标签和列标签
产品 单价
a001 短裤 45
a002 毛衣 69
a003 连衣裙 119
a004 牛仔裤 99
'''
#######################采用字典的方式
import pandas as pd
df2 = pd.DataFrame({"产品":["短裤", "毛衣","连衣裙","牛仔裤"],"单价":[45,69,119,99]},index=["a001","a002","a003","a004"])
print(df2)