详解 Pandas 的 melt 函数

Pandas 的 melt() 函数是用来将 DataFrame 中的很多列重塑转换为两列,一列为原来多列的列名,一列为原来多列对应的列值。

一、数据准备

python 复制代码
import pandas as pd

df = pd.DataFrame({
    "product_id": [0, 1],
    "store1": [95, 70],
    "store2": [100, None],
    "store3": [105, 80]
})
print(df)
复制代码
  product_id  store1  store2  store3
0           0      95   100.0     105
1           1      70     NaN      80

二、方法签名

python 复制代码
def melt(
    frame: DataFrame, # 需重塑转换的 dataframe
    id_vars=None, # 指定不参与转换的列
    value_vars=None,  # 指定参与转换的列
    var_name=None,  # 转换后列名所在列的名字,默认为 variable
    value_name: Hashable = "value", # 转换后列值所在列的名字,默认为 value
    col_level=None,
    ignore_index: bool = True,
) -> DataFrame:

三、基本使用

python 复制代码
# 使用 id_vars 参数指定不参与转换的列,其余列均进行转换
df1 = pd.melt(frame=df, id_vars="product_id")
print(df1)
复制代码
   product_id variable  value
0           0   store1   95.0
1           1   store1   70.0
2           0   store2  100.0
3           1   store2    NaN
4           0   store3  105.0
5           1   store3   80.0
python 复制代码
# # 使用 id_vars 参数指定不参与转换的列,使用 value_vars 指定参与转换的列,其余列删除
df2 = pd.melt(df, id_vars="product_id", value_vars=["store1", "store2"])
print(df2)
复制代码
   product_id variable  value
0           0   store1   95.0
1           1   store1   70.0
2           0   store2  100.0
3           1   store2    NaN
python 复制代码
# 使用 var_name 和 value_name 修改转换后的列名称
df3 = pd.melt(df, id_vars="product_id", var_name="store", value_name="price")
print(df3)
复制代码
   product_id   store  price
0           0  store1   95.0
1           1  store1   70.0
2           0  store2  100.0
3           1  store2    NaN
4           0  store3  105.0
5           1  store3   80.0
相关推荐
用户277844910499310 小时前
借助DeepSeek智能生成测试用例:从提示词到Excel表格的全流程实践
人工智能·python
JavaEdge在掘金12 小时前
ssl.SSLCertVerificationError报错解决方案
python
我不会编程55512 小时前
Python Cookbook-5.1 对字典排序
开发语言·数据结构·python
李少兄12 小时前
Unirest:优雅的Java HTTP客户端库
java·开发语言·http
老歌老听老掉牙13 小时前
平面旋转与交线投影夹角计算
python·线性代数·平面·sympy
满怀101513 小时前
Python入门(7):模块
python
无名之逆13 小时前
Rust 开发提效神器:lombok-macros 宏库
服务器·开发语言·前端·数据库·后端·python·rust
你觉得20513 小时前
哈尔滨工业大学DeepSeek公开课:探索大模型原理、技术与应用从GPT到DeepSeek|附视频与讲义下载方法
大数据·人工智能·python·gpt·学习·机器学习·aigc
似水এ᭄往昔13 小时前
【C语言】文件操作
c语言·开发语言
啊喜拔牙13 小时前
1. hadoop 集群的常用命令
java·大数据·开发语言·python·scala