详解 Pandas 的 melt 函数

Pandas 的 melt() 函数是用来将 DataFrame 中的很多列重塑转换为两列,一列为原来多列的列名,一列为原来多列对应的列值。

一、数据准备

python 复制代码
import pandas as pd

df = pd.DataFrame({
    "product_id": [0, 1],
    "store1": [95, 70],
    "store2": [100, None],
    "store3": [105, 80]
})
print(df)
复制代码
  product_id  store1  store2  store3
0           0      95   100.0     105
1           1      70     NaN      80

二、方法签名

python 复制代码
def melt(
    frame: DataFrame, # 需重塑转换的 dataframe
    id_vars=None, # 指定不参与转换的列
    value_vars=None,  # 指定参与转换的列
    var_name=None,  # 转换后列名所在列的名字,默认为 variable
    value_name: Hashable = "value", # 转换后列值所在列的名字,默认为 value
    col_level=None,
    ignore_index: bool = True,
) -> DataFrame:

三、基本使用

python 复制代码
# 使用 id_vars 参数指定不参与转换的列,其余列均进行转换
df1 = pd.melt(frame=df, id_vars="product_id")
print(df1)
复制代码
   product_id variable  value
0           0   store1   95.0
1           1   store1   70.0
2           0   store2  100.0
3           1   store2    NaN
4           0   store3  105.0
5           1   store3   80.0
python 复制代码
# # 使用 id_vars 参数指定不参与转换的列,使用 value_vars 指定参与转换的列,其余列删除
df2 = pd.melt(df, id_vars="product_id", value_vars=["store1", "store2"])
print(df2)
复制代码
   product_id variable  value
0           0   store1   95.0
1           1   store1   70.0
2           0   store2  100.0
3           1   store2    NaN
python 复制代码
# 使用 var_name 和 value_name 修改转换后的列名称
df3 = pd.melt(df, id_vars="product_id", var_name="store", value_name="price")
print(df3)
复制代码
   product_id   store  price
0           0  store1   95.0
1           1  store1   70.0
2           0  store2  100.0
3           1  store2    NaN
4           0  store3  105.0
5           1  store3   80.0
相关推荐
黎雁·泠崖3 小时前
【魔法森林冒险】5/14 Allen类(三):任务进度与状态管理
java·开发语言
2301_763472464 小时前
C++20概念(Concepts)入门指南
开发语言·c++·算法
肖永威4 小时前
macOS环境安装/卸载python实践笔记
笔记·python·macos
TechWJ4 小时前
PyPTO编程范式深度解读:让NPU开发像写Python一样简单
开发语言·python·cann·pypto
枷锁—sha4 小时前
【SRC】SQL注入WAF 绕过应对策略(二)
网络·数据库·python·sql·安全·网络安全
abluckyboy5 小时前
Java 实现求 n 的 n^n 次方的最后一位数字
java·python·算法
lly2024065 小时前
C++ 文件和流
开发语言
m0_706653235 小时前
分布式系统安全通信
开发语言·c++·算法
喵手5 小时前
Python爬虫实战:构建各地统计局数据发布板块的自动化索引爬虫(附CSV导出 + SQLite持久化存储)!
爬虫·python·爬虫实战·零基础python爬虫教学·采集数据csv导出·采集各地统计局数据发布数据·统计局数据采集
寻寻觅觅☆5 小时前
东华OJ-基础题-104-A == B ?(C++)
开发语言·c++