Excel透视表与python实现

目录

一、Excel透视表

1、源数据

2、数据总分析

3、数据top分析

二、python实现

1、第一张表演示

2、第二张表演示


一、Excel透视表

1、源数据

1)四个类目,每类50条数据

2)数据内容

2、数据总分析

1)选择要分析的字段,左侧为要对其进行汇总的数据,右侧为要汇总的具体值项

2)值字段设置

值汇总方式:数据计算方式

值显示方式:数据的百分比

数字格式:数字的表示方式(如小数点个数等)

3、数据top分析

1)按照近一个销售额对每个品类的top5进行分析

依据 "求和项:近一个月销售额" 对ID的top5进行选择

二、python实现

1、第一张表演示

复制代码
import pandas as pd
import numpy as np
#读取原始文件
file=pd.read_excel('F:\Excel\\透视表.xlsx',sheet_name='销售源数据')
#对数据汇总做成透视表 第一张表
data1=file.pivot_table(index=['品类'],values=['近一个月销售额','近一个月销量','团购价'],aggfunc=[np.sum,np.mean]).reset_index()
data11=pd.DataFrame(data1.values[:,[0,2,3,6]],columns=['品类','求和项:近一个月销售额','求和项:近一个月销量','平均值项:团购价']).sort_values('求和项:近一个月销售额',ascending=False).reset_index(drop=True)
data11['求和项:近一个月销售额']=data11['求和项:近一个月销售额'].astype(float).map(lambda x:'{:.1f}'.format(x))
data11['平均值项:团购价']=data11['平均值项:团购价'].astype(float).map(lambda x:'{:.1f}'.format(x))
data11

2、第二张表演示

复制代码
#第二张表
data2=file.pivot_table(index=['品类','ID'],values=['近一个月销售额','近一个月销量','团购价'],aggfunc=[np.sum,np.mean]).reset_index()
data22=pd.DataFrame(data2.values[:,[0,1,3,4,5]],columns=['品类','ID','求和项:近一个月销售额','求和项:近一个月销量','平均值项:团购价'])
#按照品类选择出销售额最高的ID
data22[['求和项:近一个月销售额','求和项:近一个月销量','平均值项:团购价']]=data22[['求和项:近一个月销售额','求和项:近一个月销量','平均值项:团购价']].astype(float)
#建立一张新表进行拼接
data24=pd.DataFrame()
for i in data11['品类'].to_list():
    data23=data22.loc[data22[data22.品类==i].index,:].nlargest(5,'求和项:近一个月销售额')
    data24=pd.concat([data24,data23],axis=0)
data24['求和项:近一个月销售额']=data24['求和项:近一个月销售额'].astype(float).map(lambda x:'{:.1f}'.format(x))
data24['平均值项:团购价']=data24['平均值项:团购价'].astype(float).map(lambda x:'{:.1f}'.format(x))
data24
相关推荐
西猫雷婶39 分钟前
pytorch基本运算-Python控制流梯度运算
人工智能·pytorch·python·深度学习·神经网络·机器学习
子午1 小时前
Python的uv包管理工具使用
开发语言·python·uv
java1234_小锋1 小时前
Scikit-learn Python机器学习 - 分类算法 - 朴素贝叶斯
python·机器学习·scikit-learn
凡梦千华1 小时前
Django时区感知
后端·python·django
程序猿 小项目大搞头2 小时前
即梦批量生成图片软件使用运营大管家-即梦图片批量生成器
python
dpxiaolong2 小时前
RK3588 Android12默认移除导航栏
开发语言·python
max5006003 小时前
基于多元线性回归、随机森林与神经网络的农作物元素含量预测及SHAP贡献量分析
人工智能·python·深度学习·神经网络·随机森林·线性回归·transformer
Pocker_Spades_A3 小时前
Python快速入门专业版(二十九):函数返回值:多返回值、None与函数嵌套调用
服务器·开发语言·python
yunpeng.zhou3 小时前
logging 模块升级版 loguru
python
kida_yuan3 小时前
【从零开始】14. 数据评分与筛选
python·数据分析·nlp