【Pandas】Python自动汇总Excel数据生成报表———数据处理二)

数据处理2

1、案例1:统计爆款产品的销量

需要统计双十一期间各个产品的销量,找出爆款产品。

python 复制代码
import pandas as pd

# 读取Excel数据
df = pd.read_excel("双十一订单数据.xlsx")

# 按照商品名称分组,统计销量
sales_by_product = df.groupby("商品名称")["数量"].sum()

# 按照销量排序,找出前10名
top10_products = sales_by_product.sort_values(ascending=False).head(10)

# 打印结果
print(top10_products)

输出结果:

python 复制代码
商品名称
爆款手机      10000
网红零食大礼包   8000
时尚女装       5000
... ...
Name: 数量, dtype: int64

2、案例2:计算不同地区的销售额占比

领导还要求小王分析不同地区的销售额占比,以便制定更有针对性的地区营销策略。

python 复制代码
# 计算销售额

df["销售额"] = df["数量"] * df["单价"]

# 按照地区分组,统计销售额
sales_revenue_by_region = df.groupby("地区")["销售额"].sum()

# 计算销售额占比
total_revenue = sales_revenue_by_region.sum()
sales_ratio_by_region = sales_revenue_by_region / total_revenue

# 打印结果
print(sales_ratio_by_region)

输出结果:

python 复制代码
地区
华东    0.45
华南    0.30
华北    0.25
Name: 销售额, dtype: float64

3、案例3:分析畅销产品的用户画像

为了更好地了解爆款产品的用户群体,小王还需要分析购买这些产品的用户的年龄、性别等信息。

python 复制代码
# 筛选购买爆款产品的订单
top_product_orders = df[df["商品名称"] == "爆款手机"]

# 统计购买用户的年龄分布
age_distribution = top_product_orders["用户年龄"].value_counts()

# 统计购买用户的性别比例
gender_ratio = top_product_orders["用户性别"].value_counts(normalize=True)

# 打印结果
print(age_distribution)
print(gender_ratio)

输出结果:

python 复制代码
25-34岁    5000
18-24岁    3000
35-44岁    2000
Name: 用户年龄, dtype: int64

女    0.6
男    0.4
Name: 用户性别, dtype: float64

4、案例4:生成可视化报表

为了使报表更加直观易懂,小王可以使用Python生成各种可视化图表,例如柱状图、饼图、折线图等等。

python 复制代码
import matplotlib.pyplot as plt

# 生成柱状图展示爆款产品销量
top10_products.plot(kind="bar")
plt.title("双十一爆款产品销量Top10")
plt.xlabel("商品名称")
plt.ylabel("销量")
plt.show()

# 生成饼图展示不同地区的销售额占比
sales_ratio_by_region.plot(kind="pie", autopct="%1.1f%%")
plt.title("不同地区销售额占比")
plt.show()

5、案例5:将报表导出为Excel文件

最后,小王可以将生成的报表导出为Excel文件,方便保存和分享给领导。

python 复制代码
# 将统计结果导出到Excel
with pd.ExcelWriter("双十一销售数据分析报表.xlsx") as writer:
    top10_products.to_excel(writer, sheet_name="爆款产品销量")
    sales_ratio_by_region.to_excel(writer, sheet_name="地区销售额占比")
    age_distribution.to_excel(writer, sheet_name="爆款产品用户年龄分布")
    gender_ratio.to_excel(writer, sheet_name="爆款产品用户性别比例")

6、总结

通过以上案例,我们可以看到Python可以帮助我们轻松地处理Excel数据,进行统计分析,并生成可视化报表,极大地提高工作效率。

相关推荐
Victory_orsh3 分钟前
“自然搞懂”深度学习系列(基于Pytorch架构)——01初入茅庐
人工智能·pytorch·python·深度学习·算法·机器学习
大模型真好玩17 分钟前
LangGraph实战项目:从零手搓DeepResearch(二)——DeepResearch架构设计与实现
人工智能·python·langchain
濑户川44 分钟前
基于DDGS实现图片搜索,文本搜索,新闻搜索
人工智能·爬虫·python
深蓝电商API1 小时前
快速上手 Scrapy:5 分钟创建一个可扩展的爬虫项目
爬虫·python·scrapy
核桃杏仁粉2 小时前
excel拼接数据库
数据库·oracle·excel
cx330上的猫2 小时前
价值1w的数据分析课知识点汇总-excel使用(第一篇)
数据挖掘·数据分析·excel
Q_Q5110082852 小时前
python+uniapp基于微信小程序的心理咨询信息系统
spring boot·python·微信小程序·django·flask·uni-app·node.js
Lucky_Turtle2 小时前
【Java Xml】dom4j写入XML
xml·java·python
StarPrayers.2 小时前
用 PyTorch 搭建 CIFAR10 线性分类器:从数据加载到模型推理全流程解析
人工智能·pytorch·python
程序员杰哥2 小时前
UI自动化测试实战:从入门到精通
自动化测试·软件测试·python·selenium·测试工具·ui·职场和发展