6.27数据分析实训任务1.1(python)

import pandas as pd

import matplotlib.pyplot as plt

读取 CSV 文件

data = pd.read_csv(r"C:\Users\XXGC\Desktop\shiuxun3.csv")

将订单创建时间转换为 datetime 类型

data["订单创建时间"] = pd.to_datetime(data["订单创建时间"])

提取小时信息

data["小时"] = data["订单创建时间"].dt.hour

计算每个小时的订单数量

hourly_orders = data.groupby("小时")["订单编号"].count()

绘制折线图

plt.figure(figsize=(12, 6))

plt.plot(hourly_orders.index, hourly_orders.values)

plt.xlabel("小时")

plt.ylabel("订单数量")

plt.title("订单数量随时间的变化(小时维度)")

plt.xticks(range(0, 24, 2))

plt.grid(True)

plt.show()

数据分析

1. 订单数量最多的小时

max_hour = hourly_orders.idxmax()

max_orders = hourly_orders.max()

print("订单数量最多的小时是:{} 点,订单数量为:{}".format(max_hour, max_orders))

2. 总订单数量

total_orders = data["订单编号"].count()

print("总订单数量为:{}".format(total_orders))

3. 平均订单金额

average_amount = data["总金额"].mean()

print("平均订单金额为:{:.2f}".format(average_amount))

4. 退款订单数量和退款金额

refund_orders = data[data["退款金额"] > 0]

refund_orders_count = refund_orders.shape[0]

refund_amount = refund_orders["退款金额"].sum()

print("退款订单数量为:{},退款金额为:{:.2f}".format(refund_orders_count, refund_amount))

相关推荐
Coisinilove2 分钟前
MATLAB——循环语句
开发语言·算法·matlab
傻啦嘿哟15 分钟前
为什么写Python脚本时要加上if __name__ == ‘__main__‘?
开发语言·python
十年一梦实验室31 分钟前
【C++】相机标定源码笔记- 立体视觉相机的校准和图像矫正类
开发语言·c++·笔记·数码相机
山茶花开时。35 分钟前
[SAP ABAP] 版本管理
开发语言·sap·abap
量化交易学徒38 分钟前
【DevOps】Java内存分配与JVM参数详解
java·开发语言·jvm·参数调优
大柏怎么被偷了39 分钟前
【C++】认识使用string类
开发语言·c++
米糕.1 小时前
【Linux】生物信息学常用基本命令
大数据·linux·运维·服务器·数据分析
那个那个鱼1 小时前
C#面:请写出C#中的单例模式
开发语言·单例模式·c#·.net
子龙烜1 小时前
数据分析三剑客-Matplotlib
python·数据挖掘·数据分析·matplotlib
图灵追慕者1 小时前
python绘制领域矩形
开发语言·python·领域