朝阳医院2018年销售数据 数据分析与可视化

代码及数据集下载传送门

数据分析与可视化-朝阳医院2018销售数据-ipynb+csv

实践内容

以朝阳医院2018年销售数据为例,目的是了解朝阳医院在2018年里的销售情况,这就需要知道几个业务指标,本次的分析目标是从销售数据中分析出以下业务指标:

(1)业务指标1:月均消费次数

月均消费次数 = 总消费次数 / 月份数(同一天内,同一个人所有消费算作一次消费)

(2)业务指标2:月均消费金额

月均消费金额 = 总消费金额 / 月份数

(3)客单价

客单价 = 总消费金额 / 总消费次数

(4)消费趋势(可视化展示,并根据可视化结果给出下属问题分析得出的结论)

a、分析每天的消费金额

b、分析每月的消费金额

c、分析药品销售情况(截取销售数量最多的前十种药品,并用条形图展示结果)

数据分析基本过程 数据分析基本过程包括:获取数据、数据清洗、构建模型、数据可视化以及消费趋势分析。

过程及结果

数据获取

  • 导入pandas库并读取数据,修改为DataFrame格式
  • 描述数据

使用shape方法查看数据形状;使用columns方法查看每一列的列表头内容;使用count()方法# 查看每一列数据统计数目

数据分析:数据清洗过程包括:选择子集、列名重命名、缺失数据处理、数据类型转换、数据排序及异常值处理。

  • 列明重命名

使用 rename 函数,把"购药时间" 改为 "销售时间"

  • 缺失数据处理

使用dropna函数删除缺失值

  • 数据类型转换

将字符串转为浮点型数据

字符串转日期

转换日期过程中不符合日期格式的数值会被转换为空值None,进行删除

  • 特征化处理

将列表转行为一维数据Series类型, 获取"销售时间"这一列数据, 调用函数去除星期,获取日期进行修改

  • 数据排序

按销售时间进行升序排序

  • 重置索引处理,查看描述统计信息
  • 异常值处理

将"销售数量"这一列中小于0的数排除掉

构建模型及数据可视化 数据清洗完成后,需要利用数据构建模型(就是计算相应的业务指标),并用可视化的方式呈现结果。

  • 删除重复数据后,计算总消费次数

使用.drop_duplicates方法清洗数据,查询数据有多少行

  • 按销售时间升序排序

使用sort_values方法和reset_index方法

  • 获取时间范围

分别获取最小最大时间值进行整除运算

  • 计算业务指标

月均消费次数 = 总消费次数 / 月份数(同一天内,同一个人所有消费算作一次消费)

月均消费金额 = 总消费金额 / 月份数

客单价 = 总消费金额 / 总消费次数

  • 按天消费金额可视化

导入所需库,并初始化画图

描述对象信息

  • 按月消费金额可视化

有天消费金额转换为月需要先进行一些处理

将'sale_date'列转换为datetime类型,设置为索引,按月份聚合数据

描绘按月消费金额图

  • 药品销售前十情况可视化

聚合统计各种药品的销售数量,对药品销售数量按降序排序

截取销售数量最多的十种药品,用条形图展示销售数量前十的药品

相关推荐
qq_4369621810 小时前
奥威BI:打破数据分析的桎梏,让决策更自由
人工智能·数据挖掘·数据分析
Lhan.zzZ10 小时前
Qt数据可视化实战:饼图、线图与表格的完整指南
开发语言·qt·信息可视化
B站计算机毕业设计之家11 小时前
大数据python招聘数据分析预测系统 招聘数据平台 +爬虫+可视化 +django框架+vue框架 大数据技术✅
大数据·爬虫·python·机器学习·数据挖掘·数据分析
计算机学姐17 小时前
基于SpringBoot的高校社团管理系统【协同过滤推荐算法+数据可视化】
java·vue.js·spring boot·后端·mysql·信息可视化·推荐算法
Tiandaren1 天前
大模型应用03 || 函数调用 Function Calling || 概念、思想、流程
人工智能·算法·microsoft·数据分析
人大博士的交易之路1 天前
龙虎榜——20251106
大数据·数学建模·数据分析·缠论·缠中说禅·龙虎榜
YangYang9YangYan1 天前
中专服装设计专业职业发展指南
大数据·人工智能·数据分析
歪歪1001 天前
详细介绍一下“集中同步+分布式入库”方案的具体实现步骤
开发语言·前端·分布式·后端·信息可视化
私域实战笔记1 天前
企业微信SCRM怎么选?工具适配与落地实操指南
人工智能·数据挖掘·企业微信·scrm·企业微信scrm
m0_748248021 天前
基于 C++ 的高性能批量媒体文件压缩程序
c++·人工智能·数据挖掘