AI数据分析:集中度分析和离散度分析

在deepseek中输入提示词:

你是一个Python编程专家,要完成一个Python脚本编写的任务,具体步骤如下:

读取Excel表格:"F:\AI自媒体内容\AI行业数据分析\toolify月榜\toolify2023年-2024年月排行榜汇总数据.xlsx"

计算第2列第1行-20行数据组的:

最大值

最小值

均值

中位数

极差

方差

标准差

20%分位数

25%分位数

75%分位数

80%分位数

将计算结果写入第2列第21行-31行;

然后按照上面的计算步骤一直计算到第15列第21行-31行;

计算第2列第1行(设为数据起点)到第15列第1行(设为数据终点)数据组的简单年均增长率,写入第16列第1行,然后计算第2行,第3行数据,一直计算到第20行;

计算第2列第1行(设为数据起点)到第15列第1行(设为数据终点)数据组的复合年均增长率,然后计算第2行,第3行数据,一直计算到第20行;

注意:每一步都输出信息到屏幕

一步步的思考,但是代码要整合在一起

计算复合年均增长率的时候,年数n是固定值:13

源代码:

import pandas as pd

import numpy as np

读取Excel文件

file_path = "F:\\AI自媒体内容\\AI行业数据分析\\toolify月榜\\toolify2023年-2024年月排行榜汇总数据.xlsx"

df = pd.read_excel(file_path)

计算第2列到第15列的统计量并写入新的单元格

for i in range(1, 15):

data = df.iloc[0:20, i] # 第i列的数据

stats = {

'最大值': np.max(data),

'最小值': np.min(data),

'均值': np.mean(data),

'中位数': np.median(data),

'极差': np.ptp(data),

'方差': np.var(data),

'标准差': np.std(data),

'20%分位数': np.percentile(data, 20),

'25%分位数': np.percentile(data, 25),

'75%分位数': np.percentile(data, 75),

'80%分位数': np.percentile(data, 80)

}

将计算结果写入新的单元格

for j, (stat_name, stat_value) in enumerate(stats.items(), start=20):

df.iloc[j, i] = stat_value

print(f"第{i+1}列的{stat_name}已经写入第{j+1}行。")

计算简单年均增长率并写入第16列

for i in range(1, 21):

start_value = df.iloc[i-1, 1] # 起点数据

end_value = df.iloc[i-1, 14] # 终点数据

growth_rate = ((end_value - start_value) / start_value) * 100

df.iloc[i-1, 15] = growth_rate

print(f"第{i}行的简单年均增长率已经写入第16列。")

计算复合年均增长率(假设年数为13年)并写入第17列

n = 13 # 固定年数

for i in range(1, 21):

start_value = df.iloc[i-1, 1] # 起点数据

end_value = df.iloc[i-1, 14] # 终点数据

compound_growth_rate = ((end_value / start_value) ** (1/n) - 1) * 100

df.iloc[i-1, 16] = compound_growth_rate

print(f"第{i}行的复合年均增长率(假设年数为13年)已经写入第17列。")

将更新后的DataFrame写入Excel文件

with pd.ExcelWriter(file_path, engine='openpyxl', mode='a', if_sheet_exists='overlay') as writer:

df.to_excel(writer, sheet_name='Sheet1', startrow=1, startcol=0, index=False)

print("所有计算结果已经写入Excel文件。")

相关推荐
qzhqbb1 小时前
基于统计方法的语言模型
人工智能·语言模型·easyui
冷眼看人间恩怨2 小时前
【话题讨论】AI大模型重塑软件开发:定义、应用、优势与挑战
人工智能·ai编程·软件开发
2401_883041082 小时前
新锐品牌电商代运营公司都有哪些?
大数据·人工智能
AI极客菌3 小时前
Controlnet作者新作IC-light V2:基于FLUX训练,支持处理风格化图像,细节远高于SD1.5。
人工智能·计算机视觉·ai作画·stable diffusion·aigc·flux·人工智能作画
阿_旭3 小时前
一文读懂| 自注意力与交叉注意力机制在计算机视觉中作用与基本原理
人工智能·深度学习·计算机视觉·cross-attention·self-attention
王哈哈^_^3 小时前
【数据集】【YOLO】【目标检测】交通事故识别数据集 8939 张,YOLO道路事故目标检测实战训练教程!
前端·人工智能·深度学习·yolo·目标检测·计算机视觉·pyqt
Power20246664 小时前
NLP论文速读|LongReward:基于AI反馈来提升长上下文大语言模型
人工智能·深度学习·机器学习·自然语言处理·nlp
数据猎手小k4 小时前
AIDOVECL数据集:包含超过15000张AI生成的车辆图像数据集,目的解决旨在解决眼水平分类和定位问题。
人工智能·分类·数据挖掘
好奇龙猫4 小时前
【学习AI-相关路程-mnist手写数字分类-win-硬件:windows-自我学习AI-实验步骤-全连接神经网络(BPnetwork)-操作流程(3) 】
人工智能·算法
沉下心来学鲁班4 小时前
复现LLM:带你从零认识语言模型
人工智能·语言模型