AI辅助编程_pyThon

以下是一个利用Qwen2.5 Max工具完成的数据分析与可视化示例,使用Python展示趋势、分布与相关性分析。


1. 生成示例数据

python 复制代码
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns

# 生成模拟数据(假设是某电商销售数据)
np.random.seed(42)
dates = pd.date_range(start='2023-01-01', periods=365, freq='D')
sales = np.random.normal(loc=1000, scale=300, size=365).cumsum() + np.random.randint(-50, 50, 365)
traffic = sales * 0.8 + np.random.normal(0, 100, 365)
conversion_rate = np.clip(np.random.normal(loc=0.1, scale=0.03, size=365), 0, 0.2)
customer_age = np.random.normal(loc=35, scale=10, size=365).astype(int)

df = pd.DataFrame({
    'Date': dates,
    'Sales': sales.astype(int),
    'Website_Traffic': traffic.astype(int),
    'Conversion_Rate': conversion_rate,
    'Customer_Age': customer_age
})

# 查看前5行数据
print(df.head())

2. 趋势分析(时间序列)

python 复制代码
plt.figure(figsize=(12, 6))

# 销售额趋势
plt.subplot(2, 1, 1)
sns.lineplot(x='Date', y='Sales', data=df, label='Daily Sales')
sns.regplot(x='Date', y='Sales', data=df, scatter=False, color='red', label='Trend Line')
plt.title('Sales Trend Over Time')

# 网站流量趋势
plt.subplot(2, 1, 2)
sns.lineplot(x='Date', y='Website_Traffic', data=df, color='green', label='Website Traffic')
plt.tight_layout()
plt.show()

3. 分布分析

python 复制代码
plt.figure(figsize=(12, 6))

# 销售额分布(直方图 + KDE)
plt.subplot(1, 2, 1)
sns.histplot(df['Sales'], kde=True, bins=30, color='blue')
plt.title('Sales Distribution')

# 转化率分布(箱线图)
plt.subplot(1, 2, 2)
sns.boxplot(y='Conversion_Rate', data=df, color='orange')
plt.title('Conversion Rate Distribution')

plt.tight_layout()
plt.show()

4. 相关性分析

python 复制代码
# 计算相关系数矩阵
corr_matrix = df[['Sales', 'Website_Traffic', 'Conversion_Rate', 'Customer_Age']].corr()

# 绘制热力图
plt.figure(figsize=(8, 6))
sns.heatmap(corr_matrix, annot=True, cmap='coolwarm', vmin=-1, vmax=1)
plt.title('Correlation Heatmap')

# 散点图矩阵(数值变量关系)
sns.pairplot(df[['Sales', 'Website_Traffic', 'Conversion_Rate', 'Customer_Age']])
plt.show()

5. 关键结论示例

  1. 趋势:销售额与网站流量呈现相似的上升趋势(正相关)。
  2. 分布:销售额近似正态分布,转化率中位数约10%(存在部分异常低值)。
  3. 相关性:网站流量与销售额强相关(r≈0.85),用户年龄与转化率弱负相关(r≈-0.15)。
相关推荐
Bellafu6663 小时前
selenium常用的等待有哪些?
python·selenium·测试工具
小白学大数据4 小时前
Python爬虫常见陷阱:Ajax动态生成内容的URL去重与数据拼接
爬虫·python·ajax
2401_841495645 小时前
【计算机视觉】基于复杂环境下的车牌识别
人工智能·python·算法·计算机视觉·去噪·车牌识别·字符识别
Adorable老犀牛5 小时前
阿里云-ECS实例信息统计并发送统计报告到企业微信
python·阿里云·云计算·企业微信
倔强青铜三5 小时前
苦练Python第66天:文件操作终极武器!shutil模块完全指南
人工智能·python·面试
倔强青铜三5 小时前
苦练Python第65天:CPU密集型任务救星!多进程multiprocessing模块实战解析,攻破GIL限制!
人工智能·python·面试
Panda__Panda5 小时前
docker项目打包演示项目(数字排序服务)
运维·javascript·python·docker·容器·c#
Lris-KK6 小时前
力扣Hot100--94.二叉树的中序遍历、144.二叉树的前序遍历、145.二叉树的后序遍历
python·算法·leetcode
zy_destiny7 小时前
【工业场景】用YOLOv8实现抽烟识别
人工智能·python·算法·yolo·机器学习·计算机视觉·目标跟踪
(●—●)橘子……7 小时前
记力扣2009:使数组连续的最少操作数 练习理解
数据结构·python·算法·leetcode