【Python绘制散点图】

当然,我可以提供一个更简单的示例,这个示例将仅使用matplotlibnumpy来绘制散点图,并使用numpypolyfit函数(尽管它主要用于多项式拟合,但在这里我们用它来进行线性拟合)来添加趋势线。然后,我们将手动计算相关系数(使用numpycorrcoefscipypearsonr)和RMSE(但请注意,在这个简单的例子中,RMSE的计算只是为了演示,因为通常我们不会将输入变量x视为预测值)。

以下是简化的示例:

python 复制代码
import numpy as np
import matplotlib.pyplot as plt

# 生成模拟数据
np.random.seed(0)
x = np.linspace(0, 10, 100)  # 生成一个等差数列作为x值
y = 2 * x + 3 + np.random.randn(100) * 2  # 生成y值,与x线性相关但带有噪声

# 使用numpy的polyfit进行线性拟合(1表示一次多项式,即线性)
slope, intercept = np.polyfit(x, y, 1)

# 计算趋势线的y值
y_pred = slope * x + intercept

# 计算相关系数(使用numpy的corrcoef)
corr_matrix = np.corrcoef(x, y)
corr = corr_matrix[0, 1]

# 注意:在真实的应用场景中,你不会计算x和y之间的RMSE,因为x不是预测值。
# 但为了演示,我们仍然计算它。
rmse = np.sqrt(np.mean((y - x) ** 2))  # 这在实际中没有意义,只是为了演示

# 绘制散点图
plt.figure(figsize=(10, 6))
plt.scatter(x, y, color='blue', label='Data Points')

# 添加趋势线
plt.plot(x, y_pred, color='red', label='Trend Line')

# 添加相关系数和RMSE到图中(注意RMSE的标注只是为了演示)
plt.text(0.02, 0.95, f'Correlation Coefficient: {corr:.2f}', transform=plt.gca().transAxes, fontsize=12, color='green')
plt.text(0.02, 0.90, f'RMSE (for demonstration): {rmse:.2f}', transform=plt.gca().transAxes, fontsize=12, color='red')

# 添加趋势线方程到图中
plt.text(0.85, 0.05, f'Y = {slope:.2f}X + {intercept:.2f}', transform=plt.gca().transAxes, fontsize=12, color='black', ha='right')

# 设置图例、标题和坐标轴标签
plt.legend()
plt.title('Scatter Plot with Trend Line and Correlation')
plt.xlabel('X')
plt.ylabel('Y')

# 显示图形
plt.grid(True)
plt.show()

请注意以下几点:

  1. 在这个示例中,x是一个等差数列,而y是根据x的线性关系加上一些随机噪声生成的。
  2. 我们使用np.polyfit来拟合线性模型,并获取斜率(slope)和截距(intercept)。
  3. 相关系数是使用np.corrcoef计算的,该函数返回一个相关系数矩阵,其中corr_matrix[0, 1]xy之间的相关系数。
  4. RMSE的计算在这里只是为了演示目的,因为在实际应用中,你通常会计算预测值与实际值之间的RMSE。在这个例子中,我们将x视为预测值来计算RMSE,但这在统计学上是没有意义的。
  5. 我们使用plt.text在图形上添加文本,包括相关系数、RMSE(仅为演示)和趋势线方程。
相关推荐
黑子哥呢?1 小时前
安装Bash completion解决tab不能补全问题
开发语言·bash
失败尽常态5231 小时前
用Python实现Excel数据同步到飞书文档
python·excel·飞书
2501_904447741 小时前
OPPO发布新型折叠屏手机 起售价8999
python·智能手机·django·virtualenv·pygame
青龙小码农1 小时前
yum报错:bash: /usr/bin/yum: /usr/bin/python: 坏的解释器:没有那个文件或目录
开发语言·python·bash·liunx
大数据追光猿1 小时前
Python应用算法之贪心算法理解和实践
大数据·开发语言·人工智能·python·深度学习·算法·贪心算法
Leuanghing1 小时前
【Leetcode】11. 盛最多水的容器
python·算法·leetcode
彳卸风2 小时前
Unable to parse timestamp value: “20250220135445“, expected format is
开发语言
dorabighead2 小时前
JavaScript 高级程序设计 读书笔记(第三章)
开发语言·javascript·ecmascript
xinxiyinhe3 小时前
如何设置Cursor中.cursorrules文件
人工智能·python
风与沙的较量丶3 小时前
Java中的局部变量和成员变量在内存中的位置
java·开发语言