【Python绘制散点图】

当然,我可以提供一个更简单的示例,这个示例将仅使用matplotlibnumpy来绘制散点图,并使用numpypolyfit函数(尽管它主要用于多项式拟合,但在这里我们用它来进行线性拟合)来添加趋势线。然后,我们将手动计算相关系数(使用numpycorrcoefscipypearsonr)和RMSE(但请注意,在这个简单的例子中,RMSE的计算只是为了演示,因为通常我们不会将输入变量x视为预测值)。

以下是简化的示例:

python 复制代码
import numpy as np
import matplotlib.pyplot as plt

# 生成模拟数据
np.random.seed(0)
x = np.linspace(0, 10, 100)  # 生成一个等差数列作为x值
y = 2 * x + 3 + np.random.randn(100) * 2  # 生成y值,与x线性相关但带有噪声

# 使用numpy的polyfit进行线性拟合(1表示一次多项式,即线性)
slope, intercept = np.polyfit(x, y, 1)

# 计算趋势线的y值
y_pred = slope * x + intercept

# 计算相关系数(使用numpy的corrcoef)
corr_matrix = np.corrcoef(x, y)
corr = corr_matrix[0, 1]

# 注意:在真实的应用场景中,你不会计算x和y之间的RMSE,因为x不是预测值。
# 但为了演示,我们仍然计算它。
rmse = np.sqrt(np.mean((y - x) ** 2))  # 这在实际中没有意义,只是为了演示

# 绘制散点图
plt.figure(figsize=(10, 6))
plt.scatter(x, y, color='blue', label='Data Points')

# 添加趋势线
plt.plot(x, y_pred, color='red', label='Trend Line')

# 添加相关系数和RMSE到图中(注意RMSE的标注只是为了演示)
plt.text(0.02, 0.95, f'Correlation Coefficient: {corr:.2f}', transform=plt.gca().transAxes, fontsize=12, color='green')
plt.text(0.02, 0.90, f'RMSE (for demonstration): {rmse:.2f}', transform=plt.gca().transAxes, fontsize=12, color='red')

# 添加趋势线方程到图中
plt.text(0.85, 0.05, f'Y = {slope:.2f}X + {intercept:.2f}', transform=plt.gca().transAxes, fontsize=12, color='black', ha='right')

# 设置图例、标题和坐标轴标签
plt.legend()
plt.title('Scatter Plot with Trend Line and Correlation')
plt.xlabel('X')
plt.ylabel('Y')

# 显示图形
plt.grid(True)
plt.show()

请注意以下几点:

  1. 在这个示例中,x是一个等差数列,而y是根据x的线性关系加上一些随机噪声生成的。
  2. 我们使用np.polyfit来拟合线性模型,并获取斜率(slope)和截距(intercept)。
  3. 相关系数是使用np.corrcoef计算的,该函数返回一个相关系数矩阵,其中corr_matrix[0, 1]xy之间的相关系数。
  4. RMSE的计算在这里只是为了演示目的,因为在实际应用中,你通常会计算预测值与实际值之间的RMSE。在这个例子中,我们将x视为预测值来计算RMSE,但这在统计学上是没有意义的。
  5. 我们使用plt.text在图形上添加文本,包括相关系数、RMSE(仅为演示)和趋势线方程。
相关推荐
2501_947575803 小时前
计算机毕业设计之jsp开山车行二手车交易系统
java·开发语言·hadoop·python·信息可视化·django·课程设计
骑士雄师3 小时前
java面试题 4:鉴权
java·开发语言
Byron__4 小时前
AI学习_06_短期记忆与长期记忆
人工智能·python·学习
时间的拾荒人4 小时前
C语言字符函数与字符串函数完全指南
c语言·开发语言
2501_948106914 小时前
计算机毕业设计之基于jsp教科研信息共享系统
java·开发语言·信息可视化·spark·课程设计
取经蜗牛5 小时前
Python 第一阶段完全指南:从零到第一个实用工具
开发语言·python
创世宇图5 小时前
【Python工程化实战】OpenTelemetry 在 Python 中的全链路追踪落地:从埋点到可视化的完整实战指南
python·分布式链路追踪·性能监控·opentelemetry·微服务可观测性
dog2505 小时前
从重尾到截断流量模型的演进
开发语言·php
qq_401700416 小时前
Qt QSS 完全入门写出漂亮界面以及解决样式不生效问题
开发语言·qt
许彰午6 小时前
72_Python爬虫基础BeautifulSoup
爬虫·python·beautifulsoup