全国研究生数学建模竞赛(数学建模研赛)于9月21日8时正式开赛,赛程4天半,咱这边会在开赛后第一时间给出对今年的6道赛题的评价、分析和解答。包括ABCDEF题深度建模+全解全析+完整文章,详情可以点击底部的卡片来获取哦。
以下是我们团队往期的部分建模展示:
众所周知,好的算法和可视化对于数学建模比赛至关重要,因此这边先分享一些研赛中可能会用到的算法和可视化的示例代码,希望能够对大家有所帮助,以下这些内容也是各类数学建模比赛中经常用到的,研赛同样也不例外~
蒙特卡罗算法
**算法介绍:**蒙特卡罗算法是一种基于概率和随机性的方法,通过生成大量随机样本来模拟复杂系统的行为或计算数值解。它不依赖于严格的解析解,而是通过随机采样来估计问题的结果。例如,在估计圆周率π的值时,可以在一个正方形内随机生成点,然后计算落在内切圆内的点的比例,利用这个比例估计π的值。蒙特卡罗算法广泛应用于金融风险分析、物理学中的粒子行为模拟、复杂系统的概率分析等领域.
算法示例:
我们可以使用蒙特卡罗算法来估计三维图形的体积。下面是一个简单的Python程序,它使用蒙特卡罗算法来估计一个球体的体积,并使用Matplotlib库进行三维可视化。
import random
import matplotlib.pyplot as plt
from mpl_toolkits.mplot3d import Axes3D
import numpy as np
def monte_carlo_volume(n):
count = 0
for i in range(n):
x = random.uniform(-1, 1)
y = random.uniform(-1, 1)
z = random.uniform(-1, 1)
if x**2 + y**2 + z**2 <= 1:
count += 1
return (count / n) * 8
fig = plt.figure()
ax = fig.add_subplot(111, projection='3d')
n = 10000
volume = monte_carlo_volume(n)
print(f"Estimated volume of the sphere: {volume:.4f}")
xs = []
ys = []
zs = []
colors = []
for i in range(n):
x = random.uniform(-1, 1)
y = random.uniform(-1, 1)
z = random.uniform(-1, 1)
if x**2 + y**2 + z**2 <= 1:
xs.append(x)
ys.append(y)
zs.append(z)
colors.append(z)
ax.scatter(xs, ys, zs, c=colors, cmap='coolwarm', marker='o')
ax.set_xlabel('X Label')
ax.set_ylabel('Y Label')
ax.set_zlabel('Z Label')
plt.show()
- 程序首先定义了一个名为monte_carlo_volume的函数,该函数使用蒙特卡罗算法来估计球体的体积。
- 然后,程序使用monte_carlo_volume函数来估计球体的体积,并将结果打印到控制台上。
- 接下来,程序使用Matplotlib库创建一个3D散点图,该图显示了球体的随机采样点,并根据每个点的z坐标值进行颜色渐变。
可视化效果如下:
部分依赖分析图(Partial Dependence Plot)
部分依赖分析图(Partial Dependence Plot,简称PDP)是一种用于解释复杂机器学习模型的可视化工具。PDP可以帮助我们理解一个或两个特征对模型预测结果的影响,而忽略掉其他特征的影响。这种分析对于提高模型的透明度和可解释性非常有价值。
主要特点和用途
**1. 展示特征影响:**PDP显示了在保持模型中所有其他特征固定的情况下,一个特征(或两个特征的交互)对预测结果的平均影响。
**2. 可解释性:**对于复杂的模型(如随机森林、梯度提升机等),PDP帮助解释单个特征如何影响模型的预测,提高了模型的可解释性。
**3. 非线性关系和交互效应:**PDP特别适合揭示特征与预测目标之间的非线性关系,以及不同特征之间的交互效应。
工作原理
PDP通过对数据集中的特定特征进行多次采样,并保持其他特征不变,然后计算模型对这些样本的预测平均值来生成。
PDP是机器学习领域中一个非常有用的工具,尤其是在需要解释复杂模型的决策过程时。通过使用PDP,数据科学家和分析师可以更好地理解和信任他们的模型预测。图像: 部分依赖分析图的生成需要一个训练好的模型和特定的数据集,这里使用一个简单的合成数据集和一个基本的分类模型来演示。
这是一个部分依赖分析图的示例,它展示了在一个简单的合成数据集上训练的梯度提升分类器中,特征0、特征1以及它们的组合(特征0和1)对模型预测的影响。这种类型的图表非常有用于解释机器学习模型的行为,特别是在识别哪些特征对模型预测最有影响时。
生成这个图表的Python代码如下:
from sklearn.ensemble import GradientBoostingClassifier
from sklearn.inspection import plot_partial_dependence
from sklearn.datasets import make_classification
# 创建合成数据集
X, y = make_classification(n_samples=100, n_features=5, random_state=42)
# 训练梯度提升分类器
clf = GradientBoostingClassifier(n_estimators=50, random_state=42).fit(X, y)
# 绘制部分依赖图
features = [0, 1, (0, 1)]
plot_partial_dependence(clf, X, features, grid_resolution=20)
# 显示图形
plt.suptitle('Partial Dependence Plots')
plt.show()
进阶可视化图表:成对关系图
成对关系图是一种可视化技术,用于显示数据集中每个变量之间的关系。它通常用于探索数据集中的相关性和分布情况。成对关系图可以用于许多不同的应用程序,例如数据分析、生物学、金融等领域。
下面是一个简单的Python程序,它使用Seaborn库创建一个成对关系图,该图显示了Iris数据集中每个变量之间的关系: iris数据集是一个经典的机器学习数据集,用于分类和聚类等任务。它包含了150个样本,每个样本有四个特征和一个标签。特征是鸢尾花的萼片和花瓣的长度和宽度,单位是厘米。标签是鸢尾花的三个品种之一:山鸢尾、变色鸢尾和维吉尼亚鸢尾。这个数据集是由英国统计学家和生物学家Fisher在1936年发表的论文中提出的,是最早用于评估分类方法的数据集之一。iris数据集在统计学和机器学习领域都有广泛的应用和影响,被认为是一个简单而优美的数据集。
这个程序使用Seaborn库创建一个成对关系图,该图显示了Iris数据集中每个变量之间的关系。程序使用sns.load_dataset函数加载Iris数据集,并使用sns.pairplot函数创建一个成对关系图。
import seaborn as sns
import matplotlib.pyplot as plt
iris = sns.load_dataset("iris")
sns.pairplot(iris, hue="species", markers=["o", "s", "D"])
plt.show()
成对关系图的应用场景包括但不限于以下几个方面:
- 数据分析:成对关系图可以用于显示数据集中每个变量之间的关系,帮助数据分析人员更好地理解数据。
- 生物学:成对关系图可以用于显示基因表达数据的密度和分布情况,帮助生物学家更好地理解基因表达数据。
- 金融:成对关系图可以用于显示股票价格的密度和分布情况,帮助投资者更好地理解股票市场。
其他常用可视化图表
1. 直方图(Histogram)
用途**:展示数据的分布情况。**
Python 示例:
data = np.random.normal(0, 1, 1000)
plt.hist(data, bins=30)
plt.title('Histogram Example')
plt.xlabel('Value')
plt.ylabel('Frequency')
plt.show()
2. 饼图(Pie Chart)
用途**:显示各部分占整体的比例。**
Python 示例:
sizes = [15, 30, 45, 10]
labels = ['Frogs', 'Hogs', 'Dogs', 'Logs']
plt.pie(sizes, labels=labels, autopct='%1.1f%%')
plt.axis('equal') # Equal aspect ratio ensures that pie is drawn as a circle.
plt.title('Pie Chart Example')
plt.show()
3. 热力图(Heatmap)
用途:展示变量间的相关程度或数据的密度。
Python 示例:
data = np.random.rand(10, 10)
sns.heatmap(data, annot=True)
plt.title('Heatmap Example')
plt.show()
4. 箱形图(Box Plot)
用于展示数据的分布和异常值。
Python 示例:
data = np.random.rand(10, 5)
plt.boxplot(data)
plt.title('Box Plot Example')
plt.show()
5. 三维散点图(3D Scatter Plot)
用于在三维空间中展示数据点。
Python 示例:
fig = plt.figure()
ax = fig.add_subplot(111, projection='3d')
x = np.random.standard_normal(100)
y = np.random.standard_normal(100)
z = np.random.standard
6.三维曲面图
这种图表非常适合于展示有关两个自变量和一个因变量间复杂关系的数据。
Python 示例: 这是一个三维曲面图的示例,展示了一个由函数 z=sin(x2+y2) 生成的曲面。使用了matplotlib的plot_surface方法来绘制曲面,并通过viridis色彩映射来增强视觉效果。以下是生成这个图形的Python代码:
from mpl_toolkits.mplot3d import Axes3D
import matplotlib.pyplot as plt
from matplotlib import cm
import numpy as np
# 创建一个图形对象
fig = plt.figure(figsize=(8, 6))
ax = fig.add_subplot(111, projection='3d')
# 生成数据
x = np.linspace(-5, 5, 100)
y = np.linspace(-5, 5, 100)
x, y = np.meshgrid(x, y)
z = np.sin(np.sqrt(x**2 + y**2))
# 绘制三维曲面图
surf = ax.plot_surface(x, y, z, cmap=cm.viridis)
# 添加颜色条
fig.colorbar(surf)
# 设置标题
ax.set_title('3D Surface Plot')
# 显示图形
plt.show()
三维曲面的二维投影图
介绍:将三维曲面沿一个或多个轴投影到二维平面上,以查看曲面的不同视角。
示例代码:
fig = plt.figure()
ax = fig.add_subplot(111)
ax.contourf(x, y, z, cmap=cm.viridis)
plt.show()