【最优化方法】最速下降法

给出点

复制代码
x = [1,4,5,8,12]
y = [7,9,15,14,27]

要找出温度和冰淇淋销量之间的关系,通过线性回归来拟合求出属性和结果之间的线性关系。

如果直接把这些点连起来,是吃力不讨好的,因为如果有新数据进来大概率不在这条线上,这个行为也叫做过拟合。

对于这种明显有相关关系的数据,直接用一条直线去拟合这些数据,一次函数y=kx+b,k、b确定了直线也就确定了。找最合适的直线的过程就叫线性回归。

评判标准

找出每个真实数据点到直线的距离。

列个表看看:

定义损失函数 f(k,b)=z

python 复制代码
import numpy as np
import matplotlib.pyplot as plt
from mpl_toolkits.mplot3d import Axes3D

x = np.array([1, 4, 5, 8, 12])
y_true = np.array([7, 9, 15, 14, 27])

def model(x, k, b):
    return k * x + b
def mse_loss(y_true, y_pred):
    return np.mean((y_true - y_pred) ** 2)

# 生成参数 k 和 b 的取值范围
k_values = np.linspace(0, 3, 100)  
b_values = np.linspace(-5, 5, 100) 

# 创建网格
K, B = np.meshgrid(k_values, b_values)

# 计算每个 (k, b) 组合下的损失值
Z = np.zeros_like(K)
for i in range(len(k_values)):
    for j in range(len(b_values)):
        y_pred = model(x, K[i, j], B[i, j])
        Z[i, j] = mse_loss(y_true, y_pred)

# 绘制三维损失函数曲面图
fig = plt.figure(figsize=(10, 7))
ax = fig.add_subplot(111, projection='3d')

ax.plot_surface(K, B, Z, cmap='viridis')

ax.set_xlabel('Slope (k)')
ax.set_ylabel('Intercept (b)')
ax.set_zlabel('MSE Loss')
ax.set_title('3D Loss Function Surface')

plt.show()

问题就转化成了找到图像的谷底。

对于一次函数:

高等数学下中对于梯度的介绍:

相关推荐
enjoy编程19 小时前
Spring-AI 大模型未来:从“学会世界”到“进入世界”的范式跃迁
人工智能·领域大模型·替换工种·中后训练·长尾场景
沛沛老爹19 小时前
深入理解Agent Skills——AI助手的“专业工具箱“实战入门
java·人工智能·交互·rag·企业开发·web转型ai
俊哥V19 小时前
AI一周事件(2026年01月01日-01月06日)
人工智能·ai
向量引擎19 小时前
【万字硬核】解密GPT-5.2-Pro与Sora2底层架构:从Transformer到世界模型,手撸一个高并发AI中台(附Python源码+压测报告)
人工智能·gpt·ai·aigc·ai编程·ai写作·api调用
while(awake) code19 小时前
L1 书生大模型提示词实践
人工智能
俊哥V19 小时前
[笔记.AI]谷歌Gemini-Opal上手初探
人工智能·ai·gemini·opal
code bean19 小时前
【AI】AI大模型之流式传输(前后端技术实现)
人工智能·ai·大模型·流式传输
黑客思维者19 小时前
二次函数模型完整训练实战教程,理解非线性模型的拟合逻辑(超详细,零基础可懂)
人工智能·语言模型·非线性拟合·二次函数模型
小途软件20 小时前
ssm607家政公司服务平台的设计与实现+vue
java·人工智能·pytorch·python·深度学习·语言模型
WJSKad123520 小时前
传送带物体检测识别_基于YOLO11与RGCSPELAN改进算法_工业视觉检测系统
人工智能·算法·视觉检测