使用tensorflow的线性回归的例子(七)

L1 与L2损失

这个脚本展示如何用TensorFlow求解线性回归。

在算法的收敛性中,理解损失函数的影响是很重要的。这里我们展示L1和L2损失函数是如何影响线性回归的收敛性的。我们使用iris数据集,但是我们将改变损失函数和学习速率来看收敛性的改变。

import matplotlib.pyplot as plt

import numpy as np

import tensorflow as tf

from sklearn import datasets

from tensorflow.python.framework import ops

ops.reset_default_graph()

L1-Loss

这里我们展示使用L1-损失的线性回归。后面展示L2-损失的线性回归。

线性最少二乘的L1损失函数为

其中 N 是数据点数, yi 第i个实际的y值, ^yi^ 是第i个y值的预测值。

我们加载iris数据。

iris.data = (Sepal Length, Sepal Width, Petal Length, Petal Width)

iris = datasets.load_iris()

x_vals = np.array(x\[3 for x in iris.data])

y_vals = np.array(y\[0 for y in iris.data])

我们定义模型,损失函数,变量的梯度。

def model(x,w,b):

Declare model operations

model_output = tf.add(tf.matmul(x, w), b)

return model_output

def loss1(x, y,w,b):

Declare loss functions

loss_l1 = tf.reduce_mean(tf.abs(y - model(x,w,b)))

Declare loss functions

#loss_l2 = tf.reduce_mean(tf.square(y_target - model_output))

return loss_l1

def grad1(x,y,w,b):

with tf.GradientTape() as tape:

loss_1 = loss1(x,y,w,b)

return tape.gradient(loss_1,w,b)

设置模型参数。要注意的一个重要参数是学习速率。如果学习速率太大,模型不收敛。如果学习速率太小,模型收敛太慢。这里有两个学习速率来展示收敛与不收敛。收敛的学习速小于0.35。要说明收敛,设置学习速率大于等于0.4。

batch_size = 25

learning_rate = 0.4 # Will not converge with learning rate at 0.4

iterations = 50

我们要初始化变量。

Create variables for linear regression

w1 = tf.Variable(tf.random.normal(shape=1,1),tf.float32)

b1 = tf.Variable(tf.random.normal(shape=1,1),tf.float32)

我们要告诉模型使用的优化器。

optimizer = tf.optimizers.Adam(learning_rate)

我们进行模型训练。

Training loop

loss_vec_l1=\[\]

loss_vec_l2=\[\]

for i in range(5000):

rand_index = np.random.choice(len(x_vals), size=batch_size)

rand_x = np.transpose(x_vals\[rand_index])

rand_y = np.transpose(y_vals\[rand_index])

x=tf.cast(rand_x,tf.float32)

y=tf.cast(rand_y,tf.float32)

grads1=grad1(x,y,w1,b1)

optimizer.apply_gradients(zip(grads1,w1,b1))

#sess.run(train_step, feed_dict={x_data: rand_x, y_target: rand_y})

temp_loss1 = loss1(x, y,w1,b1).numpy()

#sess.run(loss, feed_dict={x_data: rand_x, y_target: rand_y})

loss_vec_l1.append(temp_loss1)

if (i+1)%25==0:

print('Step #' + str(i+1) + ' A = ' + str(w1.numpy()) + ' b = ' + str(b1.numpy()))

print('Loss = ' + str(temp_loss1))

我们得到回归系数和拟合线。

Get the optimal coefficients

slope = w1.numpy()

y_intercept = b1.numpy()

Get best fit line

best_fit1 = \[\]

for i in x_vals:

best_fit1.append(slope*i+y_intercept)

我们绘制拟合线。

Plot the result

plt.plot(x_vals, y_vals, 'o', label='Data Points')

plt.plot(x_vals, best_fit1, 'r-', label='Best fit line', linewidth=3)

plt.legend(loc='upper left')

plt.title('Sepal Length vs Petal Width')

plt.xlabel('Petal Width')

plt.ylabel('Sepal Length')

plt.show()

Plot loss over time

plt.plot(loss_vec_l1, 'k-')

plt.title('L1 Loss per Generation')

plt.xlabel('Generation')

plt.ylabel('L1 Loss')

plt.show()

相关推荐
元岳数字人小元1 分钟前
AI 数字人开发公司浅谈 虚拟数字人打造景区新服务
人工智能·人机交互·交互
哦哦~9214 分钟前
AI赋能生物医学:从临床数据到药物分子性质预测实战培
人工智能·生物医学·药物分子
GIS数据转换器7 分钟前
城市排水生命线安全运行监测平台深度解析
java·运维·人工智能·python·安全·数据挖掘·无人机
虫无涯10 分钟前
本地离线大模型实战:Ollama + Llama 3.1 8B 全流程部署(适配VSCode Continue代码助手)
人工智能
Rocky Ding*25 分钟前
Latent Consistency Models:一篇读懂扩散模型的少步生成核心基础知识
人工智能·深度学习·机器学习·ai作画·stable diffusion·aigc·ai-native
大山佬26 分钟前
AI 边缘部署:MCU 上的轻量级目标检测,从 YOLO 到 TFLite Micro 的全链路优化
人工智能
数睿数据无代码开发28 分钟前
深度解析smardaten数据大屏:六大核心功能重塑可视化开发
人工智能·信息可视化
陈猪的杰咪28 分钟前
GitHub Copilot 2026计费新规:AI Credits消耗解析与节省策略
人工智能·ai·架构·github·copilot
学术头条37 分钟前
清华团队开源SCAIL-2:角色动画告别骨骼依赖,端到端还原视频中动作细节
人工智能·科技·机器学习·ai·开源·音视频·agi
لا معنى له37 分钟前
世界模型的功能分类法——Renderers, Simulators, Planners, and the Loop That Connects Them
人工智能