TensorFlow2 Python深度学习 - TensorFlow2框架入门 - 使用Keras实现逻辑回归

锋哥原创的TensorFlow2 Python深度学习视频教程:

https://www.bilibili.com/video/BV1X5xVz6E4w/

课程介绍

本课程主要讲解基于TensorFlow2的Python深度学习知识,包括深度学习概述,TensorFlow2框架入门知识,以及卷积神经网络(CNN),循环神经网络(RNN),生成对抗网络(GAN),模型保存与加载等。

TensorFlow2 Python深度学习 - TensorFlow2框架入门 - 使用Keras实现逻辑回归

在 TensorFlow 2 中使用 Keras 实现逻辑回归是非常简单的。逻辑回归可以看作是一个二分类问题,Keras 提供了非常方便的接口来搭建模型。

逻辑回归虽然名字中有"回归",但实际上是一种用于二分类问题的线性模型。它通过sigmoid函数将线性输出映射到[0,1]区间,表示属于正类的概率。

下面是使用 TensorFlow 2 和 Keras 实现逻辑回归的示例,使用乳腺癌数据集进行训练和测试。我们将使用 sklearn.datasets.load_breast_cancer 来加载乳腺癌数据集,并使用 Keras 构建一个简单的逻辑回归模型来对其进行分类。

1,乳腺癌数据集介绍

该数据集共有 569 个样本,每个样本有 30 个特征。这些特征是乳腺肿瘤的细胞核属性的量化值,例如半径、纹理、周长、面积、光滑度等。特征数据是通过显微镜分析细胞样本获取的。

特征

每个样本由 30 个特征组成,这些特征描述了肿瘤细胞的几何形状、纹理、面积等。特征的详细描述如下:

  1. 半径(radius): 肿瘤的半径大小

  2. 纹理(texture): 肿瘤表面的纹理粗糙度

  3. 周长(perimeter): 肿瘤的外周长

  4. 面积(area): 肿瘤的表面积

  5. 平滑度(smoothness): 细胞核边缘的平滑度

  6. 其他的特征还包括紧凑度、对称性、均匀性等。

类别标签

目标变量(即标签)只有两个类别:

  • 恶性肿瘤(Malignant,标记为 0)

  • 良性肿瘤(Benign,标记为 1)

数据集的特点

  • 样本数:569个样本

  • 特征数:30个特征(所有特征都是数字型)

  • 类别数:2(良性或恶性)

  • 数据分布:在 569 个样本中,357 个为良性肿瘤,212 个为恶性肿瘤。

2,Keras实例

复制代码
import tensorflow as tf
from keras import Input, layers
from sklearn.datasets import load_breast_cancer
​
# 1,加载乳腺癌数据集
data = load_breast_cancer()
X = data.data
y = data.target
print(X, y)
print(data.feature_names)
print(X.shape, y.shape)
​
# 2,构建逻辑回归模型
model = tf.keras.models.Sequential([
    Input(shape=(X.shape[1],)),
    layers.Dense(1, activation='sigmoid')  # 使用sigmoid激活函数
])
​
# 3,模型编译
model.compile(
    optimizer='adam',
    loss='binary_crossentropy',  # 损失函数 二分类交叉熵
    metrics=['accuracy']  # 评估指标 accuracy准确率
)
​
# 4,模型训练
history = model.fit(X, y, epochs=100, batch_size=32, validation_split=0.2, verbose=1)
print(type(history))
print(f"最终准确率: {history.history['accuracy'][-1]:.4f}")

运行结果:

3,训练历史History

keras.src.callbacks.History 对象是 Keras 中用于存储模型训练过程中各项指标历史的类,通常作为 fit() 函数的返回值。通过 History 对象,你可以访问训练过程中各个 epoch 的训练和验证指标,包括损失、精度、学习率等。

使用场景:

在模型训练过程中,History 对象会记录每个 epoch 结束时的训练和验证指标。你可以利用这些数据进行后续分析或可视化,帮助你了解模型的学习过程。

主要功能:

  1. 存储训练过程中的历史数据History 对象包含了每个 epoch 的训练和验证损失(loss)、精度(accuracy)等指标。

  2. 获取历史数据 : 通过 history.history 属性,你可以访问包含训练过程中的所有指标的字典。

  3. 方便的可视化 : 你可以直接利用 History 对象中的数据来绘制损失曲线、准确率曲线等图表,从而分析模型的训练情况。

属性:

  • history

    :一个字典,存储每个 epoch 中的训练和验证指标。例如:

    • 'loss': 训练过程中的损失值。

    • 'accuracy': 训练过程中的准确率。

    • 'val_loss': 验证集上的损失值(如果有验证集的话)。

    • 'val_accuracy': 验证集上的准确率(如果有验证集的话)。

我们可以通过matplotlib来看下损失值的可视化图表:

复制代码
from matplotlib import pyplot as plt
history.history.keys()
plt.plot(history.epoch, history.history['loss'], label='loss')

也可以看下准确率图表:

复制代码
plt.plot(history.epoch, history.history['accuracy'], label='accuracy')
相关推荐
@forever@1 小时前
【JAVA】LinkedList与链表
java·python·链表
程序员爱钓鱼1 小时前
Python编程实战:面向对象与进阶语法——类型注解与代码规范(PEP 8)
后端·python·ipython
程序员爱钓鱼1 小时前
Python实战:用高德地图API批量获取地址所属街道并写回Excel
后端·python·ipython
reasonsummer3 小时前
【教学类-97-06】20251105“葡萄”橡皮泥黏贴(小班主题《苹果与橘子》)
python
卖个几把萌3 小时前
【16】Selenium+Python 接管已打开谷歌浏览器
python·selenium·测试工具
像风一样的男人@3 小时前
python --两个文件夹文件名比对(yolo 图和label标注比对检查)
windows·python·yolo
领航猿1号4 小时前
Pytorch 内存布局优化:Contiguous Memory
人工智能·pytorch·深度学习·机器学习
lllsure4 小时前
【Python】Dict(字典)
开发语言·python
化作星辰4 小时前
使用房屋价格预测的场景,展示如何从多个影响因素计算权重和偏置的梯度
pytorch·深度学习
tianyuanwo4 小时前
Rust开发完全指南:从入门到与Python高效融合
开发语言·python·rust