GANs学习笔记

一、完整公式

J(θ)=−1m∑i=1my(i)log⁡hθ(x(i))+(1−y(i))log⁡(1−hθ(x(i))) J(\theta) = -\frac{1}{m} \sum_{i=1}^m \Big y\^{(i)} \\log h_\\theta(x\^{(i)}) + (1-y\^{(i)}) \\log\\big(1-h_\\theta(x\^{(i)})\\big) \\Big J(θ)=−m1i=1∑my(i)loghθ(x(i))+(1−y(i))log(1−hθ(x(i)))

这是二分类逻辑回归的标准损失函数(对数交叉熵损失),用来衡量模型预测结果和真实结果的差距。


二、逐个符号解释

  1. J(θ)J(\theta)J(θ)

    整体损失值/代价函数。数值越大,代表模型预测越不准;训练目标就是最小化 J(θ)J(\theta)J(θ)

  2. mmm

    训练集里样本总数量 。除以 mmm 是为了取平均损失,消除样本总数的影响。

  3. ∑i=1m\displaystyle\sum_{i=1}^mi=1∑m

    每一个样本 的损失求和,iii 代表第 iii 个样本。

  4. y(i)y^{(i)}y(i)

    第 iii 个样本的真实标签,二分类只有两个取值:

    • y=1y=1y=1:属于正样本
    • y=0y=0y=0:属于负样本
  5. hθ(x(i))h_\theta(x^{(i)})hθ(x(i))

    模型对第 iii 个样本的预测概率 ,取值范围 (0,1)(0,1)(0,1),表示该样本是正类的概率。

  6. 负号 −-−

    因为对数函数 log⁡(x)\log(x)log(x) 在 x∈(0,1)x\in(0,1)x∈(0,1) 时结果为负数,加负号把损失转为正数,方便优化。


三、分场景理解(核心逻辑)

把公式拆成两部分,对应两种真实标签:

场景1:真实标签 y=1y=1y=1(正样本)

此时 1−y=01-y=01−y=0,后半项直接消失,公式简化为:

单样本损失=−log⁡(hθ(x)) \text{单样本损失} = -\log\big(h_\theta(x)\big) 单样本损失=−log(hθ(x))

  • 模型预测 hhh 越接近 111(预测正确):损失趋近于 0
  • 模型预测 hhh 越接近 000(预测错误):损失急剧变大,严厉惩罚错误

场景2:真实标签 y=0y=0y=0(负样本)

此时 y=0y=0y=0,前半项直接消失,公式简化为:

单样本损失=−log⁡(1−hθ(x)) \text{单样本损失} = -\log\big(1-h_\theta(x)\big) 单样本损失=−log(1−hθ(x))

  • 模型预测 hhh 越接近 000(预测正确):损失趋近于 0
  • 模型预测 hhh 越接近 111(预测错误):损失急剧变大

四、整体作用总结

  1. 二分类任务量身设计,专门评价逻辑回归模型好坏;
  2. 预测越偏离真实标签,损失值越高,倒逼模型不断修正参数;
  3. 相比平方损失,交叉熵在分类任务中梯度更稳定、收敛更快,是机器学习分类模型最常用的损失函数。
相关推荐
真的想上岸啊1 小时前
EdgeMind·云边智护机器人:第一篇:从一堆舵机到第一台能动的机器人——EdgeMind 项目立项与底盘搭建记录
笔记·机器人
图灵农场2 小时前
Ollama入门笔记
笔记
IronMurphy2 小时前
AI Agent学习day6 从 MCP 到 RAG 记忆:AI Agent 项目中的三块核心基础
人工智能·学习
li星野2 小时前
RAG优化系列:基于用户反馈的检索权重调整(Feedback Loop)——让系统越用越聪明
python·学习
GNG2 小时前
《10x Is Easier Than 2x》读书笔记
笔记·学习
半导体守望者2 小时前
ADTEC AX-1000Ⅱ电源 RF电源等离子电源操作指南RF PLASMA GENERATOR
学习·机器人·自动化·制造·模块测试
Pluchon2 小时前
萌萌技术分享笔记——Java综合项目
java·开发语言·笔记·git·github·mybatis·postman
范范@2 小时前
Python进阶 网络编程笔记-多进程
网络·笔记·python
chnyi6_ya2 小时前
论文阅读笔记|Wan: Open and Advanced Large-Scale Video Generative Models
论文阅读·笔记