什么是熵、交叉熵、相对熵(KL散度)

本文将会讲述什么是熵、交叉熵、相对熵。

文章目录

1.熵

熵是衡量一个概率分布的随机程度,也可以说是其包含信息量的大小。用数学语言表达则是信息x出现不确定性的大小I(x)。其值越大说明包含的信息量越大,发生的概率越小。

但是以上仅为单一信息量的求解方法,其实情况中,我们需要求一个多个信息的信息量,即平均信息量H(x),也叫信息熵。

2.交叉熵

交叉熵是描述两个分布逼近的程度,交叉熵越大表示两个分布越可以近似,当两个分布相同时,交叉熵取得极小值。

3.相对熵(KL散度)

相对熵是描述两个分布之间的差异程度,相对熵越小表示两个分布之间的差异越小,当P和Q分布相同时,相对熵为0。

将交叉熵和信息熵的公式代入,相对熵可以表示为以下:

相关推荐
暗夜猎手-大魔王18 小时前
转载--AI Agent 架构设计:Agent 的自我欺骗(OpenClaw、Claude Code、Hermes Agent 对比)
人工智能
智枢圈18 小时前
Function-Calling与工具使用
人工智能
司南-704918 小时前
Dense结构下的 大模型系统架构研究
服务器·人工智能·后端
GISer_Jing18 小时前
AI全栈转型_TS后端学习路线
前端·人工智能·后端·学习
漫游的渔夫18 小时前
前端开发者做 Agent:别只会执行,用 4 类失败策略让 AI 知道怎么停
前端·人工智能·typescript
娃娃略18 小时前
Frame
人工智能·深度学习·机器学习
Python私教18 小时前
Pure-Admin-Thin 深度解析:完整版和精简版到底怎么选?
vue.js·人工智能·开源
星马梦缘18 小时前
强化学习实战8.3——用PPO打赢星际争霸【编写自定义环境GYM】
人工智能·强化学习·gymnasium·星际争霸·sc2·starcraft2·sb3
翔云12345618 小时前
大模型部署全流程深度解析
人工智能·ai·大模型
BU摆烂会噶18 小时前
【LangGraph】持久化实现的三大能力——人机交互
数据库·人工智能·python·langchain·人机交互