什么概率密度函数?

首先我们来理解一下什么是连续的随机变量 ,在此之前,我们要先理解什么是随机变量 。所谓随机变量 就是在一次随机实验中一组可能的值。比如说抛硬币,我们设正面=100反面=200 ,设随机变量为X ,那么X={100,200} 。 X是我们的随机变量,100,200是一次随机实验中可能的值,硬币是正面还是反面就是随机事件

随机变量 可以分为离散连续两种:

  • 离散数据只能够取确定的值,如1,2,3
  • 连续数据在一个区间内可以取任意的值(换句话说,连续数据的值是不确定的,唯一确定的是它在某个区间内),如身高、重量、长度、温度、时间等等。

我相信很多人都会这样想,连续数据是像数数那样是顺着的连续的。事实上它也是。离散数据也可以是顺着的,是不是这样就好难和离散数据区分开了呢?事实上,像上面举的列子中,离散数据1、2、3它们仍然只是数轴上的一些点,还算不上连续。在概率学习中,离散数据的值,都是确定的,每一次随机实验的结果都必定属于某个离散值。而对于适用于连续数据特点的随机实验来说,每一次结果的值都不能够确定,只是知道它所有的区间,如[0,1]这个区间,这一次结果是0,下一次可能是0.1,再下一次可能是0.11,依次下去,结果总是无穷无尽的,虽然是这样了,但是它总发生在[0,1]这个区间中,每次实验的结果,它可以取这个区间的任意值。

均匀分布

均匀分布是最简单的分布。对[a,b]这个闭区间中的所有值,它们都有相等的概率。由于它们的概率之和为1,那么每个任意值的概率为P=1/(b-a) 。所以,

P(X = x) = 1/(b−a) ,其中 a ≤ x ≤ b,在这个区间以外的值的概率都是0,即P(X = x) = 0 。

我们举个应用的例子,城市广场上的音乐喷泉每隔两小时(120分钟)会开一次,你在任意时刻到达广场并停留半小时(30分钟),那么你可以看到音乐喷泉的概率有多大?

设你在a时刻到,a+30离开,所以你看到的概率就是30/120.

累积均匀分布(Cumulative distribution function,CDF)

我们可以将均匀分布作为累积分布(随其进行而累加)。

概率从 0 开始,累积到 1 。用这个分布来计算看音乐喷泉的概率,在 a+30 时,概率累积到大约 30/120.

了解并掌握如何使用均匀分布有助于我们处理一些更复杂的分布,这些连续分布有一个通用的名字,那就是概率密度函数(probability density function,PDF)

最重要的连续分布是标准正态分布(Standard Normal Distribution) ,它的随机变量用一个它专用的字母Z来表示。

下一篇我们就讲最重要的概率密度函数,即最重要的连续分布------正态分布。

相关推荐
欣然~23 分钟前
借助 OpenCV 和 PyTorch 库,利用卷积神经网络提取图像边缘特征
人工智能·计算机视觉
白熊1881 小时前
【计算机视觉】CV实战项目 - 基于YOLOv5的人脸检测与关键点定位系统深度解析
人工智能·yolo·计算机视觉
nenchoumi31191 小时前
VLA 论文精读(十六)FP3: A 3D Foundation Policy for Robotic Manipulation
论文阅读·人工智能·笔记·学习·vln
后端小肥肠1 小时前
文案号搞钱潜规则:日入四位数的Coze工作流我跑通了
人工智能·coze
LCHub低代码社区1 小时前
钧瓷产业原始创新的许昌共识:技术破壁·产业再造·生态重构(一)
大数据·人工智能·维格云·ai智能体·ai自动化·大禹智库·钧瓷码
-曾牛1 小时前
Spring AI 快速入门:从环境搭建到核心组件集成
java·人工智能·spring·ai·大模型·spring ai·开发环境搭建
阿川20151 小时前
云智融合普惠大模型AI,政务服务重构数智化路径
人工智能·华为云·政务·deepseek
自由鬼2 小时前
开源AI开发工具:OpenAI Codex CLI
人工智能·ai·开源·软件构建·开源软件·个人开发
生信碱移2 小时前
大语言模型时代,单细胞注释也需要集思广益(mLLMCelltype)
人工智能·经验分享·深度学习·语言模型·自然语言处理·数据挖掘·数据可视化
一个数据大开发2 小时前
解读《数据资产质量评估实施规则》:企业数据资产认证落地的关键指南
大数据·数据库·人工智能