统计学

Zero1 天前
机器学习·线性回归·概率论·统计学
机器学习概率论与统计学--(13)线性回归线性回归是统计学和机器学习中最基础、最常用的预测模型。它研究一个或多个自变量(预测变量)与一个连续因变量之间的线性关系。本讲将深入探讨线性回归的模型假设、参数估计(最小二乘法与最大似然估计的等价性)、显著性检验(t检验与F检验)、模型诊断(残差分析、异常值检测)、拟合优度(R²与调整R²)以及多重共线性的识别与处理。
Zero1 天前
机器学习·概率论·统计学
机器学习概率论与统计学--(12)假设检验假设检验是统计推断的另一大支柱。它提供了一套规范的流程,用于根据样本数据对关于总体的某个陈述(假设)做出拒绝或不拒绝的决策。本讲将从基本概念出发,介绍假设检验的框架、两类错误、常见参数检验方法(t检验、方差分析)以及非参数检验(卡方检验),最后讨论p值的局限。
Zero7 天前
机器学习·概率论·参数估计·统计学
机器学习概率论与统计学--(10)统计学:参数估计②在上一讲中,我们学习了点估计的两种常用方法——矩估计和最大似然估计。然而,对于一个未知参数,往往有多种可能的估计量。那么,如何评价一个估计量的优劣?当点估计给出一个数值后,我们又如何衡量这个估计的精度?本讲将首先介绍估计量的三个核心评价准则:无偏性、有效性和一致性;然后引入区间估计,讲解置信区间的概念及其构造方法,重点包括一个正态总体均值的置信区间、两个正态总体均值差的置信区间以及比例 p p p 的置信区间。
Zero9 天前
机器学习·概率论·随机变量·统计学·方差·协方差·期望
机器学习概率论与统计学--(8)概率论:数字特征数字特征是用数值简洁地描述随机变量分布的重要属性。本讲将系统讲解期望、方差、协方差与相关系数,以及高阶矩、偏度和峰度。这些概念是概率论与统计学的核心,也是机器学习中模型评估与推断的基础。
Zero9 天前
机器学习·概率论·统计学·矩估计·最大似然估计·点估计
机器学习概率论与统计学--(9)统计学:参数估计参数估计是统计推断的核心内容。当我们面对一个总体,知道其分布类型(例如正态分布、二项分布等),但其中的某些参数(如均值、方差)未知时,就需要利用样本数据对这些参数进行估计。本讲将系统讲解点估计的基本概念,并详细介绍两种最常用的点估计方法:矩估计和最大似然估计。
Zero13 天前
机器学习·概率论·统计学·概率密度函数·连续分布
机器学习概率论与统计学--(6)概率论:连续分布连续分布描述的是在某个区间(或整个实数轴)上取值的随机变量,其概率由概率密度函数(PDF)的积分给出。本讲将深入剖析六个核心连续分布:均匀分布、正态分布、指数分布、拉普拉斯分布、卡方分布、t分布和F分布。我们将从定义出发,推导期望与方差,阐明重要性质,并通过丰富的实例展示它们在实际问题中的应用。
Zero13 天前
机器学习·概率论·随机变量·统计学·多维随机变量
机器学习概率论与统计学--(7)概率论:多维随机变量现实中的随机现象往往涉及多个变量,例如身高与体重、温度与湿度、考试成绩与学习时间。多维随机变量就是用来同时描述这些变量的数学工具。本讲将系统介绍多维随机变量的核心概念:联合分布、边缘分布、条件分布,以及刻画变量之间关系的协方差、相关系数和协方差矩阵。
Zero14 天前
机器学习·概率论·统计学·离散分布
机器学习概率论与统计学--(5)概率论:离散分布离散分布是概率论中描述“计数”或“分类”现象的数学工具。本讲我们将深入剖析四个最重要的离散分布家族:伯努利分布、二项分布、泊松分布以及类别分布与多项式分布。我们将从定义出发,推导概率质量函数(PMF),计算期望与方差,并通过丰富的实例展示它们在实际问题中的应用。
Zero14 天前
机器学习·概率论·随机变量·统计学
机器学习概率论与统计学--(3)概率论:随机变量欢迎来到概率论的核心概念——随机变量。在之前的讲解中,我们学习了样本空间和事件,但很多时候我们需要将随机试验的结果“数字化”,以便进行数学运算。随机变量正是为此而生。我们将从随机变量的定义开始,区分离散与连续两类,并深入理解分布函数这个统一描述工具。
Zero15 天前
机器学习·概率论·统计学
机器学习概率论与统计学--(2)统计学基础欢迎来到统计学的基础世界!如果说概率论是研究“已知总体规律,推测随机现象”的学问,那么统计学则是它的“逆问题”:通过分析有限的数据样本,来推断总体的特征和规律。
Zero15 天前
机器学习·概率论·统计学
机器学习概率论与统计学--(1)概率论基础欢迎来到概率论的世界!无论你是刚接触这门学科,还是想巩固基础,这篇文章都会用最直观的方式带你理解核心概念。我们将从最基础的样本空间开始,一步步深入到贝叶斯定理和机器学习中的应用。准备好了吗?让我们开始吧!
阿钱真强道23 天前
python·数据挖掘·数据分析·pandas·可视化·python入门·统计学
06 Python 数据分析入门:集中趋势与离散程度适合人群:Python 初学者 / 数据分析入门 / 统计学基础学习者 / 教学案例分享在做数据分析时,我们经常会遇到这样的问题:
MoRanzhi120324 天前
python·概率论·matplotlib·seaborn·scipy·统计学·概率分布可视化
一维概率分布可视化实践:基于 Python 的理论曲线与样本图对照概率分布是概率论、数理统计、数据分析与机器学习中的基础内容。学习分布时,除了掌握定义和公式,更重要的是理解分布的形状、参数变化带来的影响,以及随机样本与理论分布之间的关系。
无水先生3 个月前
概率论·统计学
高级概率知识1:大数定律高维数据变得非常重要。然而,高维空间与我们熟悉的二维和三维空间有很大不同。在d维空间中随机生成n个点,每个坐标都是均值为零、方差为1的高斯分布。当d足够大时,所有点对之间的距离以高概率基本上相同。此外,d维单位球(即所有满足|x|≤1的点x的集合)的体积随着维度的增加而趋近于零。高维单位球的体积集中在它的表面附近,也集中在它的赤道附近。这些性质具有重要的影响,我们将对此进行考虑。
xiao5kou4chang6kai43 个月前
r语言·贝叶斯网络·统计学
R语言的贝叶斯网络模型的实践在现代的生态、环境以及地学研究中,变量和变量间的因果关系推断占据了非常重要的地位。在实践中,变量间的因果关系研究往往求助于昂贵的实验,但所得结果又经常与天然环境中的实际因果联系相差甚远。统计学方法是研究天然环境中变量间关系的好方法,但常见的统计学方法往往回答的是变量间的相关关系。相关关系是通往因果关系的第一步,但决不是其最终的目的。贝叶斯网络是一种结合图论与统计学理论提出的新型模型。贝叶斯网络不但能够统合已有的各种统计学方法,如混合回归模型,LASSO,自回归模型,隐马模型等等;而且在很大程度上能够弥补统
Illusionna.3 个月前
c语言·编程·统计·统计学·t-test·独立样本t检验·配对样本t检验
C 语言实现独立样本 t 检验和配对样本 t 检验源代码链接:https://github.com/Illusionna/tiny-stats/blob/main/t-test.c
CS创新实验室3 个月前
学习·数据挖掘·数据分析·统计学·正态分布
正态分布的深入学习:从数学发现到自然法则的演变正态分布,又称高斯分布或钟形曲线,是统计学中最重要、最广泛使用的概率分布之一。它不仅在数学和物理学中占据核心地位,也在社会科学、工程技术和生物医学等领域展现出惊人的普遍性。这一分布的发现历程跨越了近两个世纪,从法国数学家棣莫弗在1733年对二项分布的渐近公式研究,到德国数学家高斯在1809年将其应用于天文学误差分析,再到拉普拉斯在1810年将中心极限定理与误差理论结合,最终形成了完整的理论体系 。正态分布之所以如此普遍,是因为它满足了中心极限定理的核心条件——当一个随机变量是由大量微小独立随机因素的叠加结
无水先生4 个月前
概率论·统计学
随机变量在代数运算中的误差传播(2/2)前文链接:随机变量在代数运算中的误差传播(1/2)在前文中,我们讲述支配不确定性如何在不同运算中传播的数学规则,并探索量化不确定性的方法。但仅仅考虑随机变量之间相互独立的情形,然而,假如不独立,将有什么变化?本文将继续探讨相关议题。
头发没了还会再长4 个月前
统计学·statistics
Basic statistics - 12. One-way ANOVA BasicsOne way refers that it involves only one factor, for example a two-way ANOVA involves two factors.
头发没了还会再长4 个月前
统计学·statistics
Basic statistics - 10. The unpaired t-test | Independent samples t-testOne-sample t-test : Basic statistics - 07. The one-sample t-test and p-values