贝叶斯笔记

鲸鱼24012025-08-26 9:47

核心思想

贝叶斯定理

逆向概率：P(类别|特征) = P(特征|类别)·P(类别) / P(特征)

其中 P(特征) 在比较不同类别时可忽略，因此：

P(类别|特征) ∝ P(类别)·P(特征|类别)
"朴素"假设

特征之间条件独立，因此：

P(特征集合|类别) = ∏ᵢ P(特征ᵢ|类别)

二、典型示例

拼写纠正

观测到错误单词 D，候选单词 h 的得分：score(h) = P(h)·P(D|h)

P(h)：单词先验频率；P(D|h)：打错成 D 的概率（编辑距离模型）。

选得分最高的 h 作为纠正结果。
垃圾邮件过滤

邮件 D = {w₁, w₂, ..., wₙ}

P(h⁺|D) ∝ P(h⁺) ∏ᵢ P(wᵢ|h⁺)

P(h⁻|D) ∝ P(h⁻) ∏ᵢ P(wᵢ|h⁻)

比较两者大小即可判定是否垃圾邮件。

三、三种常用模型

表格

复制

模型	适用特征类型	sklearn 类	关键参数说明
多项式	离散计数（如词频）	MultinomialNB	alpha：拉普拉斯平滑；fit_prior：是否学习先验
高斯	连续数值	GaussianNB	priors：自定义先验
伯努利	0/1 布尔变量	BernoulliNB	binarize：二值化阈值

四、sklearn 通用接口

fit(X, y) 训练

predict(X) 预测类别

predict_proba(X) 预测各类别概率

score(X, y) 准确率评估

上一篇：SpringAI1.0.1实战教程：避坑指南25年8月最新版

下一篇：全球开源大模型，前十五名全是中国的

热门推荐

01GitHub 镜像站点 02Labelme从安装到标注：零基础完整指南 03安娜的档案(Anna’s Archive) 镜像网站/国内最新可访问入口（持续更新）04Linux下V2Ray安装配置指南 05jdk21下载、安装（Windows、Linux、macOS）06KGG转MP3工具|非KGM文件|解密音频 07Claude Code 2.1.2 升级报错？别折腾了，一行命令搞定 08【踩坑笔记】50系显卡适配的 PyTorch 安装 09Opencode CLI 安装成功,但是启动失败 102025-04-03 Latex学习1——本地配置Latex + VScode环境