贝叶斯笔记

核心思想

  1. 贝叶斯定理

    逆向概率:P(类别|特征) = P(特征|类别)·P(类别) / P(特征)

    其中 P(特征) 在比较不同类别时可忽略,因此:

    P(类别|特征) ∝ P(类别)·P(特征|类别)

  2. "朴素"假设

    特征之间条件独立,因此:

    P(特征集合|类别) = ∏ᵢ P(特征ᵢ|类别)

二、典型示例

  1. 拼写纠正

    观测到错误单词 D,候选单词 h 的得分:score(h) = P(h)·P(D|h)

    P(h):单词先验频率;P(D|h):打错成 D 的概率(编辑距离模型)。

    选得分最高的 h 作为纠正结果。

  2. 垃圾邮件过滤

    邮件 D = {w₁, w₂, ..., wₙ}

    P(h⁺|D) ∝ P(h⁺) ∏ᵢ P(wᵢ|h⁺)

    P(h⁻|D) ∝ P(h⁻) ∏ᵢ P(wᵢ|h⁻)

    比较两者大小即可判定是否垃圾邮件。

三、三种常用模型

表格

复制

模型 适用特征类型 sklearn 类 关键参数说明
多项式 离散计数(如词频) MultinomialNB alpha:拉普拉斯平滑;fit_prior:是否学习先验
高斯 连续数值 GaussianNB priors:自定义先验
伯努利 0/1 布尔变量 BernoulliNB binarize:二值化阈值

四、sklearn 通用接口

fit(X, y) 训练

predict(X) 预测类别

predict_proba(X) 预测各类别概率

score(X, y) 准确率评估

相关推荐
电子_咸鱼10 分钟前
常见面试题——滑动窗口算法
c++·后端·python·算法·leetcode·哈希算法·推荐算法
深圳佛手18 分钟前
jupyter notebook如何使用虚拟环境?
人工智能·python
Mintopia20 分钟前
⚙️ WebAssembly在AIGC推理中的优化细节
人工智能·llm·trae
Mintopia24 分钟前
🌐 WebAIGC的技术普惠:降低创作门槛还是加剧数字鸿沟?
人工智能·aigc
白日做梦Q25 分钟前
少样本学习(Few-Shot Learning):让AI学会“举一反三”的图像分类新范式
人工智能
mit6.82427 分钟前
hash+presum判等|幻方0
算法
码上掘金28 分钟前
基于YOLO和大语言模型的PCB智能缺陷检测系统
人工智能·yolo·语言模型
萌>__<新1 小时前
力扣打卡每日一题————最小覆盖子串
数据结构·算法·leetcode·滑动窗口·哈希表
裤裤兔1 小时前
卷积神经网络中的自适应池化
人工智能·神经网络·cnn·自适应池化
ada7_1 小时前
LeetCode(python)230.二叉搜索树中第k小的元素
python·算法·leetcode·链表