贝叶斯笔记

核心思想

  1. 贝叶斯定理

    逆向概率:P(类别|特征) = P(特征|类别)·P(类别) / P(特征)

    其中 P(特征) 在比较不同类别时可忽略,因此:

    P(类别|特征) ∝ P(类别)·P(特征|类别)

  2. "朴素"假设

    特征之间条件独立,因此:

    P(特征集合|类别) = ∏ᵢ P(特征ᵢ|类别)

二、典型示例

  1. 拼写纠正

    观测到错误单词 D,候选单词 h 的得分:score(h) = P(h)·P(D|h)

    P(h):单词先验频率;P(D|h):打错成 D 的概率(编辑距离模型)。

    选得分最高的 h 作为纠正结果。

  2. 垃圾邮件过滤

    邮件 D = {w₁, w₂, ..., wₙ}

    P(h⁺|D) ∝ P(h⁺) ∏ᵢ P(wᵢ|h⁺)

    P(h⁻|D) ∝ P(h⁻) ∏ᵢ P(wᵢ|h⁻)

    比较两者大小即可判定是否垃圾邮件。

三、三种常用模型

表格

复制

模型 适用特征类型 sklearn 类 关键参数说明
多项式 离散计数(如词频) MultinomialNB alpha:拉普拉斯平滑;fit_prior:是否学习先验
高斯 连续数值 GaussianNB priors:自定义先验
伯努利 0/1 布尔变量 BernoulliNB binarize:二值化阈值

四、sklearn 通用接口

fit(X, y) 训练

predict(X) 预测类别

predict_proba(X) 预测各类别概率

score(X, y) 准确率评估

相关推荐
测试_AI_一辰几秒前
AI系统到底怎么测?一套六层测试框架(Agent案例)
人工智能·功能测试·需求分析·ai编程
运维小欣2 分钟前
智能体选型实战指南
运维·人工智能
小超同学你好6 分钟前
LangGraph 14. MCP:把“外部能力”标准化接入 LLM
人工智能·语言模型·transformer
superior tigre22 分钟前
22 括号生成
算法·深度优先
_张一凡1 小时前
【多模态模型学习】从零手撕一个Vision Transformer(ViT)模型实战篇
人工智能·深度学习·transformer
Westward-sun.1 小时前
OpenCV 实战:银行卡号识别系统(基于模板匹配)
人工智能·opencv·计算机视觉
网安INF1 小时前
【论文阅读】-《TtBA: Two-third Bridge Approach for Decision-Based Adversarial Attack》
论文阅读·人工智能·神经网络·对抗攻击
努力也学不会java1 小时前
【缓存算法】一篇文章带你彻底搞懂面试高频题LRU/LFU
java·数据结构·人工智能·算法·缓存·面试
旖-旎2 小时前
二分查找(x的平方根)(4)
c++·算法·二分查找·力扣·双指针
ECT-OS-JiuHuaShan2 小时前
朱梁万有递归元定理,重构《易经》
算法·重构