机器学习和数据挖掘02-Gaussian Naive Bayes

概念

贝叶斯定理:

贝叶斯定理是概率中的基本定理,描述了如何根据更多证据或信息更新假设的概率。在分类的上下文中,它用于计算给定特征集的类别的后验概率。

特征独立性假设:

高斯朴素贝叶斯中的"朴素"假设是,给定类别标签,特征之间是相互独立的。这个简化假设在现实场景中通常并不完全准确,但它简化了计算过程,在实践中仍然可以表现良好。

高斯分布:

高斯朴素贝叶斯假设每个类别中的连续特征遵循高斯(正态)分布。这意味着在给定类别的情况下,特征的似然性被建模为一个由均值和标准差确定的正态分布。

参数估计:

要使用高斯朴素贝叶斯算法,需要为每个类别估计参数。对于每个类别中的每个特征,你需要基于训练数据估计均值和标准差。

分类:

对于具有特征值的新数据点,算法使用贝叶斯定理计算每个类别的后验概率。具有最高后验概率的类别被预测为数据点的最终类别标签。

公式


代码实现

python 复制代码
from sklearn.datasets import load_iris
from sklearn.naive_bayes import GaussianNB
from sklearn.model_selection import cross_val_score, StratifiedKFold
import numpy as np

# Load example dataset (you can replace this with your own data)
data = load_iris()
X = data.data
y = data.target

# Create a Gaussian Naive Bayes model
gnb_model = GaussianNB()

# Create a StratifiedKFold cross-validation object
cvKFold = StratifiedKFold(n_splits=10, shuffle=True, random_state=0)

# Perform cross-validation using cross_val_score
scores = cross_val_score(gnb_model, X, y, cv=cvKFold)

# Print the cross-validation scores
print("Cross-validation scores:", scores)
print("Mean CV score:", np.mean(scores))
相关推荐
章鱼丸-1 分钟前
DAY40 训练与测试规范写法
人工智能·算法·机器学习
AI科技星2 分钟前
基于四维时空光速不变公设的量子几何与量子力学本质全维度推导验证
开发语言·人工智能·opencv·计算机视觉·数学建模·r语言
东离与糖宝3 分钟前
模式匹配支持原生类型!JDK26 switch语法极简实战
java·人工智能
rainbow7242443 分钟前
零基础考AI证书时间规划指南:因证施策,高效备考
人工智能
沃达德软件4 分钟前
5G技术推动移动视频监控
人工智能·深度学习·5g·目标检测·机器学习·计算机视觉
AI医影跨模态组学10 分钟前
eClinMed(IF=10)上海交通大学医学院附属仁济医院泌尿外科陈锐教授等团队:用于原发性腹膜后肿瘤诊断与分割的端到端深度学习模型
人工智能·深度学习·医学·医学影像·影像组学
i建模14 分钟前
gpt,kimi,glm三个模型的对比
人工智能
山科智能信息处理实验室15 分钟前
RENO:面向 3D LiDAR 点云的实时神经压缩
人工智能·3d
linzᅟᅠ17 分钟前
狼人杀 Agent:让 LLM 在信息不对称博弈中推理、欺骗与协作
人工智能·python·语言模型
运营小白18 分钟前
SEO 工具进阶拆解:SEONIB 批量分发至 WordPress,如何把博客变成“自动运转的内容工厂”?
人工智能·经验分享·搜索引擎·自动化·ai自动写作