python机器学习算法--贝叶斯算法

1.贝叶斯定理在20世纪60年代初就引入到文字信息检索中,仍然是文字分类的一种热门(基准)方法。文字分类是以词频为特征判断文件所属类型或其他(如垃圾邮件、合法性、新闻分类等)的问题。原理牵涉到概率论的问题,不在详细说明。

复制代码
sklearn.naive_bayes.GaussianNB (priors=None,var_smoothing=1e-09)   #Bayes函数

· priors:矩阵,shape =[n_samples,n_features]为训练数据,其中n_samples的样本数和n_features是特征的数量。

· smoothing:浮点数,所有要素的最大方差部分,添加到计算稳定性的差异中。

· min_samples_split:整数,拆分内部节点所需的最小样本数。

python 复制代码
from sklearn.naive_bayes import GaussianNB
import numpy as np

# 训练数据
X = np.array([
    [9, 9], [9.2, 9.2], [9.6, 9.2], [9.2, 9.2], [6.7, 7.1], [7, 7.4], [7.6, 7.5], 
    [7.2, 10.3], [7.3, 10.5], [7.2, 9.2], [7, 10.2], [7.2, 9.7], [7.3, 10.1], [7.3, 10.1]
])
Y = np.array([1, 1, 1, 1, 1, 1, 1, 2, 2, 2, 2, 2, 2, 2]) 
model=GaussianNB()
model.fit(X,Y)
print('class priors:',model.class_prior_)
print('model parameters:',model.get_params())
X_test=np.array([[8,8],[8.3,8.3]])
predicted=model.predict(X_test)
print('perdicted labels:',predicted)
print('predicted proabilities',model.predict_proba(X_test))
import matplotlib.pyplot as plt 
plt.plot(X[:7,0],X[:7,1],'yx')
plt.plot(X[7:,0],X[7:,1],'g.')
plt.plot(X_test[:,0],X_test[:,1],'r^')
plt.ylabel('w')
plt.xlabel('H')
plt.legend(('Lemon','Citrus'),loc='upper left')
plt.show()

· numpy.Ravel()的功能是把多维度的矩阵数据转成一个维度。

· numpy.linspace()的功能是把区间的数字依照固定比例输出。

· numpy.meshgrid(x,y)的功能是假设x是长度为m的向量,y是长度为n的向量,则最终生成的矩阵X和Y的维度都是n×m。

python 复制代码
from sklearn.naive_bayes import GaussianNB
import numpy as np
t1=np.array([[1,2],[3,4]])
print(t1.ravel())
t2=np.linspace(0,10,3)
print(t2)
t3=np.linspace(0,10,3)
print(t3)
t4,t5=np.meshgrid(t2,t3)
print(t4)
print(t5)
t4,t5=np.meshgrid(t3,t2)
print(t4)
print(t5)
python 复制代码
import numpy as np
import matplotlib.pyplot as plt
from sklearn.naive_bayes import GaussianNB

# 生成模拟数据
np.random.seed(0)  # 确保结果可复现
X = np.concatenate((
    np.random.normal([5, 5], [1, 1], (100, 2)),  # 橙子,100个样本
    np.random.normal([10, 7], [1, 1.5], (100, 2))  # 柠檬,100个样本
))

# 分配标签
Y = np.array([1] * 100 + [2] * 100)

# 初始化高斯朴素贝叶斯模型并训练
model = GaussianNB()
model.fit(X, Y)

# 计算边界
x_min, y_min = X.min(axis=0)
x_max, y_max = X.max(axis=0)
x_min -= 1
y_min -= 1
x_max += 1
y_max += 1

# 创建网格以用于预测
xx, yy = np.meshgrid(np.linspace(x_min, x_max, 30), np.linspace(y_min, y_max, 30))

# 预测网格上每个点的分类概率
Z = model.predict_proba(np.c_[xx.ravel(), yy.ravel()])[:, 1]  # 取第二类的概率

# 调整矩阵形状以匹配xx和yy的形状
Z = Z.reshape(xx.shape)

# 绘制等高线图
plt.contour(xx, yy, Z, levels=[0.5], colors='k')

# 保存图像
plt.savefig('731.png', bbox_inches='tight')

# 显示图像
plt.show()
相关推荐
好开心啊没烦恼1 小时前
Python 数据分析:计算,分组统计1,df.groupby()。听故事学知识点怎么这么容易?
开发语言·python·数据挖掘·数据分析·pandas
lljss20202 小时前
Python11中创建虚拟环境、安装 TensorFlow
开发语言·python·tensorflow
课堂剪切板2 小时前
ch03 部分题目思路
算法
空中湖2 小时前
tensorflow武林志第二卷第九章:玄功九转
人工智能·python·tensorflow
山登绝顶我为峰 3(^v^)33 小时前
如何录制带备注的演示文稿(LaTex Beamer + Pympress)
c++·线性代数·算法·计算机·密码学·音视频·latex
CodeCraft Studio3 小时前
CAD文件处理控件Aspose.CAD教程:使用 Python 将绘图转换为 Photoshop
python·photoshop·cad·aspose·aspose.cad
Two_brushes.4 小时前
【算法】宽度优先遍历BFS
算法·leetcode·哈希算法·宽度优先
Python×CATIA工业智造5 小时前
Frida RPC高级应用:动态模拟执行Android so文件实战指南
开发语言·python·pycharm
IT古董5 小时前
【第二章:机器学习与神经网络概述】04.回归算法理论与实践 -(4)模型评价与调整(Model Evaluation & Tuning)
神经网络·机器学习·回归
onceco6 小时前
领域LLM九讲——第5讲 为什么选择OpenManus而不是QwenAgent(附LLM免费api邀请码)
人工智能·python·深度学习·语言模型·自然语言处理·自动化