使用随机森林模型在digits数据集上执行分类任务

程序功能

使用随机森林模型对digits数据集进行手写数字分类任务。具体步骤如下:

加载数据:从digits数据集中获取手写数字图片的特征和对应的标签。

划分数据:将数据集分为训练集和测试集,测试集占30%。

训练模型:使用随机森林算法训练分类模型。

进行预测:使用训练好的模型对测试集进行预测。

评估模型:输出模型的分类准确率和详细的分类报告,评估模型的分类效果。

代码

python 复制代码
# 导入所需的库
from sklearn.datasets import load_digits
from sklearn.model_selection import train_test_split
from sklearn.ensemble import RandomForestClassifier
from sklearn.metrics import accuracy_score, classification_report

# 加载digits数据集
digits = load_digits()
X = digits.data  # 特征
y = digits.target  # 标签

# 划分训练集和测试集
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3, random_state=42)

# 创建随机森林分类器
clf = RandomForestClassifier(n_estimators=100, random_state=42)

# 训练模型
clf.fit(X_train, y_train)

# 预测测试集
y_pred = clf.predict(X_test)

# 评估模型
accuracy = accuracy_score(y_test, y_pred)
print(f"准确率: {accuracy:.2f}")

# 打印分类报告
print("分类报告:")
print(classification_report(y_test, y_pred, target_names=digits.target_names.astype(str)))
相关推荐
学地理的小胖砸37 分钟前
【高分系列卫星简介】
开发语言·数码相机·算法·遥感·地理信息
叫我:松哥1 小时前
基于机器学习的癌症数据分析与预测系统实现,有三种算法,bootstrap前端+flask
前端·python·随机森林·机器学习·数据分析·flask·bootstrap
yanyanwenmeng1 小时前
matlab基础
开发语言·算法·matlab
##晴天小猪1 小时前
ByteTrack多目标跟踪流程图
人工智能·算法·目标检测·机器学习·目标跟踪
ly-how2 小时前
leetcode练习 二叉树的层序遍历
算法·leetcode
疑惑的杰瑞2 小时前
[数据结构]算法复杂度详解
c语言·数据结构·算法
大油头儿2 小时前
排序算法-选择排序
数据结构·算法·排序算法
搞点夜点心2 小时前
算法课习题汇总(2)
算法
大二转专业2 小时前
408算法题leetcode--第10天
考研·算法·leetcode
.别止步春天.2 小时前
Python中lambda表达式的使用——完整通透版
数据结构·python·算法