sklearn随机森林实现(备忘版)

scikit-learn是广泛使用的机器学习python库. sklearn已经实现了决策树及集成模型, 下面是随机森林分类算法实现的示例代码.

shell 复制代码
import numpy as np
import pandas as pd
from sklearn.ensemble import RandomForestClassifier
dataset=pd.read_table('/path/to/DataSet/Classification/higgs.csv',sep=',', header=None)
data_np=dataset.values;
Y=data_np[:,0]
X=data_np[:,1:28]
clf=RandomForestClassifier(n_estimators=200,min_samples_leaf=5,random_state=101,oob_score=True)
clf.fit(X,Y) # training
clf.oob_score_  # print out-of-bag error

上述代码中, 除了sklearn库, 还需用到numpy.

读取数据集使用了pandas库的read_table, 如果是其他格式数据还需使用其他方法.

随机森林算法有两步, (1) 设置随机森林参数, (2)训练.

Python代码真的是非常简单.

相关推荐
芯片-嵌入式几秒前
具身智能(2):OpenExplorer下的模型量化
人工智能·深度学习·算法
DamianGao1 分钟前
我用 OpenClaw 做了一个 AI 新闻早报,每天自动推送
人工智能·python·语言模型
Lab_AI3 分钟前
电子实验记录本(ELN)助力熙华药业核心竞争力提升
大数据·人工智能·实验室管理·eln·药物研发·ai制药·电子实验记录本
崔高杰6 分钟前
训练数据选择又有新方法了?——两篇文章的阅读笔记 Less is Enough和 OPUS
人工智能·笔记·机器学习
爱吃奶酪的松鼠丶7 分钟前
LangGraph 实战笔记:用 AI 发起流程应用
人工智能·笔记
RechoYit13 分钟前
项目记录:把 OpenClaw 结合自己的交易项目做成飞书里的 AI Trading Partner-- A 股智能分析机器人
人工智能·python·金融·飞书·投资·openclaw
大强同学20 分钟前
复杂任务文件化规划工具:planning-with-files
人工智能·ai编程
机器小乙20 分钟前
【开源】2 分钟在 Windows 上搭建 AI Agent 运行环境:MachineY Engine 使用指南
人工智能·windows·ai·开源·openclaw
gzroy21 分钟前
企业云平台部署Openclaw的实践
人工智能
Are_You_Okkk_23 分钟前
不只是辅助编程:AI研发框架如何重构团队研发体系?
人工智能·重构·开源·ai编程