如何用sklearn对随机森林调参

文章目录

Link:https://zhuanlan.zhihu.com/p/126288078
Author:陈罐头

一、概述

sklearn是目前python中十分流行的用来实现机器学习的第三方包,其中包含了多种常见算法如:决策树,逻辑回归、集成算法(如随机森林)等等。

本文将使用sklearn自带的乳腺癌数据集,建立随机森林,并基于**泛化误差(Genelization Error)**与模型复杂度的关系来对模型进行调参,从而使模型获得更高的得分。

泛化误差是机器学习中,用来衡量模型在未知数据上的准确率 的指标,其与模型复杂度的关系如下图所示:

当模型复杂度不足时,机器学习不足,会出现欠拟合现象,泛化误差变大;当复杂度逐渐提高到最佳模型复杂度时,泛化误差会达到最低点(即最高准确度);若复杂度仍在提高,泛化误差从最小值开始逐渐增大,出现过拟合现象。

因此,我们的目的,是通过不断调参来不断调整模型复杂度,尽可能地接近泛化误差最低点

参考链接

相关推荐
tap.AI2 分钟前
RAG系列(四)高级 RAG 架构与复杂推理
人工智能·架构
mmq在路上3 分钟前
Fast-livo2 gazebo仿真实践记录
人工智能·slam·xtdrone
在等星星呐6 分钟前
人工智能从0基础到精通
前端·人工智能·python
A林玖7 分钟前
【 深度学习 】生成对抗网络 GAN
人工智能·深度学习
智驱力人工智能11 分钟前
仓库园区无人机烟雾识别:构建立体化、智能化的早期火灾预警体系 无人机烟雾检测 无人机动态烟雾分析AI系统 无人机辅助火灾救援系统
人工智能·opencv·算法·目标检测·架构·无人机·边缘计算
未来之窗软件服务12 分钟前
幽冥大陆(六十) SmolVLM 本地部署 轻量 AI 方案—东方仙盟筑基期
人工智能·本地部署·轻量模型·东方仙盟·东方仙盟自动化
今天也要学习吖14 分钟前
【开源客服系统推荐】AI-CS:一个开源的智能客服系统
人工智能·开源·客服系统·ai大模型·ai客服·开源客服系统
Christo317 分钟前
2022-《Deep Clustering: A Comprehensive Survey》
人工智能·算法·机器学习·数据挖掘
jqpwxt19 分钟前
启点创新智慧景区服务平台,智慧景区数字驾驶舱建设
大数据·人工智能
weisian15121 分钟前
入门篇--人工智能发展史-2-什么是深度学习,深度学习的前世今生?
人工智能·深度学习