【sklearn练习】datasets的使用

一、数据集分类

1、fetch类的数据集:

以 "fetch" 开头的数据集,这些数据集通常不包含在 scikit-learn 的标准安装中,需要从远程服务器上下载。这些数据集通常比标准数据集更大,因此在使用它们之前,需要通过网络下载它们。

示例(1)

python 复制代码
from sklearn.datasets import fetch_olivetti_faces

faces = fetch_olivetti_faces()

2、load类的数据集:

"load" 开头的数据集是一些较小且包含在 scikit-learn 标准安装中的示例数据集。这些数据集不需要从远程服务器下载,因为它们已经包含在 scikit-learn 的安装包中。

示例(1)

3、make类的数据集:

"load" 开头的数据集是一些较小且包含在 scikit-learn 标准安装中的示例数据集。这些数据集不需要从远程服务器下载,因为它们已经包含在 scikit-learn 的安装包中。

示例(1)

python 复制代码
from sklearn.datasets import make_regression
import matplotlib.pyplot as plt
X, y = make_regression(n_samples=100, n_features=1, noise=0.1)
plt.scatter(X, y)
plt.show()

下面图是把noise改为10的图像:

相关推荐
love530love1 分钟前
是否需要预先安装 CUDA Toolkit?——按使用场景分级推荐及进阶说明
linux·运维·前端·人工智能·windows·后端·nlp
救救孩子把38 分钟前
如何在n8n中突破Python库限制,实现持久化虚拟环境自由调用
开发语言·python·n8n
SunsPlanter1 小时前
机器学习--分类
人工智能·机器学习·分类
测试19981 小时前
2025软件测试面试题汇总(接口测试篇)
自动化测试·软件测试·python·测试工具·面试·职场和发展·接口测试
MiaoChuPPT1 小时前
告别手动做PPT!4款AI工具实现自动化生成
人工智能·自动化·powerpoint
硅谷秋水2 小时前
Genie Centurion:通过人工-回放-和-细化指导加速规模化真实世界机器人训练
人工智能·深度学习·计算机视觉·机器人
Allen Bright2 小时前
【机器学习-线性回归-7】中心极限定理在机器学习线性回归中的重要性
人工智能·机器学习·线性回归
Blossom.1182 小时前
基于区块链的去中心化身份验证系统:原理、实现与应用
运维·服务器·网络·人工智能·机器学习·去中心化·区块链
云卓SKYDROID2 小时前
无人机智能运行系统技术解析
人工智能·无人机·科普·高科技·云卓科技
计算机小手2 小时前
FastGPT实战:从0搭建AI知识库与MCP AI Agent系统
人工智能·经验分享·aigc·开源软件