【sklearn练习】datasets的使用

一、数据集分类

1、fetch类的数据集:

以 "fetch" 开头的数据集,这些数据集通常不包含在 scikit-learn 的标准安装中,需要从远程服务器上下载。这些数据集通常比标准数据集更大,因此在使用它们之前,需要通过网络下载它们。

示例(1)

python 复制代码
from sklearn.datasets import fetch_olivetti_faces

faces = fetch_olivetti_faces()

2、load类的数据集:

"load" 开头的数据集是一些较小且包含在 scikit-learn 标准安装中的示例数据集。这些数据集不需要从远程服务器下载,因为它们已经包含在 scikit-learn 的安装包中。

示例(1)

3、make类的数据集:

"load" 开头的数据集是一些较小且包含在 scikit-learn 标准安装中的示例数据集。这些数据集不需要从远程服务器下载,因为它们已经包含在 scikit-learn 的安装包中。

示例(1)

python 复制代码
from sklearn.datasets import make_regression
import matplotlib.pyplot as plt
X, y = make_regression(n_samples=100, n_features=1, noise=0.1)
plt.scatter(X, y)
plt.show()

下面图是把noise改为10的图像:

相关推荐
第一程序员几秒前
Python高级特性详解:从基础到进阶
python·github
第七页独白4 分钟前
全星研发项目管理 APQP 软件系统:驱动高端制造研发数智化升级
人工智能
FluxMelodySun4 分钟前
机器学习(二十七) 降维:度量学习与随机梯度下降法求解
人工智能·学习·机器学习
蒸汽求职7 分钟前
【蒸汽教育求职干货】OPT只剩3个月还没找到工作,怎么办?——留学生IT求职的“紧急预案”
人工智能·经验分享·面试·职场和发展·美国求职
陆业聪7 分钟前
从推理到行动:Agent 范式的真正跃迁正在发生
人工智能·aigc
蒸汽求职10 分钟前
【蒸汽教育求职分享】美国IT面试的Behavioral Question:STAR法则人人都知道,但90%的人用错了
人工智能·面试·职场和发展·github·求职招聘·留学生求职
人工智能研究所15 分钟前
字节开源 DeerFlow 2.0——登顶 GitHub Trending 1,让 AI 可做任何事情
人工智能·深度学习·开源·github·ai agent·字节跳动·deerflow2.0
江瀚视野15 分钟前
美丽田园经调净利大增41%,全方位增长未来何在?
大数据·人工智能
有个人神神叨叨17 分钟前
gstack 深度研究报告
人工智能
wzhidev20 分钟前
04、Python核心数据类型详解:从一段诡异的调试说起
开发语言·python