【sklearn练习】datasets的使用

一、数据集分类

1、fetch类的数据集:

以 "fetch" 开头的数据集,这些数据集通常不包含在 scikit-learn 的标准安装中,需要从远程服务器上下载。这些数据集通常比标准数据集更大,因此在使用它们之前,需要通过网络下载它们。

示例(1)

python 复制代码
from sklearn.datasets import fetch_olivetti_faces

faces = fetch_olivetti_faces()

2、load类的数据集:

"load" 开头的数据集是一些较小且包含在 scikit-learn 标准安装中的示例数据集。这些数据集不需要从远程服务器下载,因为它们已经包含在 scikit-learn 的安装包中。

示例(1)

3、make类的数据集:

"load" 开头的数据集是一些较小且包含在 scikit-learn 标准安装中的示例数据集。这些数据集不需要从远程服务器下载,因为它们已经包含在 scikit-learn 的安装包中。

示例(1)

python 复制代码
from sklearn.datasets import make_regression
import matplotlib.pyplot as plt
X, y = make_regression(n_samples=100, n_features=1, noise=0.1)
plt.scatter(X, y)
plt.show()

下面图是把noise改为10的图像:

相关推荐
玩转AI不是事6 分钟前
用IndexedDB做AI对话离线缓存实战
人工智能
学测绘的小杨32 分钟前
CompassFusion:一个从 GNSS 到 GNSS/INS 组合导航的独立工程包
python
Asize33 分钟前
多模态生图:从 Vite 工程化到前端调用 Qwen Image
javascript·人工智能·后端
MobotStone38 分钟前
AI项目越多,为什么越容易失控
人工智能·aigc
十有八七39 分钟前
AI时代的置身X内
前端·人工智能
Lkstar1 小时前
A2A协议深度解析|Agent2Agent通信标准,智能体互联网的"HTTP"
人工智能·llm
百度Geek说1 小时前
当代码越来越便宜,什么在变贵?
人工智能
橘子星1 小时前
LLM 无状态架构实践:从原理到代码落地
前端·javascript·人工智能
召钱熏1 小时前
裸聊可用 ≠ 工作流可用:Gemma4 12B 接入 Claude Code 的真实踩坑复盘
人工智能
黄敬峰1 小时前
从 Token 到向量:手把手带你通过代码读懂大模型(LLM)的“黑盒”原理
人工智能