【sklearn练习】datasets的使用

一、数据集分类

1、fetch类的数据集:

以 "fetch" 开头的数据集,这些数据集通常不包含在 scikit-learn 的标准安装中,需要从远程服务器上下载。这些数据集通常比标准数据集更大,因此在使用它们之前,需要通过网络下载它们。

示例(1)

python 复制代码
from sklearn.datasets import fetch_olivetti_faces

faces = fetch_olivetti_faces()

2、load类的数据集:

"load" 开头的数据集是一些较小且包含在 scikit-learn 标准安装中的示例数据集。这些数据集不需要从远程服务器下载,因为它们已经包含在 scikit-learn 的安装包中。

示例(1)

3、make类的数据集:

"load" 开头的数据集是一些较小且包含在 scikit-learn 标准安装中的示例数据集。这些数据集不需要从远程服务器下载,因为它们已经包含在 scikit-learn 的安装包中。

示例(1)

python 复制代码
from sklearn.datasets import make_regression
import matplotlib.pyplot as plt
X, y = make_regression(n_samples=100, n_features=1, noise=0.1)
plt.scatter(X, y)
plt.show()

下面图是把noise改为10的图像:

相关推荐
搬砖的小码农_Sky2 分钟前
AI大模型:如何优化提示词结构以减少Token浪费?
人工智能·ai·人机交互·agi
菜到离谱但坚持2 分钟前
零门槛学LangChain:AI开发从入门到实战
python·langchain·prompt·rag
时序之心7 分钟前
ICLR 2026 | Chronos、TimesFM、Moirai等模型在6个数据集上的校准误差对比
人工智能·时间序列
databook9 分钟前
一次函数图像工厂:用 SymPy 自动生成 y=kx+b 对比动画
python·数学·动效
测试老哥10 分钟前
接口测试详解
自动化测试·软件测试·python·测试工具·职场和发展·测试用例·接口测试
名不经传的养虾人10 分钟前
从0到1:企业级AI项目迭代日记 Vol.38|能演示的系统,和能日常用的系统,差的是这五件事
大数据·人工智能·ai编程·企业ai·多agent协作
geovindu11 分钟前
python: N-Barrier Pattern
开发语言·python·设计模式·屏障模式
SLD_Allen11 分钟前
TDD+Ralph:AI 编程实战
人工智能·tdd
浮生望12 分钟前
Python 入门 + 调用 LLM API:从 List 切片到商品文案生成
python