【sklearn练习】datasets的使用

一、数据集分类

1、fetch类的数据集:

以 "fetch" 开头的数据集,这些数据集通常不包含在 scikit-learn 的标准安装中,需要从远程服务器上下载。这些数据集通常比标准数据集更大,因此在使用它们之前,需要通过网络下载它们。

示例(1)

python 复制代码
from sklearn.datasets import fetch_olivetti_faces

faces = fetch_olivetti_faces()

2、load类的数据集:

"load" 开头的数据集是一些较小且包含在 scikit-learn 标准安装中的示例数据集。这些数据集不需要从远程服务器下载,因为它们已经包含在 scikit-learn 的安装包中。

示例(1)

3、make类的数据集:

"load" 开头的数据集是一些较小且包含在 scikit-learn 标准安装中的示例数据集。这些数据集不需要从远程服务器下载,因为它们已经包含在 scikit-learn 的安装包中。

示例(1)

python 复制代码
from sklearn.datasets import make_regression
import matplotlib.pyplot as plt
X, y = make_regression(n_samples=100, n_features=1, noise=0.1)
plt.scatter(X, y)
plt.show()

下面图是把noise改为10的图像:

相关推荐
刘一说4 分钟前
AI科技热点日报 | 2026年5月30日
人工智能·科技
大模型最新论文速读8 分钟前
SkillOpt:把 skill 文档当成模型权重来训练
论文阅读·人工智能·深度学习·机器学习·自然语言处理
吃好睡好便好8 分钟前
矩阵的左乘和右乘
人工智能·学习·线性代数·算法·matlab·矩阵
俊哥V8 分钟前
每日 AI 研究简报 · 2026-05-30
人工智能·ai
陕西企来客10 分钟前
陕西 RAG 权重调整技术对于 GEO 优化的深度调查:企来客逆 RAG 技术升级真相揭示
人工智能
weixin_4684668510 分钟前
Markitdown 文档解析快速入门指南
开发语言·python·自动化·编程
我材不敲代码12 分钟前
Python基础:注释的写法(单行、多行、文档注释)
服务器·python·microsoft
海鸥-w13 分钟前
前端学python 第一课安装python环境及开发工具下载安装
python
Aloudata13 分钟前
AI 黑盒生成 vs 原子语义组合:企业指标生产路径深度对比
大数据·人工智能·数据分析·指标平台·语义层
星辰AI14 分钟前
Function Calling 技术实现:让 AI 与世界交互
人工智能·ai·语言模型