sklearn中make_blobs方法:聚类数据生成器

sklearn中make_blobs()方法参数:

  • n_samples:表示数据样本点个数,默认值100

  • n_features:是每个样本的特征(或属性)数,也表示数据的维度,默认值是2。默认为 2 维数据,测试选取 2 维数据也方便进行可视化展示。

  • centers:表示类别数(标签的种类数),默认值3

  • cluster_std表示每个类别的方差,例如我们希望生成2类数据,其中一类比- 另一类具有更大的方差,可以将cluster_std设置为[1.0,3.0],浮点数或者浮点数序列,默认值1.0

  • center_box:中心确定之后的数据边界,默认值(-10.0, 10.0)

  • shuffle :将数据进行洗乱,默认值是True

  • random_state:官网解释是随机生成器的种子,可以固定生成的数据,给定数之后,每次生成的数据集就是固定的。

csharp 复制代码
X, y = make_blobs(n_samples=100, 
                  n_features=2,
                  centers=4, 
                  cluster_std=1.0, 
                  center_box=(-10.0, 10.0), 
                  shuffle=True, 
                  random_state=47)
plt.figure(figsize=(4, 3))
plt.scatter(X[:,0],X[:,1],c=y)
相关推荐
猿饵块3 分钟前
机器人--cfg参数
人工智能·机器人
查古穆9 分钟前
LLM的“小bug”:聊聊幻觉是什么,以及如何有效规避免
人工智能·bug
环黄金线HHJX.11 分钟前
【从0到1】
开发语言·人工智能·算法·交互
Lyyaoo.15 分钟前
【Java基础面经】Java 注解的底层原理
java·开发语言·python
HAPPY酷15 分钟前
PyCharm 终极避坑指南:环境选择、镜像加速与包管理
ide·python·pycharm
鬓戈17 分钟前
AI coding编程体验之二
人工智能
如竟没有火炬24 分钟前
搜索二维矩阵
数据结构·python·算法·leetcode·矩阵
Westward-sun.26 分钟前
OpenCV图像拼接实战:从SIFT特征匹配到透视变换全景融合
人工智能·opencv·计算机视觉
hanweixiao30 分钟前
AI 应用评测平台
人工智能
郝学胜-神的一滴32 分钟前
自动微分实战:梯度下降的迭代实现与梯度清零核心解析
人工智能·pytorch·python·深度学习·算法·机器学习