【机器学习】scikit-learn机器学习中随机数种子的应用与重现

随机数种子是为了能重现某一次实验生成的随机数而设立的,相同的随机数种子下,生成的随机数序列一样

一、随机数种子基础应用

在python中简单运用随机数种子

csharp 复制代码
import random
random.seed(1)
a = random.sample(range(0,100),10)
random.seed(2)
b = random.sample(range(0,100),10)

结果如下

csharp 复制代码
a
Out[3]: [17, 72, 97, 8, 32, 15, 63, 57, 60, 83]
b
Out[4]: [7, 11, 10, 46, 21, 94, 85, 39, 32, 77]
random.seed(1)//加载随机数种子
random.sample(range(0,100),10)
Out[6]: [17, 72, 97, 8, 32, 15, 63, 57, 60, 83]

可以看到out[6]之前加载了随机数种子1之后可以重现第一次随机数的生成结果

二、随机数种子在scikit-learn中的应用(以鸢尾花为例)

注:以下代码需要在你的环境中先行安装scikit-learn工具包

具体方法可以参考https://blog.csdn.net/quicmous/article/details/106824638

首先scikit-learn中鸢尾花的数据集需要我们进行拆分,将其拆分为训练集和测试集。在这里需要将原数据进行随机拆分:

csharp 复制代码
from sklearn import datasets
X=iris.data[:,[2,3]]
y=iris.target
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3, random_state=1)

X,y分别为原数据与标签,0.3指的是把X和y随机分为30%的测试数据和70%的训练数据

这里的随机数种子参数为random_state

在未来想要重新获取X_train, X_test, y_train, y_test的时候可以再次调用以下语句

csharp 复制代码
train_test_split(X, y, test_size=0.3, random_state=1)

例子:

csharp 复制代码
X_train1, X_test1, y_train1, y_test1 = train_test_split(X, y, test_size=0.3, random_state=1)

检验新生成的数据和同样的随机数种子下生成的数据是否一样,可以自行运行程序发现是一样的

如果将random_state设置成1以外的数

csharp 复制代码
X_train2, X_test2, y_train2, y_test2 = train_test_split(X, y, test_size=0.3, random_state=2)

会发现结果不一样了

相关推荐
真上帝的左手几秒前
26. AI-大语言模型-提示词工程
人工智能·语言模型·自然语言处理·提示词
唯创知音1 分钟前
卫浴产品智能化升级:语音交互的技术演进与场景落地
人工智能·语音识别·智能卫浴产品
元智启1 分钟前
企业AI应用从“能用”到“可信”:智能体评估体系与安全治理实战指南
人工智能·安全
橘白3163 分钟前
GVHMR
人工智能·算法·机器人·机器人数据·视频动捕
Gerardisite3 分钟前
私域运营新利器:RPA驱动外部群多模态互动
java·人工智能·python·微信·自动化
xiaotao1314 分钟前
04-进阶方向: 01-计算机视觉(CV)——实例分割:Mask R-CNN
人工智能·计算机视觉·r-cnn
工业甲酰苯胺5 分钟前
2026 产业 AI 爆发:JNPF 助企业少走 3 年弯路
人工智能·算法·低代码
今天吃饺子6 分钟前
500种组合实现故障分类够用不?50种深度学习模型×10种时频方法,故障诊断、分类一键跑通!
人工智能·深度学习·机器学习·分类·数据挖掘
cood1b7 分钟前
国内玩转claude教程!!!
人工智能
码字小学妹7 分钟前
2026年GPT-Image-2完整接入教程:中文渲染99%+DALL-E退役迁移指南
人工智能·gpt