seed_everything 函数

没有固定随机种子时的情况

假设你要随机生成 5 个数字,并希望对这些数字进行某种处理。以下是没有固定随机种子的代码:

复制代码
import random

# 每次运行都会生成不同的随机数
random_numbers = [random.random() for _ in range(5)]
print("随机生成的数字:", random_numbers)
第一次运行输出:
复制代码
随机生成的数字: [0.834, 0.769, 0.567, 0.124, 0.945]
第二次运行输出:
复制代码
随机生成的数字: [0.657, 0.345, 0.879, 0.456, 0.234]

你会发现,每次运行的结果都不一样。这是因为随机数生成器的初始状态(种子)没有被固定。


固定随机种子时的情况

现在,我们通过固定随机种子来确保随机数的结果是可重复的:

复制代码
import random

# 固定随机种子
random.seed(42)

# 每次运行都会生成相同的随机数
random_numbers = [random.random() for _ in range(5)]
print("随机生成的数字:", random_numbers)
第一次运行输出:
复制代码
随机生成的数字: [0.6394267984578837, 0.025010755222666936, 0.27502931836911926, 0.22321073814882275, 0.7364712141640124]
第二次运行输出:
复制代码
随机生成的数字: [0.6394267984578837, 0.025010755222666936, 0.27502931836911926, 0.22321073814882275, 0.7364712141640124]

无论你运行多少次代码,只要种子是 42,结果就会完全一致。


在机器学习任务中的应用

假设场景

你在训练 PINN 模型时,需要以下随机操作:

  1. 初始化模型权重(随机初始化)。
  2. 采样 PDE 的随机点 (例如用 np.random.random 生成点)。
  3. 随机打乱数据集(在数据增强时)。

如果没有固定种子,每次运行都会因为这些随机操作导致模型的最终结果不同。这会让实验难以复现,也无法比较不同的实验设置的影响


具体代码举例
复制代码
import numpy as np
import torch

# 固定种子函数
def seed_everything(seed):
    np.random.seed(seed)
    torch.manual_seed(seed)
    random.seed(seed)

# 未固定种子的情况下
x = np.random.rand(5)
print("未固定种子时的随机数:", x)

# 固定种子后
seed_everything(1)
x = np.random.rand(5)
print("固定种子后的随机数:", x)

# 再次固定相同种子
seed_everything(1)
x = np.random.rand(5)
print("再次固定种子后的随机数:", x)
输出结果
复制代码
未固定种子时的随机数: [0.5488135  0.71518937 0.60276338 0.54488318 0.4236548 ]
固定种子后的随机数: [0.417022   0.72032449 0.00011437 0.30233257 0.14675589]
再次固定种子后的随机数: [0.417022   0.72032449 0.00011437 0.30233257 0.14675589]

你会发现:

  • 未固定种子时,每次运行都不一样。
  • 固定种子后,无论运行多少次,结果都是一致的。

总结

固定随机种子是为了确保实验的可重复性。在多次运行中,你可以得到相同的随机点、相同的初始化参数,从而确保实验结果的一致性。例如,在 PINN 模拟中:

  • 你用固定种子生成的 PDE 采样点相同。
  • 训练出的模型初始参数相同。 这样,你可以专注于调整其他超参数,而不需要担心随机性的影响导致实验结果不一致。
相关推荐
珠海西格电力科技7 分钟前
微电网控制策略基础:集中式、分布式与混合式控制逻辑
网络·人工智能·分布式·物联网·智慧城市·能源
Java后端的Ai之路1 小时前
【RAG技术】- RAG系统调优手段之高效召回(通俗易懂附案例)
人工智能·rag·rag系统·召回·rag调优
草莓熊Lotso1 小时前
Linux 基础 IO 初步解析:从 C 库函数到系统调用,理解文件操作本质
linux·运维·服务器·c语言·数据库·c++·人工智能
Cx330❀1 小时前
从零实现Shell命令行解释器:原理与实战(附源码)
大数据·linux·数据库·人工智能·科技·elasticsearch·搜索引擎
Niuguangshuo8 小时前
深入解析Stable Diffusion基石——潜在扩散模型(LDMs)
人工智能·计算机视觉·stable diffusion
迈火8 小时前
SD - Latent - Interposer:解锁Stable Diffusion潜在空间的创意工具
人工智能·gpt·计算机视觉·stable diffusion·aigc·语音识别·midjourney
wfeqhfxz25887828 小时前
YOLO13-C3k2-GhostDynamicConv烟雾检测算法实现与优化
人工智能·算法·计算机视觉
芝士爱知识a8 小时前
2026年AI面试软件推荐
人工智能·面试·职场和发展·大模型·ai教育·考公·智蛙面试
Li emily8 小时前
解决港股实时行情数据 API 接入难题
人工智能·python·fastapi
Aaron15888 小时前
基于RFSOC的数字射频存储技术应用分析
c语言·人工智能·驱动开发·算法·fpga开发·硬件工程·信号处理