Hyperopt自动化调参工具实践-1

hyperopt

Hyperopt的任务是在一组可能的参数上找到标量值的最佳值,该标量值可能是随机的。

与许多优化包假定这些输入来自向量空间不同,Hyperopt是不同的,因为它鼓励使用者更详细地描述搜索空间。通过提供关于函数定义在哪里以及认为最佳值在哪里的更多信息,可以使Hyperopt中的算法更有效地搜索。

使用Hyperopt的方式是描述:

  • 要最小化的目标函数
  • 要搜索的空间
  • 用于存储搜索的所有点评估的数据库
  • 要使用的搜索算法

基础教程

在这个教程中,可以学习如何:

  1. 定义搜索空间
  2. 优化目标函数

本教程描述了如何使用HyperOpt优化超参数,而无需对HyperOpt中实现的任何算法具有数学理解。

python 复制代码
# Import HyperOpt Library
from hyperopt import fmin, tpe, space_eval

声明一个要进行优化的目标函数。在本教程中,我们将优化一个名为"objective"的简单函数,这是一个简单的二次函数。

<math xmlns="http://www.w3.org/1998/Math/MathML"> y = ( x − 3 ) 2 + 2 y = (x-3)^2 + 2 </math>y=(x−3)2+2

python 复制代码
objective = lambda x: (x-3)**2 + 2

现在可视化这个目标函数。

python 复制代码
import matplotlib.pyplot as plt
import numpy as np

x = np.linspace(-10, 10, 100)
y = objective(x)

fig = plt.figure()
plt.plot(x, y)
plt.show()

试图通过改变超参数 <math xmlns="http://www.w3.org/1998/Math/MathML"> x x </math>x 来优化这个目标函数。因此,将为 <math xmlns="http://www.w3.org/1998/Math/MathML"> x x </math>x 声明一个搜索空间。与搜索空间相关的函数是在 hyperopt.hp 中实现的,列表如下:

  • hp.randint(label, upper)hp.randint(label, low, high)
  • hp.uniform(label, low, high)
  • hp.loguniform(label, low, high)
  • hp.normal(label, mu, sigma)
  • hp.lognormal(label, mu, sigma)
  • hp.quniform(label, low, high, q)
  • hp.qloguniform(label, low, high, q)
  • hp.qnormal(label, mu, sigma, q)
  • hp.qlognormal(label, mu, sigma, q)
  • hp.choice(label, list)
  • hp.pchoice(label, p_list),其中 p_list 是概率和选项对的列表
  • hp.uniformint(label, low, high, q)hp.uniformint(label, low, high),因为当 q = 1.0 时,等同于 uniformint(label, low, high)

在本教程中,将使用最基本的 hp.uniform

python 复制代码
# Define the search space of x between -10 and 10.
space = hp.uniform('x', -10, 10)

现在只剩下最后一步了。到目前为止,已经定义了一个目标函数,也为 <math xmlns="http://www.w3.org/1998/Math/MathML"> x x </math>x 定义了一个搜索空间。现在,可以在搜索空间 <math xmlns="http://www.w3.org/1998/Math/MathML"> x x </math>x 中搜索,并找到能够优化目标函数的 <math xmlns="http://www.w3.org/1998/Math/MathML"> x x </math>x 的值。HyperOpt 使用 fmin 来执行这个过程。

python 复制代码
best = fmin(
    fn=objective,  # Objective Function to optimize
    space=space,  # Hyperparameter's Search Space
    algo=tpe.suggest,  # Optimization algorithm
    max_evals=1000  # Number of optimization attempts
)
print(best)
print(space_eval(space, best))
yaml 复制代码
100%|██████████| 1000/1000 [00:04<00:00, 228.56trial/s, best loss: 2.000001036046408]
{'x': 3.0010178636491283}
3.0010178636491283

HyperOpt找到的最优 <math xmlns="http://www.w3.org/1998/Math/MathML"> x x </math>x 值约为3.0。这非常接近min <math xmlns="http://www.w3.org/1998/Math/MathML"> y = ( x − 3 ) 2 + 2 y=(x-3)^2+2 </math>y=(x−3)2+2 的一个解。

总的代码如下

python 复制代码
# Import HyperOpt Library
from hyperopt import fmin, tpe, space_eval

objective = lambda x: (x-3)**2 + 2

import matplotlib.pyplot as plt
import numpy as np

x = np.linspace(-10, 10, 100)
y = objective(x)

fig = plt.figure()
plt.plot(x, y)
plt.show()

# Define the search space of x between -10 and 10.
space = hp.uniform('x', -10, 10)

best = fmin(
    fn=objective,  # Objective Function to optimize
    space=space,  # Hyperparameter's Search Space
    algo=tpe.suggest,  # Optimization algorithm
    max_evals=1000  # Number of optimization attempts
)
print(best)
print(space_eval(space, best))

多参数教程

在这个教程中,将学习如何:

  1. 使用多个超参数优化目标函数
  2. 定义不同类型的搜索空间
python 复制代码
# Import HyperOpt Library
import numpy as np
from hyperopt import tpe, hp, fmin, space_eval

声明一个要进行优化的目标函数。与上次不同,这次将使用两个超参数 <math xmlns="http://www.w3.org/1998/Math/MathML"> x x </math>x 和 <math xmlns="http://www.w3.org/1998/Math/MathML"> y y </math>y 来优化函数。

<math xmlns="http://www.w3.org/1998/Math/MathML"> z = s i n x 2 + y 2 z = sin\sqrt{x^2 + y^2} </math>z=sinx2+y2

python 复制代码
def objective(params):
    x, y = params['x'], params['y']
    return np.sin(np.sqrt(x**2 + y**2))

现在尝试将其可视化。但与上次不同的是,这次有两个超参数,因此需要在三维空间中将它们可视化。

python 复制代码
import matplotlib.pyplot as plt
from matplotlib import cm
from mpl_toolkits.mplot3d import Axes3D

x = np.linspace(-6, 6, 30)
y = np.linspace(-6, 6, 30)
x, y = np.meshgrid(x, y)

z = objective({'x': x, 'y': y})

fig = plt.figure()
ax = plt.axes(projection='3d')
ax.plot_surface(x, y, z, cmap=cm.coolwarm)

ax.set_xlabel('x')
ax.set_ylabel('y')
ax.set_zlabel('z')

plt.show()

同样,定义搜索空间。但这次,需要定义两个搜索空间( <math xmlns="http://www.w3.org/1998/Math/MathML"> x , y x, y </math>x,y),所以您将它们分别放在 dict() 中。

python 复制代码
space = {
    'x': hp.uniform('x', -6, 6),
    'y': hp.uniform('y', -6, 6)
}
python 复制代码
best = fmin(
    fn=objective, # Objective Function to optimize
    space=space, # Hyperparameter's Search Space
    algo=tpe.suggest, # Optimization algorithm (representative TPE)
    max_evals=1000 # Number of optimization attempts
)
print(best)
print(objective(best))
yaml 复制代码
100%|██████████| 1000/1000 [00:07<00:00, 140.14trial/s, best loss: -0.9999998138498082]
{'x': 4.660020883316342, 'y': -0.7030201784219683}
-0.99999993408562725

定义不同类型的搜索空间

  • hp.randint(label, upper) 在区间 [0, upper) 中搜索整数。
  • hp.choice(label, list) 在列表中搜索元素。
python 复制代码
def f(params):
    x1, x2 = params['x1'], params['x2']
    if x1 == 'james':
        return -1 * x2
    if x1 == 'max':
        return 2 * x2
    if x1 == 'wansoo':
        return -3 * x2

search_space = {
    'x1': hp.choice('x1', ['james', 'max', 'wansoo']),
    'x2': hp.randint('x2', -5, 5)
}

best = fmin(
    fn=f,
    space=search_space,
    algo=tpe.suggest,
    max_evals=100
)

print(best)
print(f(best))
bash 复制代码
100%|██████████| 100/100 [00:00<00:00, 396.61trial/s, best loss: -12.0]
{'x1': 2, 'x2': 4}

参考

相关推荐
仙人掌_lz21 分钟前
AI与机器学习ML:利用Python 从零实现神经网络
人工智能·python·机器学习
XiaoQiong.Zhang38 分钟前
简历模板3——数据挖掘工程师5年经验
大数据·人工智能·机器学习·数据挖掘
Blossom.1181 小时前
基于深度学习的智能视频分析系统:技术与实践
人工智能·深度学习·神经网络·目标检测·机器学习·机器人·sklearn
@解忧杂货铺1 小时前
基于用户的协同过滤推荐算法实现(Java电商平台)
算法·机器学习·推荐算法
MilesShi2 小时前
AI Agent实战 - LangChain+Playwright构建火车票查询Agent
人工智能·python·机器学习
摘取一颗天上星️3 小时前
端到端记忆网络 vs 神经图灵机:外部记忆的两种哲学之争
网络·人工智能·深度学习·机器学习·lstm·外部记忆
要努力啊啊啊5 小时前
YOLOv3 训练与推理流程详解-结合真实的数据样例进行模拟
人工智能·yolo·机器学习·计算机视觉·目标跟踪
Takina~6 小时前
python打卡day53
python·深度学习·机器学习
Blossom.1186 小时前
基于深度学习的智能图像分类系统:从零开始构建
开发语言·人工智能·python·深度学习·神经网络·机器学习·分类
硅谷秋水15 小时前
NORA:一个用于具身任务的小型开源通才视觉-语言-动作模型
人工智能·深度学习·机器学习·计算机视觉·语言模型·机器人