环境接口(强化学习)(Matlab)

rlFiniteSetSpec

rlFiniteSetSpec 对象可传输离散的动作或状态观察结果。

matlab 复制代码
spec = rlFiniteSetSpec(elements)为有限集动作或状态观察通道创建数据规范对象,并设置元素属性。
spec = rlFiniteSetSpec(elements,Name=Value)创建规范对象 spec,并使用一个或多个 name-value 参数设置其属性。

rlNumericSpec

rlNumericSpec 对象可传输连续的动作或状态观察结果。

matlab 复制代码
spec = rlNumericSpec(dimension) 为连续动作或状态观测通道创建数据明细对象,并设置维度属性。

spec = rlNumericSpec(dimension,Name=Value) 创建对象 spec ,并使用一个或多个 name-value 参数设置其属性。

getActionInfo

从强化学习环境、智能体或经验池获取动作数据规范

matlab 复制代码
actInfo = getActionInfo(env)从强化学习环境中获取动作信息。
actInfo = getActionInfo(agent)从强化学习智能体中获取动作信息。
actInfo = getActionInfo(buffer)从强化学习经验池中获取动作信息。

getObservationInfo

从强化学习环境、智能体或经验池获取状态观测数据规范

matlab 复制代码
obsInfo = getObservationInfo(env)从强化学习环境中获取状态观测信息。
obsInfo = getObservationInfo(agent)从强化学习智能体中获取状态观测信息。
obsInfo = getObservationInfo(buffer)从强化学习经验池中获取状态观测信息。

validateEnvironment

验证自定义强化学习环境

matlab 复制代码
validateEnvironment(env)

该函数在以下情况下非常有用

  • 使用 rlCreateEnvTemplate 从模板类创建自定义环境。
  • 使用 rlSimulinkEnv 或 createIntegratedEnv 创建自定义 Simulink 环境。

当使用 rlFunctionEnv 或 rlNeuralNetworkEnvironment 创建自定义环境时,软件会在创建环境对象后自动运行 validateEnvironment。

validateEnvironment 会重置环境、生成初始状态观察结果和动作,并模拟环境的一个或两个步骤。如果在这些操作过程中没有出现错误,则验证成功,validateEnvironment 不会返回任何结果。如果出现错误,这些错误会显示在 MATLAB 命令窗口中。利用这些错误来确定观察规范、操作规范、自定义函数或 Simulink 模型中需要更改的内容。

bus2RLSpec

为 Simulink 总线的元素创建强化学习数据规范

matlab 复制代码
specs = bus2RLSpec(busName) 从由 busName 指定的 Simulink 总线对象中创建一组强化学习数据规范。为相应 Simulink 总线中的每个叶元素创建一个规范元素。使用这些规范可为 Simulink 强化学习环境定义包含多个通道的观测值。
specs = bus2RLSpec(busName,Name=Value)指定使用一个或多个 Name=Value 参数创建规范的选项。
相关推荐
لا معنى له6 分钟前
学习笔记:循环神经网络(RNN)
人工智能·笔记·学习·机器学习
vortex57 分钟前
Bash 替换机制(三):变量替换
linux·开发语言·bash
奇树谦8 分钟前
Qt QDockWidget 深度解析:从基础使用到可保存布局的工程级主界面
开发语言·qt
秦苒&15 分钟前
【C语言】详解数据类型和变量(一):数据类型介绍、 signed和unsigned、数据类型的取值范围、变量、强制类型转换
c语言·开发语言·c++·c#
我爱学习_zwj16 分钟前
动态HTTP服务器实战:解析请求与Mock数据
开发语言·前端·javascript
式51620 分钟前
线性代数(九)线性相关性、基与维数
线性代数·算法·机器学习
啊阿狸不会拉杆21 分钟前
《数字图像处理》第7章:小波变换和其他图像变换
图像处理·人工智能·python·算法·机器学习·计算机视觉·数字图像处理
梅孔立28 分钟前
【实用教程】python 批量解析 EML 邮件文件 存成txt ,可以利用 AI 辅助快速生成年终总结
开发语言·python
c#上位机39 分钟前
C#异步编程之async、await
开发语言·c#
郑州光合科技余经理1 小时前
实战分享:如何构建东南亚高并发跑腿配送系统
java·开发语言·javascript·spring cloud·uni-app·c#·php