技术栈
torchrl
z樾
3 小时前
torchrl
BenchMARL-前置TorchRL7
整体思路上还是和上一节的类似;包括:环境(变换),模型,损失函数,数据收集器,回放缓冲区,日志,训练loop
我是有底线的