技术栈

价值网络

nju_spy
4 小时前
强化学习·南京大学·alphago·蒙特卡洛树搜索·策略网络·价值网络·随机梯度算法
王树森深度强化学习DRL(三)围棋AlphaGo+蒙特卡洛深度强化学习(5_5):AlphaGo_哔哩哔哩_bilibili蒙特卡洛 Monte Carlo_哔哩哔哩_bilibili