技术栈
alphago
nju_spy
4 小时前
强化学习
·
南京大学
·
alphago
·
蒙特卡洛树搜索
·
策略网络
·
价值网络
·
随机梯度算法
王树森深度强化学习DRL(三)围棋AlphaGo+蒙特卡洛
深度强化学习(5_5):AlphaGo_哔哩哔哩_bilibili蒙特卡洛 Monte Carlo_哔哩哔哩_bilibili