如何配置TensorRT版的Katago

Katago是开源界最强的围棋软件。个人感觉在相同算力下它甚至已不弱于腾讯的绝艺。

如何在拥有一款GPU的电脑上配置Katago呢?

前有珠玑,早已有Katago爱好者分享了katago下载安装配置至sabaki教程

文章清晰且图例丰富,能让人轻松上手Katago的安装和配置。

不过有一点小小的遗憾,它没有涉及到如何配置TensorRT版本的Katago,那才是最强的Katago!

先说一下Katago有几个什么版本。

简单讲,有4个版本:

  1. CPU版:这是最弱的,没什么意思。如果用这版与人对战,会输得很惨。
  2. OpenCL版:这个版本可不得了。OpenCL可应用于绝大多数GPU,即使不是Nvidia的GPU也支持。而且根据官方文档,即使对于Nvidia的GPU,OpenCL版也并不弱于CUDA版,二者各有优势。
  3. CUDA版:CUDA是Nvidia的GPU编程的SDK. 天然的支持理应更加强大。不过官方文档里提到OpenCL版似乎并不弱于它。
  4. TensorRT版:这个版是最强的。TensorRT对于GPU的加速相较于CUDA可达数倍之多。个人实测下来,比OpenCL版要快个至少百分之几十是有的。

下面在之前教程的基础上,讲解一下如何安装和配置TensorRT版的Katago.

  1. 去Nvidia官网下载CUDA 11系列的版本,如最新的11.8,并安装
    下载完的文件名大约是:cuda_11.8.0_522.06_windows.exe

安装完成后,给系统环境变量PATH(用户环境变量PATH应该也可以)添加CUDA的2个路径,举例如下:

  • C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v11.8\bin
  • C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v11.8\libnvvp
  1. 去Nvidia官网下载TensorRT的8.5.2.2版本
    注意,一定要是这个版本,如果是其他版本则很可能失败
    选 "8.5 GA Update 1"就是8.5.2.2版了
    下载完成后的文件名是:TensorRT-8.5.2.2.Windows10.x86_64.cuda-11.8.cudnn8.6.zip

在Windows上的解压了即可用。但是仍要配置环境变量。

比如,将以下路径添加到系统环境变量PATH中:

  • D:\TensorRT-8.5.2.2\bin
  • D:\TensorRT-8.5.2.2\lib
  1. 去Nvidia官网下载 cudnn 8.9.6
    下载完成后的文件名:cudnn-windows-x86_64-8.9.6.50_cuda11-archive.zip

在Windows上依然是解压了就可以用,要配置环境变量。

比如,将以下路径添加到系统环境变量PATH中:

  • D:\cudnn-windows-x86_64-8.9.6.50_cuda11-archive\bin
  • D:\cudnn-windows-x86_64-8.9.6.50_cuda11-archive\lib\x64

关于cudnn,还有额外的一步,即:
将 cudnn 目录下的 bin, lib/x64, include 这三个目录下的内容全部拷贝到 CUDA 对应的三个目录下。

  1. 下载并拷贝 cudnn64_8.dll
    有的时候会有缺失这个dll文件的问题。
    可以到如下地址下载:https://www.dll-files.com/cudnn64_8.dll.html

下载完成后,将其拷贝到 CUDA 安装目录下的 bin 目录下,如:C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v11.8\bin

  1. 下载katago的TensorRT版本,如 1.13.1 版

    下载地址:https://github.com/lightvector/KataGo/releases

    下载完成后,文件名为:katago-v1.13.1-trt8.5-cuda11.2-windows-x64.zip

    解压

  2. 在katago tensor版本的目录里打开cmd,运行以下命令生成配置文件

shell 复制代码
katago.exe genconfig -model model.bin.gz -output gtp_custom.cfg

这里的 model.bin.gz 是一个权重文件,它来自于Katago的开源代码仓库。不过那样下载也许太慢了。也可以通过前文教程中的链接下载。

  1. 最后,试一下是否可以成功运行了。
shell 复制代码
katago.exe genconfig -model model.bin.gz -output gtp_custom.cfg

当看见出现如下字样时,则说明配置成功!

shell 复制代码
KataGo v1.13.1
Using Chinese rules initially, unless GTP/GUI overrides this
Initializing board with boardXSize 19 boardYSize 19
Loaded config gtp_custom.cfg
Loaded model model.bin.gz
Model name: kata1-b18c384nbt-softplusfixv13-s5971481344-d3261785976
GTP ready, beginning main protocol loop

至此,Katago的TensorRT版本可以成功运行了!

关于配置GUI的步骤在前面的文章里都有了。再把Sabiki或Katrain配好,就可以开打了!

(END)

相关推荐
喜欢吃豆18 小时前
代理式 CI/CD 的崛起:Claude Code Action 深度技术分析报告
人工智能·ci/cd·架构·大模型
2301_7644413318 小时前
基于HVNS算法和分类装载策略的仓储系统仿真平台
人工智能·算法·分类
aitoolhub18 小时前
在线设计技术实践:稿定设计核心架构与能力拆解
图像处理·人工智能·计算机视觉·自然语言处理·架构·视觉传达
shayudiandian18 小时前
AI生成内容(AIGC)在游戏与影视行业的落地案例
人工智能·游戏·aigc
木头左18 小时前
深度学习驱动的指数期权定价与波动率建模技术实现
人工智能·深度学习
AI科技星18 小时前
统一场论变化的引力场产生电磁场推导与物理诠释
服务器·人工智能·科技·线性代数·算法·重构·生活
不会用AI的老炮18 小时前
【AI coding 智能体设计系列-05】上下文治理:清空压缩摘要与预算控制
人工智能·ai·ai编程
速易达网络18 小时前
AI工具全景:从概念到产业的深度变革
人工智能
点云SLAM18 小时前
Algebraic 英文单词学习
人工智能·英文单词学习·雅思备考·代数形式的·代数的 / 与代数相关的·algebraic
狮子座明仔18 小时前
DISCOG:知识图谱+LLM双引擎驱动的法律电子取证系统
人工智能·深度学习·知识图谱