Linux 35.6 + JetPack v5.1.4之编译 pytorch
- [1. 源由](#1. 源由)
- [2. 折腾](#2. 折腾)
- [3. 构建步骤](#3. 构建步骤)
-
- [3.1 下载代码](#3.1 下载代码)
- [3.2 编译选项](#3.2 编译选项)
- [3.3 CUDA选项](#3.3 CUDA选项)
- [3.4 CUDA路径](#3.4 CUDA路径)
- [3.5 版本控制](#3.5 版本控制)
- [3.6 编译whl](#3.6 编译whl)
- [4. 总结](#4. 总结)
- [5. 参考资料](#5. 参考资料)
1. 源由
目前,有很多科研性质的自动导航的开源代码,例如:
- Linux 35.5 + JetPack v5.1.3@VINS-Fusion编译安装
- Linux 35.5 + JetPack v5.1.3@FC-Planner编译安装
- Linux 35.5 + JetPack v5.1.3@ego-planner-swarm编译安装
- Linux 35.5 + JetPack v5.1.3@ego-planner编译安装
- Linux 35.5 + JetPack v5.1.3@RACER编译安装
- Linux 35.5 + JetPack v5.1.3@FUEL编译安装
- Linux 35.5 + JetPack v5.1.3@Fast-Planner编译安装
但是这些代码都有一个特性,基于ROS系统的一些组件:
当然逻辑上ROS2系统有对应的组件,但是要做升级就需要解决一些兼容性,以及异常问题的DEBUG。可以做,但是。。。。
从学习、研究、以及短平快项目的国内大体环境下,不会去深入系统性的解决问题,除非有利润,这是企业需要做的事情。
为了工作、学习上的收敛,期望jetson orin平台上能够集成更多的功能,我们暂时将目标对准了支持ROS中间件的Jetpack 5.1.4版本。
因为,该版本基于ubuntu20.04,支持ROS中间件,并且NVIDIA大部分AI算法以及Deepstream的功能都支持,且应该BUG修复的相对完善。
但是,pytorch官方仅支持到到2.1版本,虽然Jetpack5系列并未EOL。而在实际应用过程发现NVIDIA pytorch2.1存在导出onnx问题。
因此,想在Jetpack5系列上支持更新的pytorch版本。
2. 折腾
- build script for pytorch or up to date pytorh binary release supporting jetson boards running L4T35.6
- pytorch v2.5.1 build for nvidia jetson orin nano 8GB ·#143624
- pytorch v2.4.1 build for nvidia jetson orin nano 8GB #143816
- pytorch v2.3.1 build for nvidia jetson orin nano 8GB #143856
- pytorch v2.2.2 build for nvidia jetson orin nano 8GB #143861
- pytorch v2.3.1 build failed - CUDA kernel function #143935
功夫不负有心人,但要做好徒劳无果的准备,通常都是徒劳无果的情况居多!
3. 构建步骤
3.1 下载代码
bash
$ git clone git@github.com:pytorch/pytorch.git
$ git checkout v2.3.1
$ git submodule update --init --recursive
注:大家可以直接从pytorch官方网站获取代码,或参考SnapDragonfly/pytorch。
3.2 编译选项
bash
$ export USE_NCCL=0
$ export USE_DISTRIBUTED=0
$ export USE_QNNPACK=0
$ export USE_PYTORCH_QNNPACK=0
$ export USE_PRIORITIZED_TEXT_FOR_LD=1
注:不同的版本,选项可能有所不同,具体根据实际情况调整。
3.3 CUDA选项
bash
$ export TORCH_CUDA_ARCH_LIST="8.7"
注:8.7
是jetson orin板子的CUDA版本。
3.4 CUDA路径
bash
$ export PATH=/usr/local/cuda/bin:$PATH
$ export LD_LIBRARY_PATH=/usr/local/cuda/lib64:$LD_LIBRARY_PATH
注:当前使用的CUDA版本,这里是一个软连接。
3.5 版本控制
bash
$ export PYTORCH_BUILD_VERSION=2.3.1
$ export PYTORCH_BUILD_NUMBER=1
$ export L4T_BUILD_VERSION=35.6
注1:PYTORCH_BUILD_VERSION
是对应checkout的pytorch版本。
注2:L4T_BUILD_VERSION
是NVIDIA L4T版本号。
3.6 编译whl
bash
$ python3 setup.py bdist_wheel
4. 总结
通过不懈的努力,顺利构建了一下二进制:
注:这里需要注意各自板子当前系统的swap内存大小,笔者看到最大使用到9.2GB。
希望,在不久的将来,能够构建出 2.3.1
/ 2.4.1
甚至更高的版本!
5. 参考资料
【1】Linux 35.6 + JetPack v5.1.4@yolo安装
【2】Linux 35.6 + JetPack v5.1.4@python opencv安装
【3】Linux 35.6 + JetPack v5.1.4@DeepStream安装