Uniad复现学习

在优云智算compshare平台部署训练,加速训练。

关于UCloud(优刻得)旗下的compshare算力共享平台

UCloud(优刻得)是中国知名的中立云计算服务商,科创板上市,中国云计算第一股。

UCloud(优刻得)旗下的Compshare算力共享平台具有以下优点:

  1. 高性价比的算力资源:Compshare专注于提供高性价比的NVIDIA RTX 40系列资源,满足AI应用、模型推理/微调、科学计算等多场景需要。

  2. 100% GPU性能:通过GPU显卡直通技术,确保用户能够充分利用GPU的性能,相比传统容器形式,性能损耗降低了30%。

  3. 独立IP配备:每个Compshare实例都配备了独立的外网IP地址,使得服务器资源管理变得更加方便和灵活。

  4. 访问加速:支持对GitHub和Hugging Face等学术资源的访问加速,用户无需进行复杂的配置,即可快速拉取所需的学术资源。

  5. 灵活的配置选项:提供了多种GPU数量和配置的选项,从1GPU到8GPU不等,CPU内存从16C64GB到124C940GB,系统盘均为200GB的SSD云盘,网络为100MB的共享带宽。

这些优点使得Compshare算力共享平台成为AI研究者和开发者的优选平台之一。

UniAD 首次将所有检测,跟踪,建图,轨迹预测,占据栅格预测与规划都包含进来,ALL IN ONE

本次使用它也是因为有体验,有教程,方便
优云智算compshare

链接:https://www.compshare.cn/?ytag=GPU_daxiblog_Lcsdn_csdn

注册即可获得20元算力金,免费体验10小时4090

自动驾驶系统可大致归为三类

  1. 模块化:每个模型负责单独的子任务,优势在于易于调试迭代 ,但是解耦就会丢失最优性,各个模块的优化目标并不是以驾驶为最终目标 ,并且每个模块的误差会传递到之后的模块。
  2. 多任务模块:多任务范式利用一个共享的特征提取器来完成多个子任务,好处是节省计算成本,缺点在于不同任务之间可能会存在负面影响。
  3. 端到端:端到端范式以最终的驾驶性能为目标,具体又可以细分为两种范式:
    3.1 隐式的端到端 :以传感器数据作为输入,直接输出规划或者控制指令。这种范式的好处是较为简洁,缺点是缺乏可解释性,难以调式及迭代。
    3.2显式端到端:是将多个模块囊括在端到端模型之中,每个模块有各自的输出,并且会将提取到的特征传递到下游任务。




cpp 复制代码
复现第一天遇见问题,作者环境算CUDA11.1+ torch1.91版本,而我安装的CUDA12.1,导致后续版本都不一样,导致安装 mmcv-full、mmdet、mmsegmentation版本出错。
问题2:准备安装在docker里,但是docker换了很多源下载都很慢,可能文件较大,而且及时我复现了本机也不一定能跑,于是在云平台复现。
准备在云平台从新安装显卡驱动,cuda,cudnn和原作者适配的版本。
首先安装三件套 https://hermit.blog.csdn.net/article/details/139618350
下载数据集 可能涉及要传进云里 文件大于5G 果然需要额外下载存储工具,讲本地文件挂载到云上 https://docs.ucloud.cn/ufile/tools/us3fs/prepare
然后跟着官方dockerfile里本地安装

安装完显卡驱动若nvidia-smi还是没有,则重启即可
wget https://developer.download.nvidia.com/compute/cuda/11.1.1/local_installers/cuda_11.1.1_455.32.00_linux.run
sudo sh cuda_11.1.1_455.32.00_linux.run

注意sh的时候 在弹出的框中取消勾选,不需要再次安装显卡驱动,不然报错
结果GCC版本问题 太高了 报错
https://blog.csdn.net/yehe111/article/details/115370164
sudo update-alternatives --install /usr/bin/gcc gcc /usr/bin/gcc-9 1 --slave /usr/bin/g++ g++ /usr/bin/g++-9
说明:里面的1 代表优先级,把gcc9 设置成1 代表gcc9 优先级更高

然后添加CUDA环境变量 sudo gedit ~/.bashrc
apt-get update -q && \
    apt-get install -q -y \
    wget \
    python3.8-dev \
    python3-pip \-
    python3.8-tk \
    git \
    ninja-build \
    ffmpeg libsm6 libxext6 libglib2.0-0 libsm6 libxrender-dev libxext6 \
    && apt-get clean \
    && rm -rf /var/lib/apt/lists/*

安装好了miniconda3 运行conda 报错conda: command not found   要source ~/.bashrc

不能按照这个教程里的安装cuda和pytorch https://blog.csdn.net/lovely_yoshino/article/details/139867558
版本和论文作者的不对 要看dockerfile
pip install torch==1.9.1+cu111 torchvision==0.10.1+cu111 torchaudio==0.9.1 -f https://download.pytorch.org/whl/torch_stable.html


我是python3.10 原文是3.8 不知会不会有问题??
要自己 新建data 下载数据集 放入或者软连接 
Download nuScenes, CAN_bus and Map extensions
cd UniAD
mkdir data
#Download nuScenes V1.0 full dataset data directly to (or soft link to) UniAD/data/
#Download CAN_bus and Map(v1.3) extensions directly to (or soft link to) UniAD/data/nuscenes/

Prepare Motion Anchors
cd UniAD/data
mkdir others && cd others
wget https://github.com/OpenDriveLab/UniAD/releases/download/v1.0/motion_anchor_infos_mode6.pkl

使用优云智算平台 激励	
https://iadagxzituk.feishu.cn/share/base/form/shrcnxWcOvNV6DSlLXwCw9NOUAc 



报错
 module 'numpy.typing' has no attribute 'NDArray'
AttributeError:     module 'numpy.typing' has no attribute 'NDArray'NumpyArray = npt.NDArray[Any]
更新numpy大于1.20

print(torch.cuda.is_available())输出 false 但是nvcc -V可以输出版本
相关推荐
无规则ai33 分钟前
AI三巨头:机器学习、深度学习与人工智能解析
人工智能·深度学习·机器学习
简简单单做算法42 分钟前
基于LSTM深度学习网络的视频类型分类算法matlab仿真
深度学习·matlab·分类·lstm·视频类型分类
武子康6 小时前
Java-82 深入浅出 MySQL 内部架构:服务层、存储引擎与文件系统全覆盖
java·开发语言·数据库·学习·mysql·spring·微服务
pk_xz1234567 小时前
光电二极管探测器电流信号处理与指令输出系统
人工智能·深度学习·数学建模·数据挖掘·信号处理·超分辨率重建
格林威8 小时前
Baumer工业相机堡盟工业相机如何通过YoloV8深度学习模型实现持械检测(C#代码,UI界面版)
人工智能·深度学习·数码相机·yolo·计算机视觉
霜绛10 小时前
机器学习笔记(三)——决策树、随机森林
人工智能·笔记·学习·决策树·随机森林·机器学习
宇称不守恒4.010 小时前
2025暑期—07深度学习应用-总结
深度学习·神经网络·机器学习
站住前面的二哈11 小时前
Cartographer安装测试与模块开发(三)--Cartographer在Gazebo仿真环境下的建图以及建图与定位阶段问题(实车也可参考)
学习·ubuntu
★YUI★11 小时前
学习游戏制作记录(克隆技能)7.25
学习·游戏·unity·c#
Trust yourself24312 小时前
想把一个easyui的表格<th>改成下拉怎么做
前端·深度学习·easyui