gpu加速

CV-deeplearning2 天前
opencv·计算机视觉·pip·nvidia·cuda·gpu加速·cv-cuda
NVIDIA CV-CUDA:GPU 全流程加速计算机视觉,pip 一键安装替代 OpenCV,微软/腾讯/百度/字节全在用,云级图像处理吞吐量飙升 10 倍💡 还在用 CPU 版 OpenCV 做图像预处理?你的 GPU 在推理前白白闲置 80% 的时间!NVIDIA 联合字节跳动开源的 CV-CUDA,把图像解码、缩放、色彩转换、数据增强等全流程搬到 GPU,吞吐量飙升 10 倍+,延迟降低 90%。微软 Bing 视觉搜索、腾讯云音视频 PaaS、百度 AI 都在用。pip 一行安装,C++ 和 Python 双语言支持,Apache 2.0 开源,v0.16.0 最新版已支持 CUDA 13 和 Blackwell 架构。
元让_vincent18 天前
nvidia·视觉slam·gpu加速
论文Review SLAM cuVSLAM | NVIDIA 2025 | CUDA加速的视觉里程计与建图系统题目: cuVSLAM: CUDA accelerated visual odometry and mapping 作者: Alexander Korovko, Dmitry Slepichev, Alexander Efitorov, Aigul Dzhumamuratova, Viktor Kuznetsov, Hesam Rabeti, Joydeep Biswas, Soha Pouya 机构: NVIDIA 论文版本: arXiv:2506.04359v3,2025 年 7 月修订版 (arXi
Dfreedom.20 天前
人工智能·深度学习·gpu·gpu加速·模型加速·算子融合·模型计算
算子融合:从硬件本质到性能飞跃的深度学习优化艺术在深度学习模型部署中,我们经常遇到这样的困境:同样的模型,同样的硬件,为什么推理速度却有天壤之别?一个在GPU上需要20ms的模型,经过优化后可能只需要5ms。这背后的关键优化技术之一就是算子融合。
All The Way North-5 个月前
pytorch·深度学习·cnn·图像分类·实战项目·cifar-10·gpu加速
PyTorch从零实现CIFAR-10图像分类:保姆级教程,涵盖数据加载、模型搭建、训练与预测全流程CIFAR-10 是一个广泛使用的图像识别数据集,由加拿大圭尔夫大学的Alex Krizhevsky、Ilya Sutskever和多伦多大学的Geoffrey Hinton整理。这个数据集被设计用于机器学习中的图像分类任务。
charlee445 个月前
3d渲染·实时渲染·gpu加速·交互式图形·帧率优化
《实时渲染》第1章-绪论-1.1内容概览实时渲染是指在计算机上快速渲染图像。它是计算机图形中交互性最高的领域。图像出现在屏幕上,观看者做出动作或反应,这种反馈会影响接下来生成的内容。这种反应和渲染的循环以足够快的速度发生,以至于观看者不会看到单个图像,而是沉浸在一个动态的过程中。
小夏refresh2 年前
linux·ubuntu·docker·深度学习环境·gpu加速
Ubuntu系统docker gpu环境搭建安装最新的依赖包网址: https://cr.console.aliyun.com/cn-hangzhou/instances/mirrors
我是有底线的