gpu

virtaitech3 小时前
人工智能·科技·ai·免费·gpu·池化技术
如何评价趋动科技推出永久免费的OrionX社区版?一句话总结:OrionX社区版是一款专为中小企业、开发者及科研团队打造的GPU池化工具,以“零成本接入,企业级体验”为核心优势,打破算力资源管理壁垒,让轻量化团队也能高效掌控GPU算力。
virtaitech5 天前
人工智能·深度学习·机器学习·ai·gpu·算力·云平台
云平台一键部署【Tencent-YouTu-Research/Youtu-LLM-2B】具备原生智能体能力Youtu-LLM 是一款全新、小巧但功能强大的大语言模型(LLM),仅包含 19.6 亿参数,支持 128k 长上下文,并具备原生的智能体(agentic)能力。在通用评估中,Youtu-LLM 在常识推理、STEM、编程和长上下文处理等方面显著优于同规模的当前最先进(SOTA)LLM;在智能体相关测试中,Youtu-LLM 甚至超越了更大规模的领先模型,真正能够完成多种端到端的智能体任务。
hahahahanhanhan7 天前
人工智能·python·tensorflow·gpu
Tensorflow使用GPU(cuda和cudnn和tensorflow下载)提供一个比较简单的方法安装:不需要去那些网站下载cuda和cudnn,当然如果要升级系统cuda版本,还是需要重新安装的,升级可以看之前的文章
InfraTech9 天前
gpu
虚拟GPU MIG原理与实践详解本文作者:kaiyuan虚拟GPU MIG原理与实践详解MIG(Multi-Instance GPU)作为Ampere架构开始支持的特性,解决了GPU在集群服务应用时一类需求:GPU切分与虚拟化。本文主要是介绍MIG相关的概念与使用方法,通过实际操作带读者了解该特性的基本情况。
scott1985129 天前
gpu
智驾芯片算力比较 Horizon J6 VS Nvidia orinSummary Table: Journey 6 (Flagship/P) vs. Orin-XOEM / Tier 1
缘友一世10 天前
bug·gpu·硬件·主板·x99
精粤X99-TI D4 PLUS大板使用多显卡BIOS设置
明洞日记12 天前
c++·图像处理·算法·ai·图形渲染·gpu·cuda
【CUDA手册002】CUDA 基础执行模型:写出第一个正确的 Kernel在医学图像处理场景中(例如 CT / MRI 切片),输入数据通常以二维矩阵形式存在。将这类数据映射到 GPU 上并行处理时,真正需要解决的问题并不复杂:
明洞日记12 天前
c++·图像处理·算法·ai·图形渲染·gpu·cuda
【CUDA手册004】一个典型算子的 CUDA 化完整流程在本篇中,我们将以医学图像处理中最基础的“二值化阈值算子(Thresholding)”为例,演示如何将一个 C++ 算子完整地迁移到 CUDA。
抠头专注python环境配置13 天前
人工智能·pytorch·windows·深度学习·gpu·环境配置·cuda
2026终极诊断指南:解决Windows PyTorch GPU安装失败,从迷茫到确定目录免责声明:这不是一篇传统教程 (熟手请全部跳过)第一部分:5分钟自我诊断系统(90%的问题可在此定位)
Hi2024021714 天前
人工智能·自动驾驶·gpu·机器视觉·bev·算力平台
使用星图AI算力平台训练PETRV2-BEV模型想象一下,当自动驾驶汽车行驶在路上时,它需要通过摄像头、雷达等传感器感知周围环境。这些传感器数据通常是2D图像,而BEV(Bird’s Eye View,鸟瞰图)模型的神奇之处在于,它能将这些不同视角的数据“翻译”成一个从上往下看的统一视图。
virtaitech15 天前
人工智能·科技·ai·gpu·算力·云平台
云平台一键部署【Step-1X-3D】3D生成界的FluxStep1X-3D 是由 StepFun 联合 LightIllusions 推出的新一代 高精度、高可控性 3D资产生成框架。基于严格的 数据清洗与标准化流程,从 500万+ 3D资产 中筛选出 200万高质量数据,构建了标准化的几何与纹理属性数据集,为3D生成提供更可靠的训练基础。
KIDGINBROOK15 天前
gpu·cuda·blackwell
Blackwell架构学习最近学习了一下Blackwell相关的架构,本文整理一下,最大的感受是看到GPU越来越NPU。首先约定一下后续的符号,假设TensorCore处理的D = A x B + D,A和B为bf16,D为fp32。
REDcker15 天前
架构·gpu·显卡·nvidia·cuda·英伟达·演进
Nvidia英伟达显卡型号发布史与架构演进详解英伟达显卡的发展史,核心主线是 GPU架构的迭代 与 GeForce产品线的演进。以下将按时间顺序,为您梳理两大主线的关键节点。
英雄各有见17 天前
c++·gpu·cuda·hpc
Chapter 5.1.1: 编写你的第一个GPU kernel——Cuda Basics本文介绍GPU编程的基础,包括一些基本术语以及如何编写一个kernel实现两个矩阵的加法kernel是GPU跑的的一个特殊的函数,GPU有很多同时工作的线程,而kernel就像发给他们的指令。我们通常用__global__ 关键字来标识一个kernel,其返回值只能为空
Taiyuuki17 天前
前端·gpu·图形学
WebGPU 开发者福音!在 VS Code 中实时预览你的WGSL着色器作品WebGPU 是下一代 Web 图形标准,而 WGSL(WebGPU Shading Language)是其着色器语言。但在开发 WGSL 时,由于WebGPU API的复杂性,哪怕是一个最简单的着色器效果,也需要写大量的js代码才能在浏览器中看到效果,而着色器的热更新也非常麻烦,往往得手动刷新浏览器才能看到修改后的效果,另外调试起来也很不友好,着色器错误往往不会直接报错,而是在控制台显示警告,开发体验不好。
scott19851218 天前
线性代数·矩阵·gpu·nvidia·cuda
NVIDIA GPU内部结构:高性能矩阵乘法内核剖析在这篇文章中,我们将逐步介绍支撑最先进的 NVIDIA GPU 矩阵乘法 (matmul) 内核的所有核心硬件概念和编程技术。
颜早早19 天前
图形渲染·gpu·unreal engine 5·graphic
Unreal Engine MobileFSR插件实现机制分析Engine/Plugins/Runtime/MobileFSR/Source/MobileFSR/Private/MobileFSRViewExtension.cpp
BFT白芙堂20 天前
人工智能·深度学习·算法·机器学习·gpu·具身智能·frankaresearch3
基于 GPU 并行加速的 pRRTC 算法:赋能 Franka 机械臂的高效、稳定运动规划高自由度机械臂(如7 自由度的 Franka Research 3)在执行复杂任务时,运动规划的实时性和一致性是至关重要的。传统的基于采样的运动规划算法(SBMP),如 RRT-Connect,虽然在处理高维空间问题上表现出色,但在复杂受限环境下的计算开销依然巨大 。
InfraTech22 天前
gpu·cuda
一文了解AI经典GPU架构---Tesla一文了解AI经典GPU架构—Tesla引言:Tesla架构可以认为是第一代真正开始用于并行运算的GPU架构,其硬件设计与细节奠定了当前并行运算架构的基本形态, 尽管主流的显卡架构Hopper(2022年3月发布,H100)的算力已经远超Tesla,但其运作模式、单元细节的设计理念基本保持不变,所以认识Tesla 架构,是了解GPU显卡硬件的基础。 本文通过分析Tesla架构的第一代(G80)和第二代(GT200),帮助读者对Tesla硬件有个基本认识。
STCNXPARM22 天前
arm开发·arm·gpu·android显示
Android14显示系统 - ARM GPU完全剖析1、Linux GPU物理模型 : http://joyxu.github.io/2021/05/09/gpu01/