gpu

扫地的小何尚9 小时前
神经网络·r语言·机器人·llm·gpu·nvidia
R²D²深度解析:NVIDIA三大神经网络突破如何变革机器人学习尽管今天的机器人在受控环境中表现出色,但它们在面对现实世界的不可预测性、灵巧性以及与环境进行精细交互时,仍然显得力不从心。无论是组装精密的电子元件,还是像人一样自然地操作日常物品,都对机器人的学习和适应能力提出了极高的要求。
Eloudy10 小时前
gpu·risc-v·arch
全文 -- Vortex: Extending the RISC-V ISA for GPGPU and 3D-Graphics ResearchVortex: Extending the RISC-V ISA for GPGPU and 3D-Graphics Research
扫地的小何尚1 天前
人工智能·语言模型·llm·gpu·量子计算·nvidia·cuda
深度解析 CUDA-QX 0.4 加速 QEC 与求解器库在通往大规模、容错量子超级计算机的征程中,量子纠错(Quantum Error Correction, QEC)既是最大的机遇,也是最严峻的挑战 。它将当今的含噪中等规模量子(Noisy Intermediate-Scale Quantum, NISQ)设备与未来的强大计算引擎区分开来。克服这一挑战需要的不仅仅是渐进式的改进,而是一场范式革命——从零散、受限于 CPU 的研究工具,转向一个紧密集成、大规模并行、端到端的开发平台。
Baihai_IDP2 天前
人工智能·llm·gpu
GPU 网络通信基础,Part 1(横向与纵向扩展;训练中的通信环节...)编者按: 当我们谈论训练万亿参数的大语言模型时,除了惊叹于其算力需求,是否曾深入思考过:如何让成千上万甚至数十万块 GPU 高效协同工作,像超级大脑般实时共享信息?
charlie1145141913 天前
前端·chrome·学习·渲染·gpu·客户端
Chrome View渲染机制学习小记笔者最近正在看一点Chrome的源码,觉得这里的源码非常的庞大,找到了年初看Linux源码的感觉了。好在Chrome的文档非常的齐全,可以非常好的帮助我们入门。这一篇文章更多的是将Chrome Documentations和我翻到的一些文章的一次整理和归纳。
Nicander12 天前
webgl·gpu
上帝视角看 GPU 学习笔记上帝视角看GPU(1):图形流水线基础_哔哩哔哩_bilibili《上帝视角看 GPU》龚大教程学习笔记。
杰克逊的日记15 天前
压力测试·gpu
用deepseek对GPU服务器进行压力测试利用 DeepSeek 模型对 GPU 服务器进行压力测试,核心思路是通过模拟高负载的模型推理 / 微调任务,验证 GPU 服务器在计算、显存、网络等维度的承载能力,同时观察稳定性与性能瓶颈。以下是具体的测试方案,涵盖测试环境准备、核心测试场景、指标监控与结果分析:
小武~20 天前
ubuntu·gpu·黑屏
ubuntu 系統使用過程中黑屏問題分析工欲善其事,必先利其器。作为程序员,想要得到更好的发展,遇到问题直接baidu, google 虽然可以得到一些参考或者答案,但是也会降低自己的思考能力,本文以ubuntu 使用过程中黑屏这一问题为背景,旨在提供一个从零开始完全不借助搜索引擎的问题分析方法。
weiwei2284424 天前
gpu·cuda·nsight compute
NVIDIA Kernel级性能分析工具Nsight Compute入门详解仍以之前的vectorAdd程序为分析目标,在新建的工程中只指定编译好的可执行文件及其输出report文件,其他部分都保持默认,然后直接点击“Launch”进行分析。
云道轩24 天前
阿里云·华为云·云计算·gpu·rocky linux
阿里云和华为云Rocky LINUX 9.X镜像就绪及低端可用英伟达GPU阿里云和华为云Rocky LINUX 9.X镜像已经就绪低端可用英伟达GPU
杰克逊的日记1 个月前
运维·cpu·gpu
gpu与cpu各厂商的优劣国内CPU厂商GPU厂商
weiwei228441 个月前
gpu·cuda·nsight systems
NVIDIA系统级性能分析工具Nsight Systems入门详解Nsight Systems(简称nsys)是NVIDIA推出的一款系统级性能分析工具,主要用于优化 GPU 加速应用程序(尤其是基于 CUDA、OpenCL、DirectX、Vulkan 等 API 开发的程序)的性能,帮助开发者定位和解决计算、内存、通信等环节的瓶颈。所谓系统层面的分析工具,除了分析GPU的使用,还要分析CPU的使用,以及CPU和GPU的交互情况,可以捕捉CPU和GPU的各种事件,发现CPU和GPU上的等待以及不必要的同步,可以通过Nsight systems将任务均匀的分配到CPU和
weiwei228441 个月前
gpu·cuda
CUDA编程初探1993年:NVIDIA 成立,初期专注于图形芯片设计。 1997年:发布 RIVA 128,首款支持 DirectX 5 和 OpenGL 1.1 的显卡,采用 128-bit 架构,奠定早期 3D 加速基础。 1999年:推出 GeForce 256,首次提出“GPU”概念,集成硬件变换与光照(T&L)引擎,不再依赖 CPU 处理图形数据,性能较前代提升 10 倍。
数据智能老司机1 个月前
人工智能·python·gpu
GPU 编程实战——使用 PyCUDA 与 CuPy 功能到目前为止,我们都是在 Python 脚本里以静态字符串的形式定义 CUDA C kernel,手动编写、一次性编译然后按需调用。这对于固定不变的 kernel 足够,但随着项目规模增大,我们往往需要更多灵活性:根据运行时参数生成代码、调优编译选项,或在同一框架里支持多种算法变体。
都都学算法2 个月前
gpu
【CUDA编程】hello world 级入门(一)最近参考 CUDA 入门教程,想记录自己学习和思考的过程。根据这份参考教程,整体分为将以下两个部分:在这篇博客中围绕第一部分进行展开讨论。
杰克逊的日记2 个月前
linux·运维·gpu
GPU运维常见问题处理硬件故障是 GPU 运维中最直接的问题,通常表现为设备无法识别或运行异常,需优先排查物理层面问题。症状:
胡耀超2 个月前
运维·python·docker·容器·ocr·paddlepaddle·gpu
基于Docker的GPU版本飞桨PaddleOCR部署深度指南(国内镜像)2025年7月底测试好用:从理论到实践的完整技术方案还是网上没找到这个基于Docker的GPU版本飞桨PaddleOCR部署教程,于是就有了这一篇。 这个的确坑很多,可能后面变一个版本就不好用了,也是为什么这篇博客不完全粘贴代码的原因。 端口是示例,可以随意改。
雪碧聊技术2 个月前
人工智能·cpu·gpu·中央处理器·图形处理器
CPU(中央处理器)和GPU(图形处理器)的区别🌟 欢迎来到AI奇妙世界! 🌟亲爱的开发者朋友们,大家好!👋我是人工智能领域的探索者与分享者,很高兴在CSDN与你们相遇!🎉 在这里,我将持续输出AI前沿技术、实战案例、算法解析等内容,希望能和大家一起学习、交流、成长!💡
POLOAPI2 个月前
人工智能·gpu
GpuGeek 实操指南:So-VITS-SVC与Stable Diffusion详解和音画同步生成实战在人工智能飞速发展的当下,AI 创作工具不断推陈出新,为我们的创意表达开辟了全新路径。So-VITS-SVC 语音合成模型能够赋予文字灵动的声音,Stable Diffusion 文生图模型则可将文字描述转化为精美的图像,二者结合,能构建出极具创意的多媒体内容创作体系。本文将借助 GpuGeek 平台,详细讲解这两个模型的搭建过程,以及如何将它们与即梦 AI 深度融合,实现更强大的创作功能。