技术栈
gpu
被制作时长两年半的个人练习生
1 天前
gpu
·
cuda
blackwell和warp specialization的背景下如何理解CTA
在Blackwell架构和Warp Specialization的背景下,CTA(协作线程数组)的概念和角色发生了重要演变,从传统的执行单元转变为更复杂的任务协调和数据流管理单元。
放逐者-保持本心,方可放逐
2 天前
javascript
·
cpu
·
gpu
·
热力图
·
cesium
·
核心渲染判断
·
渲染管线优化
地图 热力图核心封装
以下是一个完整的HTML测试案例,演示如何使用整合后的MultiScaleHeatmapManager在Cesium中显示热力图。该案例生成5000个随机点(模拟北京市区周边数据),并包含简单的启用/禁用控制。
心歌技术
5 天前
python
·
gpu
·
性能对比
·
实验
CPU与GPU排序性能对比分析
本实验通过实现CPU和GPU版本的大数排序算法,对比了两者在不同数据规模下的性能表现。实验结果表明,GPU在处理大规模数据排序时具有显著优势,而CPU在小规模数据上表现更好。本文详细介绍了实验设计、实现过程、结果分析以及编程步骤,为相关领域的性能优化提供参考。
叶智辽
7 天前
webgl
·
gpu
·
three.js
【Three.js 与 Shader】编写你的第一个自定义着色器,让模型拥有灵魂
以前我觉得 Shader 是神仙才能看懂的东西,直到我发现它其实就是告诉 GPU“怎么画”的说明书。两年前我第一次接触 Shader,看了一篇教程,开头就是 gl_FragColor、varying、uniform 这些天书一样的词。我心想:这玩意儿是人写的吗?
波哥学开发
18 天前
webgl
·
gpu
# Three.js 进阶:如何绘制"像素大小固定"的箭头?三种方案全解析
🎯 一句话总结:在 3D 场景中绘制 2D UI 标记,既要「像素恒定」又要「性能可控」,选对方案比写对代码更重要。
爱学习的大牛123
23 天前
学习
·
架构
·
gpu
GPU架构学习
图形处理单元(Graphics Processing Unit,GPU)自诞生以来,已从专注于图形渲染的专用硬件演变为支撑现代计算科学、人工智能、科学仿真乃至区块链等多元领域的通用并行计算引擎。其核心架构设计理念——以大规模并行性换取高吞吐量——与传统中央处理单元(CPU)的低延迟串行执行路线形成了鲜明对比。本文将系统、深入地剖析GPU的架构演进历程、核心组成部件、内存层次结构、执行模型、调度机制以及现代GPU在AI与高性能计算(HPC)领域的前沿扩展,旨在为读者提供一份兼具理论深度与工程实践价值的综合性
virtaitech
23 天前
人工智能
·
科技
·
ai
·
gpu
·
池化技术
趋动科技 OrionX 社区版永久免费:重塑 AI 算力格局的“胜负手”
嘿,朋友,我知道你现在面临什么。看着GPU利用率监控,那条线永远在20%-30%徘徊。价值几十万的硬件,大部分时间都在“睡大觉”。
专注VB编程开发20年
25 天前
算法
·
gpu
C#,VB.NET GPU计算和调试
c# OpenCL可以直接以源码形式调试吗?估计不行吧,要是可以事件方式返回结果,或者把结果写入C#的几个地址,通过监控主线程的一些内存或对象的地址,查看GPU运行进度和计算结果
love530love
1 个月前
人工智能
·
windows
·
gpu
·
cuda
·
ollama
·
lm studio
·
openclaw
【OpenClaw 本地实战 Ep.2】零代码对接:使用交互式向导快速连接本地 LM Studio 用 CUDA GPU 推理
目标:让 OpenClaw 调用本地 LM Studio 运行的模型,代替 Ollama 实现稳定的 CUDA GPU 推理,体验极速的本地模型服务 部署方式:从源代码部署(非 npm 全局安装) 环境:Windows + WSL2(推荐)或原生 Windows 版本:OpenClaw 2026.2.13 (a2b45e1)
Eloudy
1 个月前
机器学习
·
gpu
·
cuda
CUTLASS README v4.4.0
CUTLASS 4.4.0 - 2026年1月CUTLASS 是一套在 CUDA 中所有层次和规模上实现高性能矩阵乘法(GEMM)及相关计算的抽象集合。它融合了分层分解和数据移动的策略。CUTLASS 将这些“可动部件”分解为可重用、模块化的软件组件和抽象。
RainbowC0
1 个月前
gpu
总结各GPU的OpenCL子组洗牌支持情况
子组(Sub-group)自 OpenCL 2.0 正式引入,是工作组(Work-group)内部更小的执行单位,通常直接映射到 GPU 的 SIMD/SIMT 执行单元(如 Nvidia Warp 和 AMD Wavefront),具有更好的数据共享与同步能力。
70asunflower
1 个月前
gpu
·
就业
·
岗位
算子开发到底在做什么?
“算子开发(Operator Kernel Development)”在真实工业环境里,绝对不只是“写一个 conv 的实现”,而是:
迎仔
1 个月前
gpu
B-基础:GPU驱动基础概念
GPU(图形处理器)就像一个超级厨师,专门负责处理复杂的计算任务。而GPU驱动就是这个厨师的工作手册,告诉厨师如何使用厨房里的各种设备,如何高效地完成烹饪任务。在算力中心,GPU驱动的重要性不言而喻,它直接影响着AI训练和推理的效率。
迎仔
1 个月前
gpu
·
gpu驱动
F-排查:GPU驱动故障排查手册
在算力中心的日常运维中,GPU驱动故障是不可避免的。就像人生病需要医生诊断一样,GPU驱动故障也需要系统化的排查方法。本手册将为你提供一套完整的GPU驱动故障排查流程和方法,帮助你快速定位和解决问题。
迎仔
1 个月前
gpu
·
gpu驱动
D-安装:GPU驱动安装与升级最佳实践
在算力中心的运维中,GPU驱动的安装与升级是一项基础但关键的工作。就像我们日常生活中安装和更新手机应用一样,正确的安装和升级方法可以确保GPU驱动的稳定性和性能。本章节将为你提供一份GPU驱动的"安装指南",帮助你掌握最佳实践。
迎仔
1 个月前
运维
·
gpu
·
gpu驱动
E-自动化:GPU驱动维护自动化
在现代算力中心,自动化已经成为提高运维效率、减少人为错误的关键手段。GPU驱动的维护也不例外,通过自动化工具和流程,我们可以实现驱动的自动监控、更新、部署和告警,将运维人员从重复性工作中解放出来,专注于更有价值的任务。
小白狮ww
1 个月前
人工智能
·
深度学习
·
机器学习
·
ocr
·
cpu
·
gpu
·
deepseek
要给 OCR 装个脑子吗?DeepSeek-OCR 2 让文档不再只是扫描
如何形容现在市面上普遍的 OCR 呢?可能你已经习惯了它的「固执」——无论文档布局多复杂,它总是老老实实从左到右、从上到下扫一遍。遇到双栏论文还好,碰上跨页表格或者公式脚注混排,输出结果往往乱得让人头疼。这不是识别不准,而是理解方式出了问题。
小白狮ww
2 个月前
人工智能
·
深度学习
·
目标检测
·
机器学习
·
cpu
·
gpu
·
视觉分割模型
Ovis-Image:卓越的图像生成模型
你是否还在为无法得到自己心中想要的画面发愁?直到现在 ai 生成的图片也会有很多槽点,比如文字乱码想在 T 恤上印「LOVE」,结果出来的是 ℒℴ𝒱 外星文,放大一看全是伪笔画,又或者是常识错误,猫耳朵长到头顶正中间,汽车轮子比车身还大,咖啡杯没有底,物理老师沉默,生物老师落泪,除了这些还有风格漂移,乱打光影甚至多写几句,它又自动忽略后半截,像跟健忘症患者对话。
virtaitech
2 个月前
人工智能
·
科技
·
ai
·
ocr
·
gpu
·
算力
云平台一键部署【rednote-hilab/dots.ocr】多语言文档布局解析模型
dots.ocr 是一个强大的多语言文档解析器,它在一个单一的视觉-语言模型中统一了布局检测和内容识别,同时保持良好的阅读顺序。尽管其基础是紧凑的1.7B参数的大规模语言模型,但它达到了最先进的(SOTA)性能。
virtaitech
2 个月前
人工智能
·
科技
·
ai
·
免费
·
gpu
·
池化技术
如何评价趋动科技推出永久免费的OrionX社区版?
一句话总结:OrionX社区版是一款专为中小企业、开发者及科研团队打造的GPU池化工具,以“零成本接入,企业级体验”为核心优势,打破算力资源管理壁垒,让轻量化团队也能高效掌控GPU算力。