技术栈
gpu算力
weixin_44764006
20 小时前
c语言
·
gpu算力
[GPU运算]cuda调用
这段代码是一个标准的CUDA GPU内核函数,用于并行计算向量加法。让我详细解释每一部分的写法和目的:
ZStack开发者社区
2 天前
服务器
·
云计算
·
gpu算力
VMware替代:从POC通过到生产可用,差距在哪里
博通停售、国产化死线临近,选型误区正在让替代项目付出额外代价。VMware的核心价值从来不只是虚拟机调度。vSphere生态二十年积累的,是一套完整的运维体系:vCenter统一管理、vMotion热迁移、DRS动态资源调度、HA高可用、NSX网络虚拟化、vSAN存储融合——这些能力彼此咬合,构成了企业数据中心的运转底座。
zhangfeng1133
2 天前
人工智能
·
深度学习
·
安全
·
语言模型
·
gpu算力
·
芯片
那nvidia orim车载gpu tee安全飞地 和天垓 100 gpgpu的 飞地 ,大概有多大存储量 ,解密流程
前提说明:英伟达 DRIVE Orin 与天数智芯天垓100 是两类完全不同的芯片。Orin 是车载 SoC(单片集成 CPU+GPU+安全引擎),天垓100 是数据中心 PCIe GPGPU 加速卡(需配合外部 CPU 使用)。两者的安全架构无法直接套用同一模板,必须分情况讨论。
zhangfeng1133
3 天前
人工智能
·
分布式
·
安全
·
transformer
·
gpu算力
·
芯片
天数智芯天垓 100 加密大模型分布式部署安全方案
ai生成,不一定准确本方案针对企业用户在天数智芯天垓 100 通用 GPU 集群上部署加密大语言模型的核心安全需求——重点解决模型参数被窃取、推理过程数据泄露、分布式计算环节安全防护不足三大风险,基于天垓 100 的硬件级安全能力与 FlagOS 国产统一异构软件栈,量身设计了一套"密文存储-可信传输-密文分片计算-闭环验证"全链路加密的分布式部署架构。
zhangfeng1133
3 天前
人工智能
·
深度学习
·
语言模型
·
架构
·
机器人
·
gpu算力
·
芯片
把权重写死在芯片的架构 Taalas(HC1)芯片:车载 GPU / 智能驾驶 / 机器人 / 算力卡适配总结
Taalas 不是通用GPU,是模型硬连线ASIC专用推理芯片(一芯片绑定一个固定大模型,HC1原生固化Llama3.1-8B),细分场景高度适配、全场景无法替代通用车载GPU,分三大场景拆解:
goodluckyaa
3 天前
架构
·
gpu算力
NVIDIAGPU 架构中的不变常量(宏观 → 微观)
这一层几乎没有不变的常量。 GPU 芯片的 SM 总数、GPC 总数、L2 缓存大小,都随架构和型号剧烈变化。旗舰卡可能有 128 个 SM,入门卡可能只有 20 个,这是 GPU 厂商划分产品线的主要手段。
zhangfeng1133
3 天前
人工智能
·
深度学习
·
语言模型
·
gpu算力
·
芯片
2021-2026 年全球 传统厂家AI 算力卡 GPU 前沿技术研究报告
由ai生成,内容不一定准确(以下是基于上述三轮审稿意见修改后的完整报告)我已完成三轮审读。以下是详细的审稿意见,随后提供修改后的全文。
算力视野
4 天前
服务器
·
人工智能
·
gpu算力
GPU、NPU、TPU有什么区别?
GPU(Graphics Processing Unit,图形处理器),最初是用来处理电脑游戏画面的。
浪飘
4 天前
docker
·
kubernetes
·
gpu算力
K8S场景下:华为NPU+基于HAMI VNPU能力整体介绍
最近把HAMI vnpu的软硬切分能力测完了,写一篇整体的介绍,最主要的结论是当前vnpu的能力都无法直接用到生产,本身能力与周边可靠性、可观测性等能力缺失太多。
zhangfeng1133
4 天前
人工智能
·
语言模型
·
架构
·
transformer
·
gpu算力
ai算力卡,Tenstorrent 公司Jim Keller 和 Ljubisa Bajic的故事,taals公司
这里有一个常见的误解需要澄清:Jim Keller 和 Ljubisa Bajic 并没有"一起成立"公司。Tenstorrent 是 Bajic 创立的,Keller 是后来加入的第一个投资人和高管。
zhangfeng1133
4 天前
人工智能
·
语言模型
·
transformer
·
gpu算力
·
芯片
非传统架构 AI 算力卡前沿研究报告:技术痛点、破局路2021-2026
我已完成三轮审核(事实核查、逻辑结构、语言规范),发现原文存在1处重大事实错误、多处数据存疑、若干术语及格式问题。以下是修改后的完整报告:
算力视野
6 天前
人工智能
·
gpu算力
AMD Instinct MI325X/MI350X路线图深度解析:288GB HBM3e如何硬刚英伟达?
AMD宣布Instinct GPU一年一更,与英伟达同步节奏——GPU军备竞赛进入"双雄对撞"新阶段。
哈泽尔都
6 天前
c++
·
python
·
算法
·
决策树
·
贪心算法
·
机器人
·
gpu算力
运动控制教学——5分钟学会力控算法(阻抗/导纳/力位混合)
传统机器人控制的目标很单纯:让末端执行器准确到达某个位置。这在搬运、焊接这类"不碰东西"的任务里没问题。
yumgpkpm
7 天前
sql
·
华为
·
langchain
·
json
·
ai编程
·
ai写作
·
gpu算力
华为HUAWEI昇腾910B下千问Qwen3.6-27B在的推理加速实践
千问Qwen3.6-27B在华为昇腾910B下的推理加速实践华为HUAWEI昇腾910B下千问Qwen3.6-27B在的推理加速实践
活跃的煤矿打工人
7 天前
人工智能
·
语言模型
·
gpu算力
【星海出品】大模型微调-Part-One
LoRA (Low-Rank Adaptation of Large Language Model) 大规模语言模型的低秩适应 低秩: 指矩阵的秩远小于其行数和列数,意味着数据中存在大量冗余信息 。
有来有去9527
10 天前
人工智能
·
语言模型
·
gpu算力
【模型评测】SWE-bench Verified数据集-2-修复精度偏离
可以直接修改 swebench.yaml 中的 system_template 和 instance_template。项目里已经提供了不同风格的配置供参考:
Akamai中国
10 天前
人工智能
·
云计算
·
gpu算力
·
云服务
针对 Akamai Cloud 上的 NVIDIA RTX Pro 6000 Blackwell 进行基准测试
基准测试显示,Akamai Cloud 上运行的 NVIDIA RTX PRO™ 6000 Blackwell 的推理吞吐量最高可达 H100 的 1.63 倍;在 100 个并发请求下,每台服务器的处理能力高达 24,240 TPS。
生成论实验室
11 天前
人工智能
·
深度学习
·
机器人
·
自动驾驶
·
gpu算力
算力时代结束,判断力时代开始
当前AI有一个默认的信仰:算力决定一切。参数越大越好,数据越多越好,GPU越多越好。这个信仰正在逼近它的边界。训练一个前沿大模型的成本已达数亿甚至数十亿美元,而能力提升的边际效应越来越小。更大的模型没有解决幻觉问题。更大的模型没有解决安全脆弱性问题。更大的模型没有让AI变得更可靠。
算力百科小星
12 天前
gpu算力
云GPU环境配置:PyTorch/TensorFlow安装避
2026年的今天,CUDA版本不匹配仍是开发者最常遇到的“拦路虎”。这种问题的根源:本地开发环境可能基于Windows+CUDA 11.7,而云服务器可能是Linux+CUDA 12.0,导致动态链接库不兼容。两个小时的宝贵时间浪费在解决依赖冲突上,太不值。
码农阿强
12 天前
人工智能
·
ai
·
aigc
·
ai编程
·
gpu算力
OpenCode 快速配置指南:三步完成部署与接口对接
把大象装进冰箱仅需3步,opencode 配置也是如此官方文档,使用nodejshttps://opencode.ai/docs/providers/