gpu算力

ZStack开发者社区7 小时前
服务器·云计算·gpu算力
VMware替代:从POC通过到生产可用,差距在哪里博通停售、国产化死线临近,选型误区正在让替代项目付出额外代价。VMware的核心价值从来不只是虚拟机调度。vSphere生态二十年积累的,是一套完整的运维体系:vCenter统一管理、vMotion热迁移、DRS动态资源调度、HA高可用、NSX网络虚拟化、vSAN存储融合——这些能力彼此咬合,构成了企业数据中心的运转底座。
zhangfeng113310 小时前
人工智能·深度学习·安全·语言模型·gpu算力·芯片
那nvidia orim车载gpu tee安全飞地 和天垓 100 gpgpu的 飞地 ,大概有多大存储量 ,解密流程前提说明:英伟达 DRIVE Orin 与天数智芯天垓100 是两类完全不同的芯片。Orin 是车载 SoC(单片集成 CPU+GPU+安全引擎),天垓100 是数据中心 PCIe GPGPU 加速卡(需配合外部 CPU 使用)。两者的安全架构无法直接套用同一模板,必须分情况讨论。
zhangfeng113312 小时前
人工智能·分布式·安全·transformer·gpu算力·芯片
天数智芯天垓 100 加密大模型分布式部署安全方案ai生成,不一定准确本方案针对企业用户在天数智芯天垓 100 通用 GPU 集群上部署加密大语言模型的核心安全需求——重点解决模型参数被窃取、推理过程数据泄露、分布式计算环节安全防护不足三大风险,基于天垓 100 的硬件级安全能力与 FlagOS 国产统一异构软件栈,量身设计了一套"密文存储-可信传输-密文分片计算-闭环验证"全链路加密的分布式部署架构。
zhangfeng113318 小时前
人工智能·深度学习·语言模型·架构·机器人·gpu算力·芯片
把权重写死在芯片的架构 Taalas(HC1)芯片:车载 GPU / 智能驾驶 / 机器人 / 算力卡适配总结Taalas 不是通用GPU,是模型硬连线ASIC专用推理芯片(一芯片绑定一个固定大模型,HC1原生固化Llama3.1-8B),细分场景高度适配、全场景无法替代通用车载GPU,分三大场景拆解:
goodluckyaa1 天前
架构·gpu算力
NVIDIAGPU 架构中的不变常量(宏观 → 微观)这一层几乎没有不变的常量。 GPU 芯片的 SM 总数、GPC 总数、L2 缓存大小,都随架构和型号剧烈变化。旗舰卡可能有 128 个 SM,入门卡可能只有 20 个,这是 GPU 厂商划分产品线的主要手段。
zhangfeng11331 天前
人工智能·深度学习·语言模型·gpu算力·芯片
2021-2026 年全球 传统厂家AI 算力卡 GPU 前沿技术研究报告由ai生成,内容不一定准确(以下是基于上述三轮审稿意见修改后的完整报告)我已完成三轮审读。以下是详细的审稿意见,随后提供修改后的全文。
算力视野2 天前
服务器·人工智能·gpu算力
GPU、NPU、TPU有什么区别?GPU(Graphics Processing Unit,图形处理器),最初是用来处理电脑游戏画面的。
浪飘2 天前
docker·kubernetes·gpu算力
K8S场景下:华为NPU+基于HAMI VNPU能力整体介绍最近把HAMI vnpu的软硬切分能力测完了,写一篇整体的介绍,最主要的结论是当前vnpu的能力都无法直接用到生产,本身能力与周边可靠性、可观测性等能力缺失太多。
zhangfeng11332 天前
人工智能·语言模型·架构·transformer·gpu算力
ai算力卡,Tenstorrent 公司Jim Keller 和 Ljubisa Bajic的故事,taals公司这里有一个常见的误解需要澄清:Jim Keller 和 Ljubisa Bajic 并没有"一起成立"公司。Tenstorrent 是 Bajic 创立的,Keller 是后来加入的第一个投资人和高管。
zhangfeng11332 天前
人工智能·语言模型·transformer·gpu算力·芯片
非传统架构 AI 算力卡前沿研究报告:技术痛点、破局路2021-2026我已完成三轮审核(事实核查、逻辑结构、语言规范),发现原文存在1处重大事实错误、多处数据存疑、若干术语及格式问题。以下是修改后的完整报告:
算力视野3 天前
人工智能·gpu算力
AMD Instinct MI325X/MI350X路线图深度解析:288GB HBM3e如何硬刚英伟达?AMD宣布Instinct GPU一年一更,与英伟达同步节奏——GPU军备竞赛进入"双雄对撞"新阶段。
哈泽尔都4 天前
c++·python·算法·决策树·贪心算法·机器人·gpu算力
运动控制教学——5分钟学会力控算法(阻抗/导纳/力位混合)传统机器人控制的目标很单纯:让末端执行器准确到达某个位置。这在搬运、焊接这类"不碰东西"的任务里没问题。
yumgpkpm5 天前
sql·华为·langchain·json·ai编程·ai写作·gpu算力
华为HUAWEI昇腾910B下千问Qwen3.6-27B在的推理加速实践千问Qwen3.6-27B在华为昇腾910B下的推理加速实践华为HUAWEI昇腾910B下千问Qwen3.6-27B在的推理加速实践
活跃的煤矿打工人5 天前
人工智能·语言模型·gpu算力
【星海出品】大模型微调-Part-OneLoRA (Low-Rank Adaptation of Large Language Model) 大规模语言模型的低秩适应 低秩: 指矩阵的秩远小于其行数和列数,意味着数据中存在大量冗余信息 。
有来有去95278 天前
人工智能·语言模型·gpu算力
【模型评测】SWE-bench Verified数据集-2-修复精度偏离可以直接修改 swebench.yaml 中的 system_template 和 instance_template。项目里已经提供了不同风格的配置供参考:
Akamai中国8 天前
人工智能·云计算·gpu算力·云服务
针对 Akamai Cloud 上的 NVIDIA RTX Pro 6000 Blackwell 进行基准测试基准测试显示,Akamai Cloud 上运行的 NVIDIA RTX PRO™ 6000 Blackwell 的推理吞吐量最高可达 H100 的 1.63 倍;在 100 个并发请求下,每台服务器的处理能力高达 24,240 TPS。
生成论实验室9 天前
人工智能·深度学习·机器人·自动驾驶·gpu算力
算力时代结束,判断力时代开始当前AI有一个默认的信仰:算力决定一切。参数越大越好,数据越多越好,GPU越多越好。这个信仰正在逼近它的边界。训练一个前沿大模型的成本已达数亿甚至数十亿美元,而能力提升的边际效应越来越小。更大的模型没有解决幻觉问题。更大的模型没有解决安全脆弱性问题。更大的模型没有让AI变得更可靠。
算力百科小星9 天前
gpu算力
云GPU环境配置:PyTorch/TensorFlow安装避2026年的今天,CUDA版本不匹配仍是开发者最常遇到的“拦路虎”。这种问题的根源:本地开发环境可能基于Windows+CUDA 11.7,而云服务器可能是Linux+CUDA 12.0,导致动态链接库不兼容。两个小时的宝贵时间浪费在解决依赖冲突上,太不值。
码农阿强10 天前
人工智能·ai·aigc·ai编程·gpu算力
OpenCode 快速配置指南:三步完成部署与接口对接把大象装进冰箱仅需3步,opencode 配置也是如此官方文档,使用nodejshttps://opencode.ai/docs/providers/
xingyuzhisuan11 天前
服务器·运维开发·远程工作·gpu算力
企业级GPU算力远程部署:标准化访问配置与性能调优手册随着人工智能训练、大数据仿真、三维渲染等业务规模化落地,企业与研发团队对GPU算力资源的复用效率要求持续提升。据行业公开数据显示,2025年国内中小科技企业GPU服务器闲置率均值达32%,核心原因集中在远程访问配置不规范、连接稳定性不足、权限管控缺失三个维度。标准化的远程访问配置,可实现跨地域算力调度、设备集中运维、资源按需分配,是释放GPU服务器算力价值的核心基础。本文结合通用技术标准与落地实操经验,梳理完整的GPU服务器远程访问配置流程、参数规范、故障排查及优化方案,同时结合星宇智算标准化算力服务体系