技术栈
gpu算力
湘问海
11 小时前
gpu算力
算力租赁网站
记录一下,一个常用的gpu租赁平台 英博云 。相对别的平台来说,支持我使用k8s进行部署。使用kubeconfig,通过kubectl操作资源。 当然,相比别的k8s平台,这是个超轻量的,没有具体的host node可以操作,但是执行kubeflow这些crd定义的资源是绰绰有余的。
GMICLOUD
1 天前
gpu算力
·
出海
·
ai原生
·
ai基础设施
AICon 演讲精华 | GMI Cloud 深度解析全球化场景下的跨云异构 MaaS 平台实践
摘要12 月 19 日 -20 日,AICon 大会在北京圆满落地。在这场面向 AI 资深开发者的大会上,GMI Cloud 资深架构师汪小康受邀参加,并进行了主题分享,本文为演讲内容精华整理。
DARLING Zero two♡
2 天前
华为
·
gpu算力
·
vllm
0-Day 极速响应:基于 vLLM-Ascend 在昇腾 NPU 上部署 Qwen2.5 的实战避坑指南
资源导航:https://atomgit.com/Ascendhttps://ai.gitcode.com/ascend-tribe/openPangu-Ultra-MoE-718B-V1.1?source_module=search_result_model (建议关注昇腾社区活动或 GitCode/ModelArts 提供的体验实例)
DARLING Zero two♡
5 天前
华为
·
llama
·
gpu算力
拒绝“环境劝退”:Llama-2-7b 在昇腾 NPU 上的工程化部署与深度故障排查实录
资源导航:昇腾模型开源社区 : https://atomgit.com/Ascend免费算力申请 : https://ai.gitcode.com/ascend-tribe/openPangu-Ultra-MoE-718B-V1.1?source_module=search_result_model (建议关注昇腾社区活动或 GitCode/ModelArts 提供的体验实例)
facaixxx2024
8 天前
运维
·
服务器
·
gpu算力
GPU算力租赁:3080Ti、Tesla P40和RTX40服务器配置整理
UCloud云服务器GPU显卡RTX40、3080Ti和Tesla P40费用表,低至9.9元起,云服务器吧yunfuwuqiba.com整理UCloud优刻得GPU云服务器详细配置及费用:
纪伊路上盛名在
10 天前
ide
·
vscode
·
python
·
编辑器
·
开发工具
·
gpu算力
·
colab
在vscode中使用colab的GPU算力
最近才发现Colab在Vscode出了extension,是官方的拓展!不是之前开源社区的各种工具。Google 在微软官方 Jupyter Extension 基础上开发了 Colab VS Code Extension 扩展,Colab Extension 通过 Kernel 选项将 Notebook 的执行交给 Colab Server。
深耕AI
13 天前
windows
·
经验分享
·
gpu算力
【CUDA安装报错?】Nsight Visual Studio Edition安装失败《终极解决方法》
最近,安装CUDA安装进度条一次次卡在Nsight Visual Studio Edition安装失败的错误提示,我已尝试了网上能找到的所有方法,最终发现了一个被忽略的简单选项。
IT·小灰灰
14 天前
大数据
·
人工智能
·
数据分析
·
云计算
·
音视频
·
gpu算力
AI算力租赁完全指南(一):选卡篇——从入门到精通的GPU选购
欢迎来到小灰灰的博客空间!Weclome you!博客主页:IT·小灰灰爱发电:小灰灰的爱发电 热爱领域:前端(HTML)、后端(PHP)、人工智能、云服务
仪***沿
15 天前
gpu算力
预测算法三:LSTM、EMDKPCALSTM等
预测算法三:LSTM、EMDKPCALSTM等 1、采用基础LSTM、EMDLSTM以及采用EMDKPCALSTM,先对数据进行模态分解,对分解后的IMF分量进行主成分分析,最后利用预测算法进行预测,并将三种算法进行对比 2、算法实际应用效果需要与数据匹配,原始算法采用光伏数据进行测试 3、提供各种调试、指导服务,有想法的可以随时加好友,也可以提供对上述算法的优化改进,比如优化某种参数等
捷智算云服务
20 天前
服务器
·
人工智能
·
云计算
·
gpu算力
A100云主机租赁价格贵吗?具体费用是多少?
A100服务器作为高性能计算资源的代表之一,广泛应用于人工智能、大数据分析、科学计算等高算力领域。其搭载的NVIDIA A100 GPU拥有强大的并行计算能力,能够显著提升模型训练和数据处理效率。对于个人开发者或者企业级用户而言,了解A100服务器云租赁的费用是决定是否选择该服务的重要因素之一。
中杯可乐多加冰
22 天前
华为
·
云原生
·
k8s
·
gpu算力
·
openfuyao
深度解析openFuyao核心组件:从NUMA亲和调度看云原生算力释放新思路
随着 AI 大模型、自动驾驶、实时数据分析、云计算 等技术的爆发式增长,现代计算系统正承受前所未有的算力需求。大模型训练需要 海量矩阵运算 与 高带宽内存;数据中心要处理 实时海量数据流;企业级业务希望在更低成本下获得更高吞吐与更低时延。结果就是:“算力”成为新的生产力核心,CPU/GPU 集群的每一分性能都至关重要。现在算力对于AI发展来说真的是至关重要。
Sinnet-cloud
22 天前
人工智能
·
gpu算力
以AI算力基建赋能中国企业出海新征程 | 光环云香港亮相2025 GIS全球创新峰会
作为香港云服务与AI算力基础设施企业代表,光环云香港受邀出席2025 GIS全球创新展暨全球创新峰会“中国企业出海高峰论坛”,与行业专家和企业嘉宾共同探讨AI算力基础设施赋能中国企业把握出海新机遇。
mit6.824
23 天前
gpu算力
[bak]多线程&cuda
爱刷题的有福了,邻居家的小孩都爱刷😋https://leetgpu.com现在一般都cuda了,感兴趣的可以去看【【NVIDIA】CUDA官方入门课】 https://b23.tv/WX3pPM6前年的课,但是入门还是挺好的,ppt很简练
quantanexus深算工场
23 天前
人工智能
·
ai
·
gpu算力
·
深算工场
·
gpu管理软件
·
ai实训教学平台
Quantanexus(QN)深算工场AI智能调度平台安装
深算工场是一个智能调度平台,实现了AI显卡的智能调度。线上公有云(https://www.hi168.com)
猫头虎
23 天前
开源
·
github
·
aigc
·
ai编程
·
ai写作
·
gpu算力
·
华为snap
openEuler异构算力体系下的GPU加速性能测试与优化研究
随着人工智能技术的快速发展,单一CPU架构已无法满足大规模并行计算需求。异构计算成为提升算力密度的核心路径,而操作系统作为连接硬件与应用的桥梁,其对多样性算力的支持能力直接决定了上层应用的性能表现。openEuler作为面向数字基础设施的开源操作系统,通过内置异构通用内存管理框架(GMEM)、sysHAX异构调度器等创新技术,实现了对x86、ARM、RISC-V等通用架构及GPU、NPU、FPGA等专用加速器的统一纳管。
神算大模型APi--天枢646
23 天前
大数据
·
人工智能
·
科技
·
架构
·
硬件架构
·
gpu算力
国产硬件架构赋能大模型:构建本地化部署的标准化算力服务平台
随着人工智能技术的飞速发展,大模型已成为推动产业智能化升级的核心引擎。然而,高昂的算力成本、数据安全合规要求以及对特定业务场景的深度适配需求,使得企业对大模型的本地化部署需求日益迫切。在此背景下,基于国产硬件架构的大模型算力服务平台应运而生,其核心价值在于提供一套安全可控、高效灵活且具备标准接口的本地化大模型部署与开发解决方案。
有来有去9527
24 天前
人工智能
·
语言模型
·
gpu算力
[模型量化]-大模型量化效果评价-Qwen2.5-72B
本文主要对qwen2.5-72B-Instruct模型的量化效果进行评价,分别从模型精度损失和模型推理服务性能提升两个方面进行评测。
大大da怪i
1 个月前
c++
·
gpu算力
GPU编程之warp级编程
在CPU架构中,线程是独立的调度单位,但GPU为了实现极高的并行度,采用了截然不同的线程管理方式——以Warp(线程束)作为最小执行和调度单元。简单来说,Warp是一组被硬件强制同步执行相同指令的线程集合,其核心定义与特性如下:
神算大模型APi--天枢646
1 个月前
大数据
·
人工智能
·
科技
·
重构
·
架构
·
gpu算力
智能协同与垂直深耕:聚合模型API算力平台重构软件开发生态
在2025年AI技术深度渗透产业的关键节点,聚合模型API算力平台正以“智能中枢”角色重构软件开发生态。这类平台通过标准化接口整合多模型能力、弹性调度算力资源、构建垂直场景知识库,让企业以更低门槛实现AI能力落地,成为数字化转型的核心技术底座。
神算大模型APi--天枢646
1 个月前
大数据
·
人工智能
·
科技
·
架构
·
gpu算力
聚合模型 API 算力平台:前端开发的强劲助力
在当今数字化浪潮汹涌澎湃的时代,前端开发作为构建用户交互界面的关键环节,正面临着前所未有的挑战与机遇。随着人工智能技术的飞速发展,聚合模型 API 算力平台应运而生,为前端开发带来了全新的可能性,成为开发者们手中的一把锐利工具。