ai推理

brave and determined4 小时前
人工智能·算法·机器学习·ai实战·昇腾ai·ai推理·实战记录
CANN训练营 学习(day8)昇腾大模型推理调优实战指南训练营简介报名链接https://www.hiascend.com/developer/activities/cann20252#cann-camp-2502-intro
云雾J视界2 天前
fpga开发·边缘计算·gpu·vitis·ai推理·azure云·异构编程
FPGA在AI时代的角色重塑:硬件可重构性与异构计算的完美结合截至2025年,半导体行业已普遍接受一个不可逆的事实:晶体管微缩带来的性能红利正在枯竭。台积电3nm工艺的每晶体管成本不降反升,而2nm以下制程面临量子隧穿、原子级制造等物理极限。国际器件与系统路线图(IRDS)明确指出,未来十年算力增长将主要依赖架构创新而非制程微缩。
DO_Community3 天前
运维·服务器·人工智能·llm·aigc·ai推理
NVIDIA HGX™ B300 GPU Droplet 服务器,即将上线DigitalOcean 云平台!人工智能正以史无前例的速度演进,新的模型和繁重的负载不断突破可能的边界。从复杂的大型语言模型(LLM)到精密的科学模拟,开发者与企业都需要获得最强大、最高效的算力基础设施。在 DigitalOcean,我们致力于提供顶级的算力资源,让你的团队能够以简单且经济的方式构建、部署并扩展 AI 项目。因此,我们激动地宣布:即将推出由 NVIDIA HGX™ B300 加速的 GPU Droplets,这标志着我们 GPU 产品的一次重大升级。目前,中国区及亚太企业可与 DigitalOcean 中国区独家战略合作
DO_Community16 天前
人工智能·开源·aigc·音视频·教程·ai推理
开源视频生成新标杆:美团LongCat Video全面解析与实战指南今年涌现了大量新的视频模型,可以说 2025 年是视频建模真正主导公众对 AI 技术兴趣的第一年。随着 Sora 2 的普及,这一点变得越来越清晰。得益于 OpenAI 的一系列移动应用程序,获取视频生成工具的可能性与普及度达到了前所未有的高度。但闭源模型并非本文的重点,而这些模型的开源竞争实际上正变得比以往任何时候都更加令人印象深刻。
逻极23 天前
物联网·边缘计算·实时数据处理·ai推理
边缘计算实战:物联网实时数据处理延迟降低65%的架构演进从云端到边缘,我们如何解决数千设备并发下的数据处理瓶颈去年我们团队接手了一个智慧工厂项目,2000多个传感器每秒钟产生数万条数据。最初的云端集中处理架构在高并发时延迟飙升到5-8秒,产线实时监控几乎瘫痪。更糟的是,网络抖动导致15%的数据丢失,质量控制形同虚设。
DO_Community2 个月前
人工智能·aigc·ai编程·ai推理
AI 推理 GPU 选型指南:从 A100 到 L40S 再看 RTX 4000 Ada在当今 AI 推理部署场景中,选择合适的 GPU 已经不仅是“买最强”的问题,而是“任务-匹配 + 预算-优化”的问题。尤其对于高校课题组、研究机构、大模型服务提供商或出海企业而言,一张 GPU 卡既要支撑效率,也要兼顾成本、功耗、稳定性与服务质量。
Hi202402177 个月前
嵌入式·rk3588·vulkan·ai推理·armnn
RK3588 ArmNN CPU/GPU ResNet50 FP32/FP16/INT8 推理测试本文在RK3588芯片上完成了以下任务:输出输出输出输出输出输出输出输出
我是有底线的