深度学习推理框架汇总

深度学习推理框架汇总

  • TensorFlow Serving:TensorFlow Serving 是 TensorFlow 的官方模型服务框架,专门用于部署 TensorFlow 模型。它提供了高性能、可扩展、灵活的模型部署和推理服务。

  • TorchServe:TorchServe 是 PyTorch 官方推出的模型服务框架,用于部署 PyTorch 模型。它支持灵活的模型部署、动态扩缩容、模型版本控制等功能。

  • ONNX Runtime:ONNX Runtime 是一个高性能的推理引擎,专门用于执行 ONNX 格式的模型。它支持跨平台部署,包括 CPU、GPU、移动设备等,并提供了 C++、Python 和 Java 等多种语言的 API。

  • TensorRT:TensorRT 是 NVIDIA 推出的高性能推理引擎,专门针对 NVIDIA GPU 进行了优化。它支持对 TensorFlow、PyTorch、ONNX 等模型进行优化和部署。

  • OpenVINO (Open Visual Inference & Neural Network Optimization):OpenVINO 是英特尔推出的深度学习推理工具包,支持针对英特尔 CPU、GPU、VPU(Vision Processing Unit)等硬件进行优化的推理。

  • TensorRTX:TensorRTX 是英伟达推出的一款基于 TensorRT 的深度学习推理框架,提供了更多的优化和扩展功能,适用于高性能和低延迟的推理需求。

  • NCNN (NVIDIA CUDA Convolutional Neural Networks):NCNN 是一个高效的深度学习推理框架,专门针对移动端和嵌入式设备进行了优化,支持多种硬件平台。

  • MNN (Mobile Neural Network):MNN 是阿里巴巴推出的移动端深度学习推理引擎,支持多种模型格式,并且适用于 Android、iOS 等移动设备。

相关推荐
用户6915811416542 分钟前
Ascend Extension for PyTorch的源码解析
人工智能
用户691581141651 小时前
Ascend C的编程模型
人工智能
-Nemophilist-1 小时前
机器学习与深度学习-1-线性回归从零开始实现
深度学习·机器学习·线性回归
成富2 小时前
文本转SQL(Text-to-SQL),场景介绍与 Spring AI 实现
数据库·人工智能·sql·spring·oracle
CSDN云计算2 小时前
如何以开源加速AI企业落地,红帽带来新解法
人工智能·开源·openshift·红帽·instructlab
艾派森2 小时前
大数据分析案例-基于随机森林算法的智能手机价格预测模型
人工智能·python·随机森林·机器学习·数据挖掘
hairenjing11232 小时前
在 Android 手机上从SD 卡恢复数据的 6 个有效应用程序
android·人工智能·windows·macos·智能手机
小蜗子2 小时前
Multi‐modal knowledge graph inference via media convergenceand logic rule
人工智能·知识图谱
SpikeKing2 小时前
LLM - 使用 LLaMA-Factory 微调大模型 环境配置与训练推理 教程 (1)
人工智能·llm·大语言模型·llama·环境配置·llamafactory·训练框架
黄焖鸡能干四碗3 小时前
信息化运维方案,实施方案,开发方案,信息中心安全运维资料(软件资料word)
大数据·人工智能·软件需求·设计规范·规格说明书