推理PyTorch模型的方法

姓刘的哦2026-01-14 8:33

第一章图像领域

1.1 深度学习算法模型

YOLOx
FastRCNN
SSD
VIT Transform
Mask RCNN
图像分类系类算法

1.2 推理框架

opencv的DNN模块
TensorRT
OpenVINO
ONNX Runtime C++

第二章音频领域

2.1 深度学习算法模型

Zipformer
Paraformer
Whisper(基于 Transformer 架构的深度学习模型，能够将语音转换为文本，支持多种语言的语音识别、语音翻译和语言识别任务)
VITS

2.2 推理框架

sherpa-onnx（就像 TensorRT 或 OpenVINO 是推理引擎一样，Sherpa-ONNX 是专为语音任务优化的推理引擎）

参考资料

语音大模型概述

上一篇：在AI时代，重写网络的角色

下一篇：秋招篇—某云厂商后台开发岗二面面经（问题+答案）版

热门推荐

01GitHub 镜像站点 02【OpenClaw 本地实战 Ep.3】突破瓶颈：强制修改 openclaw.json 解锁 32k 上下文记忆 03OpenClaw 使用和管理 MCP 完全指南 04OpenClaw + 飞书（Feishu）环境搭建指南 05Clawdbot部署教程：解决‘gateway token missing’授权问题的完整步骤 06Window 10部署openclaw报错node.exe : npm error code 128 07OpenClaw优化飞书API 额度已耗尽问题 08Claude Code + GLM4.7 避坑指南：解决 Unable to connect to Anthropic services 09OpenClaw大龙虾机器人完整安装教程 10OpenClaw 接入阿里云百炼 Coding Plan 指南