推理PyTorch模型的方法

第一章 图像领域

1.1 深度学习算法模型

  • YOLOx
  • FastRCNN
  • SSD
  • VIT Transform
  • Mask RCNN
  • 图像分类系类算法

1.2 推理框架

  • opencv的DNN模块
  • TensorRT
  • OpenVINO
  • ONNX Runtime C++

第二章 音频领域

2.1 深度学习算法模型

  • Zipformer

  • Paraformer

  • Whisper(基于 Transformer 架构的深度学习模型,能够将语音转换为文本,支持多种语言的语音识别、语音翻译和语言识别任务)

  • VITS

2.2 推理框架

  • sherpa-onnx(就像 TensorRT 或 OpenVINO 是推理引擎一样,Sherpa-ONNX 是专为语音任务优化的推理引擎

参考资料

语音大模型概述

相关推荐
光泽雨5 分钟前
检测阈值 匹配阈值分析 金字塔
图像处理·人工智能·计算机视觉·机器视觉·smart3
Σίσυφος190013 分钟前
PCL 法向量估计-PCA邻域点(经典 kNN 协方差)的协方差矩阵
人工智能·线性代数·矩阵
小鸡吃米…28 分钟前
机器学习的商业化变现
人工智能·机器学习
青春不朽51230 分钟前
Scrapy框架入门指南
python·scrapy
sali-tec30 分钟前
C# 基于OpenCv的视觉工作流-章22-Harris角点
图像处理·人工智能·opencv·算法·计算机视觉
2的n次方_32 分钟前
ops-math 极限精度优化:INT8/INT4 基础运算的底层指令集映射与核函数复用
人工智能
AI袋鼠帝34 分钟前
Claude4.5+Gemini3 接管电脑桌面,这回是真无敌了..
人工智能·windows·aigc
Lun3866buzha39 分钟前
农业害虫检测_YOLO11-C3k2-EMSC模型实现与分类识别_1
人工智能·分类·数据挖掘
方见华Richard1 小时前
世毫九量子原住民教育理念全书
人工智能·经验分享·交互·原型模式·空间计算
忆~遂愿1 小时前
GE 引擎进阶:依赖图的原子性管理与异构算子协作调度
java·开发语言·人工智能