推理PyTorch模型的方法

第一章 图像领域

1.1 深度学习算法模型

  • YOLOx
  • FastRCNN
  • SSD
  • VIT Transform
  • Mask RCNN
  • 图像分类系类算法

1.2 推理框架

  • opencv的DNN模块
  • TensorRT
  • OpenVINO
  • ONNX Runtime C++

第二章 音频领域

2.1 深度学习算法模型

  • Zipformer

  • Paraformer

  • Whisper(基于 Transformer 架构的深度学习模型,能够将语音转换为文本,支持多种语言的语音识别、语音翻译和语言识别任务)

  • VITS

2.2 推理框架

  • sherpa-onnx(就像 TensorRT 或 OpenVINO 是推理引擎一样,Sherpa-ONNX 是专为语音任务优化的推理引擎

参考资料

语音大模型概述

相关推荐
岛雨QA2 小时前
Skill学习指南🧑‍💻
人工智能·agent·ai编程
zh路西法2 小时前
【宇树机器人强化学习】(七):复杂地形的生成与训练
python·深度学习·机器学习·机器人
波动几何2 小时前
从人性到无名:一条向内的觉悟之路
人工智能
python猿2 小时前
打卡Python王者归来--第30天
开发语言·python
EllenLiu2 小时前
架构演进与性能压榨:在金融 RAG 中引入条款森林 (FoC)
人工智能·架构
2401_831824962 小时前
为你的Python脚本添加图形界面(GUI)
jvm·数据库·python
2401_879693872 小时前
用Pygame开发你的第一个小游戏
jvm·数据库·python
用户0332126663672 小时前
使用 Python 查找并高亮 Word 文档中的文本
python
IT_陈寒2 小时前
深入理解JavaScript:核心原理与最佳实践
前端·人工智能·后端
xushichao19892 小时前
实战:用OpenCV和Python进行人脸识别
jvm·数据库·python