推理PyTorch模型的方法

第一章 图像领域

1.1 深度学习算法模型

  • YOLOx
  • FastRCNN
  • SSD
  • VIT Transform
  • Mask RCNN
  • 图像分类系类算法

1.2 推理框架

  • opencv的DNN模块
  • TensorRT
  • OpenVINO
  • ONNX Runtime C++

第二章 音频领域

2.1 深度学习算法模型

  • Zipformer

  • Paraformer

  • Whisper(基于 Transformer 架构的深度学习模型,能够将语音转换为文本,支持多种语言的语音识别、语音翻译和语言识别任务)

  • VITS

2.2 推理框架

  • sherpa-onnx(就像 TensorRT 或 OpenVINO 是推理引擎一样,Sherpa-ONNX 是专为语音任务优化的推理引擎

参考资料

语音大模型概述

相关推荐
国服第二切图仔1 小时前
实战:在华为云上快速搭建 openJiuwen Agent 平台,并开发一个“诗词雅集”知识库智能体
人工智能·华为云·智能体·openjiuwen
pangtout2 小时前
在AI时代,重写网络的角色
人工智能
PeterClerk2 小时前
计算机视觉(Computer Vision)领域重要会议及 CCF 等级
人工智能·深度学习·计算机视觉·ccf·计算机会议
4***17542 小时前
Python酷库之旅-第三方库Pandas(051)
开发语言·python·pandas
初学大模型2 小时前
现代大模型数据跟神经网络的若干问题讨论
人工智能·机器人
咚咚王者2 小时前
人工智能之核心基础 机器学习 第十三章 自监督学习
人工智能·学习·机器学习
学海无涯,行者无疆2 小时前
Tauri框架实战——鼠标左键单击托盘图标不显示菜单
人工智能·ai编程·tauri·trae·氛围编程·托盘功能·托盘点击
__如风__2 小时前
国产海光CPU+DCU+麒麟OS上使用Docker成功部署PaddleSpeech实战
pytorch·python·paddlepaddle
liliangcsdn2 小时前
LLM训练中batchsize与过拟合和泛化的关系
人工智能·算法·机器学习