推理PyTorch模型的方法

第一章 图像领域

1.1 深度学习算法模型

  • YOLOx
  • FastRCNN
  • SSD
  • VIT Transform
  • Mask RCNN
  • 图像分类系类算法

1.2 推理框架

  • opencv的DNN模块
  • TensorRT
  • OpenVINO
  • ONNX Runtime C++

第二章 音频领域

2.1 深度学习算法模型

  • Zipformer

  • Paraformer

  • Whisper(基于 Transformer 架构的深度学习模型,能够将语音转换为文本,支持多种语言的语音识别、语音翻译和语言识别任务)

  • VITS

2.2 推理框架

  • sherpa-onnx(就像 TensorRT 或 OpenVINO 是推理引擎一样,Sherpa-ONNX 是专为语音任务优化的推理引擎

参考资料

语音大模型概述

相关推荐
Deepoch9 分钟前
Deepoc VLA开发板:采摘机器人的环境鲁棒作业与不确定性应对
人工智能·机器人·采摘机器人·deepoc
云栖梦泽在27 分钟前
AI安全专项:AI人脸识别的安全风险与防护
人工智能·安全
欧阳天羲33 分钟前
【开源资料】AI激光灭蚊机器人|YOLOv8数据集标注模板+完整训练配置文件一键拿走(适配ESP32-S3/树莓派双版本)
人工智能·机器人·开源
Dust-Chasing43 分钟前
Claude Code源码剖析 - Claude Code 上下文压缩机制
人工智能·python·ai
甲维斯1 小时前
MiMo Code 初体验,免费,易上手,适合新手!
人工智能
2301_764441331 小时前
主流手机pc品牌的端侧模型部署梳理
人工智能·windows·机器学习·智能手机·产品运营
虾壳云智能1 小时前
阿里云百炼 API 配置 OpenClaw 2.7.9 环境搭建
人工智能·阿里云百炼·open claw安装·open claw教程
Xzh04231 小时前
AI Agent 学习路线(Java 后端方向)
java·人工智能·学习
醒醒该学习了!2 小时前
视觉与声音大模型(理论篇)
人工智能