推理PyTorch模型的方法

第一章 图像领域

1.1 深度学习算法模型

  • YOLOx
  • FastRCNN
  • SSD
  • VIT Transform
  • Mask RCNN
  • 图像分类系类算法

1.2 推理框架

  • opencv的DNN模块
  • TensorRT
  • OpenVINO
  • ONNX Runtime C++

第二章 音频领域

2.1 深度学习算法模型

  • Zipformer

  • Paraformer

  • Whisper(基于 Transformer 架构的深度学习模型,能够将语音转换为文本,支持多种语言的语音识别、语音翻译和语言识别任务)

  • VITS

2.2 推理框架

  • sherpa-onnx(就像 TensorRT 或 OpenVINO 是推理引擎一样,Sherpa-ONNX 是专为语音任务优化的推理引擎

参考资料

语音大模型概述

相关推荐
灵机一物几秒前
灵机一物AI原生电商小程序、PC端(已上线)-OpenAI 模型推翻离散几何核心猜想:AI 首次证明人类错了
人工智能
Tony Bai几秒前
AI 编码胜率榜:Go 与 Rust 完胜 C++
人工智能
数字时代全景窗1 分钟前
从OpenClaw、Palantir、SpaceX,看颠覆式创新的四个层次(5)传统财务模型的局限
大数据·人工智能·架构·软件工程
code_pgf1 分钟前
sVLM在资源受限环境中的应用案例
人工智能·深度学习·架构
多年小白2 分钟前
复盘】2026年5月21日(周四)
大数据·人工智能·ai·金融·区块链
南屹川2 分钟前
【并发编程】Python异步编程实战:从协程到异步框架
人工智能
BU摆烂会噶3 分钟前
【LangGraph】House_Agent 实战(四):预定流程 —— 中断与人工干预
android·人工智能·python·langchain
AI玫瑰助手3 分钟前
Python运算符:比较运算符(等于不等等于大于小于)与返回值
android·开发语言·python
AI技术控4 分钟前
LangChain 是什么?从零开始学会 LangChain 的工程实践指南
人工智能·语言模型·自然语言处理·langchain·nlp
陈天伟教授5 分钟前
图解人工智能(32)深度学习前沿
人工智能·深度学习