推理PyTorch模型的方法

第一章 图像领域

1.1 深度学习算法模型

  • YOLOx
  • FastRCNN
  • SSD
  • VIT Transform
  • Mask RCNN
  • 图像分类系类算法

1.2 推理框架

  • opencv的DNN模块
  • TensorRT
  • OpenVINO
  • ONNX Runtime C++

第二章 音频领域

2.1 深度学习算法模型

  • Zipformer

  • Paraformer

  • Whisper(基于 Transformer 架构的深度学习模型,能够将语音转换为文本,支持多种语言的语音识别、语音翻译和语言识别任务)

  • VITS

2.2 推理框架

  • sherpa-onnx(就像 TensorRT 或 OpenVINO 是推理引擎一样,Sherpa-ONNX 是专为语音任务优化的推理引擎

参考资料

语音大模型概述

相关推荐
RoyLin1 小时前
沉睡三十年的标准:HTTP 402、生成式 UI 与智能体原生软件的时代
人工智能
needn3 小时前
TRAE为什么要发布SOLO版本?
人工智能·ai编程
毅航3 小时前
自然语言处理发展史:从规则、统计到深度学习
人工智能·后端
前端付豪4 小时前
LangChain链 写一篇完美推文?用SequencialChain链接不同的组件
人工智能·python·langchain
ursazoo4 小时前
写了一份 7000字指南,让 AI 帮我消化每天的信息流
人工智能·开源·github
曲幽4 小时前
FastAPI实战:打造本地文生图接口,ollama+diffusers让AI绘画更听话
python·fastapi·web·cors·diffusers·lcm·ollama·dreamshaper8·txt2img
老赵全栈实战5 小时前
Pydantic配置管理最佳实践(一)
python
_志哥_7 小时前
Superpowers 技术指南:让 AI 编程助手拥有超能力
人工智能·ai编程·测试
YongGit8 小时前
OpenClaw 本地 AI 助手完全指南:飞书接入 + 远程部署实战
人工智能
程序员鱼皮9 小时前
斯坦福大学竟然开了个 AI 编程课?!我已经学上了
人工智能·ai编程