技术栈

音频大模型

浩哥依然
4 个月前
tts·语音生成·音频大模型·语音生成大模型·mega-tts2
【论文笔记之 Mega-TTS2】Boosting Prompting Mechanisms For Zero-Shot Speech Synthesis本文对 Ziyue Jiang 等人于 2024 年发表的论文进行简单地翻译。如有表述不当之处欢迎批评指正。欢迎任何形式的转载,但请务必注明出处。
带电的小王
5 个月前
android·智能手机·llm·whisper·音频大模型·whisper.cpp
whisper.cpp: Android端测试 -- Android端手机部署音频大模型以下是经实验验证可行的环境参考,也可尝试其他版本。(1)PC:Ubuntu 22.04.4(2)硬件设备:Android 手机
带电的小王
5 个月前
llm·whisper·音视频·音频大模型
whisper.cpp: PC端测试 -- 电脑端部署音频大模型以下是经实验验证可行的环境参考,也可尝试其他版本。(1)PC:Ubuntu 22.04.4(2)软件环境:如下表所示