技术栈
音频大模型
浩哥依然
17 天前
tts
·
语音生成
·
音频大模型
·
语音生成大模型
·
mega-tts2
【论文笔记之 Mega-TTS2】Boosting Prompting Mechanisms For Zero-Shot Speech Synthesis
本文对 Ziyue Jiang 等人于 2024 年发表的论文进行简单地翻译。如有表述不当之处欢迎批评指正。欢迎任何形式的转载,但请务必注明出处。
带电的小王
1 个月前
android
·
智能手机
·
llm
·
whisper
·
音频大模型
·
whisper.cpp
whisper.cpp: Android端测试 -- Android端手机部署音频大模型
以下是经实验验证可行的环境参考,也可尝试其他版本。(1)PC:Ubuntu 22.04.4(2)硬件设备:Android 手机
带电的小王
1 个月前
llm
·
whisper
·
音视频
·
音频大模型
whisper.cpp: PC端测试 -- 电脑端部署音频大模型
以下是经实验验证可行的环境参考,也可尝试其他版本。(1)PC:Ubuntu 22.04.4(2)软件环境:如下表所示