FishSpeech应用篇——专属朗读人

背景

FishSpeech部署教程参见:使用FishSpeech进行语音合成推理 - 天命小猪 - 博客园
部署好之后,就能够基于推理来定制自己专属朗读人。编程能力强的小伙伴可以结合AI定制一个自己的私人助理,直接语音对话。
不想变成的小伙伴,可以通过快捷插件调用tts接口来朗读电脑上所见。

方案

使用Quicker软件 您的指尖工具箱 - Quicker,其自带的插件和自定义编程能力让调用并播放推理语音变为可能。

步骤

  1. 下载软件并安装:下载 - Quicker
  2. 软件免费但是需要注册登录。
    1. 注册时可以填写推荐码,推荐码填写后在购买时,双方都可以增加时长。详见:推荐码 - Quicker
  3. 复制分享的动作,然后粘贴至Quicker中。
  4. 地址:语音朗读 - by 天命小猪 - 动作信息 - Quicker, 本动作页面右侧会有复制

  5. 设置接口地址、参考ID等。默认访问本地,如果要跨网访问,可以通过FRP等内网穿透工具映射至公网IP。

  6. 保存设置后可以在浏览器选中文本,弹出面板进行语音朗读。
  7. 使用流式输出适合大段文本的朗读。注意目前只支持wav格式的流式输出,勾选streaming后需要设置format为wav。
  8. 此动作也适用于文本编辑器之类的软件,可以粘贴到默认中。
相关推荐
刺猬的温驯4 天前
Flow Matching 训练的输入分布问题:从 VAE Latent 统计性质到归一化工程实践——以 VoxFlash-TTS 为例
人工智能·语音合成·tts
刺猬的温驯11 天前
语音克隆模型的难点之一:音素对齐及交叉注意力早期失效问题 (兼论旋转位置编码)——F5-TTS、SupertonicTTS、VoxFlash-TTS 对比
人工智能·语音合成·tts
武子康19 天前
调查研究-173 MOSS-TTS 调查:开源 TTS 正在从“朗读器“走向声音生成系统
人工智能·ai·chatgpt·claude·tts·minimax
kaixinshier21 天前
【无标题】
大模型·人机交互·语音识别·tts·s100p
MageGojo1 个月前
基于 API Zero 平台集成 TTS 语音合成服务的技术实践
python·语音合成·tts·restful api·api集成
chenying9981791 个月前
掩码扩散语音克隆:参考音频为什么会被噪声“污染“?
人工智能·音视频·语音合成
chenying9981791 个月前
扩散模型语音克隆:参考音频注入的五种方式
人工智能·音视频·语音合成
Soari1 个月前
GitHub 开源项目解析:OpenBMB/VoxCPM —— Tokenizer-Free 多语言语音合成与声音克隆模型
开源·github·语音合成·tts·多语言语音生成