语音

Jiaberrr2 个月前
前端·微信小程序·小程序·语音·录音
手把手教你:微信小程序实现语音留言功能在微信小程序中,语音留言功能为用户提供了便捷的交流方式。本文将带你一步步了解如何在微信小程序中实现语音留言功能。
伊织code3 个月前
gpt·tts·克隆·语音·clone·gpt-sovits·音色
GPT-SoVITS - few shot 声音克隆演示视频 :https://www.bilibili.com/video/BV12g4y1m7Uw未见过的说话者 few-shot 微调演示:
若石之上3 个月前
whisper·openai·参数·语音·文字
语音识别模型whisper的参数说明一、whisper简介:Whisper是一种通用的语音识别模型。它是在各种音频的大型数据集上训练的,也是一个多任务模型,可以执行多语言语音识别、语音翻译和语言识别。
伊织code3 个月前
python·whisper·openai·asr·语音·vad·whisperx
WhisperXWhisperX:具有字级时间戳的自动语音识别(和分类)该存储库提供快速语音识别(70倍实时与big-v2)与字级时间戳和说话人分类。
AI 研究所4 个月前
人工智能·语言模型·机器人·交互·语音
讯飞星火V4.0 发布,全面对标GPT-4 Turbo6月27日,讯飞星火V4.0如期而至,升级成为更懂你的AI助手。七大核心能力持续突破,全面对标GPT-4 Turbo。在8个国际主流测试集中排名第一,讯飞星火以一份惹眼的成绩单,成为国内大模型的先行者。
陌上阳光5 个月前
深度学习·chatgpt·tts·语音
TTS前端原理学习 chatgpt生成答案文章: https://arxiv.org/pdf/2012.15404本文提出了一种基于Distilled BERT模型的统一普通话文本到语音前端模块。该模型通过预训练的中文BERT作为文本编码器,并采用多任务学习技术来适应TTS前端的两个重要任务:韵律结构预测(PSP)和字素到音素转换(G2P)。然后,通过使用TinyBERT的知识蒸馏技术将BERT编码器压缩为更小的模型,使整个模型的大小仅为基准前端模型的25%,同时在两个任务上保持竞争性能。通过这些方法,我们能够以轻量且统一的方式运行整个TTS前端
AI 研究所7 个月前
人工智能·机器人·交互·语音
机器人交互新纪元:讯飞星火大模型引领升级浪潮放眼全球,大模型浪潮从前沿话题到规模落地,传统计划和商业模式正在“重构”。依托大模型的持续迭代与快速升级,从文本生成、图像生成乃至视频生成,AI不断改变工作本质,为产业发展注入“超能量”。 当众多行业还在探索大模型接入时,机器人行业已率先迭代,特别是在人形机器人领域。微软、亚马逊、谷歌、智元机器人、优必选、宇树等科技公司纷纷入局,马斯克公布了大模型加持的Optimus(擎天柱)第二代机器人,OpenAI则与人形机器人初创公司Figure合作推出了Figure 01机器人。
老菜鸟YDZ7 个月前
语音·普通话·男声·女声·粤语·国语
获取自己电脑系统中的语音上述代码能试听你的电脑系统安装的语音种类。考试指令系统下载链接:https://pan.baidu.com/s/11x9fS1gUEPCd6w15KHCxSw?pwd=zvw3 提取码:zvw3
我是Superman丶1 年前
java·微信·音频·语音·silk
【工具】转码silk格式为mp3【工具】转码slk格式为mp3前提 安装 ffmpeg【安装】Linux安装ffmpeg_linux安装ffmpeg4.4_我是Superman丶的博客-CSDN博客
长安紫薯1 年前
前端·语音
黑豹程序员-h5前端录音、播放H5加入录音组件,录音后可以进行播放,并形成录音文件,其采样率固化48000,传言是google浏览器的BUG,它无法改动采样率。 大BUG,目前主流的支持16000hz的采样率。