语音

夜间去看海20 天前
单片机·嵌入式硬件·wifi·定位·语音·储存·闹钟
基于单片机的WIFI、语音、储存、时钟、闹钟、定位系统所有仿真详情导航:PROTEUS专栏说明-CSDN博客目录一、主要功能二、硬件资源三、程序编程四、实现现象
夜间去看海24 天前
单片机·嵌入式硬件·proteus·串口·仿真·语音
51-基于单片机的智能语音识别与处理系统设计目录一、主要功能二、硬件资源三、程序编程四、实现现象基于51单片机,搞L298N驱动两个电机转动,然后搞LCD1602显示屏,弄个超声波传感器实时检测距离 通过LCD1602显示距离,如果距离小于阈值,则两个电机停止,蜂鸣器报警,灯光亮起。如果大于阈值,说明没有障碍物,电机正常运作。有两个按键,一个是自动按键,就是按下后靠超声波来避障。一个是手动按键,按下后,由电脑云端也就模拟语音来控制小车的运转,比如发现0x01,让小车停止运行,发送0x02,让小车正常运行。
Good@dz1 个月前
语音交互·语音·录音
Linux麦克风录音实战在 Linux 上使用麦克风进行录音可以通过多种方式实现,包括使用命令行工具、图形界面应用程序以及编程接口。下面我将介绍几种常见的方法,从简单的命令行工具到使用 PortAudio 库进行编程。
Jiaberrr3 个月前
前端·微信小程序·小程序·语音·录音
手把手教你:微信小程序实现语音留言功能在微信小程序中,语音留言功能为用户提供了便捷的交流方式。本文将带你一步步了解如何在微信小程序中实现语音留言功能。
伊织code5 个月前
gpt·tts·克隆·语音·clone·gpt-sovits·音色
GPT-SoVITS - few shot 声音克隆演示视频 :https://www.bilibili.com/video/BV12g4y1m7Uw未见过的说话者 few-shot 微调演示:
若石之上5 个月前
whisper·openai·参数·语音·文字
语音识别模型whisper的参数说明一、whisper简介:Whisper是一种通用的语音识别模型。它是在各种音频的大型数据集上训练的,也是一个多任务模型,可以执行多语言语音识别、语音翻译和语言识别。
伊织code5 个月前
python·whisper·openai·asr·语音·vad·whisperx
WhisperXWhisperX:具有字级时间戳的自动语音识别(和分类)该存储库提供快速语音识别(70倍实时与big-v2)与字级时间戳和说话人分类。
AI 研究所6 个月前
人工智能·语言模型·机器人·交互·语音
讯飞星火V4.0 发布,全面对标GPT-4 Turbo6月27日,讯飞星火V4.0如期而至,升级成为更懂你的AI助手。七大核心能力持续突破,全面对标GPT-4 Turbo。在8个国际主流测试集中排名第一,讯飞星火以一份惹眼的成绩单,成为国内大模型的先行者。
陌上阳光6 个月前
深度学习·chatgpt·tts·语音
TTS前端原理学习 chatgpt生成答案文章: https://arxiv.org/pdf/2012.15404本文提出了一种基于Distilled BERT模型的统一普通话文本到语音前端模块。该模型通过预训练的中文BERT作为文本编码器,并采用多任务学习技术来适应TTS前端的两个重要任务:韵律结构预测(PSP)和字素到音素转换(G2P)。然后,通过使用TinyBERT的知识蒸馏技术将BERT编码器压缩为更小的模型,使整个模型的大小仅为基准前端模型的25%,同时在两个任务上保持竞争性能。通过这些方法,我们能够以轻量且统一的方式运行整个TTS前端
AI 研究所8 个月前
人工智能·机器人·交互·语音
机器人交互新纪元:讯飞星火大模型引领升级浪潮放眼全球,大模型浪潮从前沿话题到规模落地,传统计划和商业模式正在“重构”。依托大模型的持续迭代与快速升级,从文本生成、图像生成乃至视频生成,AI不断改变工作本质,为产业发展注入“超能量”。 当众多行业还在探索大模型接入时,机器人行业已率先迭代,特别是在人形机器人领域。微软、亚马逊、谷歌、智元机器人、优必选、宇树等科技公司纷纷入局,马斯克公布了大模型加持的Optimus(擎天柱)第二代机器人,OpenAI则与人形机器人初创公司Figure合作推出了Figure 01机器人。
老菜鸟YDZ9 个月前
语音·普通话·男声·女声·粤语·国语
获取自己电脑系统中的语音上述代码能试听你的电脑系统安装的语音种类。考试指令系统下载链接:https://pan.baidu.com/s/11x9fS1gUEPCd6w15KHCxSw?pwd=zvw3 提取码:zvw3
我是Superman丶1 年前
java·微信·音频·语音·silk
【工具】转码silk格式为mp3【工具】转码slk格式为mp3前提 安装 ffmpeg【安装】Linux安装ffmpeg_linux安装ffmpeg4.4_我是Superman丶的博客-CSDN博客
长安紫薯1 年前
前端·语音
黑豹程序员-h5前端录音、播放H5加入录音组件,录音后可以进行播放,并形成录音文件,其采样率固化48000,传言是google浏览器的BUG,它无法改动采样率。 大BUG,目前主流的支持16000hz的采样率。