技术栈
实时语音识别
Slientsakke
20 天前
人工智能
·
计算机视觉
·
llm
·
funasr
·
实时语音识别
FunASR实时多人对话语音识别、分析、端点检测
核心功能:FunASR是一个基础语音识别工具包,提供多种功能,包括语音识别(ASR)、语音端点检测(VAD)、标点恢复、语言模型、说话人验证、说话人分离和多人对话语音识别等。FunASR提供了便捷的脚本和教程,支持预训练好的模型的推理与微调。 项目地址: FunASR 模型仓库: ModelScope Huggingface
漫游者Nova
2 个月前
语音识别
·
语音转文字
·
音频转录
·
实时语音识别
·
录音转文字
麦克风和电脑内播放声音实时识别转文字软件FunASR整合包V5下载
我基于FunASR制作的实时语音识别转文字软件当前更新到V5版本。软件可以实时识别麦克风声音和电脑内播放声音转为文字。
Luke Ewin
3 个月前
人工智能
·
语音识别
·
实时语音识别
·
商用级别实时语音识别
CentOS7.9部署FunASR实时语音识别接口 | 部署商用级别实时语音识别接口FunASR
本次在云服务器中部署一套实时语音识别接口,基于阿里开源的FunASR。云服务器使用莱卡云,4核心4GB内存50GB存储空间,带宽10Mbps。
一只老虎
9 个月前
人工智能
·
python
·
交互
·
实时语音识别
AI大模型识别多人发音的实时语音交互理论研究
目录摘要第一章 引言第二章 研究方法2.1 多说话人分离技术2.1.1 现有工具的使用与调优2.2 语音识别与转录
MonkeyKing_sunyuhua
10 个月前
实时语音识别
ESP32 S3 怎么开发基于ESP-RTC的音视频实时交互的应用,用语AI陪伴的领域
在ESP32-S3平台上开发基于ESP-RTC的音视频实时交互应用,尤其是在AI陪伴领域,涉及到音视频数据的采集、编码、传输和解码。ESP32-S3 具备较强的处理能力,且拥有丰富的接口和模块支持,可以用来实现这种功能。以下是一个完整的开发方案:
王佑辉
1 年前
microsoft
·
实时语音识别
【java】websocket对接微软语音实时识别