语音识别

一条数据库11 小时前
人工智能·音视频·语音识别
南京方言数据集|300小时高质量自然对话音频|专业录音棚采集|方言语音识别模型训练|情感计算研究|方言保护文化遗产数字化|语音情感识别|方言对话系统开发随着人工智能技术的快速发展,语音识别和自然语言处理领域对高质量方言数据的需求日益增长。南京方言作为江淮官话的重要分支,承载着丰富的地域文化和语言特色,在语言学研究和方言保护方面具有重要价值。本数据集精心采集了300小时的南京方言自然对话音频,不仅填补了当前南京话高质量语音数据的空白,更为方言研究、语音识别模型训练、情感计算等前沿领域提供了宝贵资源。这些数据通过专业录音棚采集,严格控制质量,确保方言纯正度和情感表达的自然性,能够有效支持各类语言技术研发和文化传承项目。
殷忆枫1 天前
stm32·嵌入式硬件·语音识别
基于STM32的智能语音识别饮水机系统设计若该文为原创文章,转载请注明原文出处。传统饮水机功能单一,需手动操作,缺乏人机交互与智能化管理。用户无法远程了解水温、水量状态,接水时需长时间手持等待,且存在干烧、漏水等安全隐患。随着人工智能和物联网技术的普及,智能家居设备正朝着更自然、更便捷的方向发展。
SmartJavaAI3 天前
java·人工智能·whisper·语音识别
Java调用Whisper和Vosk语音识别(ASR)模型,实现高效实时语音识别(附源码)语音识别(Automatic Speech Recognition, ASR)是将人类的语音信号自动转换为对应文字的技术,它使计算机能够“听懂”人说的话,是人机语音交互的核心技术,广泛应用于智能助手、语音输入、客服系统等场景。
MYZR14 天前
自动化·语音识别
现代农业自动化的技术演进与应用现代农业自动化是农业现代化的核心驱动力,通过集成传感器、人工智能、机器人及物联网技术,实现生产全流程的精准化、智能化和高效化,彻底重塑传统农业生产模式。
bst@微胖子5 天前
人工智能·语音识别·xcode
WGAI项目图像视频语音识别功能前端就一个点击事件,主要是查看后端识别图片信息的功能。图像识别的方法:主要调用opencv中的图像方法来识别图片的内容结果。
东风西巷6 天前
前端·人工智能·学习·语音识别·软件需求
Balabolka:免费高效的文字转语音软件一、软件简介Balabolka 是一款免费的 TTS(文字转语音)软件,能够将文本转换成语音,支持多种语言和声音,包括英语、西班牙语、法语、德语、俄语等。它不仅可以在电脑上直接播放语音,还可以将文本转换成音频文件,支持多种格式,如 MP3、WAV、OGG 等。Balabolka 由俄罗斯开发者开发,界面简洁,操作方便,适合各种用户使用。
大数据张老师6 天前
人工智能·系统架构·语音识别·架构设计·后端架构
【案例】AI语音识别系统的标注分区策略在某语音识别训练平台中,项目目标是构建一套可持续进化的中文客服通话识别模型,系统每天需处理超过10万段客服音频,如何管理标注资源、控制样本流转、保障模型训练质量,成为核心难点。
小马哥编程7 天前
人工智能·计算机网络·语音识别
计算机网络:调制解调器调制解调技术是通信系统中实现信号跨信道传输的核心技术,通过“调制”与“解调”两个互补过程,解决原始信号(如数字信号、低频模拟信号)在传输介质(如无线信道、有线线路)中的适配问题,确保信息高效、可靠传输。
今日待办7 天前
c语言·单片机·嵌入式硬件·mcu·语音识别·ardunio·arduinonano33
Arduino Nano33 BLESense Rev2【室内空气质量检测语音识别蓝牙调光台灯】Arduino Nano 33 BLE Rev2,利用了nRF52840微控制器的先进功能。这款32位Arm® Cortex®-M4 CPU 64 MHz与MicroPython的兼容性增强了板子的灵活性,该开发板的突出特点是其蓝牙低功耗(BLE)功能,使其能够轻松与其他蓝牙低功耗设备进行通信。Nano 33 BLE Rev2设计具备多功能性,配备了内置的9轴惯性测量单元、提供位置、方向和加速度的精确测量等。
水印云7 天前
人工智能·语音识别
AI配音工具哪个好用?7款热门配音软件推荐指南!如今的短视频领域里,不少博主创作内容时都会选择配音软件代替自己发声 —— 这点在影视解说类视频中尤为突出。有时候,这些软件生成的声音逼真到让人误以为是博主原声,想必大家也会好奇:到底是哪些AI配音工具,能让新媒体博主们如此青睐?今天就推荐7款热门的配音软件,从速度,核心优势测评,让你能更快的找到适合自己的配音软件!
Luke Ewin7 天前
java·人工智能·语音识别·asr·funasr·paraformer·sensevoice
FunASR的Java实现Paraformer实时语音识别 | 一款无需联网的本地实时字幕软件我们在看直播时,没有视频字幕,可能看惯了视频字幕,来到直播中缺少字幕会感觉不习惯,特别是对于听力障碍的人群,只能依赖于字幕,那么这个软件可以解决直播,在线会议等场景中无字幕的情况。此外,我们还可以用于人机交互中,以及智能呼叫中心系统中(实时语音质检)。因此,开发一款可以运行在普通CPU中的实时字幕软件很有必要。
浅醉樱花雨7 天前
人工智能·python·语音识别·asr·vosk
vosk语音识别实战Vosk 是一个由 Alpha Cephei 团队开发的开源离线语音识别(ASR)工具包。它的核心优势在于完全离线运行和轻量级,使其非常适合在资源受限的环境、注重隐私的场景或需要低延迟的应用中使用。
我是海飞8 天前
python·学习·tensorflow·音视频·嵌入式·语音识别
Tensorflow Lite 的yes/no语音识别音频预处理模型训练教程本文档详细介绍如何生成 audio_preprocessor_int8.tflite 预处理模型,该模型用于将原始 PCM 音频转换为 49×40 的 int8 特征,供微语音模型使用。
殷忆枫8 天前
stm32·嵌入式硬件·语音识别
基于STM32的智能语音识别分类垃圾桶若该文为原创文章,转载请注明原文出处。随着城市化进程加快和人口增长,“垃圾围城”已成为全球性的环境挑战。有效的垃圾分类是实现垃圾减量化、资源化、无害化处理的关键前提。然而,公众普遍存在垃圾分类知识不足、嫌麻烦等问题,导致分类效果不佳。本项目旨在利用嵌入式人工智能技术,设计一款基于STM32的智能语音识别垃圾桶。它能够通过语音指令交互,辅助用户进行正确的垃圾分类,并通过传感器实时监控桶内状态,从而提升垃圾分类的便捷性、准确性与智能化管理水平,对推动环保事业具有积极的现实意义。
海天瑞声AI9 天前
数据库·人工智能·语音识别
“AI 正回应时,也可随时打断?”揭秘 GPT Realtime × Gemini 的“全双工魔力”,都离不开它!最近,OpenAI 的 GPT Realtime 和 Google 的 Gemini 2.5 接连亮相,给语音助手带来了「真正的“实时对话”」体验 —— 你说一句,它就秒接;它正说,你也能随时打断,回应自然不尬聊。这才是真正像人一样“插话”的自然对话模式。
我是海飞10 天前
人工智能·python·tensorflow·语音识别·neo4j
TensorFlow的Yes/No 关键词识别模型训练参考 TensorFlow 官方教程的 Yes/No 关键词识别模型训练脚本,可以生成直接替换原有mirco_speech识别模型数据的C文件。
张成AI12 天前
人工智能·gpt·语音识别
OpenAI GPT-realtime 实时语音 API 完整指南:2025年语音AI的革命性突破OpenAI 的 GPT-realtime 是一款革命性的语音对语音模型,通过实时 API (Realtime API) 提供服务。与传统的语音处理流程不同,这套系统直接处理和生成音频,无需经过语音转文本再转语音的复杂链条。
森之鸟12 天前
华为·语音识别·harmonyos
开发中使用——鸿蒙CoreSpeechKit语音识别不再是一个安安静静的“APP”,做一个可以发出声音,甚至讲话、与人进行交互,是一个APP孜孜不倦的追求和最终理想。————一个APP的独白。
水印云12 天前
人工智能·音视频·语音识别
视频提取文字用什么软件好?分享6款免费的视频转文字软件!在当下这个信息高速流转的时代,视频早已成为我们获取信息、创作内容的主要形式之一。但面对海量视频,你是不是也常陷入这些困境:剪辑视频时,反复听语音记字幕累到头晕;整理课程或会议视频笔记时,手速赶不上语速,关键信息总遗漏;想从长视频里找重点内容,却要逐帧回放,浪费大量时间?
cici1587412 天前
神经网络·matlab·语音识别
matlab-神经网络的语音识别语音识别是一个复杂的模式识别问题,通常涉及两个主要任务:这里,我们将重点介绍使用深度学习进行语音命令识别,这是入门和实验最常见、最直接的方法。MATLAB 提供了强大的工具和预置的数据集,使得这个过程变得相对简单。