技术栈
语音识别
单片机系统设计
2 天前
c语言
·
stm32
·
单片机
·
毕业设计
·
语音识别
基于STM32单片机的智能手环/音乐播放/语音识别
基于STM32单片机的智能手环/音乐播放/语音识别持续更新,欢迎关注!!!****21世纪,社会高速发展,生活物质越来越丰富,随着科技的进步,智能化成为了人们关注的焦点,同时也越来越贴近人们的生活。人们对于健康生活方式的需求催生出了智能可穿戴设备,智能手环就属于其中的一种代表性产物。其主要应用于监测运动,监测心率血氧以及智能化的音乐娱乐方式等。是一款突出个性与人性的智能化产物。本文讲述一套初步的智能手环解决方案,对于智能手环的设计以及制造有可行性方案指导作用。
zhslhm
3 天前
人工智能
·
语音识别
·
文字转语音
·
pc小工具
文字变央视级语音转换工具
语音合成技术采用国际领先的语音引擎,支持中文、英文、日文、韩文等多语种朗读,效果接近真人发音。音效与背景音乐
帅小柏
3 天前
人工智能
·
语音识别
ISCA Archive 的 关于 dysarthria 的所有文章摘要(1996~2024)
构音障碍(Dysarthria)研究全景总结(1996–2024)The nemours database of dysarthric speech
帅小柏
4 天前
人工智能
·
语音识别
《声音的未来:语音识别文献解读》专栏介绍及其文章解读目录
——探索语音技术的前沿,解读未来的声音世界——欢迎来到 “声音的未来:语音识别文献解读”!这是一个专注于语音识别领域前沿研究与技术突破的深度解读专栏。在这里,我们将带您走进语音技术的核心,探索从音位分类到语音合成,从语音障碍分析到多口音语音合成的精彩世界。
mosquito_lover1
5 天前
python
·
音视频
·
语音识别
Python基于深度学习的多模态人脸情绪识别研究与实现
一、系统架构设计A[数据采集] --> B[预处理模块]B --> C[特征提取]C --> D[多模态融合]
wwwzhouhui
6 天前
人工智能
·
音视频
·
语音识别
dify案例分享-儿童故事绘本语音播报视频工作流
前期给大家介绍过儿童故事绘本dify工作流的制作,当时的工作流实现大模型生成分境图片提示词,利用文生图模型生成了图片。另外我们调用语音播报TTS 实现了一个简单儿童绘本工作流。当时这个工作流图片内容和文字内容是单独分开的。并没有做成一个完整儿童故事绘本的视频。当时就觉的做的不太好。今天把这个这块给补上。对之前文章不熟悉的小伙伴可以看我之前的文章dify案例分享-儿童故事绘本工作流. 下面我们给大家看一下时间的一个效果。
前端娱乐圈
6 天前
vue.js
·
音频
·
语音识别
【前端 vue 或者麦克风,智能语音识别和播放功能】
与火星的孩子对话
6 天前
人工智能
·
windows
·
语音识别
·
宠物
Unity3D开发AI桌面精灵/宠物系列 【二】 语音唤醒 ivw 的两种方式-Windows本地或第三方讯飞等
该系列主要介绍怎么制作AI桌面宠物的流程,我会从项目开始创建初期到最终可以和AI宠物进行交互为止,项目已经开发完成,我会仔细梳理一下流程,分步讲解。 这篇文章主要讲有关于语音唤醒ivw方面的一些方法。
背水
7 天前
人工智能
·
语言模型
·
音视频
·
语音识别
音频大语言模型可作为描述性语音质量评价器
论文《AUDIO LARGE LANGUAGE MODELS CAN BE DESCRIPTIVE SPEECH QUALITY EVALUATORS》学习 推动多模态代理从"能听"到"懂好坏"的进化
一休Q_Q
7 天前
人工智能
·
语音识别
流式语音识别概述-paddlespeech
语音识别技术(Automatic Speech Recognition)是一种将人的语音转换为文本的技术。在智能问答中,可通过语音接入用户query,实现问答。
weixi_kelaile520
8 天前
运维
·
服务器
·
人工智能
·
机器人
·
语音识别
智能电话机器人的技术原理是什么?AI语音机器人评判标准是什么?
如今智能语音设备或者机器人很多,如智能手机,个人助理,交互式语音应答,语音机器人,在生活中很常见,表现都让人惊喜,他们工作原理也大致相同。让我们一起来看看语音机器人的技术原理是什么?评判标准又是什么?
SZ170110231
9 天前
人工智能
·
语音识别
语音识别 FireRedASR-AED模型主要特点
架构设计训练数据与策略FireRedASR-AED凭借高效的架构设计、高质量训练数据及渐进正则化策略,在普通话识别中达到行业领先的准确率(CER 3.18%),并在方言场景中展现出色泛化能力(CER 4.48%)。其轻量化特性(1.1B参数)和开源协议使其成为工业部署与学术研究的理想选择。
唯创知音
9 天前
人工智能
·
单片机
·
语音识别
智能血糖仪语音提示播报-高品质音质WT2003H芯片方案
血糖仪的主要用户群体多为中老年人,他们中的很多人视力有所下降,查看血糖仪屏幕上的数据可能存在困难。血糖仪可以通过置入语音芯片,实现语音播报、判断是否属于正常值,从而帮助用户更好地了解自身血糖状况。同时设备的智能化水平有利于提升用户体验,也让产品的市场推广更便捷。
欣然~
10 天前
人工智能
·
语音识别
手搓智能音箱——语音识别及调用大模型回应
此 Python 代码实现了一个语音交互系统,主要功能为监听唤醒词,在唤醒后接收用户语音问题,利用百度语音识别将语音转换为文本,再调用 DeepSeek API 获取智能回复,最后使用文本转语音功能将回复朗读出来。
SecPulse
14 天前
人工智能
·
科技
·
opencv
·
自然语言处理
·
开源
·
语音识别
AI开源竞赛与硬件革命:2025年3月科技热点全景解读——阿里、腾讯领跑开源,英特尔、台积电重塑算力格局
目录开源生态:阿里与腾讯的“技术对决”1. 阿里云QwQ-32B:小参数撬动大性能的技术革命2. 腾讯混元:视频创作的普惠化尝试
cainiaojunshi
14 天前
语音识别
语音识别踩坑记录
本来想在原来的语音识别的基础上增加本地扩展本地词典,采用的语音识别是Vosk识别器,模型是 vosk-model-small-cn-0.22
手插口袋谁也不爱♡
14 天前
人工智能
·
语音识别
本地化语音识别CapsWriter结合内网穿透远程会议录音秒变文字稿
今天我要给大家推荐一个绝对能让你 productivity 爆表的神器——CapsWriter-Offline。这款工具简直是懒人福音,只需动动嘴皮子,所有文字输入工作都能轻松搞定!无论是整理会议录音、高效聊天输入,还是处理复杂文本转换任务,它都能一招制胜。而且最棒的是,操作超级简单,上手几乎零门槛!接下来就让我们一起探索如何在Windows系统中安装和使用这款神级工具吧,保证让你的工作效率瞬间提升到新高度!
windwant
14 天前
人工智能
·
自然语言处理
·
语音识别
自然语言处理中的语音识别技术:从声波到语义的智能解码
语音识别(Automatic Speech Recognition, ASR)是自然语言处理(NLP)的关键分支,旨在将人类语音信号转化为可处理的文本信息。随着深度学习技术的突破,语音识别已从实验室走向日常生活,赋能智能助手、实时翻译、医疗转录等场景。本文将系统解析语音识别的技术演进、核心算法、应用实践及未来挑战。
法号:吃肉
15 天前
人工智能
·
docker
·
语音识别
语音识别-FunASR-docker部署-【超简洁步骤】
FunASR是一个开源的语音识别工具包,它旨在为开发者提供一个灵活且易于使用的平台,用于开发和部署自动语音识别(ASR)系统。FunASR支持多种语言,并提供了丰富的API接口,使得集成和定制化变得更加简单。这个项目通常包含一些最新的语音识别技术,如深度学习模型等,这些技术能够显著提高语音识别的准确率和效率。 源码地址https://github.com/modelscope/FunASR
诸葛小猿
16 天前
windows
·
音视频
·
音频
·
语音识别
·
spleeter
windows部署spleeter 版本2.4.0:分离音频的人声和背景音乐
Spleeter 是由法国音乐流媒体公司 Deezer 开发并开源的一款基于深度学习的音频分离工具。它能够将音乐中的不同音轨(如人声、鼓、贝斯、钢琴等)分离为独立的音频文件,适用于音乐制作、学术研究、音频处理等领域。