技术栈
语音识别
行业探路者
1 天前
学习
·
音视频
·
语音识别
·
二维码
·
设备巡检
如何利用二维码提升标牌标识实用性和用户体验?
本文将探讨如何通过标牌标识二维码提升品牌的实用性和用户体验。借助二维码,企业可以为用户提供关键的产品信息,简化获取流程。用户只需轻松扫描,即可获得合格证二维码、产品说明和详细操作指南。这种方式大大提高了信息透明度,让消费者在购物时更有信心。接下来,我们将通过实际案例分析,展示二维码在不同场合的应用效果,包括如何通过扫二维码视频进一步提升用户的参与感和满意度。这样的创新应用,不仅优化了企业管理,还有效提高了消费者对品牌的信任。
乐迪信息
1 天前
人工智能
·
物联网
·
算法
·
目标检测
·
目标跟踪
·
语音识别
乐迪信息:目标检测算法+AI摄像机:煤矿全场景识别方案
一:煤矿安全监控的现状与技术瓶颈当前,多数煤矿已在重点区域部署了视频监控系统,但普遍存在“看得见、看不懂”的问题。摄像头产生海量视频流,但有效信息的提取极度依赖监控人员长时间、不间断的注意力。人员疲劳、注意力分散等因素导致漏报、误报频发。此外,井下环境光照不均、粉尘干扰、设备遮挡、背景复杂,对视觉分析的准确性构成巨大挑战。
小CC吃豆子
2 天前
人工智能
·
语音识别
Adobe Premiere Pro 2024 (pr) 剪辑软件剪辑 + 调色 + 导出全攻略下载安装教程
Adobe Premiere Pro 2024(简称 Pr2024)是一款专业视频剪辑软件,不管是影视大片、广告宣传片,还是日常短视频都能搞定。它的核心升级都在 AI 功能、音频处理、界面操作和运行速度上,既能降低剪辑门槛,又能让大家出片更快。
aopstudio
2 天前
人工智能
·
语音识别
·
asr
ASR概念和术语学习指南(2):传统 ASR 系统的工作流程
如果你曾好奇"在现代端到端ASR系统普及之前,语音识别是怎么工作的?“,那么答案就藏在一个高度工程化的系统里。它不像今天的端到端模型那样"一键出文字”,而更像一座由四个车间组成的精密工厂:
yugi987838
2 天前
算法
·
支持向量机
·
语音识别
MFCC特征提取与SVM训练语音识别
在MATLAB中结合MFCC特征提取与SVM训练,是语音识别、说话人识别等音频分类任务的经典流程。从原始音频到分类结果的完整实现路径:
独自归家的兔
3 天前
人工智能
·
华为
·
语音识别
基于 cosyvoice-v3-plus 的 个人音色复刻 (华为OBS)
在 AI 语音技术飞速发展的今天,个性化语音交互已成为智能产品的核心竞争力之一。从智能客服的专属音色、有声书的个性化朗读,到虚拟数字人的语音定制,个人音色复刻 技术正逐步从实验室走向商业化落地。
Nautiluss
4 天前
linux
·
人工智能
·
嵌入式硬件
·
音频
·
语音识别
·
dsp开发
·
智能音箱
一起调试XVF3800麦克风阵列(三)
XVF3800 的实际性能很大程度上取决于其所集成到的最终产品的电气和声学环境,为了达到最佳性能,包括通过产品认证测试,必须执行配置和调优过程,使固件适应最终产品的外形尺寸和硬件设计。
HySpark
4 天前
人工智能
·
语音识别
基于声纹预处理技术的智能语音识别实现
在 AI 语音识别场景中,语音数据来源复杂,通话环境不可控,往往伴随强背景噪声、回声、通道失真以及大量无效静音片段。如果直接对原始语音进行识别或声纹建模,效果会明显下降。因此,在整个系统中,声纹预处理模块是决定后续识别准确率的关键基础环节。
天庭鸡腿哥
5 天前
人工智能
·
语音识别
Vivo出品,干趴付费!
啰嗦几句现在语音转文字、文字转语音好多大厂都实行了收费制度。虽然我推荐了不少的免费软件,但是这类的软件由于是个人维护,所以很容易就失效了。
凤希AI伴侣
5 天前
人工智能
·
语音识别
·
凤希ai伴侣
凤希AI伴侣V1.3.2.0正式发布:语音创作全链路升级,个性化交互再进阶 2025年12月28日
凤希AI伴侣迎来V1.3.2.0版本更新。本次更新聚焦「语音内容创作闭环」「个性化交互体验」「底层性能优化」三大核心方向,新增多项实用功能,同时针对用户反馈打磨体验、修复已知问题,进一步践行“让AI触手可及”的普惠理念。
Dev7z
6 天前
人工智能
·
语音识别
基于Matlab的Logistic混沌映射语音信号加密与解密系统设计与仿真
摘要:为了保护语音信号在网络通信中的传输安全,避免敏感语音信息被非法窃取或篡改,本文设计并实现了一种基于Logistic混沌映射的语音信号加密与解密系统。该系统采用MATLAB作为开发平台,并结合GUI(图形用户界面)技术,为用户提供了友好的交互界面,支持语音信号的录制、加密、解密以及信号的时域和频域可视化分析功能。通过混沌理论中的Logistic映射生成加密序列,系统实现了高效且复杂的语音加密过程。
杰瑞不懂代码
6 天前
开发语言
·
matlab
·
语音识别
·
am
·
dsb-sc
·
vsb
基于 MATLAB 的 AM/DSB-SC/VSB 模拟调制与解调仿真及性能对比研究
模拟调制作为经典模拟通信系统的核心内容,既是频谱搬移思想最直观的载体,也是理解“带宽占用—解调复杂度—抗噪性能”三者权衡关系的基础。在通信实验中,AM(带载波幅度调制)、DSB-SC(抑制载波双边带) 以及 VSB(残留边带) 通常被用作三个层次的代表:AM 强调包络可检波与实现简洁性,DSB-SC 强调同步解调与载波恢复的重要性,而 VSB 则体现频谱效率与系统工程折中的设计思想。
未来之窗软件服务
6 天前
语音识别
·
asr
·
仙盟创梦ide
·
东方仙盟
幽冥大陆(七十五) MinGW编译 WISPER ASR源码fairyalliancewhisper——东方仙盟练气期
https://github.com/cyberwin/fairyalliancewhisperhttps://www.mingw-w64.org/
未来之窗软件服务
6 天前
javascript
·
whisper
·
语音识别
·
仙盟创梦ide
·
东方仙盟
幽冥大陆(七十一) Whisper-ASR网页对接语音识别—东方仙盟练气期
在东方仙盟广袤无垠的世界里,ASR(Automatic Speech Recognition,自动语音识别)技术宛如一种神奇的 “灵识传音” 仙术,正悄然改变着商业与娱乐领域的格局,为其带来前所未有的便捷与奇妙体验。其中,基于 Whisper 的语音识别应用,更是如同仙盟中的神秘法器,发挥着关键作用。
Nautiluss
7 天前
大数据
·
人工智能
·
嵌入式硬件
·
音频
·
语音识别
·
dsp开发
一起调试XVF3800麦克风阵列(二)
上一章我们大概了解了下四个波束,这里官方给我们写了一个脚本,直观的展示了几个波束的运行可视化。运行如下,可以清楚看到每一束波形的方向(目前我就是在90度方向说话,输出处理过的波束刚好与beam1重合!):
TMT星球
7 天前
人工智能
·
语音识别
欧瑞博推出全新集成方案,用谷电做空调,一晚只需一度电
12月26日,欧瑞博创始人兼CEO王雄辉(Mark)站在2025年末战略新品发布会的舞台上,背后的屏幕闪烁着“智慧居住新纪元”六个大字。“我们今年在产品上还是有新的突破和思考。”他开场说道。
未来之窗软件服务
7 天前
人工智能
·
whisper
·
语音识别
·
仙盟创梦ide
·
东方仙盟
幽冥大陆(六十九) Whisper-CLI —东方仙盟练气期
Whisper-CLI 是基于 OpenAI Whisper 模型的命令行工具,由 whisper.cpp 项目封装实现,能在本地快速完成语音转文字、精准识别特定指令的任务。对于初学者而言,无需复杂的代码开发,仅靠几条命令就能解锁语音识别能力。
北京宇音天下
7 天前
人工智能
·
语音识别
城市守护者:VTX316芯片如何用语音重塑公共安全播报
在日常的城市生活中,突发火警、恶劣天气或人流疏导,往往依赖语音播报系统及时传递信息。然而,传统播报设备只能播放预存内容,更新滞后且缺乏感染力。北京宇音天下科技有限公司推出的VTX316语音合成芯片,正以革命性的TTS技术解决这一痛点——它让冰冷的喇叭变身“智慧解说员”,用动态语音守护公共安全。 一、核心技术优势:重新定义安全播报标准 在公共安全播报领域,语音合成芯片的性能直接关系到应急信息传递的效率与可靠性。VTX316 语音合成芯片通过四大核心技术突破,构建起覆盖“听清-及时-持久-适应”全维度的安全播
net3m33
8 天前
人工智能
·
机器人
·
语音识别
做了一块可以调用百度云语音识别api和tts api的esp32 s3开发板,支持跑ai小智机器人的源码,基于idf5.5.1库编译,分享下
esp32调用百度语音识别api
前端世界
8 天前
华为
·
语音识别
·
harmonyos
鸿蒙语音控制实战:从语音识别到业务执行的完整链路
随着智能设备和物联网场景的不断普及,语音控制已经从“锦上添花”的功能,逐渐变成很多应用的基础交互方式。 在鸿蒙系统中,官方已经提供了较为完整的语音识别能力,但在实际项目中,很多开发者会卡在几个地方,比如不知道完整流程怎么走、语音识别结果怎么和业务结合、或者代码能跑但不好扩展。