技术栈
语音识别
2zcode
41 分钟前
开发语言
·
matlab
·
语音识别
原创文档:基于MATLAB的线性预测编码变声器系统
摘要:本文设计并实现了一个基于线性预测编码(LPC)技术的语音变换系统。该系统利用LPC算法对语音信号进行分析和合成,通过调整基音频率和共振峰参数实现多种变声效果。
agicall.com
1 小时前
人工智能
·
语音识别
·
agi
·
信创电话助手
·
座机语音转文字
·
固话录音转文字
信电助 - 智能坐席盒 UB-B-AGI 型号功能列表
适用需要双轨录音,区分通话人并离线语音转文字的录音场合,包含信创坐席盒功能,不支持耳麦通话
agicall.com
1 小时前
人工智能
·
语音识别
·
信创电话助手
·
座机语音转文字
·
固话座机录音
信电助 - 智能录音盒 UB-R-AGI 型号功能列表
适用只需固话座机自动录音上传,来电弹屏的场景并需要离线语音转文字的场合,不能软件免提拨号,性价比高
agicall.com
3 小时前
人工智能
·
语音识别
·
信创电话助手
·
固话录音转文字
信电助 - 智能话务盒 UB-A-XC 型号功能列表
适合通话时需要解放双手,使用耳麦通话并且需要离线语音转文字的应用场合,包含信创话务盒的功能
木斯佳
7 小时前
音视频
·
语音识别
·
harmonyos
HarmonyOS 实战(源码教学篇):从一次语音识别率排查,讲透音频采集、PCM 与 ASR 同源校验
熟悉我的朋友们应该知道,前段时间,我们公司在做一个语音 AI 助手类应用。整体链路并不复杂:前面做语音输入,接第三方 ASR,后面再接意图理解和执行逻辑。测试跑得一直还可以,直到有一次去现场联调,问题开始集中冒出来。
HDD985
10 小时前
语音识别
·
效率工具
·
语音转文字
2026 年录音转文字重构研发会议:智在记录让 1 小时会议整理从 2 小时变 5 分钟
作为广州番禺一家互联网公司的研发主管,我每天至少要开 3 个会 —— 需求评审会、技术方案讨论会、故障复盘会、迭代规划会…… 会议已经成为研发工作的重要组成部分。但长期以来,研发会议一直存在一个致命痛点:会议记录效率极低。
飞Link
1 天前
人工智能
·
gpt
·
microsoft
·
交互
·
语音识别
GPT-5.5 Instant 震撼发布:Realtime-2 API 如何重新定义多模态交互?
2026年5月10日,OpenAI 正式发布了 GPT-5.5 Instant,这标志着大模型正式从“对话时代”迈向了“无感响应时代”。作为 AI 架构师,最令我振奋的并非模型参数的提升,而是同步推出的 Realtime-2 API 和 Realtime-Translate API。
agicall.com
1 天前
人工智能
·
语音识别
信电助 - 信创话务盒 UB-A-XC 型号功能列表
适合通话时需要解放双手,使用耳麦通话的应用场景,包含信创语音盒的功能
agicall.com
1 天前
人工智能
·
语音识别
·
信创电话助手
·
座机语音转文字
·
固话座机录音转文字
信电助 - 信创无线盒 UB-W-XC 型号功能列表
适合没有模拟电话线,可插手机卡来实现自动外呼拨号,精准接通检测放音的应用场合,包含信创话务盒功能
agicall.com
1 天前
人工智能
·
语音识别
·
信创电话助手
·
座机语音转文字
·
固话录音转文字
信电助 - 信创坐席盒 UB-B-XC 型号功能列表
适用需要双轨录音,区分通话人的录音场景,包含信创语音盒功能,不支持耳麦通话
z1940892066
2 天前
语音识别
导出JPG前最后检查指南:裁切、出血与现场显示比例详解
在点击 “导出为 JPG” 按钮前的最后时刻,一次系统性的检查往往能避免后续 99% 的麻烦。无论是用于网络传播还是实体印刷,错误的裁切、缺失的出血或不匹配的显示比例都可能导致心血白费。
北京宇音天下
2 天前
人工智能
·
语音识别
骑行升级!VTX316语音合成芯片,让电动车秒变“智能出行伙伴”
日常骑行电动车,你是否也有过这些烦恼?低头看仪表盘查电量、辨故障,分心瞬间藏着安全隐患;离车时匆忙健忘,总担心物品遗留车内;操作复杂繁琐,老人、新手上手困难……
开开心心就好
2 天前
人工智能
·
学习
·
游戏
·
决策树
·
音视频
·
动态规划
·
语音识别
支持音视频图片文档的格式转换器
软件介绍格式工厂是一款完全免费的全能格式转换工具,从2008年发布至今已经走过19个年头,属于老牌实用工具。它支持音频、视频、图片和文档等多类文件的格式转换,功能全面覆盖日常格式处理需求。
LCG元
2 天前
stm32
·
嵌入式硬件
·
语音识别
STM32实战:基于STM32F103的智能语音识别系统(LD3320)
本项目基于STM32F103C8T6单片机+LD3320语音识别模块实现非特定人语音识别功能,无需训练、无需外接Flash,可直接识别预设的中文语音指令,实现语音控制LED、继电器、蜂鸣器等外设,适合零基础小白入门智能语音控制项目。
俊基科技
2 天前
语音识别
·
ai降噪
·
回音消除
·
语音模组
·
语音处理模块
A-29 双数字麦阵列回音消除模块:超大音量场景下的全功能语音处理解决方案
在免提通话、全双工对讲、远程交互等音频应用场景中,小体积结构、超大音量输出、远距离拾音、强环境噪音一直是制约语音清晰度与通话流畅度的核心难题。传统语音处理模块受限于主芯片算力、算法效率与硬件架构,在喇叭音量接近或超过 100dB、麦克风与扬声器间距极近的条件下,难以实现稳定可靠的回音消除,常出现啸叫、断续、回声残留、底噪过大等问题,严重影响用户体验与设备性能。
AIDF2026
3 天前
人工智能
·
深度学习
·
语音识别
【无声音的画像——当深度学习遇上 MFCC标题】
既然大家对于图片是怎么识别,有所了解,那么声音又是怎么识别的?(▽)?毕竟它可不想图片一样那么容易描述
agicall.com
4 天前
人工智能
·
语音识别
·
信创电话助手
·
座机语音转文字
·
固话座机录音转文字
座机通话双方语音分离技术解决方案详解
目前市面上绝大多数传统模拟座机电话线,采用RJ11二线制接线架构,整条线路仅搭载单一语音传输通道。该技术架构设计初衷为满足基础通话需求,通话过程中,进线方(外线客户)与出线方(座机客服)的语音信号会在同一条线路内混合传输,原始录音文件中双方语音叠加混杂,无法直接区分音源方位。
MonkeyKing_sunyuhua
4 天前
人工智能
·
语音识别
什么是服务端 VAD 端点检测
在服务器端对音频流做“语音活动检测(VAD, Voice Activity Detection)”,并进一步判断一段话什么时候开始、什么时候结束。
小仙女的小稀罕
4 天前
大数据
·
人工智能
·
学习
·
自然语言处理
·
语音识别
培训要点写不完不会整理?规范培训转待办可这样操作
做销售客服的谁没碰过这个糟心事?公司定期的规范培训,两三个小时下来,要么记了满满一本乱笔记,要么录了音不知道怎么整理,要点攒一堆,转成待办要熬大半个晚上,今天就把我亲测能用的方法说给你们。
小仙女的小稀罕
4 天前
大数据
·
人工智能
·
学习
·
自然语言处理
·
语音识别
适合销售从业者会议整理使用的销售录音转任务工具
做销售、客服的,不管是线下客户拜访,还是内部需求对接会、电话沟通,都要整理录音转成可跟进的任务,找不对工具就会浪费大量跟进客户的时间,这里给你零基础最短路径上手的方案。