技术栈
语音识别
yuan19997
5 小时前
人工智能
·
matlab
·
语音识别
MATLAB 多窗谱谱减法语音去噪
多窗谱谱减法 (Multi-taper Spectral Subtraction) 语音去噪实现,这是一种比传统谱减法更鲁棒的语音增强方法。
zero.cyx
7 小时前
人工智能
·
计算机视觉
·
语音识别
更换Live2D模型具体步骤
(具体情况有差异,文章仅供思路参考)我的后端来自fay数字人,https://gitee.com/xszyou/fay
byte轻骑兵
1 天前
人工智能
·
音视频
·
语音识别
·
le audio
·
低功耗音频
从收音机到蓝牙:LE Audio核心BASS服务解析与实战
在嵌入式蓝牙开发的赛道上,我们习惯了点对点的音频传输模式。从经典蓝牙的A2DP到BLE早期的音频尝试,设备之间始终绕不开配对、连接、主从角色这些固有流程。这种模式在个人聆听场景下运转良好,但当我们走进机场、博物馆,或是想和朋友共享同一首歌时,传统蓝牙的局限性便暴露无遗——一对多传输困难、多设备同步延迟高、低功耗设备持续扫描功耗过大。
开开心心就好
1 天前
人工智能
·
游戏
·
pdf
·
音视频
·
智能家居
·
语音识别
·
媒体
无需安装的单机塔防游戏轻松畅玩
软件介绍植物大战僵尸是一款经典塔防游戏,衍生出多个版本。之前给大家推荐过融合版,这次带来的是最新推出的杂交版本。
开开心心就好
1 天前
人工智能
·
游戏
·
音视频
·
语音识别
·
媒体
·
程序员创富
·
高考
这款工具批量卸载软件并清理残留文件
软件介绍IObitUninstaller是一款功能全面的软件卸载工具,已经多次推荐给大家。它的核心功能包括强制卸载、批量卸载、软件安装监视、文件粉碎和软件健康检查等,是清理电脑软件的好帮手。
MaoziShan
1 天前
人工智能
·
语言模型
·
自然语言处理
·
语音识别
CMU Subword Modeling | 14 Descriptive Phonetics
本文解读 CMU “Subword Modeling” (Spring 2026) 第14讲:Descriptive Phonetics。
renhongxia1
2 天前
大数据
·
人工智能
·
机器学习
·
语言模型
·
自然语言处理
·
语音识别
·
xcode
网络效应与大型语言模型辩论中的协议漂移
大语言模型展现出前所未有的模拟类人社会行为的能力,使其成为模拟复杂社会系统的有效工具。然而,这些模拟在多大程度上能够可靠地捕捉关键的社会机制,尤其是在涉及少数群体的高度不平衡情境下,目前尚不明确。
开开心心_Every
2 天前
人工智能
·
pdf
·
计算机外设
·
ocr
·
语音识别
·
团队开发
·
规格说明书
安卓图片压缩工具,无损缩放尺寸免费好用
软件介绍这款叫 照片压缩(安卓) 的工具,专门给安卓手机用的图片压缩软件。之前介绍过好几款压缩工具,今天这款目前完全免费,就是不知道以后会不会收费。
Single
2 天前
人工智能
·
经验分享
·
能源
·
语音识别
·
产品经理
·
空间计算
从电工张三的故事所提炼出的一种产品设计模式与技术实现路径
注:本文由笔者口述,AI整理与代笔.【文章导读】本文通过一个 “刷脸进入、动嘴操作”的智能配电室场景,为你拆解一个在ToB(企业服务)领域高价值的产品设计模式及技术实现路径:
HySpark
2 天前
人工智能
·
语音识别
会议离线转记实战:静音幻觉修复、Qwen-ASR 集成与高并发优化
做离线语音转写服务的同学应该都深有体会,静音幻觉、时间戳不准、并发上来就崩,这三大问题几乎是所有本地 ASR 项目的 “拦路虎”。最近在打磨公司内部熙瑾会悟离线会议转写系统时,我们就完整踩了一遍坑,从静音幻觉修复、Qwen-ASR 模型集成、时间戳对齐,到实时会议迁移与高并发优化,一步步把系统从 “勉强能用” 打磨到 “稳定可靠”。
李永奉
3 天前
单片机
·
嵌入式硬件
·
物联网
·
语音识别
杰理可视化SDK开发-蓝牙的可发现可连接和回连
现在为止也开发了许多杰理TWS蓝牙耳机、音响项目SDK的案子,在调试案子时不断的向前辈们学习到了很多关于蓝牙音响、蓝牙TWS耳机专业的知识。想在这里做一个学习汇总,方便各位同行和对杰理芯片可视化SDK感兴趣的小伙伴们学习;
IPHWT 零软网络
3 天前
大数据
·
人工智能
·
重构
·
语音识别
·
ai agent
·
话务台
从被动应答到主动处理:零软智慧通讯的AI Agent与知识库实践
传统企业通讯系统常面临明显的效率瓶颈:客户来电依赖人工按键转接,客服需跨系统翻阅文档获取答案,调度员则在海量数据中手动检索信息。这些重复性操作不仅拖慢了响应速度,也占用了大量人力资源。零软智慧通讯产品引入AI Agent与智能知识库,旨在改变这一现状,将通讯系统的职能从基础的信息传递,升级为直接解决业务问题的处理中枢。
惠惠软件
4 天前
人工智能
·
学习
·
语音识别
豆包 AI 学习投喂与排名优化指南
在豆包中 “投喂语料”(让 AI 学习你的资料)和 “优化排名”(让你的内容 / 知识库被优先引用),核心是结构化投喂 + 权威内容 + 语义匹配。下面分两部分讲完整实操方法。
云和数据.ChenGuang
4 天前
人工智能
·
深度学习
·
神经网络
·
目标检测
·
机器学习
·
自然语言处理
·
语音识别
机器学习之超参数是什么?
超参数 = 训练前由人手动设置、模型自己不会学的参数模型参数(参数): 模型在训练过程中自己学到的东西 比如:权重、系数、分割点
云和数据.ChenGuang
4 天前
人工智能
·
深度学习
·
神经网络
·
目标检测
·
机器学习
·
自然语言处理
·
语音识别
机器学习之预测概率问题
我直接给你讲最核心、最本质的原因,保证你一看就懂!你代码里这两行:一个是“做过的题得分”,一个是“没做过的新题得分”,当然不一样!
爱上珍珠的贝壳
4 天前
人工智能
·
音频
·
语音识别
·
esp32-s3
·
语音转文字
·
豆包
ESP32-S3-CAM:豆包语音识别文字后控制小车(终章)——语音控制+L298N模块驱动小车
1)L198N连接两个轮子,然后用胶带粘到车架上的,比较丑陋,先组装起来2)供电:我是用充电宝给ESP32-S3供电;用电池仓给L298N供电
神州数码云基地
5 天前
人工智能
·
ai
·
语音识别
·
前端开发
·
tts
·
ai语音
AI助手语音交互:从技术到体验
在人工智能技术飞速发展的今天,AI 助手已从 “文字框里的应答者” 进化为 “能听会说的智能伙伴”。无论是手机端的 Siri、小爱同学,还是 Web 端的智能客服、教育 AI 助手,语音交互都成为其核心竞争力 —— 用户无需手动输入,只需开口提问,AI 助手就能用自然的语音回应。
Code-keys
5 天前
系统架构
·
音频
·
语音识别
【WEKWS】论文解读 && 语音唤醒系统架构详解 && 实战
WEKWS (Wake-up Word Keyword Spotting;https://arxiv.org/pdf/2210.16743.pdf) 是一个基于PyTorch的端到端关键词识别系统,支持多种深度学习模型架构,包括TCN、FSMN、GRU、MDTC等。该项目提供了完整的训练、推理、部署和测试流程。
皓晗
6 天前
语音识别
·
whisper模型
·
多语言处理
Whisper-large-v3参数详解:config.yaml与language自动检测机制解析
Whisper-large-v3是OpenAI推出的多语言语音识别模型,拥有15亿参数,支持99种语言的自动检测与转录。这个模型在语音识别领域表现出色,特别是在多语言环境和嘈杂背景下的识别准确率有显著提升。
byte轻骑兵
6 天前
人工智能
·
语音识别
·
蓝牙
·
hfp
·
通话
【HFP】规范精讲[23]: 蓝牙超宽频语音革命——LC3-SWB编码深度解析,重塑无线通话体验
在蓝牙语音技术的演进历程中,从窄带到宽频,再到如今的超宽频,每一次技术突破都源于对更清晰、更自然通话体验的追求。LC3-SWB(Low Complexity Communication Codec - Super Wideband)作为HFP规范中为超宽频语音量身打造的核心编码技术,将语音采样率提升至32kHz,能捕捉到更多人类语音的细节成分,让无线通话音质无限接近面对面交流。