音频

声光界3 天前
人工智能·音频·信号处理·声学
《信号处理赋能智能体音感知》《2026GAS声学大讲堂——音频产业创新技术公益讲座》第一期计算机听觉与心理生理健康专题,讲座第7讲将于4月23日周四19点开讲,本次邀请了北京理工大学博士生李恩泽演讲,讲座主题《信号处理赋能智能体音感知》。(点击观看直播)
凛_Lin~~3 天前
android·音频·安卓
Android录音、试听功能实现安卓中可使用AudioRecord进行音频录制,录制的结果是pcm文件,也就是音频裸数据(裸流)。可调用AudioRecord.startRecording进行录制,不过使用前需要初始化AudioRecord。
憨波个5 天前
人工智能·深度学习·音频·语音识别
【说话人日志】多说话人数据仿真 Property-Aware Simulation论文:Property-Aware Multi-Speaker Data Simulation: A Probabilistic Modelling Technique for Synthetic Data Generation 作者:Tae Jin Park, He Huang, Coleman Hooper, Nithin Koluguri, Kunal Dhawan, Ante Jukic, Jagadeesh Balam, Boris Ginsburg 时间:2023 会议:CHiME-7 Wor
憨波个5 天前
人工智能·机器学习·音频·语音识别·聚类
【说话人日志】Sortformer:将说话人日志接入多说话人 ASR论文:Sortformer: A Novel Approach for Permutation-Resolved Speaker Supervision in Speech-to-Text Systems 简称:Sortformer 作者:Taejin Park, Ivan Medennikov, Kunal Dhawan, Weiqing Wang, He Huang, Nithin Rao Koluguri, Krishna C. Puvvada, Jagadeesh Balam, Boris Gin
重生之我在安卓搞音频9 天前
音频·安卓
一、Android 音频简介文档类型:理论基础 适用读者:系统工程师、Framework/HAL 开发者、音视频方向架构师在移动终端与嵌入式系统中,应用层所感知的“音频”可归纳为两条主路径:录制(Capture)与播放(Playback)。
周末也要写八哥11 天前
音频
Cubase Pro v15.0音乐创作全流程下载与安装指南对于录音棚与影视配乐师或业余音乐创作爱好者来说,应该不会感到陌生。‌Cubase‌是一款专业级‌数字音频工作站,广泛用于音乐创作、录音、编曲、混音及母带处理等全流程音乐制作环节。
海特伟业12 天前
音频
工厂IP广播/企业IP广播/车间IP广播系统-集音乐铃声、新闻播报、紧急喊话、呼叫对讲、领导讲话、消防广播于一体的数字交互式IP广播系统方案与应用工厂IP广播 企业IP广播 车间IP广播系统-集音乐铃声、新闻播报、紧急喊话、呼叫对讲消防广播于一体的数字交互式IP广播系统方案与应用
爱上珍珠的贝壳13 天前
人工智能·音频·语音识别·esp32-s3·语音转文字·豆包
ESP32-S3-CAM:豆包语音识别文字后控制小车(终章)——语音控制+L298N模块驱动小车1)L198N连接两个轮子,然后用胶带粘到车架上的,比较丑陋,先组装起来2)供电:我是用充电宝给ESP32-S3供电;用电池仓给L298N供电
Code-keys14 天前
系统架构·音频·语音识别
【WEKWS】论文解读 && 语音唤醒系统架构详解 && 实战WEKWS (Wake-up Word Keyword Spotting;https://arxiv.org/pdf/2210.16743.pdf) 是一个基于PyTorch的端到端关键词识别系统,支持多种深度学习模型架构,包括TCN、FSMN、GRU、MDTC等。该项目提供了完整的训练、推理、部署和测试流程。
超开心~16 天前
音频
Android audio中的AUDIO_OUTPUT_FLAG_NON_BLOCKING如字面意思,非阻塞式写入,在以下文件中也有相关定义。AudioOutputFlags.aidl /** * Write operations must return as fast as possible instead of * being blocked until all provided data has been consumed. */ NON_BLOCKING = 5,
爱上珍珠的贝壳17 天前
人工智能·音频·语音识别·esp32-s3·小车
ESP32-S3-CAM:豆包语音识别文字后控制小车(规划)最近一直很忙,有半个月没折腾板子了,但一直都有个想法,搞个复杂一丢丢的需求,通过MIC拾音,然后豆包后台接口去识别语音内容,转成文字后,再控制小车前进还是后退。
爱上珍珠的贝壳17 天前
音频·语音识别·智能硬件·esp32-s3·豆包
ESP32-S3-CAM:豆包语音识别文字后控制小车(四)——增加mic拾音后通过豆包语音识别后转文字输出ESP32-S3-CAM:豆包语音识别文字后控制小车(三)——SD卡本地音频识别转文字本地音频文件已经识别成功了,接下来就是增加mic拾音转文字功能。
爱上珍珠的贝壳17 天前
人工智能·音频·语音识别·智能硬件·esp32-s3
ESP32-S3-CAM:豆包语音识别文字后控制小车(三)——SD卡本地音频识别转文字1、前面ESP32-S3-CAM:豆包语音识别文字后控制小车(二)——跑通demo代码已经把python 代码跑通了
憨波个18 天前
人工智能·深度学习·lstm·transformer·音频·语音识别
【说话人日志】从 LSTM attractor 到 Transformer attractor:EEND-TA论文:Transformer Attractors for Robust and Efficient End-to-End Neural Diarization 简称:EEND-TA 作者:Lahiru Samarakoon, Samuel J. Broughton, Marc Harkonen, Ivan Fung 时间:ASRU2023 任务:Speaker Diarization,回答“谁在什么时候说话”
憨波个18 天前
人工智能·深度学习·音频·语音识别
【说话人日志】从固定输出到可变说话人数:EEND-EDA论文:Encoder-Decoder Based Attractors for End-to-End Neural Diarization 简称:EEND-EDA 作者:Shota Horiguchi, Yusuke Fujita, Shinji Watanabe, Yawen Xue, Paola Garcia 时间:2021 arXiv v1,2022 期刊版整理 任务:Speaker Diarization,回答“谁在什么时候说话”
超开心~19 天前
音频
Audio 中的 drain 和 flash当上层应用(如播放器)检测到音频文件已到达末尾(EOF)时,它会向 AudioTrack 发出停止指令。Framework 会调用 HAL 的 out_drain 接口,要求硬件把缓冲区里剩余的字节“消化”完。
筱谙19 天前
嵌入式硬件·音频·蓝牙
BES 芯片跨核通讯与共享内存设计原理基于BES Best1600_SOC 项目代码实例分析 涉及核心:SensorHub、M33 (MCU)、M55 (DSP) 场景:陀螺仪头部追踪 → 空间音效渲染
iceslime24 天前
windows·音频·修复
Windows10系统静音修复相关在台式机使用过程中,经常遇到以下这种情况:自带音频设备并没有出现物理损坏,但是却无法正常发出声音,遂编辑bat以解决这一问题。
憨波个1 个月前
人工智能·transformer·音频·语音识别
【说话人日志】从 BLSTM 到 Self-Attention:SA-EEND论文:End-to-End Neural Speaker Diarization with Self-Attention 简称:SA-EEND 作者:Yusuke Fujita, Naoyuki Kanda, Shota Horiguchi, Yawen Xue, Kenji Nagamatsu, Shinji Watanabe 时间:2019 任务:Speaker Diarization,回答“谁在什么时候说话”
哦***71 个月前
华为·音频
华为Freebuds SE4 ANC降噪不稳定怎么回事?谁懂这种崩溃感!入手华为FreeBuds SE4 ANC之后,有时候用着用着,降噪突然变弱,一会儿又恢复正常,忽强忽弱的,研究了好久都找不到哪里出问题,麻了😤 后来去找客服问了一下,才知道一下这几种情况,都会导致降噪变弱: ✅办公室安安静静的时候,降噪稳稳的,但一走到窗边或户外吹风,降噪立马变弱 ✅有时候戴歪了、耳塞没塞紧,也会出现降噪忽强忽弱 ✅还有固件没更新,偶尔也会有小卡顿 其实核心原因就这4个,全是常识性问题,看完立马解决👇 1️⃣ 风噪模式自动切换,不是降噪失灵 这是最常见的原因!这款耳机有