音频

Silicore_Emma4 天前
音频·智能音箱·消费电子·音频功率放大器·芯谷科技·音频设备·8002d
芯谷科技—D8002:2.8W 单通道 AB 类差分输入音频功率放大器D8002 是芯谷科技(Silicore)推出的一款高性能单通道 AB 类差分输入音频功率放大器,采用 SOP8 封装,专为便携式音频设备设计。其差分输入架构有效提升了噪声抑制能力,配合极简的外围电路设计,可在保证高品质、低失真音频输出的同时,大幅降低系统 BOM 成本。
哦***75 天前
华为·音频·harmonyos
真实评测 | FreeBuds Pro 5独立空间音频作为用了大半年的FreeBuds Pro5老用户,本来以为耳机升级也就小修小补,没想到更完最新的固件版本,这个独立空间音频直接戳中我! 之前的空间音频只有华为手机才能用,这次更新后安卓和IOS系统都能安排上了。 这次升级耳机不用死死绑定华为手机,不管连啥设备,双声道音频都能给你渲染出环绕感,这点挺不戳的!😭 平时通勤、宅家实测了好几天,说说最真实的感受: ✅看剧/电影氛围感拉满 晚上窝在床上追悬疑剧,转头的时候,身后的脚步声、环境音会跟着脑袋动,不是死板的耳机立体声,真的像身边有环绕声场,代入感直接拉满
daanpdf10 天前
音频
新人教版七年级下册英语单词表完整版及听力音频新人教版七年级下册英语完整单词表(含音标 + 词性 + 中文),并附上听力音频,直接可用、可打印。我用夸克网盘分享了「【2】七年级下册英语课本+单词表+听力音频(人教版)」,
一块小土坷垃10 天前
macos·音频·开源软件
## Permute 3.14.7 特别版 – 强大的 macOS 多媒体格式转换工具体验### 软件简介Permute 是一款运行在 macOS 上的**极速多媒体格式转换工具**,支持视频、音频、图像乃至 ISO 镜像文件的相互转换。它的最大特点是**操作极简**:只需要将文件拖拽到软件窗口,选择目标格式,点击一下就能开始转换,几乎不需要任何额外设置。
Prannt16 天前
ai·音频·语音识别
星朗智能语音——声音设计本来想试试声音克隆功能,但我上哪去找杀手和熊孩子的干音原声去克隆啊?!直到昨天,群里的视频剪辑大佬甩给我一个宝藏网站的隐藏功能——声音设计。体验了十分钟后,我直接惊掉下巴!它居然完全不需要你提供任何录音,只要你像玩捏脸游戏一样,用文字描述出你想要的声音特征(比如:25岁冷酷男青年,语速缓慢,带点沙哑),它就能凭空给你“捏”出一个绝无仅有、感情丰沛的专属音色!
憨波个17 天前
人工智能·深度学习·算法·音频·语音识别
【说话人日志】DOVER-Lap:overlap-aware diarization 输出融合算法论文:DOVER-Lap: A Method for Combining Overlap-aware Diarization Outputs 作者:Desh Raj, Leibny Paola Garcia-Perera, Zili Huang, Shinji Watanabe, Daniel Povey, Andreas Stolcke, Sanjeev Khudanpur 时间:2020 arXiv:2011.01997 任务:Speaker Diarization Output Combinatio
憨波个17 天前
人工智能·算法·音频·语音识别·聚类
【说话人日志】DOVER:diarization 输出融合算法论文:DOVER: A Method for Combining Diarization Outputs 作者:Andreas Stolcke, Takuya Yoshioka 单位:Microsoft Speech and Dialog Research Group 时间:2020 arXiv v2 / ASRU 2019 相关工作 arXiv:1909.08090 任务:Speaker Diarization Output Combination,把多个 diarization 系统或多个通道的输出融
代码小书生18 天前
音频·视频·视频下载·8k·4k·下载神器·画质
视频下载工具!支持8K、4K分辨率画质,视频音频文件多线程下载!字幕同步匹配下载保存到本地,自带视频格式转换功能!哈喽各位伙伴大家好!今天给大家分享一款超强的视频下载工具!它默认支持 8K、4K 高清画质与多线程高速下载,覆盖全网众多音视频网站,粘贴链接自动下载,还能预览、转格式、看速度、开文件夹,功能齐全、操作简单,追剧、素材保存都超方便!
声光界23 天前
人工智能·音频·信号处理·声学
《信号处理赋能智能体音感知》《2026GAS声学大讲堂——音频产业创新技术公益讲座》第一期计算机听觉与心理生理健康专题,讲座第7讲将于4月23日周四19点开讲,本次邀请了北京理工大学博士生李恩泽演讲,讲座主题《信号处理赋能智能体音感知》。(点击观看直播)
凛_Lin~~23 天前
android·音频·安卓
Android录音、试听功能实现安卓中可使用AudioRecord进行音频录制,录制的结果是pcm文件,也就是音频裸数据(裸流)。可调用AudioRecord.startRecording进行录制,不过使用前需要初始化AudioRecord。
憨波个25 天前
人工智能·深度学习·音频·语音识别
【说话人日志】多说话人数据仿真 Property-Aware Simulation论文:Property-Aware Multi-Speaker Data Simulation: A Probabilistic Modelling Technique for Synthetic Data Generation 作者:Tae Jin Park, He Huang, Coleman Hooper, Nithin Koluguri, Kunal Dhawan, Ante Jukic, Jagadeesh Balam, Boris Ginsburg 时间:2023 会议:CHiME-7 Wor
憨波个25 天前
人工智能·机器学习·音频·语音识别·聚类
【说话人日志】Sortformer:将说话人日志接入多说话人 ASR论文:Sortformer: A Novel Approach for Permutation-Resolved Speaker Supervision in Speech-to-Text Systems 简称:Sortformer 作者:Taejin Park, Ivan Medennikov, Kunal Dhawan, Weiqing Wang, He Huang, Nithin Rao Koluguri, Krishna C. Puvvada, Jagadeesh Balam, Boris Gin
重生之我在安卓搞音频1 个月前
音频·安卓
一、Android 音频简介文档类型:理论基础 适用读者:系统工程师、Framework/HAL 开发者、音视频方向架构师在移动终端与嵌入式系统中,应用层所感知的“音频”可归纳为两条主路径:录制(Capture)与播放(Playback)。
周末也要写八哥1 个月前
音频
Cubase Pro v15.0音乐创作全流程下载与安装指南对于录音棚与影视配乐师或业余音乐创作爱好者来说,应该不会感到陌生。‌Cubase‌是一款专业级‌数字音频工作站,广泛用于音乐创作、录音、编曲、混音及母带处理等全流程音乐制作环节。
海特伟业1 个月前
音频
工厂IP广播/企业IP广播/车间IP广播系统-集音乐铃声、新闻播报、紧急喊话、呼叫对讲、领导讲话、消防广播于一体的数字交互式IP广播系统方案与应用工厂IP广播 企业IP广播 车间IP广播系统-集音乐铃声、新闻播报、紧急喊话、呼叫对讲消防广播于一体的数字交互式IP广播系统方案与应用
爱上珍珠的贝壳1 个月前
人工智能·音频·语音识别·esp32-s3·语音转文字·豆包
ESP32-S3-CAM:豆包语音识别文字后控制小车(终章)——语音控制+L298N模块驱动小车1)L198N连接两个轮子,然后用胶带粘到车架上的,比较丑陋,先组装起来2)供电:我是用充电宝给ESP32-S3供电;用电池仓给L298N供电
Code-keys1 个月前
系统架构·音频·语音识别
【WEKWS】论文解读 && 语音唤醒系统架构详解 && 实战WEKWS (Wake-up Word Keyword Spotting;https://arxiv.org/pdf/2210.16743.pdf) 是一个基于PyTorch的端到端关键词识别系统,支持多种深度学习模型架构,包括TCN、FSMN、GRU、MDTC等。该项目提供了完整的训练、推理、部署和测试流程。
超开心~1 个月前
音频
Android audio中的AUDIO_OUTPUT_FLAG_NON_BLOCKING如字面意思,非阻塞式写入,在以下文件中也有相关定义。AudioOutputFlags.aidl /** * Write operations must return as fast as possible instead of * being blocked until all provided data has been consumed. */ NON_BLOCKING = 5,
爱上珍珠的贝壳1 个月前
人工智能·音频·语音识别·esp32-s3·小车
ESP32-S3-CAM:豆包语音识别文字后控制小车(规划)最近一直很忙,有半个月没折腾板子了,但一直都有个想法,搞个复杂一丢丢的需求,通过MIC拾音,然后豆包后台接口去识别语音内容,转成文字后,再控制小车前进还是后退。
爱上珍珠的贝壳1 个月前
音频·语音识别·智能硬件·esp32-s3·豆包
ESP32-S3-CAM:豆包语音识别文字后控制小车(四)——增加mic拾音后通过豆包语音识别后转文字输出ESP32-S3-CAM:豆包语音识别文字后控制小车(三)——SD卡本地音频识别转文字本地音频文件已经识别成功了,接下来就是增加mic拾音转文字功能。