音频

Jons伯恩特11 天前
音视频·音频·噪音门·噪声门
音频中的噪音门在音频矩阵中,噪音门通过精准控制信号通断,可有效消除底噪、隔离串音,提升音频清晰度。就如同他的名字,噪音门(Noise-Gate通常被简称为门限)是一个能把低于特定音量的音频“拦在门外”的处理工具。
花开莫与流年错_14 天前
数学·音视频·音频·软件
音频相关数学支持时域(Time domain)是描述数学函数或物理信号对时间的关系,如果声音对应频率正负波动,对应事件x轴为时间,y轴为振幅
我是海飞20 天前
音频·pcm
16进制pcm数据转py波形脚本将16bit的单声道或者双声道的16进制的pcm数据转成波形图片出来分析数据,python脚本如下:
EthanLifeGreat21 天前
人工智能·pytorch·深度学习·音频·语音识别
ParallelWaveGAN-KaldiFree:纯Pytorch的PWGEspnet在几年前已经实现过了PWG了,但是还是需要使用kaldi格式的文件作为输入输出,十分不便,博主写了一份使用Pytorch进行数据预处理的代码,直接接入Espnet的PWG,不需要构造Kaldi文件或环境,直接进行PWG训练和推理。
努力还债的学术吗喽23 天前
人工智能·深度学习·生成对抗网络·密码学·音频·gan·隐写
2021 IEEE【论文精读】用GAN让音频隐写术骗过AI检测器 - 对抗深度学习的音频信息隐藏本文为个人阅读GAN音频隐写论文,部分内容注解,由于原文篇幅较长这里就不再一一粘贴,仅对原文部分内容做注解,仅供参考详情参考原文链接
却道天凉_好个秋1 个月前
音视频·音频·adts
音视频学习(五十二):ADTSADTS(Audio Data Transport Stream)是一种用于 AAC(Advanced Audio Coding)音频数据传输 的帧封装格式。它常见于 AAC 裸流(raw AAC) 的存储与传输场景,比如在线广播、流媒体推送和文件存储。
思绪漂移1 个月前
人工智能·音频·腾讯云·信息传播
从博客到播客:文本转音频的全流程技术点最新版的ima可以支持根据文章生成播客了将博客转化为播客,本质是解决信息传播的「最后一公里」问题——让复杂 / 有用知识通过声音穿透场景限制。
俺不理解1 个月前
音频·鸿蒙·录音·播放·纯血鸿蒙
纯血鸿蒙 AudioRenderer+AudioCapturer+RingBuffer 实现麦克风采集+发声总共两个类,放到代码里,就可以快速完成K歌的效果,但应用层这么做延迟是比较高的,只是做一个分享。
wang_hao..1 个月前
android·音频
Day4.AndroidAudio初始化AudioServer 是 Android 音频系统的核心服务,负责管理音频硬件资源、音频策略调度、跨进程音频通信等核心功能。它由 Init 进程启动,是系统核心服务之一,直接影响音频播放、录音、音效处理等功能的正常运行。
Kandiy180253981871 个月前
音视频·音频·视频编解码
DP4871音频放大芯片3W功率单通道AB类立体声/音频放大器DP4871 是一款桥式带关断功能的单通道 AB 类音频功率放大器。在 5V 输入工作电压下,负 载 3Ω时,平均输出功率为 3W,总谐波失真 THD 小于 10%。当 SHUTDOWN 管脚电压为 VDD时,芯片工作在关断模式下,此时芯片的功耗极低,IQ 仅为 0.6uA;同时芯片内置噪音消除电路,消除了芯片启动和关断过程中的噗噗声和咔嗒声。 DP4871 采用 SOP8 封装,具有输入工作电压范围宽(2.0V~5.5V),外围简单,成本低等优,是高保真、大功率电子产品的理想器件。
TalkU浩克1 个月前
开发语言·c++·音频·istft·stft·essentia
C++中使用Essentia实现STFT/ISTFT最近在做一个项目,需要将音频送入 AI 模型进行处理。整个流程包括:从 .wav 文件中加载音频;进行 短时傅里叶变换(STFT);
孤独的追光者2 个月前
算法·汽车·音频·信号处理·数字信号处理
论文阅读|汽车虚拟环绕音响系统设计与实现策略的比较研究《Comparative Study of Design and Implementation Strategies of Automotive Virtual Surround Audio Systems》
Jons伯恩特2 个月前
音频·动态压缩·juce·压缩器·c++实现·曲线绘制
音频动态压缩算法曲线实现动态范围压缩算法(Dynamic Range Compression,DRC)是将音频信号的动态范围映射到一个较小的范围内的过程,即降低较高的峰值的信号电平,而不处理较安静的部分。DRC被广泛用于音频录制、制作工作、降噪、广播和现场表演等应用中。
哦***73 个月前
华为·音频
华为 FreeArc耳机不弹窗?新买的华为 FreeArc终于到手啦!但是我发现有个问题,就是有时候耳机连接没有弹窗动画,大家有没有遇到过这种情况呢?后来我也是咨询了客服小姐姐才将问题解决。 具体的操作方法我放下面啦,大家快来看看吧:
FF-Studio3 个月前
笔记·自动化·音视频·音频·信号处理
【DSP笔记 · 第7章】信号处理的“整形”大师:FIR滤波器与线性相位的奥秘在上一章,我们学习了IIR滤波器,它像一位精明的工程师,能用最少的计算资源(低阶数)实现非常陡峭的频率响应。但这种高效是有代价的——它的相位响应是非线性的。这会带来什么问题呢?想象一下,一个完美的方波信号通过一个非线性相位的滤波器,出来的波形可能在方波的拐角处出现“过冲”或“振铃”,波形发生了畸变。在很多应用中,比如普通的语音通话,这种细微的畸变无伤大雅。但在高保真音频、医学图像处理、数据通信等领域,保持波形的原始形状至关重要。
FF-Studio3 个月前
笔记·fpga开发·自动化·音视频·音频·信号处理
【DSP笔记 · 第5章】数字滤波器的蓝图:从数学公式到硬件实现的艺术在前几章,我们已经领略了数字信号处理的魅力。在未来的章节(第六、七章),我们将深入学习如何设计一个滤波器——也就是根据需求,计算出一套神奇的数学系数,来“筛”出我们想要的信号。
riveting3 个月前
人工智能·功能测试·音频·智能家居·边缘计算·智能硬件
明远智睿SD2351核心板:边缘计算时代的工业级核心引擎深度解析在工业4.0与物联网深度融合的背景下,边缘计算设备正从单一功能模块向高集成度、智能化平台演进。明远智睿推出的SD2351核心板,凭借其异构计算架构、工业级接口资源和全栈技术生态,重新定义了边缘计算设备的性能边界。本文将从技术架构、场景适配、生态支撑三个维度,深度解析SD2351如何成为工业网关与智能终端的"核心大脑"。
哦***73 个月前
华为·音频
华为FreeArc能和其他华为产品共用充电线吗?最近刚买的FreeArc终于到手啦,看到网上有朋友说,这次的耳机是不附带充电线,开箱后发现果真如此,那FreeArc到底用什么规格的充电线,能不能和华为的Type-C数据线通用,我来给大家解答一下吧! FreeArc可以选择常规电压5V,电流≥1A,功率5W及以上的充电器,都是可以哦!大家根据实际情况选择就好啦! 随着现在科技产品更新迭代的加快,其实很多时候往往是电子产品买回来后,家里多了一堆用不完的Type-C数据线和充电器,所以FreeArc和airpods一样未附带充电线、充电头,因为它可以和华为的
声光界4 个月前
音频·声学·眼镜·声学技术
小米MUJIA智能音频眼镜来袭智能眼镜赛道风云再起,小米新力作MIJIA智能音频眼镜2正式亮相,引发市场热议。 这款产品在设计和功能上都有显著提升,为用户带来更舒适便捷的佩戴体验,同时也标志着小米在智能眼镜领域的持续深耕。
Panesle4 个月前
大模型·transformer·音频·扩散模型·文本生成音乐
ACE-Step:扩散自编码文生音乐基座模型快速了解ACE-Step 是一款由 ACE Studio 和 StepFun 开发的新型开源音乐生成基础模型。它通过整合基于扩散的生成方式、Sana 的深度压缩自编码器(DCAE)以及轻量级线性变换器,在音乐生成速度、音乐连贯性和可控性等方面达到前所未有的高度,成功克服了现有方法的关键局限性。