音频处理库libros安装使用教程笔记

音频处理库libros安装使用教程

1.音频处理库librosa

sr:采样率

hop_length:帧移

overlapping:连续帧之间的重叠部分

n_fft:窗口大小

spectrum:频谱

spectrogram:频谱图或叫做语谱图

amplitude:振幅

mono:单声道

stereo:立体声

常用处理函数-核心IO和DSP(数字信号处理器):

bash 复制代码
http://librosa.org/doc/latest/core.html

2.librosa安装

conda

bash 复制代码
conda install -c conda-forge librosa

pip

bash 复制代码
pip install librosa

在系统范围内安装

bash 复制代码
pip install -u librosa

3.ffmpeg

一般的语音处理库读取只支持wav格式音频文件,需要配结合ffmpeg来读取其它格式的文件

1.安装ffmpeg的python接工具口库

bash 复制代码
conda install -c conda-forge ffmpeg

2.下载ffmpeg本地软件包

Builds - CODEX FFMPEG @ gyan.dev

下载其中一个zip即可,解压到电脑磁盘中,将bin目录放入系统环境变量中

4.ffmpeg手动文件转换使用

使用cmd输入ffmpeg命令进行音频格式转换

bash 复制代码
ffmpeg -i input.m4a output.wav
相关推荐
宝贝儿好18 小时前
【强化学习实战】第十一章:Gymnasium库的介绍和使用(1)、出租车游戏代码详解(Sarsa & Q learning)
人工智能·python·深度学习·算法·游戏·机器学习
绝世这天下20 小时前
【在 DGX Spark 上运行 vLLM-Omni 用于 Qwen3-TTS(语音设计,语音克隆)】
人工智能
陈大鱼头21 小时前
[译]费尽心思来保障 OpenClaw ?那跟直接用 GPT 有什么区别?
人工智能
Fleshy数模21 小时前
玩转OpenCV:视频椒盐噪声处理与图像形态学操作实战
人工智能·opencv·音视频
幂律智能21 小时前
Agent × 流程引擎融合架构:从静态流程到智能流程编排
人工智能·架构·agent
无垠的广袤21 小时前
ChatECNU 大语言模型与 PicoClaw 部署
人工智能·语言模型·自然语言处理·嵌入式·树莓派
爱淋雨的男人21 小时前
自动驾驶感知相关算法
人工智能·算法·自动驾驶
互联网科技看点21 小时前
AI算力爆发叠加数据资产风口,铂拉锐科技布局去中心化数字生态
人工智能·科技·去中心化
如若12321 小时前
flash-attn 安装失败?从报错到成功的完整排雷指南(CUDA 12.8 + PyTorch 2.7)
人工智能·pytorch·python
ALKAOUA21 小时前
力扣面试150题刷题分享
javascript·笔记