音频处理库libros安装使用教程笔记

音频处理库libros安装使用教程

1.音频处理库librosa

sr:采样率

hop_length:帧移

overlapping:连续帧之间的重叠部分

n_fft:窗口大小

spectrum:频谱

spectrogram:频谱图或叫做语谱图

amplitude:振幅

mono:单声道

stereo:立体声

常用处理函数-核心IO和DSP(数字信号处理器):

bash 复制代码
http://librosa.org/doc/latest/core.html

2.librosa安装

conda

bash 复制代码
conda install -c conda-forge librosa

pip

bash 复制代码
pip install librosa

在系统范围内安装

bash 复制代码
pip install -u librosa

3.ffmpeg

一般的语音处理库读取只支持wav格式音频文件,需要配结合ffmpeg来读取其它格式的文件

1.安装ffmpeg的python接工具口库

bash 复制代码
conda install -c conda-forge ffmpeg

2.下载ffmpeg本地软件包

Builds - CODEX FFMPEG @ gyan.dev

下载其中一个zip即可,解压到电脑磁盘中,将bin目录放入系统环境变量中

4.ffmpeg手动文件转换使用

使用cmd输入ffmpeg命令进行音频格式转换

bash 复制代码
ffmpeg -i input.m4a output.wav
相关推荐
wggmrlee16 小时前
模型训练流程
人工智能
南境十里·墨染春水16 小时前
C++笔记 继承关系中构造和析构顺序(面向对象)
开发语言·c++·笔记
逆境不可逃16 小时前
【用AI学Agent】Agent入门前置:大模型基础(开发向)
人工智能·深度学习·机器学习
热爱生活的猴子16 小时前
PyTorch导出ONNX报错(ShapeInferenceError)问题笔记(含dynamo=False作用解析)
人工智能·pytorch·笔记
新缸中之脑16 小时前
用Kreuzberg提取文档结构
人工智能
Gauss松鼠会17 小时前
【GaussDB】GaussDB技术解读之AI大模型在智能运维场景的应用
运维·人工智能·gaussdb
财经汇报17 小时前
Unloq发布SC+平台 包括智能合约解决清算难题
大数据·人工智能·智能合约
2401_8322981017 小时前
模型军备竞赛白热化:OpenClaw 3 月模型生态爆发,GPT-5.4 / 国产模型双轮驱动
网络·人工智能
Coder个人博客17 小时前
11_apollo_docker_setup_host子模块软件架构分析
人工智能·架构
猹叉叉(学习版)17 小时前
【系统分析师_知识点整理】 11.软件架构设计
笔记·架构·软考·系统分析师