音频处理库libros安装使用教程笔记

音频处理库libros安装使用教程

1.音频处理库librosa

sr:采样率

hop_length:帧移

overlapping:连续帧之间的重叠部分

n_fft:窗口大小

spectrum:频谱

spectrogram:频谱图或叫做语谱图

amplitude:振幅

mono:单声道

stereo:立体声

常用处理函数-核心IO和DSP(数字信号处理器):

bash 复制代码
http://librosa.org/doc/latest/core.html

2.librosa安装

conda

bash 复制代码
conda install -c conda-forge librosa

pip

bash 复制代码
pip install librosa

在系统范围内安装

bash 复制代码
pip install -u librosa

3.ffmpeg

一般的语音处理库读取只支持wav格式音频文件,需要配结合ffmpeg来读取其它格式的文件

1.安装ffmpeg的python接工具口库

bash 复制代码
conda install -c conda-forge ffmpeg

2.下载ffmpeg本地软件包

Builds - CODEX FFMPEG @ gyan.dev

下载其中一个zip即可,解压到电脑磁盘中,将bin目录放入系统环境变量中

4.ffmpeg手动文件转换使用

使用cmd输入ffmpeg命令进行音频格式转换

bash 复制代码
ffmpeg -i input.m4a output.wav
相关推荐
_codemonster3 分钟前
BERT和Transformer的双向性理解
人工智能·bert·transformer
十铭忘10 分钟前
SAM2跟踪的理解19——位置编码
人工智能·深度学习·计算机视觉
张二娃同学14 分钟前
深度学习入门篇——Github的使用和项目的导入
人工智能·git·深度学习·开源·github
一个处女座的程序猿O(∩_∩)O17 分钟前
transformer模型:彻底改变AI格局的革命性架构
人工智能·深度学习·transformer
Ahtacca22 分钟前
Linux环境下前后端分离项目(Spring Boot + Vue)手动部署全流程指南
linux·运维·服务器·vue.js·spring boot·笔记
Damon小智28 分钟前
【TextIn大模型加速器 + 火山引擎】跨国药企多语言手册智能翻译系统设计与实现
人工智能·ai·ocr·agent·火山引擎
2501_9361460429 分钟前
YOLOv26鱼类目标检测与计数任务实现与优化
人工智能·yolo·目标检测
老吴学AI31 分钟前
范式转移:生成式AI如何重新定义“智能应用
人工智能·aigc·agent
540_54035 分钟前
ADVANCE Day33
人工智能·python·机器学习
8K超高清1 小时前
风机叶片运维:隐藏于绿色能源背后的挑战
网络·人工智能·科技·5g·智能硬件