音频处理库libros安装使用教程笔记

音频处理库libros安装使用教程

1.音频处理库librosa

sr:采样率

hop_length:帧移

overlapping:连续帧之间的重叠部分

n_fft:窗口大小

spectrum:频谱

spectrogram:频谱图或叫做语谱图

amplitude:振幅

mono:单声道

stereo:立体声

常用处理函数-核心IO和DSP(数字信号处理器):

bash 复制代码
http://librosa.org/doc/latest/core.html

2.librosa安装

conda

bash 复制代码
conda install -c conda-forge librosa

pip

bash 复制代码
pip install librosa

在系统范围内安装

bash 复制代码
pip install -u librosa

3.ffmpeg

一般的语音处理库读取只支持wav格式音频文件,需要配结合ffmpeg来读取其它格式的文件

1.安装ffmpeg的python接工具口库

bash 复制代码
conda install -c conda-forge ffmpeg

2.下载ffmpeg本地软件包

Builds - CODEX FFMPEG @ gyan.dev

下载其中一个zip即可,解压到电脑磁盘中,将bin目录放入系统环境变量中

4.ffmpeg手动文件转换使用

使用cmd输入ffmpeg命令进行音频格式转换

bash 复制代码
ffmpeg -i input.m4a output.wav
相关推荐
hetao1733837几秒前
2026-01-16~19 hetao1733837 的刷题笔记
c++·笔记·算法
2501_94183726几秒前
龙虾性别分类与未定义类别识别模型训练 tood_r50_fpn_ms-2x_coco实现详解_1
人工智能·分类·数据挖掘
彩虹糖_haha3 分钟前
多线程并发处理模式详解
人工智能·计算机视觉
Alter12303 分钟前
海南椰子鸡和宁夏滩羊的拼多多“漂流”:透视地域特产的数字进化论
大数据·人工智能
柠萌f4 分钟前
《当投放预算跑不动:易元AI如何解决电商素材产能的系统性瓶颈》
人工智能
小陈phd4 分钟前
langGraph从入门到精通(七)——基于 LangGraph 的结构化数据AI 代理自动入库实战
人工智能
汽车仪器仪表相关领域5 分钟前
全组分精准捕获,台架研发中枢:MEXA-ONE发动机尾气测量装置项目实战全景
大数据·人工智能·功能测试·单元测试·压力测试·可用性测试
(; ̄ェ ̄)。6 分钟前
机器学习入门(八)过拟合、欠拟合、L1、L2正则化
人工智能·机器学习
qyresearch_6 分钟前
全球干燥水果和蔬菜市场:健康消费浪潮下的增长引擎与产业重构
大数据·人工智能·物联网
没学上了6 分钟前
Vlm-RT-DETR网络模型部署推理
人工智能