音频处理库libros安装使用教程笔记

音频处理库libros安装使用教程

1.音频处理库librosa

sr:采样率

hop_length:帧移

overlapping:连续帧之间的重叠部分

n_fft:窗口大小

spectrum:频谱

spectrogram:频谱图或叫做语谱图

amplitude:振幅

mono:单声道

stereo:立体声

常用处理函数-核心IO和DSP(数字信号处理器):

bash 复制代码
http://librosa.org/doc/latest/core.html

2.librosa安装

conda

bash 复制代码
conda install -c conda-forge librosa

pip

bash 复制代码
pip install librosa

在系统范围内安装

bash 复制代码
pip install -u librosa

3.ffmpeg

一般的语音处理库读取只支持wav格式音频文件,需要配结合ffmpeg来读取其它格式的文件

1.安装ffmpeg的python接工具口库

bash 复制代码
conda install -c conda-forge ffmpeg

2.下载ffmpeg本地软件包

Builds - CODEX FFMPEG @ gyan.dev

下载其中一个zip即可,解压到电脑磁盘中,将bin目录放入系统环境变量中

4.ffmpeg手动文件转换使用

使用cmd输入ffmpeg命令进行音频格式转换

bash 复制代码
ffmpeg -i input.m4a output.wav
相关推荐
格林威1 天前
常规的变焦镜头有哪些类型?能做什么?
人工智能·数码相机·opencv·计算机视觉·视觉检测·机器视觉·工业镜头
心无旁骛~1 天前
【OpenArm|Control】openarm机械臂ROS2仿真控制
人工智能·ros
丰锋ff1 天前
2013 年真题配套词汇单词笔记(考研真相)
笔记·学习·考研
程序员陆业聪1 天前
AI智能体的未来:从语言泛化到交互革命
人工智能
小小程序媛(*^▽^*)1 天前
第十二届全国社会媒体处理大会笔记
人工智能·笔记·学习·ai
却道天凉_好个秋1 天前
OpenCV(二):加载图片
人工智能·opencv·计算机视觉
音视频牛哥1 天前
系统级超低延迟音视频直播模块时代:如何构建可控、可扩展的实时媒体底座
人工智能·音视频·大牛直播sdk·rtsp播放器·rtmp播放器·rtsp服务器·rtmp同屏推流
铁手飞鹰1 天前
VS2022创建项目工程笔记
c++·windows·笔记·visualstudio
学無芷境1 天前
VOCO摘要
人工智能
格林威1 天前
机器视觉的工业镜头有哪些?能做什么?
人工智能·深度学习·数码相机·算法·计算机视觉·视觉检测·工业镜头