音频处理库libros安装使用教程笔记

音频处理库libros安装使用教程

1.音频处理库librosa

sr:采样率

hop_length:帧移

overlapping:连续帧之间的重叠部分

n_fft:窗口大小

spectrum:频谱

spectrogram:频谱图或叫做语谱图

amplitude:振幅

mono:单声道

stereo:立体声

常用处理函数-核心IO和DSP(数字信号处理器):

bash 复制代码
http://librosa.org/doc/latest/core.html

2.librosa安装

conda

bash 复制代码
conda install -c conda-forge librosa

pip

bash 复制代码
pip install librosa

在系统范围内安装

bash 复制代码
pip install -u librosa

3.ffmpeg

一般的语音处理库读取只支持wav格式音频文件,需要配结合ffmpeg来读取其它格式的文件

1.安装ffmpeg的python接工具口库

bash 复制代码
conda install -c conda-forge ffmpeg

2.下载ffmpeg本地软件包

Builds - CODEX FFMPEG @ gyan.dev

下载其中一个zip即可,解压到电脑磁盘中,将bin目录放入系统环境变量中

4.ffmpeg手动文件转换使用

使用cmd输入ffmpeg命令进行音频格式转换

bash 复制代码
ffmpeg -i input.m4a output.wav
相关推荐
狮子座明仔18 小时前
体验式强化学习:让模型学会“吃一堑长一智“
人工智能·深度学习·自然语言处理
FakeOccupational19 小时前
【电路笔记 通信】香农公式(Shannon-Hartley Theorem/香农-哈特利定理)证明(暂记)
笔记
冬奇Lab19 小时前
一天一个开源项目(第30篇):banana-slides - 基于 nano banana pro 的原生 AI PPT 生成应用
人工智能·开源·aigc
冬奇Lab19 小时前
Plugin 扩展实战:增强 Claude Code 的能力
人工智能·ai编程·claude
大好人ooo19 小时前
企业级LLM评估与测试
人工智能
coding者在努力19 小时前
LangChain简介,最直白的介绍
人工智能·python·语言模型·langchain
福大大架构师每日一题19 小时前
dify 1.13.0——Human-in-the-Loop与工作流执行架构全面升级,释放AI与人的协作潜力
人工智能·架构
文艺倾年19 小时前
【强化学习&SWE】如何无容器化进行强化学习训练
人工智能·分布式·大模型
ZhengEnCi20 小时前
06. Embedding模型与向量化
人工智能
人机与认知实验室20 小时前
人类智能中依然存在还未被发现的新机制
人工智能