脚本:批量修改语音后缀(比如flac转wav) + 对语音进行重采样

一、 批量修改后缀

python 复制代码
import os
# 目标文件
filePath = 'E:\\Datasets\\16Khz\\train\\LibriSpeech\\train-clean-100'
# 算法
for i,j,k in os.walk(filePath):
        if len(k)!=0:
                for index in range(len(k)):
                        path = i
                        new_k= k[index].replace('.flac', '.wav')
                        os.rename(os.path.join(path,k[index]),os.path.join(path,new_k))

二、批量重采样

python 复制代码
import os
import librosa
import soundfile as sf

filePath = 'E:\PaperWork\Codec\datasets'
for i,j,k in os.walk(filePath):
        if len(k)!=0:
                for index in range(len(k)):
                        if(k[index].endswith('.wav')):
                                path = i
                                audio, sr = librosa.load(path+'\\'+k[index])
                                # Resample audio to 8 kHz
                                resampled_audio = librosa.resample(audio, orig_sr=sr, target_sr=8000)
                                # args:保存路径,重采样目标,目标采样率
                                sf.write(path+'\\'+k[index],resampled_audio,samplerate=8000)
相关推荐
sheji34162 分钟前
【开题答辩全过程】以 基于hadoop的空气质量数据分析及可视化系统为例,包含答辩的问题和答案
大数据·hadoop·数据分析
爱打代码的小林6 分钟前
用 PyTorch 实现 CBOW 模型
人工智能·pytorch·python
Aloudata7 分钟前
数据工程指南:指标平台选型避坑与 NoETL 语义编织技术解析
sql·数据分析·自动化·etl·指标平台
CDA数据分析师干货分享9 分钟前
【干货】CDA一级知识点拆解3:《CDA一级商业数据分析》第3章 商业数据分析框架
大数据·人工智能·数据挖掘·数据分析·cda证书·cda数据分析师
曲幽16 分钟前
FastAPI定时任务全攻略:从入门到避开多进程的坑
python·fastapi·web·async·sqlalchemy·lock·apscheduler·works
逢城戏元宇宙19 分钟前
区域文化IP‘逢城戏’进军元宇宙,AR盲盒带来哪些全新互动体
python
AI数据皮皮侠27 分钟前
中国耕地利用强度数据(2018-2023)
大数据·人工智能·python·深度学习·机器学习
lpfasd12329 分钟前
Spring Boot 定时任务详解(从入门到实战)
spring boot·后端·python
查无此人byebye37 分钟前
深度解析:当前AI视频生成为何普遍“短小精悍”?
人工智能·pytorch·python·深度学习·音视频·transformer
小白学大数据1 小时前
Python 进阶爬虫:解析知识星球 API
开发语言·爬虫·python