音频分割:长语音音频 分割为 短语音音频 - python 实现

在做语音任务时,有是会用到的语音音频是长音频,这就需要我们将长音频分割为短音频。

该示例将声音的音量和静默时间结合作为语音的分割条件。

使用音量和静默时间结合的分割条件,能够比较好的进行自然断句,不会话语没有说完就切断音频。

按照 python 库:

python 复制代码
pip install pydub

具体实现代码如下:

python 复制代码
#-*-coding:utf-8-*-
# date:2024-10
# Author: DataBall - XIAN
# Function: 长音频分割为短音频

from pydub import AudioSegment
from pydub.silence import split_on_silence
import os
import wave
import shutil
# 初始化
chunks_path = "./short_audio/" # 保存分割段音频的保存路径
audiopath = "audio/test_long.wav"
audiotype = 'wav' # 音频类型
print("audiopath:",audiopath)
# 读入音频
sound = AudioSegment.from_file(audiopath, format=audiotype)
'''
    根据 音量 和 静默 时间长度 条件进行音频分割
    示例:音量阈值 -25 dB , 静默阈值:300ms
'''
chunks = split_on_silence(sound,min_silence_len=300,silence_thresh=-25)

# 保存分割后的短音频
print('开始保存')
for i in range(len(chunks)):
    new = chunks[i]
    save_name = "{}{}.{}".format(chunks_path,i,audiotype)
    new.export(save_name, format=audiotype)

​​

助力快速掌握数据集的信息和使用方式。

数据可以如此美好

相关推荐
大模型任我行2 小时前
阿里:揭示RLVR训练不稳定性根源
人工智能·语言模型·自然语言处理·论文笔记
沃达德软件6 小时前
视频增强技术解析
人工智能·目标检测·机器学习·计算机视觉·超分辨率重建
魔乐社区6 小时前
GLM-5上线魔乐社区,基于昇腾的模型推理+训练部署教程请查收!
人工智能·开源·大模型
geneculture7 小时前
化繁为简且以简驭繁:唯文论英汉对照哲学术语49个主义/论
人工智能·融智学的重要应用·哲学与科学统一性·信息融智学·融智时代(杂志)
睡醒了叭7 小时前
coze-工作流-http请求
人工智能·aigc
清水白石0087 小时前
Python 纯函数编程:从理念到实战的完整指南
开发语言·python
twilight_4697 小时前
机器学习与模式识别——机器学习中的搜索算法
人工智能·python·机器学习
冰西瓜6008 小时前
深度学习的数学原理(十)—— 权重如何自发分工
人工智能·深度学习·计算机视觉
niuniudengdeng8 小时前
基于时序上下文编码的端到端无文本依赖语音分词模型
人工智能·数学·算法·概率论
Jia ming8 小时前
《智能法官软件项目》—罪名初判模块
python·教学·案例·智能法官