音频分割:长语音音频 分割为 短语音音频 - python 实现

在做语音任务时,有是会用到的语音音频是长音频,这就需要我们将长音频分割为短音频。

该示例将声音的音量和静默时间结合作为语音的分割条件。

使用音量和静默时间结合的分割条件,能够比较好的进行自然断句,不会话语没有说完就切断音频。

按照 python 库:

python 复制代码
pip install pydub

具体实现代码如下:

python 复制代码
#-*-coding:utf-8-*-
# date:2024-10
# Author: DataBall - XIAN
# Function: 长音频分割为短音频

from pydub import AudioSegment
from pydub.silence import split_on_silence
import os
import wave
import shutil
# 初始化
chunks_path = "./short_audio/" # 保存分割段音频的保存路径
audiopath = "audio/test_long.wav"
audiotype = 'wav' # 音频类型
print("audiopath:",audiopath)
# 读入音频
sound = AudioSegment.from_file(audiopath, format=audiotype)
'''
    根据 音量 和 静默 时间长度 条件进行音频分割
    示例:音量阈值 -25 dB , 静默阈值:300ms
'''
chunks = split_on_silence(sound,min_silence_len=300,silence_thresh=-25)

# 保存分割后的短音频
print('开始保存')
for i in range(len(chunks)):
    new = chunks[i]
    save_name = "{}{}.{}".format(chunks_path,i,audiotype)
    new.export(save_name, format=audiotype)

​​

助力快速掌握数据集的信息和使用方式。

数据可以如此美好

相关推荐
godspeed_lucip7 小时前
LLM和Agent——专题5: LLM Ops 入门(1)
人工智能·python
lqqjuly7 小时前
状态空间模型:从经典控制论到现代序列建模——S4、Mamba 及其理论体系的完整论述(一)
人工智能
逻辑君7 小时前
本地LLM的图像和视频理解
人工智能
AI医影跨模态组学7 小时前
Nat. Biomed. Eng(1区top,IF=26.6)上海科技大学钱学军团队:一种用于乳腺癌风险分层的多模态机器学习模型
人工智能·科技·深度学习·机器学习·论文·医学影像
翼龙云_cloud7 小时前
腾讯云代理商:腾讯云云桌面如何部署Hermes Agent?
人工智能·云计算·腾讯云·ai智能体·hermes agent
菜鸡旭旭7 小时前
【AI培训中台-话术润色】
人工智能
ftpeak8 小时前
深入浅出 LoongSuite Python Agent:让你的 AI 应用「透明化」(下篇)
开发语言·人工智能·ai·ai编程·ai开发
蔡俊锋8 小时前
为Agent重新设计云:Vibe Coding背后的新基建
人工智能·ai编程
l1t8 小时前
DeepSeek总结的使用实体-组件-系统和基于存在性处理进行Python编程7-8
开发语言·python
俊哥工具8 小时前
无广告免费壁纸工具,手机电脑壁纸随心更换
python·智能手机·django·计算机外设·virtualenv·pygame