音频分割:长语音音频 分割为 短语音音频 - python 实现

在做语音任务时,有是会用到的语音音频是长音频,这就需要我们将长音频分割为短音频。

该示例将声音的音量和静默时间结合作为语音的分割条件。

使用音量和静默时间结合的分割条件,能够比较好的进行自然断句,不会话语没有说完就切断音频。

按照 python 库:

python 复制代码
pip install pydub

具体实现代码如下:

python 复制代码
#-*-coding:utf-8-*-
# date:2024-10
# Author: DataBall - XIAN
# Function: 长音频分割为短音频

from pydub import AudioSegment
from pydub.silence import split_on_silence
import os
import wave
import shutil
# 初始化
chunks_path = "./short_audio/" # 保存分割段音频的保存路径
audiopath = "audio/test_long.wav"
audiotype = 'wav' # 音频类型
print("audiopath:",audiopath)
# 读入音频
sound = AudioSegment.from_file(audiopath, format=audiotype)
'''
    根据 音量 和 静默 时间长度 条件进行音频分割
    示例:音量阈值 -25 dB , 静默阈值:300ms
'''
chunks = split_on_silence(sound,min_silence_len=300,silence_thresh=-25)

# 保存分割后的短音频
print('开始保存')
for i in range(len(chunks)):
    new = chunks[i]
    save_name = "{}{}.{}".format(chunks_path,i,audiotype)
    new.export(save_name, format=audiotype)

​​

助力快速掌握数据集的信息和使用方式。

数据可以如此美好

相关推荐
方安乐9 分钟前
杂记:Quart和Flask比较
后端·python·flask
得赢科技9 分钟前
2025年GEO营销应用白皮书 - 服务业区域推广深度剖析
大数据·人工智能
Deepoch11 分钟前
Deepoc具身智能家庭系统:重塑居家生活新体验
人工智能·科技·机器人·生活·具身模型·deepoc·deepoc具身模型开发板
嫂子开门我是_我哥14 分钟前
第十六节:异常处理:让程序在报错中稳定运行
开发语言·python
测试199814 分钟前
如何使用Appium实现移动端UI自动化测试?
自动化测试·软件测试·python·测试工具·ui·appium·测试用例
yuankoudaodaokou15 分钟前
无图纸如何定制汽车外饰件?3DeVOK MT+ QUICKSURFACE逆向设计解决方案
python·3d·汽车·机器翻译
GIS数据转换器24 分钟前
基于GIS的宠物救助服务平台
大数据·人工智能·科技·机器学习·无人机·智慧城市·宠物
qwy71522925816327 分钟前
3-用摄像头拍摄图像及视频
人工智能·opencv·音视频
AI街潜水的八角27 分钟前
基于YOLO26苹果水果缺陷检测系统1:苹果水果缺陷检测数据集说明(含下载链接)
人工智能·深度学习·神经网络
Solar202528 分钟前
工程材料企业如何借助数字化工具突破获客瓶颈:方法论与实践路径
大数据·人工智能·物联网