音频分割:长语音音频 分割为 短语音音频 - python 实现

在做语音任务时,有是会用到的语音音频是长音频,这就需要我们将长音频分割为短音频。

该示例将声音的音量和静默时间结合作为语音的分割条件。

使用音量和静默时间结合的分割条件,能够比较好的进行自然断句,不会话语没有说完就切断音频。

按照 python 库:

python 复制代码
pip install pydub

具体实现代码如下:

python 复制代码
#-*-coding:utf-8-*-
# date:2024-10
# Author: DataBall - XIAN
# Function: 长音频分割为短音频

from pydub import AudioSegment
from pydub.silence import split_on_silence
import os
import wave
import shutil
# 初始化
chunks_path = "./short_audio/" # 保存分割段音频的保存路径
audiopath = "audio/test_long.wav"
audiotype = 'wav' # 音频类型
print("audiopath:",audiopath)
# 读入音频
sound = AudioSegment.from_file(audiopath, format=audiotype)
'''
    根据 音量 和 静默 时间长度 条件进行音频分割
    示例:音量阈值 -25 dB , 静默阈值:300ms
'''
chunks = split_on_silence(sound,min_silence_len=300,silence_thresh=-25)

# 保存分割后的短音频
print('开始保存')
for i in range(len(chunks)):
    new = chunks[i]
    save_name = "{}{}.{}".format(chunks_path,i,audiotype)
    new.export(save_name, format=audiotype)

​​

助力快速掌握数据集的信息和使用方式。

数据可以如此美好

相关推荐
雪隐2 分钟前
个人电脑玩AI-02让5060 Ti给你打工——Whisper语音识别篇(下)
人工智能·后端
winfredzhang4 分钟前
用 Python + wxPython 做一个个人健康饮食管理工具:从记录三餐到综合生活建议
python·wxpython·deepseek·生活习惯管理
HIT_Weston4 分钟前
110、【Agent】【OpenCode】todowrite 工具提示词(示例)(四)
人工智能·agent·opencode
ECT-OS-JiuHuaShan9 分钟前
什么是对和错?——“有针对性定义域的逻辑值的真伪”:认识论终极追问的公理化裁决
数据库·人工智能·算法·机器学习·数学建模
Irissgwe15 分钟前
十、LangGraph能力详解:工作流的常见模式
python·langchain·ai编程·工作流·langgraph
澹锦汐18 分钟前
从 0 到 1 构建 AI 创意工具:独立开发者的 LLM 应用实战
人工智能
道友可好18 分钟前
Superpowers vs OpenSpec vs Spec Kit:该选哪个?
前端·人工智能·后端
xixingzhe219 分钟前
AI运维注意点
运维·人工智能
morning_judger19 分钟前
Agent开发系列(十一)-知识库建设(知识地图)
人工智能