AI用Alice_split_toolset切割音频的采样率

AI用Alice_split_toolset切割音频的采样率

目录

AI用Alice_split_toolset切割音频的采样率

[一、Sample rate采样率的概念](#一、Sample rate采样率的概念)

二、Alice_split_toolset切割音频的参数

2.1、字符串参数--input_folder输入文件夹路径

2.2、字符串参数--output_folder输出文件夹路径

2.3、字符串参数--sample_rate声音的采样率

2.4、动作参数--mono转化为单声道

2.5、动作参数--use_subtitle_as_name使用字幕所在的.wav文件名作为文件名

三、本期关联技术博文


一、Sample rate采样率的概念

声音的Sample rate(‌采样率)‌是指每秒从连续信号中提取并组成离散信号的采样个数,‌用赫兹(Hz)来表示。‌ 采样率是音频处理中的一个重要参数,‌它直接关系到音频的质量和数据量的大小。‌采样频率的高低决定了音频信号的还原程度,‌即音频的质量。‌采样频率越高,‌音频质量越高 ,‌但同时数据量也会增大 。‌为了保证声音不失真,‌采样频率需要不低于音频信号最高频率的两倍。‌人耳能听到的频率范围大约在20Hz到20kHz之间 ,‌因此为了保证声音质量 ,‌采样频率通常在40kHz以上。‌常见的采样率包括11025Hz、‌22050Hz、‌24000Hz、‌44100Hz和48000Hz等。‌其中,‌44100Hz是理论上的CD音质界限,‌而48000Hz则更加精确一些。

二、Alice_split_toolset切割音频的参数

python 复制代码
if __name__ == "__main__":
    parser = argparse.ArgumentParser(description="Split WAVs based on SRT timings in a folder")
    parser.add_argument("--input_folder", type=str, default="input", help="Path to the input folder containing SRT and WAV files")
    parser.add_argument("--output_folder", type=str, default="output", help="Output folder path")
    parser.add_argument("--sample_rate", type=int, default=44100, help="Sample rate for output WAVs")
    parser.add_argument("--mono", action="store_true", help="Convert to mono")
    parser.add_argument("--use_subtitle_as_name", action="store_true", help="Use subtitle as filename")

2.1、字符串参数--input_folder输入文件夹路径

--input_folder input

请不要带中文,原始.wav文件及其字幕文件.srt所在的目录。

2.2、字符串参数--output_folder输出文件夹路径

--output_folder output

请不要带中文,切割后的.wav文件及其.list列表文件所在的目录。

2.3、字符串参数--sample_rate声音的采样率

--sample_rate 48000

44100Hz是理论上的CD音质界限,也是默认值。

而48000Hz则更加精确,通常被更多的音频输出设备软件,标识为DVD音质界限 。会将原始录制的人声中,人的**"嗓音"**也识别和还原出来。

输出设备:

输入设备:

2.4、动作参数--mono转化为单声道

--mono

默认值。不要混响和声音通道的,纯粹的人声。

2.5、动作参数--use_subtitle_as_name使用字幕所在的.wav文件名作为文件名

--use_subtitle_as_name

默认值。

三、本期关联技术博文

《comfyUI-MuseTalk的参数设置》

《ComfyUI-MuseTalk部署依赖mmcv》
《Win10环境将Docker部署到非系统盘》

相关推荐
木斯佳4 小时前
HarmonyOS 6实战:AI Action富媒体卡片迭代——实现快照分享
人工智能·harmonyos·媒体
芝士爱知识a4 小时前
2026高含金量写作类国际竞赛汇总与测评
大数据·人工智能·国际竞赛·写作类国际竞赛·写作类比赛推荐·cwa·国际写作比赛推荐
华农DrLai7 小时前
什么是LLM做推荐的三种范式?Prompt-based、Embedding-based、Fine-tuning深度解析
人工智能·深度学习·prompt·transformer·知识图谱·embedding
东北洗浴王子讲AI7 小时前
GPT-5.4辅助算法设计与优化:从理论到实践的系统方法
人工智能·gpt·算法·chatgpt
超低空8 小时前
OpenClaw Windows 安装详细教程
人工智能·程序员·ai编程
恋猫de小郭8 小时前
你的代理归我了:AI 大模型恶意中间人攻击,钱包都被转走了
前端·人工智能·ai编程
yongyoudayee8 小时前
2026 AI CRM选型大比拼:四大架构路线实测对比
人工智能·架构
高洁019 小时前
多模态AI模型融合难?核心问题与解决思路
人工智能·深度学习·机器学习·数据挖掘·transformer
碑 一9 小时前
视频分割Video K-Net
人工智能·计算机视觉
renhongxia19 小时前
ORACLE-SWE:量化Oracle 信息信号对SWE代理的贡献
人工智能·深度学习·学习·语言模型·分类