AI用Alice_split_toolset切割音频的采样率

AI用Alice_split_toolset切割音频的采样率

目录

AI用Alice_split_toolset切割音频的采样率

[一、Sample rate采样率的概念](#一、Sample rate采样率的概念)

二、Alice_split_toolset切割音频的参数

2.1、字符串参数--input_folder输入文件夹路径

2.2、字符串参数--output_folder输出文件夹路径

2.3、字符串参数--sample_rate声音的采样率

2.4、动作参数--mono转化为单声道

2.5、动作参数--use_subtitle_as_name使用字幕所在的.wav文件名作为文件名

三、本期关联技术博文


一、Sample rate采样率的概念

声音的Sample rate(‌采样率)‌是指每秒从连续信号中提取并组成离散信号的采样个数,‌用赫兹(Hz)来表示。‌ 采样率是音频处理中的一个重要参数,‌它直接关系到音频的质量和数据量的大小。‌采样频率的高低决定了音频信号的还原程度,‌即音频的质量。‌采样频率越高,‌音频质量越高 ,‌但同时数据量也会增大 。‌为了保证声音不失真,‌采样频率需要不低于音频信号最高频率的两倍。‌人耳能听到的频率范围大约在20Hz到20kHz之间 ,‌因此为了保证声音质量 ,‌采样频率通常在40kHz以上。‌常见的采样率包括11025Hz、‌22050Hz、‌24000Hz、‌44100Hz和48000Hz等。‌其中,‌44100Hz是理论上的CD音质界限,‌而48000Hz则更加精确一些。

二、Alice_split_toolset切割音频的参数

python 复制代码
if __name__ == "__main__":
    parser = argparse.ArgumentParser(description="Split WAVs based on SRT timings in a folder")
    parser.add_argument("--input_folder", type=str, default="input", help="Path to the input folder containing SRT and WAV files")
    parser.add_argument("--output_folder", type=str, default="output", help="Output folder path")
    parser.add_argument("--sample_rate", type=int, default=44100, help="Sample rate for output WAVs")
    parser.add_argument("--mono", action="store_true", help="Convert to mono")
    parser.add_argument("--use_subtitle_as_name", action="store_true", help="Use subtitle as filename")

2.1、字符串参数--input_folder输入文件夹路径

--input_folder input

请不要带中文,原始.wav文件及其字幕文件.srt所在的目录。

2.2、字符串参数--output_folder输出文件夹路径

--output_folder output

请不要带中文,切割后的.wav文件及其.list列表文件所在的目录。

2.3、字符串参数--sample_rate声音的采样率

--sample_rate 48000

44100Hz是理论上的CD音质界限,也是默认值。

而48000Hz则更加精确,通常被更多的音频输出设备软件,标识为DVD音质界限 。会将原始录制的人声中,人的**"嗓音"**也识别和还原出来。

输出设备:

输入设备:

2.4、动作参数--mono转化为单声道

--mono

默认值。不要混响和声音通道的,纯粹的人声。

2.5、动作参数--use_subtitle_as_name使用字幕所在的.wav文件名作为文件名

--use_subtitle_as_name

默认值。

三、本期关联技术博文

《comfyUI-MuseTalk的参数设置》

《ComfyUI-MuseTalk部署依赖mmcv》
《Win10环境将Docker部署到非系统盘》

相关推荐
一次旅行1 小时前
HyperTool:突破传统工具调用限制,让Agent更高效执行复杂任务
人工智能
陈天伟教授2 小时前
图解人工智能(58)人工智能应用-围棋国手
人工智能·语音识别·机器翻译
闻道参看2 小时前
2026年AI优质企业培训系统综合测评:合规管控/数据量化
人工智能
老虾头2 小时前
科技贴近烟火:本地化 AI,赋能各行各业日常经营
人工智能
毒爪的小新2 小时前
Linux 环境极速部署 vLLM:从零搭建生产级大模型推理服务
linux·人工智能·ai·语言模型·vllm
老大白菜2 小时前
25美元,DIY开源可穿戴智能AI眼镜:Arduino+乐鑫ESP32+DeepSeek项目
人工智能
岁月宁静3 小时前
RAG 文档摄入全链路,从原理到生产落地
vue.js·人工智能·python
小和尚同志3 小时前
AI 自动化测试探索(一):Playwright MCP
前端·人工智能·aigc
硅谷秋水3 小时前
面向长上下文自动驾驶的规划对齐Token压缩
人工智能·深度学习·机器学习·计算机视觉·自动驾驶