AI用Alice_split_toolset切割音频的采样率

AI用Alice_split_toolset切割音频的采样率

目录

AI用Alice_split_toolset切割音频的采样率

[一、Sample rate采样率的概念](#一、Sample rate采样率的概念)

二、Alice_split_toolset切割音频的参数

2.1、字符串参数--input_folder输入文件夹路径

2.2、字符串参数--output_folder输出文件夹路径

2.3、字符串参数--sample_rate声音的采样率

2.4、动作参数--mono转化为单声道

2.5、动作参数--use_subtitle_as_name使用字幕所在的.wav文件名作为文件名

三、本期关联技术博文


一、Sample rate采样率的概念

声音的Sample rate(‌采样率)‌是指每秒从连续信号中提取并组成离散信号的采样个数,‌用赫兹(Hz)来表示。‌ 采样率是音频处理中的一个重要参数,‌它直接关系到音频的质量和数据量的大小。‌采样频率的高低决定了音频信号的还原程度,‌即音频的质量。‌采样频率越高,‌音频质量越高 ,‌但同时数据量也会增大 。‌为了保证声音不失真,‌采样频率需要不低于音频信号最高频率的两倍。‌人耳能听到的频率范围大约在20Hz到20kHz之间 ,‌因此为了保证声音质量 ,‌采样频率通常在40kHz以上。‌常见的采样率包括11025Hz、‌22050Hz、‌24000Hz、‌44100Hz和48000Hz等。‌其中,‌44100Hz是理论上的CD音质界限,‌而48000Hz则更加精确一些。

二、Alice_split_toolset切割音频的参数

python 复制代码
if __name__ == "__main__":
    parser = argparse.ArgumentParser(description="Split WAVs based on SRT timings in a folder")
    parser.add_argument("--input_folder", type=str, default="input", help="Path to the input folder containing SRT and WAV files")
    parser.add_argument("--output_folder", type=str, default="output", help="Output folder path")
    parser.add_argument("--sample_rate", type=int, default=44100, help="Sample rate for output WAVs")
    parser.add_argument("--mono", action="store_true", help="Convert to mono")
    parser.add_argument("--use_subtitle_as_name", action="store_true", help="Use subtitle as filename")

2.1、字符串参数--input_folder输入文件夹路径

--input_folder input

请不要带中文,原始.wav文件及其字幕文件.srt所在的目录。

2.2、字符串参数--output_folder输出文件夹路径

--output_folder output

请不要带中文,切割后的.wav文件及其.list列表文件所在的目录。

2.3、字符串参数--sample_rate声音的采样率

--sample_rate 48000

44100Hz是理论上的CD音质界限,也是默认值。

而48000Hz则更加精确,通常被更多的音频输出设备软件,标识为DVD音质界限 。会将原始录制的人声中,人的**"嗓音"**也识别和还原出来。

输出设备:

输入设备:

2.4、动作参数--mono转化为单声道

--mono

默认值。不要混响和声音通道的,纯粹的人声。

2.5、动作参数--use_subtitle_as_name使用字幕所在的.wav文件名作为文件名

--use_subtitle_as_name

默认值。

三、本期关联技术博文

《comfyUI-MuseTalk的参数设置》

《ComfyUI-MuseTalk部署依赖mmcv》
《Win10环境将Docker部署到非系统盘》

相关推荐
整得咔咔响几秒前
贝尔曼最优公式(BOE)
人工智能·算法·机器学习
2501_946961473 分钟前
极简大气创业融资 PPT 模板,适合路演、项目宣讲
人工智能·排序算法
得一录4 分钟前
AI 语音助手:如何用大模型优化智能语音交互?
人工智能
玄同7654 分钟前
Python 自动发送邮件实战:用 QQ/163 邮箱发送大模型生成的内容
开发语言·人工智能·python·深度学习·机器学习·邮件·邮箱
逸俊晨晖5 分钟前
NVIDIA 4090的8路1080p实时YOLOv8目标检测
人工智能·yolo·目标检测·nvidia
Olamyh7 分钟前
【手搓 ReAct Agent:告别框架,回归本质】
人工智能·python
seaside20037 分钟前
大模型计算量、显存计算方法推导
人工智能·大模型
AI资源库8 分钟前
nvidiapersonaplex-7b-v1模型深入解析
人工智能·语言模型·回归
weixin_5091383411 分钟前
智能体认知动力学理论和实践
人工智能·智能体·语义空间·认知动力学
玄同76511 分钟前
机器学习中的三大距离度量:欧式距离、曼哈顿距离、切比雪夫距离详解
人工智能·深度学习·神经网络·目标检测·机器学习·自然语言处理·数据挖掘