AI用Alice_split_toolset切割音频的采样率

AI用Alice_split_toolset切割音频的采样率

目录

AI用Alice_split_toolset切割音频的采样率

[一、Sample rate采样率的概念](#一、Sample rate采样率的概念)

二、Alice_split_toolset切割音频的参数

2.1、字符串参数--input_folder输入文件夹路径

2.2、字符串参数--output_folder输出文件夹路径

2.3、字符串参数--sample_rate声音的采样率

2.4、动作参数--mono转化为单声道

2.5、动作参数--use_subtitle_as_name使用字幕所在的.wav文件名作为文件名

三、本期关联技术博文


一、Sample rate采样率的概念

声音的Sample rate(‌采样率)‌是指每秒从连续信号中提取并组成离散信号的采样个数,‌用赫兹(Hz)来表示。‌ 采样率是音频处理中的一个重要参数,‌它直接关系到音频的质量和数据量的大小。‌采样频率的高低决定了音频信号的还原程度,‌即音频的质量。‌采样频率越高,‌音频质量越高 ,‌但同时数据量也会增大 。‌为了保证声音不失真,‌采样频率需要不低于音频信号最高频率的两倍。‌人耳能听到的频率范围大约在20Hz到20kHz之间 ,‌因此为了保证声音质量 ,‌采样频率通常在40kHz以上。‌常见的采样率包括11025Hz、‌22050Hz、‌24000Hz、‌44100Hz和48000Hz等。‌其中,‌44100Hz是理论上的CD音质界限,‌而48000Hz则更加精确一些。

二、Alice_split_toolset切割音频的参数

python 复制代码
if __name__ == "__main__":
    parser = argparse.ArgumentParser(description="Split WAVs based on SRT timings in a folder")
    parser.add_argument("--input_folder", type=str, default="input", help="Path to the input folder containing SRT and WAV files")
    parser.add_argument("--output_folder", type=str, default="output", help="Output folder path")
    parser.add_argument("--sample_rate", type=int, default=44100, help="Sample rate for output WAVs")
    parser.add_argument("--mono", action="store_true", help="Convert to mono")
    parser.add_argument("--use_subtitle_as_name", action="store_true", help="Use subtitle as filename")

2.1、字符串参数--input_folder输入文件夹路径

--input_folder input

请不要带中文,原始.wav文件及其字幕文件.srt所在的目录。

2.2、字符串参数--output_folder输出文件夹路径

--output_folder output

请不要带中文,切割后的.wav文件及其.list列表文件所在的目录。

2.3、字符串参数--sample_rate声音的采样率

--sample_rate 48000

44100Hz是理论上的CD音质界限,也是默认值。

而48000Hz则更加精确,通常被更多的音频输出设备软件,标识为DVD音质界限 。会将原始录制的人声中,人的**"嗓音"**也识别和还原出来。

输出设备:

输入设备:

2.4、动作参数--mono转化为单声道

--mono

默认值。不要混响和声音通道的,纯粹的人声。

2.5、动作参数--use_subtitle_as_name使用字幕所在的.wav文件名作为文件名

--use_subtitle_as_name

默认值。

三、本期关联技术博文

《comfyUI-MuseTalk的参数设置》

《ComfyUI-MuseTalk部署依赖mmcv》
《Win10环境将Docker部署到非系统盘》

相关推荐
肥猪猪爸11 分钟前
使用卡尔曼滤波器估计pybullet中的机器人位置
数据结构·人工智能·python·算法·机器人·卡尔曼滤波·pybullet
LZXCyrus40 分钟前
【杂记】vLLM如何指定GPU单卡/多卡离线推理
人工智能·经验分享·python·深度学习·语言模型·llm·vllm
我感觉。1 小时前
【机器学习chp4】特征工程
人工智能·机器学习·主成分分析·特征工程
EasyCVR1 小时前
私有化部署视频平台EasyCVR宇视设备视频平台如何构建视频联网平台及升级视频转码业务?
大数据·网络·音视频·h.265
天空中的野鸟1 小时前
Android音频采集
android·音视频
YRr YRr1 小时前
深度学习神经网络中的优化器的使用
人工智能·深度学习·神经网络
DieYoung_Alive1 小时前
一篇文章了解机器学习(下)
人工智能·机器学习
夏沫的梦1 小时前
生成式AI对产业的影响与冲击
人工智能·aigc
goomind1 小时前
YOLOv8实战木材缺陷识别
人工智能·yolo·目标检测·缺陷检测·pyqt5·木材缺陷识别
只怕自己不够好1 小时前
《OpenCV 图像基础操作全解析:从读取到像素处理与 ROI 应用》
人工智能·opencv·计算机视觉