TIGER - 一个轻量高效的语音分离模型,支持人声伴奏分离、音频说话人分离等 支持50系显卡 本地一键整合包下载

TIGER 是一种轻量级语音分离模型,通过频段分割、多尺度及全频帧建模有效提取关键声学特征。该项目由来自清华大学主导研发,通过频率带分割、多尺度以及全频率帧建模的方式,有效地提取关键声学特征,从而实现高效的语音分离。

TIGER 模型大小不到20M,即使CPU也可以流畅运行,且支持人声伴奏分离(音频文件中分离人声和伴奏)、音频说话人分离(从多个说话人音频中分离出每个说话人的声音)、视频降噪以及视频语音分离等功能。

应用领域 ‌

语音通信‌:在多人语音通信场景中,TIGER可以有效分离出各个说话人的声音,提高通话质量和清晰度。 ‌

智能语音识别‌:在智能家居、车载系统等智能语音识别应用中,TIGER能够帮助系统更准确地识别用户的指令,提升用户体验。 ‌

音频处理软件‌:作为音频处理软件中的一个组件,TIGER可以用于音频编辑、混音等场景,实现音频信号的精细分离和处理。 ‌

远程教育和会议‌:在远程教育和在线会议中,TIGER能够分离出各个参与者的声音,减少背景噪音和干扰,提高沟通效率。

使用教程: (CPU可流畅运行。建议N卡,显存4G起。支持50系显卡,基于CUDA12.8)

上传需要分离的音视频素材,提交即可。

注. 适用大部分音视频素材分离,但不保证所有复杂的场景都有好的效果。支持自定义素材模型训练

下载地址:点此下载

相关推荐
Jackson_Mseven6 分钟前
Instruction Tuning & RLHF:大侠成长之路的“武功秘籍”
人工智能·chatgpt·llm
人工智能训练师9 分钟前
Fay数字人如何使用GPT-SOVITS进行TTS转换以及遇到的一些问题
人工智能·gpt·语音识别
eric-sjq9 分钟前
0.08B参数以小博大:用小模型生成媲美GPT-4o的古典诗词
人工智能
数据知道12 分钟前
百度翻译详解:包括PaddleNLP、百度AI开放平台、接口逆向(包括完整代码)
人工智能·百度·语言模型·自然语言处理·机器翻译
舒一笑36 分钟前
企业AI落地不顺问题可能出在你没搞懂知识库
人工智能
涛思数据(TDengine)1 小时前
可信数据库大会现场,TDengine 时序数据库展示核电场景下的高性能与 AI 创新
大数据·运维·数据库·人工智能·时序数据库·tdengine·涛思数据
不剪发的Tony老师1 小时前
NeoBase:一款开源、基于AI的数据库管理助手
数据库·人工智能·neobase
一碗白开水一1 小时前
【YOLO系列】YOLOv12详解:模型结构、损失函数、训练方法及代码实现
人工智能·深度学习·yolo·计算机视觉
努力一点9481 小时前
ubuntu22.04系统实践 linux基础入门命令(三) 用户管理命令
linux·运维·服务器·人工智能·ubuntu·gpu算力