【AI视野·今日Sound 声学论文速览 第十期】Fri, 22 Sep 2023

AI视野·今日CS.Sound 声学论文速览

Fri, 22 Sep 2023
Totally 1 papers
👉上期速览更多精彩请移步主页

Daily Sound Papers

|--------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|
| Performance Conditioning for Diffusion-Based Multi-Instrument Music Synthesis Authors Ben Maman, Johannes Zeitler, Meinard M ller, Amit H. Bermano 从符号音乐表示中生成多乐器音乐是音乐信息检索 MIR 中的一项重要任务。在这种情况下,一个核心但在很大程度上仍未解决的问题是生成过程中的音乐和声学控制。作为这项工作的主要贡献,我们建议通过在特定的演奏和录音环境下调节生成模型来增强对多乐器合成的控制,从而更好地指导音色和风格。基于最先进的基于扩散的音乐生成模型,我们引入了性能调节,这是一种简单的工具,指示生成模型来合成具有来自特定表演的特定乐器的风格和音色的音乐。我们的原型使用各种乐器的未经策划的表演进行评估,并实现了最先进的 FAD 现实主义分数,同时允许新颖的音色和风格控制。 |
| Chinese Abs From Machine Translation |

Papers from arxiv.org

更多精彩请移步主页


pic from pexels.com

相关推荐
云知谷3 小时前
【C++基本功】C++适合做什么,哪些领域适合哪些领域不适合?
c语言·开发语言·c++·人工智能·团队开发
rit84324993 小时前
基于MATLAB实现基于距离的离群点检测算法
人工智能·算法·matlab
初学小刘4 小时前
深度学习:从图片数据到模型训练(十分类)
人工智能·深度学习
递归不收敛5 小时前
大语言模型(LLM)入门笔记:嵌入向量与位置信息
人工智能·笔记·语言模型
之墨_6 小时前
【大语言模型】—— 自注意力机制及其变体(交叉注意力、因果注意力、多头注意力)的代码实现
人工智能·语言模型·自然语言处理
从孑开始6 小时前
ManySpeech.MoonshineAsr 使用指南
人工智能·ai·c#·.net·私有化部署·语音识别·onnx·asr·moonshine
涛涛讲AI6 小时前
一段音频多段字幕,让音频能够流畅自然对应字幕 AI生成视频,扣子生成剪映视频草稿
人工智能·音视频·语音识别
可触的未来,发芽的智生7 小时前
新奇特:黑猫警长的纳米世界,忆阻器与神经网络的智慧
javascript·人工智能·python·神经网络·架构
WWZZ20257 小时前
快速上手大模型:机器学习2(一元线性回归、代价函数、梯度下降法)
人工智能·算法·机器学习·计算机视觉·机器人·大模型·slam
AKAMAI7 小时前
数据孤岛破局之战 :跨业务分析的难题攻坚
运维·人工智能·云计算