【AI视野·今日Sound 声学论文速览 第十期】Fri, 22 Sep 2023

AI视野·今日CS.Sound 声学论文速览

Fri, 22 Sep 2023
Totally 1 papers
👉上期速览更多精彩请移步主页

Daily Sound Papers

|--------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|
| Performance Conditioning for Diffusion-Based Multi-Instrument Music Synthesis Authors Ben Maman, Johannes Zeitler, Meinard M ller, Amit H. Bermano 从符号音乐表示中生成多乐器音乐是音乐信息检索 MIR 中的一项重要任务。在这种情况下,一个核心但在很大程度上仍未解决的问题是生成过程中的音乐和声学控制。作为这项工作的主要贡献,我们建议通过在特定的演奏和录音环境下调节生成模型来增强对多乐器合成的控制,从而更好地指导音色和风格。基于最先进的基于扩散的音乐生成模型,我们引入了性能调节,这是一种简单的工具,指示生成模型来合成具有来自特定表演的特定乐器的风格和音色的音乐。我们的原型使用各种乐器的未经策划的表演进行评估,并实现了最先进的 FAD 现实主义分数,同时允许新颖的音色和风格控制。 |
| Chinese Abs From Machine Translation |

Papers from arxiv.org

更多精彩请移步主页


pic from pexels.com

相关推荐
Wendy14411 分钟前
【灰度实验】——图像预处理(OpenCV)
人工智能·opencv·计算机视觉
中杯可乐多加冰13 分钟前
五大低代码平台横向深度测评:smardaten 2.0领衔AI原型设计
人工智能
无线图像传输研究探索24 分钟前
单兵图传终端:移动场景中的 “实时感知神经”
网络·人工智能·5g·无线图传·5g单兵图传
zzywxc7871 小时前
AI在编程、测试、数据分析等领域的前沿应用(技术报告)
人工智能·深度学习·机器学习·数据挖掘·数据分析·自动化·ai编程
铭keny2 小时前
YOLOv8 基于RTSP流目标检测
人工智能·yolo·目标检测
墨尘游子2 小时前
11-大语言模型—Transformer 盖楼,BERT 装修,RoBERTa 直接 “拎包入住”|预训练白话指南
人工智能·语言模型·自然语言处理
金井PRATHAMA2 小时前
主要分布于内侧内嗅皮层的层Ⅲ的网格-速度联合细胞(Grid × Speed Conjunctive Cells)对NLP中的深层语义分析的积极影响和启示
人工智能·深度学习·神经网络·机器学习·语言模型·自然语言处理·知识图谱
天道哥哥3 小时前
InsightFace(RetinaFace + ArcFace)人脸识别项目(预训练模型,鲁棒性很好)
人工智能·目标检测
幻风_huanfeng3 小时前
学习人工智能所需知识体系及路径详解
人工智能·学习
云道轩3 小时前
使用Docker在Rocky Linux 9.5上在线部署LangFlow
linux·人工智能·docker·容器·langflow