SampleMatch自动检索匹配的音乐曲目鼓样本的模型
基于机器学习的计算模型已成功应用于广泛的复杂信息处理任务,包括那些涉及从大型档案中检索特定数据项的任务。法国索尼计算机科学实验室(CSL)的研究人员一直在尝试开发机器学习技术,以帮助音乐制作人轻松识别和检索数据库中的特定音频样本。
为此,SonyCSL的研究员StefanLattner最近推出了SampleMatch,这是一种基于机器学习的模型,可以自动从大型档案中检索与特定音乐曲目相匹配的鼓样本。他的模型将于12月在ISMIR2022会议上展示,这是一个专注于音乐信息检索的领先活动。
“我们在SonyCSL的音乐团队正在研究可以让音乐制作人的生活更轻松的人工智能,”进行这项研究的研究人员之一StefanLattner告诉TechXplore。“在音乐制作中,有许多任务可以让AI发挥价值。目前相对乏味的一项任务是鼓样本选择。”
鼓样本选择是音乐制作人必须搜索能够与特定无鼓音乐轨道很好地配合使用的鼓样本的过程。由于鼓样本库通常很大,因此识别合适的鼓样本可能非常耗费时间和精力。
目前,音乐制作人只能使用一些基本的计算工具,这些工具旨在帮助他们进行鼓样本选择过程。这些主要包括按标签或关键字过滤大型数据集。
几年前,Lattner着手开发一种新系统,该系统可以更直观、更有效的方式检索鼓样本。然而,由于当时可用技术的限制,该系统需要相对复杂。
“我发现我之前创建的系统不是很优雅,所以我没有发布它,”拉特纳解释道。“随着对比学习的最新进展(以及神经网络编码器的改进),估计两个数据点是否适合在一起变得更加容易。结果,系统变得更加通用,我的方法可以用来估计适合多种声音。”
使用SampleMatch时,音乐家可以在制作的任何阶段将他们的音轨输入到他们的系统中。然后,系统会根据计算出的最匹配的鼓样本库自动对鼓样本库进行排序。
Lattner使用包含4,830首电子音乐曲目和885首著名流行/摇滚曲目的大型数据集训练SampleMatch。具体来说,他使用了器乐的音频对(即合成基础、贝斯、吉他、打击垫、弦乐、合唱团、键盘和人声)和匹配的鼓音轨。
“SampleMatch接受了我们知道会匹配的音频对的训练,”Lattner说。“现在,当我们向模型展示一对新配对时,它将提供一个‘匹配分数’。虽然已经有系统使用提取的音乐特征匹配音频样本,但它们的检索质量取决于预定义的特征和样本类型。对于鼓样本,甚至不清楚我们应该查看哪些特征来计算匹配分数。"
虽然Lattner训练他的模型以了解哪些鼓样本与特定音轨相匹配,但它也可以用于其他形式的音频匹配。事实上,通过使用不同的训练样本对,SampleMatch也可以被教导检索匹配的贝斯、吉他或其他乐器音轨。
“音乐家在音乐制作中的一些审美选择仍然很神秘。”拉特纳说。“虽然很明显一种乐器不应该用鼓样本弹奏,但没有理论为什么有些适合你的音轨,有些则不适合。通过展示例子,计算机现在可以学习我们在何时应用的美学原则听。在某种程度上,计算机学会了像人类一样倾听。
将来,Lattner和他在SonyCSL的同事创建的音频检索模型可以帮助音乐制作人为其音轨寻找合适的鼓样本或其他乐器样本。此外,仔细分析系统如何学会组织数据可以帮助设计可能指导音乐制作工作的新理论。更具体地说,系统的逆向工程可能允许研究人员概述音乐家在混合音乐时应遵循的一些一般规则。
“在我们未来的工作中,我们希望将这种方法与我们的DrumGAN技术相结合,以生成直接匹配给定音轨的鼓样本,”Lattner补充道。“同时,我们还希望将SampleMatch扩展到其他类型的样本。”
标签: