机器学习有助于追溯古典音乐的发展
EPFL位于人文学院的数字与认知音乐学实验室的研究人员使用一种无监督的机器学习模型来“监听”并分类了13,000多首西方古典音乐,揭示了主要和次要的模式在整个历史中是如何变化的。
许多人可能无法定义音乐中的次要模式,但是大多数人几乎可以肯定会识别以次要键演奏的乐曲。这是因为我们直观地将属于小调的音符集(通常听起来暗,紧张或悲伤)与大调的音符区分开,大声调通常表示幸福,力量或轻盈。
但是,纵观整个历史,有时还会使用除主要和次要之外的多种其他模式,或者根本找不到明确的模式分离。
数字和认知音乐学实验室(DCML)的研究人员Daniel Harasim,Fabian Moss,Matthias Ramirez和Martin Rohrmeier在最近的一项研究中着眼于理解和可视化这些差异,该研究已发表在开放存取杂志Humanities上和社会科学传播。在他们的研究中,他们开发了一种机器学习模型,可以分析15世纪至19世纪超过13,000首音乐,涵盖了文艺复兴时期,巴洛克时期,古典时期,浪漫主义早期和浪漫主义后期。
“例如,我们已经知道,在文艺复兴时期[1400-1600]中,存在两种以上的模式。但是,在[1750-1820]古典时代之后的时期中,两种模式之间的区别就变得模糊了。我们想看看是否我们可以更具体地确定这些差异。”
机器听力(和学习)
研究人员使用数学模型来推断西方古典音乐在这五个历史时期中模式的数量和特征。他们的工作产生了新颖的数据可视化效果,显示了文艺复兴时期的音乐家,如乔瓦尼·皮耶鲁吉·达·帕莱斯特里纳,喜欢使用四种模式,而巴洛克作曲家的音乐,例如约翰·塞巴斯蒂安·巴赫,则围绕主要和次要模式进行了旋转。有趣的是,研究人员没有发现由弗朗兹·李斯特(Franz Liszt)等晚期浪漫作曲家创作的复杂音乐的模式之间没有明确的分离。
Harasim解释说DCML的方法是独特的,因为这是第一次使用未标记的数据来分析模式。这意味着他们的数据集中的音乐片段以前没有被人类分类为各种模式。
“我们想知道如果让计算机有机会分析数据而又不引入人为偏见会是什么样子。因此,我们应用了无监督的机器学习方法,其中计算机“聆听”音乐并找出这些模式本身没有元数据标签。”
尽管执行起来要复杂得多,但是这种“无监督”的方法产生了特别有趣的结果,据哈拉西姆说,就人类如何听和解释音乐而言,这种结果更具“认知上的合理性” 。
“我们知道音乐结构可能非常复杂,而且音乐家需要多年的训练。但是与此同时,就像孩子学习母语一样,人们会在不知不觉中学习这些结构。这就是为什么我们开发了一个简单的模型来逆转使用认知科学家使用的一类所谓的贝叶斯模型来设计学习过程,以便我们也可以利用他们的研究成果。”
从课堂项目到出版及以后
Harasim满意地注意到,这项研究源于他和他的合著者Moss和Ramirez在EPFL教授罗伯·韦斯特(Robert West)教授的应用数据分析课程中一起完成的一项课堂项目。他希望通过将他们的方法应用于其他音乐问题和体裁来进一步推进该项目。
“对于模式发生变化的乐段,准确地识别出这种变化发生在什么位置是很有趣的。我也想将相同的方法应用于爵士乐,这是我的博士论文的重点,因为爵士乐的音调爵士乐不仅仅只有两种模式。”
标签: