用Python绘制音乐图谱

2015-4-4 00:32| 发布者: joejoe0332| 查看: 8073| 评论: 0|原作者: 伯乐在线|来自: 伯乐在线

摘要: 在本文中，我们将探讨一种简洁的方式，以此来可视化你的MP3音乐收藏。此方法最终的结果将是一个映射你所有歌曲的正六边形网格地图，其中相似的音轨将处于相邻的位置。不同区域的颜色对应不同的音乐流派（例如：古典 ...

选择一个最优的特征子集

　　我们已经计算了42种不同的特种，但是并不是所有特征都有助于判断两首歌曲听起来是否相同。下一步就是找到这些特征的一个最优子集，以便在这个减小的特征空间中两个特征向量之间的欧几里得距离能够很好地对应两首歌听起来的相似性。

　　变量选择的过程是一个有监督的机器学习问题，所以我们需要一些训练数据集合，这些训练集能够引导算法找到最好的变量子集。我并非通过手动处理音乐集并标记哪些歌曲听起来相似来创建算法的训练集，而是使用了一个更简单的方法：从每首歌曲中提取两段时长为1分钟的样本，然后试图找到一个最能匹配同一首歌曲中的两个片段的算法。

　　为了找到针对所有歌曲能够达到最好平均匹配度的特征集，我使用了一个遗传算法（在R语言的genalg包中）对42个变量中的每一个进行选取。下图显示了经过遗传算法的100次迭代，目标函数的改进情况（例如，一首歌的两个样本片段通过最近邻分类器来匹配到底有多么稳定）。

　　如果我们强制距离函数使用所有的42个特征，那么目标函数的值将变为275。而通过正确地使用遗传算法来选取特征变量，我们已经将目标函数（例如，错误率）减小到了90，这是一个非常重大的改进。最后选取的最优特征集包括：

amp10mean
amp10std
amp10skew
amp10dstd
amp10dskew
amp10dkurt
amp100mean
amp100std
amp100dstd
amp1000mean
power2
power3
power4
power5
power6
power7
power8
power9

在二维空间可视化数据

　　我们最优的特征集使用了18个特征变量来比较歌曲的相似性，但是我们想最终在2维平面上可视化音乐集合，所以我们需要将这个18维的空间降到2维，以便于我们绘画。为了实现这个目的，我简单地使用了前两个主成分来作为X和Y坐标。当然，这会引入一些错误到可视化图中，可能会造成一些在18维空间中相近的歌曲在2维平面中却不再相近。不过，这些错误无可避免，但幸好它们不会将这种关系扭曲得太厉害—听起来相似的歌曲在2维平面上仍然会大致集聚在一起。

将点映射到一个六角网格

　　从主成分中生成的2D点在平面上不规则地分布。虽然这个不规则的分布描述了18维特征向量在2维平面上最“准确”的布置，但我还是想通过牺牲一些准确率来将它们映射到一个很酷的画面上，即一个有规律间隔的六角网格。通过以下操作实现：

将xy平面的点嵌入到一个更大的六角网格点阵中。
从六角形最外层的点开始，将最近的不规则间隔的主成分点分配给每个六角网格点。
延伸2D平面的点，使它们完全填充六角网格，组成一个引人注目的图。

为图上色

　　这个练习的一个主要目的是不对音乐集的内容做任何假设。这意味着我不想将预定义的颜色分配给特定的音乐流派。相反，我在18维空间中聚合特征向量以找到聚集听起来相似的音乐的容器，并将颜色分配给这些群组中心。结果是一个自适应着色算法，它会找出你所要求的尽可能多的细节（因为用户可以定义群组的数量，也即是颜色数量）。正如前面提到的，我发现使用k=10的群组数量往往会给出好的结果。