拓扑数据分析(TDA)是一个快速发展的研究领域,它基于深厚的数学基础(Carlsson, 2009, Wasserman, 2018, Chazal and Michel, 2021)。它为数字音频信号处理提供了新颖且潜在有用的工具,并带来了新的分析视角。这种创新的数据科学方法侧重于从数据的形状中提取信息。
TDA已经应用于多种信号处理问题(Barbarossa and Sardellitti, 2020a, Barbarossa and Sardellitti, 2020b, Tulchinskii et al., 2023)。该方法基于数据具有形状的假设(Ferri, 2018),并计算其持久同调(persistent homologies),从而提供其拓扑特征的紧凑表示。这些拓扑表示对输入数据的扰动具有稳定性,并且不依赖于维度或坐标系。然而,这种形状很大程度上取决于信号的表示方式(即表示空间)。本研究的目的是探讨持久同调的计算如何依赖于所选的表示空间,特别是针对人类语言中的元音分类任务。我们研究了表示空间对提取的拓扑信息的影响,并确定访问更高维度的持久同调是否能够获得更具区分性的信息。我们还讨论了如何最好地总结持久图(persistence diagram)中包含的信息,以适应我们的具体分类任务。
本文的结构如下:首先介绍问题及其背景;其次简要介绍TDA的理论和处理流程;第三阐述解决问题的策略、数据集的性质以及我们的分类目标;最后在最后一节详细讨论主要结果。