在奇妙的动物世界里,声音是许多动物交流的重要方式。蝙蝠作为哺乳动物中的 “飞行高手”,它们的声学通信一直是科学家们关注的焦点。长久以来,研究声学通信的科学家们主要聚焦在蝙蝠的回声定位叫声上。通过对这些回声定位叫声的研究,已经成功开发出了一些能够识别蝙蝠物种的机器学习算法。
然而,蝙蝠的 “语言” 可不止回声定位这一种。它们还有丰富多样的通信叫声,这些叫声在形式和功能上都与回声定位叫声大不相同。但到目前为止,对这些通信叫声的研究还远远不够。一方面,收集蝙蝠的通信叫声面临诸多技术难题,它们常常在难以到达的栖息地发出这些声音,而且声音还容易被环境噪音掩盖。另一方面,现有的深度学习算法虽然在其他动物声学信号分类上有一定成果,但在蝙蝠通信叫声分类上却遭遇困境,因为这些算法通常需要大量的标注样本进行训练,而获取大量蝙蝠通信叫声的标注样本并非易事。例如,研究人员为了得到 45 个特定类别的大棕蝠(Eptesicus fuscus)叫声样本,就花费了数月时间收集数据和标注。在这样的背景下,开展对蝙蝠通信叫声标注和分类工具的研究显得尤为迫切。
为了解决这些问题,来自国外的研究人员展开了深入研究。他们开发了一款名为 BattyCoda 的开源、可定制工具,旨在利用少量训练数据集(几十到几百个标注叫声)对蝙蝠物种的通信叫声类型进行分类和标注。该研究成果发表在《Ecological Informatics》上。
研究人员在开展研究时,用到了以下几个主要关键的技术方法:首先,通过野外捕捉大棕蝠并在特定环境下进行饲养,利用超声敏感麦克风和数据采集设备记录其回声定位和通信叫声,获取研究数据。然后,运用 R 软件包 WarbleR 提取叫声的声学特征,并选择多种分类算法,如支持向量机(SVM)、k 近邻(KNN)等进行测试,最终确定最佳分类算法。
下面来看具体的研究结果:
- LDA 是最佳分类算法:研究人员对多种分类算法进行测试后发现,线性判别分析(LDA)在处理蝙蝠叫声分类时表现最为出色,其平均平衡准确率达到 0.496。XGBoost 次之,平均平衡准确率为 0.458。LDA 通过将特征转化为线性组合来最大化类间分离,在蝙蝠叫声类型分类中效果良好,这表明蝙蝠叫声类型的声学特征存在明显模式。
- 不同叫声分类准确率各异:在 LDA 模型中,不同类型叫声的分类准确率有所不同。回声定位叫声的分类准确率最高,接近 90%;FMB 和 sHFM 叫声的分类准确率也相对较高,分别为 71% 和 70%。而 UFM 和 LsDFM - LFM 叫声则最容易被误分类,准确率仅为 21% 和 22%。分类准确率与样本数量以及叫声间的声学相似性有关,如 LDFM 叫声因与回声定位叫声声学特征相似,虽样本数量较多,但分类准确率仍较低。
- LDA 对小训练数据量表现稳健:研究人员测试了 LDA 模型在不同训练数据量下的性能,发现即使使用较小的训练数据集,其平均平衡准确率与使用整个训练数据集时相似,这对于研究蝙蝠通信数据时常常面临小样本问题的研究人员来说是个好消息。
在研究结论和讨论部分,研究人员开发的 BattyCoda 工具为蝙蝠声学数据的标注和分类提供了新的解决方案。它能够利用少量训练数据对常见蝙蝠叫声类型进行准确标注,同时辅助研究人员对罕见叫声进行分类。尽管该工具存在一定局限性,如受数据可用性和算法线性假设的限制,但随着蝙蝠通信叫声研究的深入和数据的积累,这些问题有望得到改善。此外,研究人员计划利用该工具进一步探索未被描述过的蝙蝠物种的叫声,并将收集到的数据公开,促进相关研究的发展。这一研究成果不仅推动了蝙蝠声学通信领域的研究,也为生物声学领域其他物种的研究提供了有益的参考,有助于更好地理解动物的声学通信行为,为物种保护等工作提供科学依据。