海洋地形(Bathymetry)是理解海洋环境的基础信息,同时也是开展海洋制图项目的首要依据。随着科技的发展,卫星反演地形(Satellite-Derived Bathymetry, SDB)为解决浅水区域当前地形数据不足的问题提供了一种有前景的替代方法,特别是在使用Sentinel-2等卫星平台的数据,并结合先进的机器学习(Machine Learning, ML)和深度学习(Deep Learning, DL)技术后,其在提高地形估算精度方面相较于传统方法表现更为出色。本研究评估了两种不同的算法在西方地中海两个区域中估算SDB的表现:一种是基于物理原理的模型,另一种是人工神经网络(Artificial Neural Network, ANN)。我们不仅评估了这些方法在算法校准后连续多年预测地形的能力,还评估了它们在未参与模型校准的其他区域估算深度的性能,从而分别检验了时间和空间上的独立性。
在本研究中,使用了由回声测深仪收集的现场深度测量数据来训练和测试算法。性能评估指标包括决定系数(R²)和均方根误差(Root Mean Square Error, RMSE),结果表明在所有区域中,R²值均大于等于0.8,RMSE值均小于等于1.5米,显示出良好的拟合效果,即使是在检验时间和空间独立性的场景中。此外,两种模型在估算浅水区(<10米)和较深水域(>10米)方面均表现出色,浅水区的中位绝对误差(Median Absolute Error, MedAE)和平均偏差误差(Mean Bias Error, MBE)分别不超过0.82米,而在深度达到20米的区域,这些误差分别不超过2.15米和2.33米。ANN模型在精度上略有提升,尤其在有足够的现场数据用于算法训练和验证的情况下,这种优势更为明显。然而,物理驱动的模型虽然精度略逊于ANN,但在数据获取受限的区域中仍然具有优势。
传统的地形测量方法,如单波束(Single Beam Echo Sounder, SBES)或多波束(Multi Beam Echo Sounder, MBES)回声测深仪,虽然能够提供高精度的数据,但它们在时间效率和空间覆盖范围上存在一定的局限性,尤其是在那些难以进入的区域中。此外,空中激光雷达(LiDAR)虽然能够测量传统方法无法准确获得的区域,但其在经济性和效率上也面临挑战。卫星反演地形(SDB)技术,借助Sentinel-2A/B卫星上的多光谱仪器(MultiSpectral Instrument, MSI),以其10–20–60米的空间分辨率、5天的重访周期和全球覆盖能力,成为一种革命性的工具。SDB不仅克服了传统方法的限制,还提供了前所未有的时空覆盖能力。
为了确保方法的实用性,本研究特别关注了SDB在时间与空间上的独立性预测能力。通过使用连续三年的地形数据,从两个不同的研究区域中进行分析,研究评估了这些模型在不同年份和不同地点预测地形的能力。这一方法不仅有助于理解地形的动态变化,还为海岸管理提供了适应性的决策支持。此外,利用全球覆盖的卫星数据,使得在不同地点进行校准和应用成为可能,从而拓展了SDB的应用范围。
在本研究中,我们选择了两种方法进行比较:一种是基于物理原理的C-S方法,另一种是人工神经网络(ANN)模型。C-S方法基于光在水体中的衰减与深度之间的关系,假设光的衰减呈指数形式,因此较浅的水体呈现出较亮的颜色,而较深的水体则颜色较暗。这种方法通常依赖于多时相图像,通过选择特定时间范围内的图像来减少水体中的混浊度和叶绿素-a(chlorophyll-a, chl-a)的干扰,从而提高估算精度。在本研究中,使用了ACOLITE软件进行大气校正,以确保数据的准确性。通过在多时相图像中选取像素最大值的方法,能够更有效地减少水体中混浊度的变化,从而提高估算的稳定性。
ANN模型在本研究中被选为一种先进的机器学习方法,其结构包括全连接层、Rectified Linear Unit(ReLU)激活函数、批量归一化(Batch Normalization, BN)层和Dropout层,以减少过拟合现象。全连接层的结构使得每个神经元与前一层的所有神经元相连,从而能够处理复杂的非线性关系。ReLU激活函数用于所有全连接层,除了输出层,而输出层采用线性激活函数,适合于回归问题。BN层的作用是提高模型的稳定性并加快训练过程,通过在训练过程中计算每个层的均值和标准差,使输入数据的均值接近零,标准差接近一。Dropout层则通过随机禁用输入,设置为零的频率,减少对单个神经元的依赖,促使网络学习更鲁棒的特征,从而提高模型的泛化能力。
在训练过程中,使用了均方误差(Mean Squared Error, MSE)作为损失函数,并采用Adam优化器进行参数更新。为了防止过拟合,还引入了EarlyStopping选项,当验证集上的损失不再改善时停止训练。此外,为了找到最佳的超参数组合,避免过拟合风险,采用了k折交叉验证方法。这种方法将训练集划分为k个子集,每个子集依次作为验证集,其余k-1个子集作为训练集。详细的模型结构和超参数值如图4和表2所示。
为了确保模型的泛化能力,分别对C-S和ANN模型进行了时间与空间上的独立预测。在时间预测方面,研究区域的地形数据是在不依赖现场测量的情况下获取的。例如,在Cala Millor区域,地形预测使用了2019年和2020年的Sentinel-2图像,而校准数据则基于2018年的现场数据。在Son Bou区域,地形预测使用了2020年和2021年的图像,而校准数据则基于2019年的现场数据。在空间预测方面,模型是在一个区域校准后,用于预测另一个具有相似光学特性的区域。这种方法不仅提高了模型的适用性,还减少了对现场数据的依赖,从而降低了数据收集的成本和时间。
在评估模型的性能时,采用了多种指标,包括决定系数(R²)、均方根误差(RMSE)、中位绝对误差(MedAE)和平均偏差误差(MBE)。这些指标的计算基于测试数据,即模型未见过的数据。对于C-S模型,通过计算10条垂直剖面的中位数来确定校准曲线。对于ANN模型,数据被划分为70%用于训练,10%用于验证,20%用于测试。研究结果表明,两种方法在所有评估案例中均表现出色,R²值在0.8至0.96之间,RMSE值在0.57至1.34米之间,显示出良好的拟合效果和较低的误差。
在时间预测方面,研究结果表明,两种模型在预测地形方面均表现良好,误差与验证阶段的误差保持一致。例如,在Cala Millor区域,当模型使用2018年的现场数据进行校准时,预测2019年和2020年的地形,R²值分别为0.91和0.84,RMSE值分别为0.83米和1.13米。而在Son Bou区域,当模型使用2019年的现场数据进行校准时,预测2020年和2021年的地形,R²值分别为0.92和0.88,RMSE值分别为0.82米和1.34米。这些结果表明,两种方法在不同时间间隔和不同区域中的预测能力均得到了验证。
在空间预测方面,研究区域的地形数据是基于一个区域的校准数据进行预测的。例如,使用Cala Millor的现场数据进行校准,预测Son Bou的地形数据。在2019年和2020年的预测中,C-S模型的R²值分别为0.85和0.92,RMSE值分别为1.09米和0.82米。而ANN模型的R²值分别为0.86和0.93,RMSE值分别为1.07米和0.74米。这些结果表明,两种方法在不同区域中的预测能力均得到了验证,尽管ANN模型在某些深度范围内的表现略优于C-S模型。
在深度估算方面,两种方法均表现出良好的性能,尤其是在浅水区(<10米)和较深水域(>10米)。对于浅水区,C-S模型的MBE值在-0.87米至-0.10米之间,而ANN模型的MBE值在-0.99米至-0.01米之间。对于较深水域,C-S模型的MBE值在-1.89米至-0.66米之间,而ANN模型的MBE值在-1.36米至-0.95米之间。这些结果表明,两种方法在不同深度范围内的表现均较为稳定,尽管在某些深度区间内存在轻微的偏差。
研究还指出,尽管ANN模型在精度上略胜一筹,但其对训练数据的依赖性较高,因此在数据获取受限的情况下,物理驱动的模型可能更具优势。此外,研究结果表明,两种方法在时间与空间上的独立预测能力均得到了验证,这对于开展多时相和多区域的地形研究具有重要意义。例如,可以通过比较不同年份的地形数据来研究海岸侵蚀,或者通过历史或空间隔离的数据进行全面的地形研究。
在研究中,还特别关注了模型在不同深度范围内的表现。例如,在浅水区(<10米),两种方法均表现出较低的偏差和较高的精度,而在较深水域(>10米),模型的偏差略有增加。这些结果表明,两种方法在不同深度范围内的表现存在差异,但总体上均能提供可靠的地形估算。
研究还强调了SDB技术在全球范围内的应用潜力,特别是在多时相和多区域的研究中。通过使用多时相卫星图像和LiDAR测高仪数据,结合多光谱和地形信息,可以进一步提高地形估算的精度。此外,SDB技术的广泛应用有助于提高海洋监测和海岸管理的效率,为可持续发展提供支持。
总之,本研究通过比较物理驱动模型和ANN模型在时间与空间上的独立预测能力,验证了SDB技术在浅水区的可行性。研究结果表明,这两种方法均能提供较高的精度和可靠性,尽管在某些深度范围内存在轻微的偏差。通过结合现场数据和卫星数据,研究为未来的海岸研究和海洋管理提供了重要的参考价值。
打赏