编辑推荐:
摘要ERA5再分析数据集由欧洲中期天气预报中心(ECMWF)开发,提供了从1950年至今的高分辨率、每小时更新的全球气候和天气数据。然而,其庞大的数据量给存储和分发带来了巨大挑战。为了解决这个问题,我们推出了CRA5,这是一个通过神经网络框架Aeolus生成的ERA5的高压缩版本
ERA5再分析数据集由欧洲中期天气预报中心(ECMWF)开发,提供了从1950年至今的高分辨率、每小时更新的全球气候和天气数据。然而,其庞大的数据量给存储和分发带来了巨大挑战。为了解决这个问题,我们推出了CRA5,这是一个通过神经网络框架Aeolus生成的ERA5的高压缩版本。CRA5将原本400 TB的未压缩float32格式数据集压缩到了仅0.85 TB,实现了470倍的压缩比。值得注意的是,其压缩效率比哥白尼气候数据存储库(CDS)提供的无损GRIB文件高出100多倍。大量实验验证了其数值准确性:CRA5在气候特征上保持一致,并且功率谱密度相当,37个垂直层上的平均绝对误差仅为0.17 K。此外,它还能真实地再现极端天气事件和大尺度气候模式。通过显著降低基础设施方面的限制,CRA5加快了数据访问速度,促进了大规模大气研究的更广泛合作。
生物通 版权所有