在血液系统疾病的诊断领域,骨髓涂片细胞形态学评估始终扮演着不可替代的角色。特别是对于骨髓增生异常综合征(MDS)这种高度异质性的疾病,病理造血过程导致细胞形态复杂多变,给准确诊断带来巨大挑战。目前诊断需要两位病理医师人工鉴别和计数至少500个有核细胞,这个过程不仅耗时耗力,而且结果易受主观因素影响。尽管近年来自动形态分析仪已逐步应用于实验室工作,机器学习的发展也提升了分析仪的准确性,但其进步很大程度上依赖于大规模高质量数据集的可用性。令人遗憾的是,现有研究多集中于外周血细胞,而骨髓细胞数据集相对稀缺。由于骨髓细胞形态特征多样、类型众多,且某些细胞出现频率较低,很难获得足够数量的细胞进行有效算法训练。此外,在细胞分割过程中,骨髓涂片因细胞重叠现象更为严重而比外周血涂片更具挑战性。为了解决这些难题,浙江大学医学院附属第一医院的研究团队联合杭州金斯顿生物科技有限公司开展了开创性工作,他们在《Scientific Data》上发表了题为"A large dataset of bone marrow cells in myelodysplastic syndrome for classification systems"的重要研究成果。研究方法的核心在于建立高质量的MDS骨髓细胞图像数据集。研究团队收集了125例MDS患者的首次骨髓涂片,这些患者根据世界卫生组织(WHO)2022年分类标准确诊,包括MDS-LB(44例)、MDS-IB1(46例)、MDS-IB2(31例)等亚型。患者年龄范围23-82岁,中位年龄64岁,男性69例,女性56例。数据采集采用两种方式:主要部分通过MorphoInsight全自动玻片扫描分析系统完成,该系统配备100倍油镜和LED光源,生成像素距离为75纳米的全玻片图像(WSI);补充部分则通过安装在显微镜上的数码相机获取。创新之处在于,细胞裁剪时基于最长边将边界框转换为正方形,并扩展10%,从而保证细胞边界和形态特征的完整性,同时最小化周围细胞的包含。