编辑推荐:
评估甲状腺眼病临床活动评分中眼睑水肿标准的观察者间可靠性,发现κ值仅0.10且存在显著顺序偏见,结膜充血和眼睑红斑为重要干扰因素,影响CAS评分准确性及治疗决策阈值判定。
本研究旨在评估甲状腺眼病(TED)临床活动评分(CAS)中眼睑充血水肿指标的观察者间一致性,并探讨可能影响其评分的偏差因素,包括图像审查顺序的影响以及结膜充血和眼睑红斑的干扰作用。
我们回顾性分析了261名TED患者的773张标准化照片。
三名独立的眼科医生对每张照片中的眼睑充血、眼睑红斑和结膜充血情况进行评分。为了评估重复性偏差的影响,部分照片被随机和按时间顺序进行了重新评估。观察者间一致性通过Cohen's kappa系数进行量化,系统差异通过McNemar检验进行检测,一致性强度根据Landis和Koch的分类标准进行解释。
眼睑充血的观察者间一致性较低(κ = 0.10,95%置信区间:0.06–0.15),远低于结膜充血的一致性(κ = 0.30,95%置信区间:0.26–0.35)。在比较随机顺序和按时间顺序的评分结果时,有两名评分者的评分一致性较差,且均表现出与顺序相关的显著偏差(p = 0.022和p < 0.001);只有第三名评分者的评分一致性为中等但无显著性(κ = 0.49,p = 0.147)。总体而言,按时间顺序评分时更常发现眼睑充血现象,这符合重复性偏差(“肯定效应”)。此外,眼睑红斑和结膜充血与水肿评分之间存在显著关联:眼睑发红或充血会显著增加误判为水肿的可能性。这些干扰因素可能是导致该CAS指标重现性较差的原因。
CAS中的眼睑充血评分观察者间一致性较差,且容易受到认知和视觉偏差的影响。结膜和眼睑充血是重要的干扰因素,可能会高估疾病活动程度,从而改变患者的分级(超过3分),而这一分级是决定是否需要免疫抑制治疗的依据。鉴于这些局限性,应考虑通过客观影像学工具或替代指标(如眼压)对该指标进行改进或替换,以提高CAS在眼科和内分泌学实践中的重现性和诊断价值。
作者声明没有利益冲突。
生物通 版权所有