摘要:椎心尺度(Vertebral Heart Scale, VHS)与椎左心房尺度(Vertebral Left Atrial Size, VLAS)是常用于评估犬心脏大小的影像学测量方法。目前尚不清楚在同一测量流程下,不同培训水平的观测者是否会改善上述测量的可重复性(repeatability)与再现性(reproducibility)。本研究旨在描述测量误差并评估经验水平是否影响测量结果。研究纳入健康犬及患黏液瘤样二尖瓣疾病(myxomatous mitral valve disease, MMVD)犬的胸线片,9名兽医学学生分为三组,分别在学习阶段测量10张、30张及50张图像后接受测量误差评估;随后每组对20张胸片各测量两次,并以一名经验丰富的观测者(reference observer, RO)的测量值为基准计算再现性与可重复性。结果显示,VHS与VLAS测量中分别有67.8%和54.1%存在至少一项误差;VHS的观测者间(interobserver)ICC为0.948–0.993,VLAS为0.819–0.978;VHS的观测者内(intraobserver)ICC为0.959–0.995,VLAS为0.710–0.994。研究表明测量误差较常见,但所有学生均获得实质到近乎完美的一致性,提示测量经验并不显著影响VHS与VLAS测量结果。
论文解读——《Evaluation of Radiographic Heart Size Measurement Repeatability and Reproducibility Among Veterinary Students with Varying Training Levels》
本研究发表于Veterinary and Animal Science。犬心脏病尤其是黏液瘤样二尖瓣疾病(myxomatous mitral valve disease, MMVD)在小型动物临床十分常见,胸腔X线是基层兽医评估心脏大小及排查左侧充血性心力衰竭最常用的手段。临床上常采用椎心尺度(Vertebral Heart Scale, VHS)——以第4胸椎长度归一化的心脏长轴与短轴之和,以及椎左房尺度(Vertebral Left Atrial Size, VLAS)——以第4胸椎长度归一化的从左主支气管分叉腹侧至后腔静脉(caudal vena cava, CVC)与心影交界点的线段,来量化心脏整体大小与左房扩大程度。既往研究对VHS与VLAS的可重复性和再现性结论不一,部分学者认为VHS受观测者选取参考点影响较大但受经验影响小,而VLAS可能存在观测者间差异且与经验有关;此外尚不清楚在同一标准化培训协议下,不同练习量(即不同培训深度)是否能进一步提高测量一致性。为此,研究人员设计此项观测一致性研究,探讨经过统一培训但练习量不同的兽医学学生测量VHS与VLAS时的测量误差类型、组内与组间一致性及偏倚,并与一名具有>10年兽医心脏专科经验的参考观测者(reference observer, RO)比较,验证培训量是否影响结果。结论显示尽管操作错误常见,但经统一标准培训的兽医学学生在VHS与VLAS测量上均可达到较高的一致性,培训量(练习10、30或50例影像)未显著改变一致性水平,提示这两项指标具有良好的可重复性与再现性。
主要技术方法简述:
研究人员回顾性选取70张右外侧位胸片(健康犬14只,MMVD B1期20只、B2期8只、C期28只),排除心影边界不清、体位不当及椎体畸形病例。9名已完成放射学模块课程的四年级兽医学学生随机分为三组(G1、G2、G3各3人),统一接受VHS(改良Hansson法)与VLAS(Malcolm法)测量流程培训及实操校正,G1练习10张、G2练习30张、G3练习50张学习集图像并记录错误类型;随后三组对相同20张测试集胸片间隔≥1周各测两次,RO同期测量测试集。由RO对学生保存图像逐例判定参考点选取错误,计算VHS与VLAS的观测者内(intraobserver,两次测试)与观测者间(interobserver,学生vs RO)组内相关系数(Intraclass Correlation Coefficient, ICC,双向混合效应模型绝对一致),并绘制Bland–Altman图评估偏倚。
研究结果
3.1. Demographics(人口学与病例特征)
学习集与测试集间MMVD分期分布无统计学差异(P>0.05),保证各组影像难度均衡。
3.2. Errors(测量错误分析)
VHS测量中共268例有效记录,67.8%含≥1项错误,最常见错误为心尖(cardiac apex)定位错误(29.6%)与短轴未垂直于长轴(27.0%),其次为气管隆突(carina)起点错误(22.2%)、短轴尾点错误(18.5%)、短轴头点错误(14.8%)、T4颅缘误判(13%)、短轴高度位置错误(9.3%)。VLAS测量中54.1%含≥1项错误,最常见为CVC交点错误(41.5%),其次为carina起点错误(24.1%),T4颅缘误判最少(15.2%)。G3组VHS错误率(75%)显著高于G1(60%)与G2(57.8%)(P=0.007),VLAS各组间错误率无差异(P=0.221)。临床C期犬胸片中VHS短轴垂直性、头点及尾点错误率及VLAS之CVC点错误率均显著高于非临床期犬(P<0.01),提示心脏增大伴肺浸润或呼吸状态影响参考点辨识。
3.3. Interobserver and intraobserver analysis(观测者间与观测者内一致性分析)
排除1名持续选错T4椎体之学生后,VHS观测者间ICC介于0.948–0.993,VLAS观测者间ICC为0.819–0.978;VHS观测者内ICC为0.959–0.995,VLAS观测者内ICC为0.710–0.994。VHS三组间一致性均为近乎完美且组间无差异;VLAS呈随培训量增加轻微升高趋势(G1实质一致,G2–G3近完美),但统计学上培训量未造成显著性差异。表明经标准流程培训后不同经验学生均可获可靠一致性。
3.4. Bias analysis(偏倚分析)
Bland–Altman分析显示VHS学生与RO间偏倚范围为‑0.44至+0.30椎体单位,VLAS偏倚范围为‑0.13至+0.13椎体单位,偏倚大小在各组间无规律分布,不随培训量增加减小,进一步佐证经验水平对测量系统偏倚无影响。
讨论与结论总结
讨论部分指出,VHS与VLAS虽常见参考点选取错误(尤于心尖辨识及CVC交点定位),尤其临床心衰犬因肺浸润及吸气不足致心影与血管结构模糊使错误增多,但错误并未导致一致性显著降低,原因可能为个体系统性偏差在自身重复测量中被抵消,且统一培训规范了参考点认知。VHS在不同经验层级均有近乎完美ICC,与既往认为VHS受经验影响小的结论相符;VLAS一致性略低于VHS但在充分练习后可接近完美,与部分报道VLAS更依赖经验的观点一致。本研究局限性包括单次集中培训、学习阶段无即时纠错反馈、错误判定由RO主观进行。作者最后总结:胸片上VHS与VLAS测量中错误并不少见,但经过统一标准培训后,无论练习量为10、30或50例,兽医学学生均可获得实质至近乎完美的观测者内与观测者间一致性,提示测量经验(在本研究范围内)不影响结果,VHS与VLAS是具备良好可重复性与再现性的可靠心脏尺寸评估方法。
Conclusions(结论原文翻译):
本研究结果显示,进行心脏放射学测量时出现错误并不罕见,但这些错误对测量结果无重大影响。此外,无论经验多少,所有学生与参考观测者均获得实质至近乎完美的一致性,提示测量经验并不影响结果。这些发现表明VHS与VLAS两种方法均为具有良好再现性(reproducibility)与可重复性(repeatability)的可靠测量手段。