基于深度学习脊柱弯曲表型精准识别鉴定UK Biobank中脊柱侧凸新型遗传风险位点

时间:2026年3月27日
来源:npj Digital Medicine

编辑推荐:

针对脊柱侧凸遗传机制尚不明确的问题,本研究利用深度学习技术处理57,588例UK Biobank(UKB)双能X线吸收测定法(DXA)扫描数据,量化累积水平位移以构建定量影像表型。通过全基因组关联研究(GWAS)鉴定出2个新型风险位点(SEM1/SHFM1及chr3长链非编码RNA),其与ICD-10及日本Biobank遗传相关性显著。结果显示,定量影像GWAS较万例级病例对照研究更具效力,为超越病历记录的遗传关联挖掘提供了范式。

广告
   X   

在人体骨骼系统中,脊柱扮演着支撑躯干、保护脊髓的关键角色,它本该如挺拔青松般笔直,却常常因为各种原因发生侧向弯曲,形成俗称的“脊柱侧凸”。这种常见的发育性脊柱畸形,不仅影响体态美观,严重时还会压迫心肺功能,威胁健康。尽管医学界早已意识到遗传因素在其中扮演重要角色,但其具体的遗传密码却始终未被完全破译。传统的诊断依赖于临床医生测量的Cobb角,这一金标准虽然准确,却难以在大规模人群中进行高效筛查和表型量化。更为棘手的是,依赖医院病历编码(如ICD-10)进行的遗传学分析,往往受限于诊断标准的异质性和漏诊率,导致许多处于疾病早期或症状轻微的患者被遗漏,使得遗传信号的捕捉如同“大海捞针”。
为了突破这一瓶颈,来自国外研究团队的一项最新成果给出了极具启发性的答案。该研究发表于《npj Digital Medicine》,题为“Deep learning-based precision phenotyping of spine curvature identifies novel genetic risk loci for scoliosis in the UK Biobank”。研究人员并未止步于传统的临床诊断,而是另辟蹊径,将目光投向了英国生物样本库(UK Biobank, UKB)中数以万计的双能X线吸收测定法(Dual Energy X-ray Absorptiometry, DXA)扫描图像。他们利用前沿的深度学习技术,对脊柱弯曲进行了前所未有的精准量化,并以此为基础开展了全基因组关联研究(Genome-Wide Association Study, GWAS),成功揭示了隐藏在图像背后的遗传奥秘,为脊柱侧凸的遗传学研究开辟了新航道。
为了实现这一目标,研究团队采用了几项关键技术手段。首先,他们利用深度学习算法对DXA图像进行脊椎分割(vertebral segmentation)和关键点标记(landmarking),从而自动计算出能够代表脊柱弯曲程度的“累积水平位移”(cumulative horizontal displacement)。随后,他们将该算法应用于UKB中57,588名个体的DXA扫描数据,构建了一个大规模的定量影像表型数据集。在此基础上,团队开展了全基因组关联研究(GWAS),并将基于影像的遗传结果与UKB及日本Biobank(Biobank of Japan)中的ICD-10诊断数据进行遗传相关性(genetic correlation)分析,以验证结果的普适性。

Abstract

在摘要部分,研究概述了利用深度学习从DXA扫描中提取脊柱曲率表型的方法。通过对150名受试者的子集分析,证实自动化图像衍生的曲率测量值与临床Cobb角评估值具有0.83的相关性,验证了该定量指标作为脊柱侧凸严重程度替代标志物的有效性。进一步的GWAS分析在欧洲人群中鉴定出2个与脊柱侧凸相关的新型遗传位点,分别位于SEM1/SHFM1基因区域以及染色体3号(chr 3)上EDEM1GRM7基因之间的一个长链非编码RNA(lncRNA)区域。遗传相关性分析显示,基于图像的GWAS与ICD-10诊断的GWAS存在显著重叠。更重要的是,研究表明定量GWAS相较于样本量十倍于它的病例对照研究,能识别出更多的全基因组显著性位点。

研究结果

深度学习表型的验证
研究人员开发了一套基于深度学习的自动化流程,用于处理UK Biobank中的DXA图像。通过对150名个体进行的手动测量与自动化测量的对比,发现两者计算出的脊柱曲率(累积水平位移)与临床Cobb角呈现出高度一致性(相关系数r=0.83)。这一结果强有力地支持了利用自动化影像表型作为脊柱侧凸严重程度的客观、可量化替代指标的可行性,解决了传统表型主观性强、难以大规模应用的难题。
全基因组关联研究(GWAS)发现
基于上述高精度表型,团队对57,588名UKB参与者进行了GWAS分析。分析结果显示,该研究成功鉴定出两个此前未被报道过的脊柱侧凸风险遗传位点。其中一个位点在SEM1/SHFM1基因区域,另一个则位于染色体3号上的一个长链非编码RNA(lncRNA),具体位置处于EDEM1GRM7基因之间。这些发现为理解脊柱侧凸的分子遗传基础提供了新的线索。
遗传相关性与跨群体验证
为了验证基于影像表型发现的遗传信号是否具有生物学意义,研究者进行了遗传相关性分析。结果表明,本研究得出的GWAS结果不仅与UKB内部的ICD-10脊柱侧凸诊断数据存在显著遗传重叠,还与来自日本Biobank的独立数据集表现出显著的遗传相关性。这证实了该定量表型捕捉到的遗传信号在不同种族背景(欧洲与亚洲)中具有普遍性。
定量表型与传统方法的效能比较
研究还进行了一项关键的效能对比。结果显示,利用该定量影像表型进行的GWAS,在样本量仅为数万的情况下,识别出的全基因组显著性位点数量,超过了样本量达到十万级别(十倍于此研究)的传统病例对照(case-control)脊柱侧凸数据集。这一发现凸显了精确、连续型表型在遗传力解析中的巨大优势。

结论与讨论

这项研究的结论令人振奋且意义深远。首先,它成功证明了深度学习驱动的定量影像表型分析,能够有效弥补传统临床诊断和病历记录在大规模遗传学研究中的不足。通过将复杂的脊柱形态转化为可计算的“累积水平位移”,研究人员克服了ICD-10编码带来的分类偏倚和信息丢失,使得微弱的遗传效应得以被检测。
其次,该研究鉴定的两个新型遗传位点——SEM1/SHFM1和位于chr3的lncRNA,为后续的分子生物学功能研究提供了明确的目标。特别是SHFM1基因已知与肢端发育相关,这暗示了脊柱侧凸可能与肢体发育通路存在共享的遗传调控机制,值得深入探索。而位于EDEM1GRM7之间的lncRNA则可能通过调控邻近基因参与脊柱形成的生物学过程。
最后,这项研究提供了一个极具说服力的范例:在生物样本库时代,结合人工智能与医学影像,能够从看似非结构化的常规影像数据中挖掘出宝贵的生物学标志物。这种方法不仅适用于脊柱侧凸,也为其他复杂疾病的遗传研究提供了新的思路,即通过高精度的表型细化来提高遗传关联分析的统计效能,从而在有限的样本量下获得更大的发现力。正如研究者所言,定量成像表型有望揭示那些仅凭医疗记录难以捕捉的遗传关联,推动精准医疗迈向新的高度。

生物通微信公众号
微信
新浪微博


生物通 版权所有