编辑推荐:
来自英国生物银行的研究团队利用166,740例全基因组测序(WGS)数据,通过整合血液基因调控网络和有害性评分,系统分析了42项血液细胞计数与生物标志物性状的非编码区罕见变异关联。研究发现数百个基因-性状关联信号,但多数可被附近常见变异与罕见变异间的连锁不平衡(LD)所解释,为复杂性状遗传解析提供了方法学警示。
这项突破性研究利用英国生物银行(UK Biobank)16.7万例全基因组测序(WGS)数据,对42种血液细胞计数和生物标志物性状展开深度解析。研究者创新性地结合血液系统基因调控图谱与变异有害性预测算法,系统筛选可能影响血液性状的非编码区罕见变异(占基因组>98%区域)。通过变异聚合分析(variant collapsing tests),团队鉴定出数百个涉及非编码变异的基因-性状关联信号。
然而深入分析揭示,这些关联信号主要呈现两大特征:首先,多数信号与既往研究报道的已知关联高度重合;更重要的是,这些关联性主要源于罕见变异与邻近常见变异之间的连锁不平衡(LD)效应。该发现为大规模基因组关联研究(GWAS)提供了重要方法论启示——在解读非编码区罕见变异关联时,必须谨慎区分真正的功能变异与LD驱动的假阳性信号。研究结果发表于国际顶级期刊,为复杂性状遗传架构解析树立了新的分析范式,同时凸显当前罕见变异研究面临的技术挑战。
生物通 版权所有