坦桑尼亚肺炎克雷伯菌泛基因组分析:揭示具有高基因组可塑性及多样化移动组、毒力组和耐药组的高风险克隆

时间:2025年10月21日
来源:Microbiology Spectrum

编辑推荐:

本文通过对坦桑尼亚临床来源的198株肺炎克雷伯菌(Klebsiella pneumoniae)进行泛基因组分析,首次系统揭示了该地区流行菌株具有开放的泛基因组结构(13.6%核心基因,75.2%云基因),并鉴定出ST45、ST39等高危克隆。研究重点报道了其高度可变的移动遗传元件(MGEs,如IS5075、Tn5403)及近乎普遍存在的耐药基因(如blaCTX-M-15、oqxA/B)。研究强调了结合荚膜(K)和O抗原分型(以KL24/25和OL2α.1/2为主)进行多学科监测,对于优化治疗和疫苗开发以应对多重耐药(MDR)菌株传播的重要意义。

广告
   X   

ABSTRACT
肺炎克雷伯菌(Klebsiella pneumoniae)是一种快速进化的病原体,拥有多样化的泛基因组,其移动组和耐药组仍不甚明确。本研究旨在描绘来自坦桑尼亚地区198株分离株的泛基因组特征。研究对从公共数据库获取的Illumina原始读数进行了组装,并采用多位点序列分型(MLST)、基于核心基因组单核苷酸多态性(SNP)的系统发育分析、荚膜多糖(K位点)和脂多糖O抗原(O位点)分型进行了分析。结果显示,184株分离株被鉴定为严格意义上的肺炎克雷伯菌(K. pneumoniae sensu stricto),其余14株属于肺炎克雷伯菌复合体(KpSC)中的其他物种。共鉴定出90种序列型(STs),包括全球高风险ST45、ST39、ST336、ST14、ST1552和ST17。KL24和KL25是最常见的K位点,而OL2α.1和OL2α.2是主要的O位点。泛基因组分析揭示了30,992个基因家族,分布为持久性基因(13.6%)、外壳基因(11.2%)和云基因(75.2%),表明其具有开放的泛基因组结构。基于核心基因组SNP的系统发育分析证实了克隆扩张和谱系聚类。毒力分析显示44%的分离株携带耶尔森菌素(yersiniabactin)。大多数基因组携带关键的菌毛和铁摄取基因。耐药组分析揭示了blaCTX-M-15、oqxA/B、fosA6、sul2和marA的近乎普遍存在。质粒分型鉴定出IncF型(76%)和Col型(54%)质粒,同时检测到超过120种移动遗传元件(MGEs),其频率分布广泛,包括插入序列(如IS5075和MITEYpe1)和转座子(如Tn5403和Tn6082)。总之,坦桑尼亚肺炎克雷伯菌菌株表现出广泛的基因组可塑性、高风险谱系和多样化的移动组,呼吁建立国家基因组监测以指导干预策略。
IMPORTANCE
肺炎克雷伯菌复合体包含一组多样化的细菌病原体,能够适应多种环境。来自临床和环境样本的分离株与医院感染和多重耐药相关,具有相似的基因组结构和固有基因。我们的研究首次报告了坦桑尼亚临床标本肺炎克雷伯菌分离株基因组可塑性的泛基因组基础,展示了多样化的克隆、移动组和耐药组特征。结合这些特征与K和O结构的多样性,我们的研究强调需要进行全面的多学科监测研究,以优化治疗和疫苗开发。
INTRODUCTION
肺炎克雷伯菌是一种常见的革兰氏阴性病原体,可引起多种临床感染,包括尿路感染、肺炎、败血症和伤口感染。它尤其与新生儿和免疫功能低下患者的医院获得性感染相关。肺炎克雷伯菌的临床成功很大程度上归因于其基因组可塑性,这有助于通过质粒和其他移动遗传元件(MGEs)获得和传播抗菌素耐药性(AMR)决定因子。特别值得关注的是产超广谱β-内酰胺酶(ESBL)的肺炎克雷伯菌的全球出现,常与blaCTX-M-15基因相关,该基因赋予了对第三代头孢菌素的耐药性,使治疗选择复杂化。在坦桑尼亚,产ESBL肺炎克雷伯菌在医院和社区环境中的报道日益增多,反映了其广泛且未被有效控制的传播。达累斯萨拉姆的一项基因组监测研究在超过70%的儿科患者分离株中鉴定出一个携带blaCTX-M-15的保守IncFIIK5/IncR质粒,这些分离株跨越了遗传多样化的谱系,提示了水平传播。姆万扎新生儿病房的一项研究将产ESBL肺炎克雷伯菌(主要是ST45)与严重的新生儿败血症和高死亡率联系起来。最近,有报道称坦桑尼亚农村地区尿路感染患者中产ESBL肠杆菌的粪便携带率高达70.9%,主要是大肠埃希菌和肺炎克雷伯菌。尽管有这些发现,大多数研究依赖于表型耐药性测试或靶向聚合酶链反应,提供的基因组背景及其公共卫生影响范围有限。基因组框架对于理解低收入和中等收入国家多重耐药(MDR)谱系的传播动态、进化压力和传播至关重要。
本研究旨在描绘当前可用数据集的泛基因组,以推断我们对坦桑尼亚流行菌株遗传复杂性的理解。这项综合分析的信息有助于揭示坦桑尼亚毒力和抗生素耐药性传播的模式和动态。
利用多位点序列分型(MLST)、核心基因组系统发育、AMR和毒力基因分析、荚膜和O抗原血清分型以及移动组分析,我们报告了一个复杂的开放泛基因组、一系列MGEs和多样化的质粒,共同构成了未被充分探索的毒力组和耐药组特征。
MATERIALS AND METHODS
数据收集和元数据整理
本研究分析了从NCBI序列读取档案库获取的198个肺炎克雷伯菌全基因组测序数据集,BioProject登录号包括PRJEB65607、PRJNA951629、PRJEB20875和PRJNA503964。这些分离株来自坦桑尼亚三个地区的不同临床和地理环境,提供了比任何单一研究更广阔的视角。具体数据集包括2010年8月至2011年7月在达累斯萨拉姆收集的腹泻儿童粪便样本、2021年尿路感染患者的粪便样本、2020年在姆万扎收集的骨科患者直肠拭子以及2016年在姆万扎收集的新生儿败血症病例血液样本。相关的元数据,包括样本年份、地理来源、临床来源和疾病状况,均从BioSample记录和已发表文献中系统整理,以确保完整性和准确性。
质量控制和基因组组装
使用FastQC (v0.11.9) 对原始Illumina读数进行质量检查。使用Trimmomatic (v0.39) 修剪接头序列和低质量碱基(Phred分数<20)。使用SPAdes (v3.15.4) 默认参数对高质量读数进行从头组装。使用QUAST (v5.2.0) 评估组装质量;记录N50、基因组大小、鸟嘌呤-胞嘧啶(GC)含量和总重叠群数等指标。组装体若重叠群数>500或完整度<90%则被排除在后续分析之外。
物种确认和分型
使用Kleborate (v2.3.0) 进行物种水平鉴定。使用Kleborate内置的PubMLST方案进行MLST分型。
基因组注释
使用Bakta (v1.7.0) 对基因组组装进行注释,并针对肺炎克雷伯菌使用物种特异性设置。注释包括编码序列、tRNAs、rRNAs、ncRNAs和假基因。使用 curated 数据库(UniRef90, Pfam, TIGRFAMs)进行功能注释,从而能够下游整合基因产物名称、COG类别、基因本体论术语和EC编号。生成的GFF3文件用于泛基因组和比较分析。
泛基因组分析
使用PPanGGOLiN (v1.2.74) 进行泛基因组分析。将来自Bakta的注释GFF3文件作为输入,基于≥80%氨基酸同一性对基因进行聚类。使用概率图模型将基因家族划分为持久性(核心)、外壳(附属)和云(独特)组分。使用瓦片图和U形频率图可视化基因分布和基因组可塑性。生成饼图以说明基因分区和功能模块的组成。
SNP calling和系统发育分析
使用Snippy (v4.6.0) 以肺炎克雷伯菌MGH 78578 (GCF_000016305.1) 为参考,鉴定核心基因组单核苷酸多态性(SNPs)。使用Snippy-core保留≥95%分离株共享的SNPs。使用IQ-TREE (v2.2.0) 从核心SNP比对中推断最大似然系统发育树。通过ModelFinder使用贝叶斯信息准则选择最佳拟合模型,并使用超快速自举法(1000次重复)评估分支支持度。
毒力组和耐药组分析
使用Kleborate (v2.3.0) 进行毒力基因检测和评分,筛查耶尔森菌素(ybt)、气杆菌素(iuc)、沙门菌素(iro)、大肠杆菌素(clb)和rmpA/rmpA2等位点。使用ABRicate (v1.0.1) 和VFDB数据库(≥90%同一性,≥80%覆盖率)进行额外的毒力基因检测。使用ABRicate和ResFinder及CARD数据库在相同阈值下鉴定AMR基因。按照Kleborate评分标准计算耐药性分数。通过Kleborate的Kaptive进行O抗原和荚膜(K)位点血清分型。为了确认与高粘液粘度相关的超强毒力,使用K-PAM平台对独特分离株的FASTA格式组装重叠群进行了重新分析。
质粒复制子和移动遗传元件分析
使用ABRicate和PlasmidFinder数据库(阈值≥90%同一性和≥80%覆盖率)鉴定质粒复制子。使用MobileElementFinder (MEFinder v1.0.3) 鉴定MGEs,包括插入序列(ISs)、转座酶和整合元件。使用存在/缺失矩阵通过热图可视化整个数据集中MGEs、质粒、AMR基因和毒力基因的分布。
RESULTS
数据集概述和基因组质量指标
共检索并处理了来自坦桑尼亚三个地区不同临床研究的198株克雷伯菌属分离株,用于比较基因组分析。原始测序读数显示出高质量数据,中位读长为151 bp,平均为160.7 bp(范围:110–246 bp)。平均GC含量为56.78%(范围:51%–69%),平均序列重复水平为27.86%(范围:0.08–0.52)。平均组装长度为5.57 Mbp,平均N50为155.25 kbp,最大重叠群大小为400.42 kbp。排除了重叠群数>500或完整度<90%的组装体。过滤后,所有198个组装体均符合质量阈值,并纳入下游分析。
物种确认和序列型多样性
基于基因组的物种鉴定确认,198株分离株中的184株属于严格意义上的肺炎克雷伯菌。其余14株被归类为肺炎克雷伯菌物种复合体(KpSC)的其他成员,包括10株肺炎克雷伯菌 quasipneumoniae亚种 quasipneumoniae,3株差异克雷伯菌 variicola亚种 variicola和1株 quasivariicola克雷伯菌。对198株分离株的MLST分析显示了显著的遗传多样性,共鉴定出90种不同的序列型(STs)。最流行的ST是ST45(n = 21),其次是ST39和ST336(各n = 9),ST14和ST348(各n = 6),以及ST1552和ST17(各n = 5)。其他频繁检测到的STs包括ST35、ST37和ST391(各n = 4),而ST15、ST405、ST111、ST48、ST30、ST323、ST13、ST661、ST307和ST834各在三个分离株中被鉴定(各n = 3)。有17个STs各出现在两个分离株中。值得注意的是,67个分离株代表了独特的STs(单例)。
泛基因组结构
对198个肺炎克雷伯菌基因组的泛基因组分析显示,共有1,045,769个基因,归入30,992个基因家族。其中4,207个基因家族(13.6%)被归类为持久性基因,存在于≥85%的基因组中。外壳基因组包含3,464个基因家族(11.2%),细分为外壳-S1(n = 413)、外壳-S2(n = 506)和外壳-S3(n = 2,545),而云基因组,代表在<5%基因组中发现的稀有基因,占23,321个基因家族(75.2%)。基因频率范围从0.01到1.0,外壳基因的标准差为0.21,云基因的标准差为0.01。
基因存在/缺失矩阵说明了基因分区(持久性、外壳和云)在基因组间的可变分布。此外,还鉴定出879个基因模块,涵盖4,646个基因家族,其中62.4%属于云基因组,37.5%属于外壳基因组,仅0.06%属于持久性基因组。基因频率分布呈现U形曲线,表明存在于几乎所有或极少数基因组中的基因比例很高,这是开放泛基因组结构的特征。
基于SNP的系统发育和基因组聚类
在198个基因组中共鉴定出683,177个高质量核心基因组SNPs。注释的系统发育树代表了多位点STs、荚膜位点(K-locus)、O抗原位点(O-locus)、耶尔森菌素序列型(YbST)、大肠杆菌素(CbST)、气杆菌素(AbST)、沙门菌素(KSmST)、rmpA(RmST)、地理位置、标本类型和疾病状况元数据。观察到ST45、ST39、ST336和ST14等STs聚集在一起。同样,共享相同K位点和O位点类型的分离株也聚集在同一进化枝内。按国家和采样点分布的分离株以地理地图形式呈现。
毒力基因分布
使用Kleborate进行毒力基因分析,在198株分离株中的87株(43.94%)中鉴定出ybtA和ybtP,而fyuA、irp2、ybtE、ybtQ、ybtS、ybtT、ybtU和ybtX各在86株(43.43%)中检测到。值得注意的是,操纵子clbABCDEFGILMNPQ(大肠杆菌素)、iucABCD-iutA(气杆菌素)和iroBCDN(沙门菌素)仅存在于一株分离株(0.51%)中,即ERR11968338(ST348)。在所有分析的基因组中均未发现调节基因rmpA和rmpA2。
总体而言,每个分离株的毒力基因数量从6到68个不等。最普遍的毒力决定因子包括entB、fepC和ompA,各在194株(97.98%)分离株中发现,以及yagV/ecpE、yagZ/ecpA和ykgK/ecpR,各存在于196株(98.99%)分离株中。yagY/ecpB在195株(98.48%)分离株中发现。分离株SRR24046082(ST307)显示出最高的毒力评分4,而ERR11968338(ST348)尽管携带多个毒力位点,评分仅为2。大多数分离株的毒力评分为0或1。相反,低频率基因如afaA、afaB-I、afaC-I、afaD、afaE-I、draP、fimH、iucA和espX5各仅在一个分离株(0.51%)中检测到,而fimA缺失。
耐药组特征
每个分离株检测到6-68个AMR基因。频繁检测到的基因包括CTX-M-15(197/198, 99.49%)、TEM-1(174/198, 87.88%)、FosA6(160/198, 80.81%)、sul2(178/198, 89.9%)、oqxA(192/198, 96.97%)和oqxB(194/198, 97.98%)。其他高度流行的基因包括acrB(197/198, 99.49%)、KpnF(198/198, 100%)、marA(198/198, 100%)和msbA(198/198, 100%)。在氨基糖苷类修饰酶中,AAC(3)-IId在108株(54.55%)中检测到,APH(3″)-Ib在82株(41.41%)中,APH(6)-Id在97株(48.99%)中。氟喹诺酮耐药决定因子如AAC(6″)-Ib-cr在63/198(31.82%)中鉴定出。质粒介导的喹诺酮耐药基因如QnrS1(27/198, 13.64%)、QnrB17(25/198, 12.63%)和OXA-1(49/198, 24.75%)也被观察到。发现了几种SHV变体,包括SHV-187(67/198, 33.84%)、SHV-120(23/198, 11.62%)、SHV-110(15/198, 7.58%)和SHV-106(14/198, 7.07%),而其他β-内酰胺酶如OKP-B-17(2/198, 1.01%)和ACT-6(2/198, 1.01%)则很罕见。极低频率基因(各在一个分离株中检测到;0.51%)包括ErmB、SHV-1、OKP-B-5、FosB1、QepA2、LEN-26等。基因分析显示,核心AMR基因的存在在分离株间聚集在一起。在198株分离株中,196株表现出耐药性评分1,1株评分0,1株肺炎克雷伯菌ST290-1LV SRR24046077显示出耐药性评分2。
荚膜(K)和O抗原血清分型
对O抗原和K荚膜位点的分析揭示了198株分离株中特定O位点和K位点类型占主导地位。最普遍的O位点是OL2α.1,在92株(46.5%)分离株中鉴定出,其次是OL2α.2,在63株(31.8%)中,OL3γ在18株(9.1%)中。其他O位点类型,包括OL3α/β(9株)、OL5(?)、OL4(?)、OL13(?)以及OL10、OL12、OL15和OL2α.3(各<2%)则不太常见。就K位点(荚膜)类型而言,KL24是最常观察到的,在34株(17.2%)分离株中检测到,其次是KL25,在20株(10.1%)中,KL102在9株(4.5%)中,KL16、KL30、KL23和KL149各在6-7株分离株中。
移动组特征
在198株克雷伯菌分离株中,质粒复制子和MGEs揭示了广泛的多样性和分布。在所有分离株中,共鉴定出24种不同的质粒复制子类型。每个分离株的质粒复制子数量从1到10个不等。最普遍的复制子类型包括IncFII_1_pKP91(150株,75.76%)、IncFIB(K)1_Kpn3(143株,72.22%)、IncR_1(136株,68.69%)和Col440I_1(107株,54.04%)。其他频繁检测到的复制子包括ColRNAI_1(65株,32.83%)、IncFIB(pKPHS1)1(34株,17.17%)、IncFIB(Mar)_1_pNDM-Mar(35株,17.68%)和IncHI1B_1_pNDM-MAR(36株,18.18%)。
MGE分析检测到超过120种不同的MGEs,包括插入序列、转座酶和整合元件。每个分离株的MGEs数量从2到28个不等。最常观察到的元件包括MITEYpe1(194株,97.98%)、MITEEc1(175株,88.38%)、IS5075(151株,76.26%)、ISEc9(140株,70.71%)、ISSen9(148株,74.75%)和ISEcl10(122株,61.62%)。其他常见的MGEs包括ISKpn1(108株,54.55%)、ISKpn24(105株,53.03%)和Tn6196(101株,51.01%),而几种低频率MGEs,如ICEKpnHS11286-1、ISPlge3和ISCfr12,也在<10%的分离株中检测到。质粒复制子和MGEs在分离株中的完整分布通过热图可视化。
DISCUSSION
肺炎克雷伯菌正在快速进化,其毒力组和耐药组仍不明确,对全球公共卫生构成威胁。通过全面的泛基因组分析,我们报告了具有多样化毒力组、耐药组和移动组特征的多种STs,反映了一个具有开放泛基因组的复杂病原体。总体而言,平均组装长度5.57 Mbp、GC含量和其他基因组特征表明,大多数测序的坦桑尼亚分离株具有标准研究中描述的肺炎克雷伯菌的平均基因组大小,因此我们的下游分析和结果足以进行基因组解释和推断。
从198株分离株的泛基因组结构来看,基因存在/缺失矩阵中每个分离株的基因家族和U形频率分布所代表的高基因组可塑性是开放泛基因组的标志。13.6%基因的持久性表明这些基因可能存在于≥85%的基因组中(核心或近乎核心)。这表明这些分离株包含一个最小的核心基因组,最大的部分则适应于特定生态位功能或近期获得。11.2%基因家族的外壳基因组表明泛基因组可能相当保守。外壳基因的标准差0.21和云基因的标准差0.01表明菌株间存在中等频率变异。云基因比例75.2%表明大多数基因(四分之三)在<5%的基因组中发现,表明强烈的菌株间变异性和高水平的基因转移率。这可能归因于质粒和移动遗传元件,包括噬菌体。总体而言,这些发现表明本工作中的分离株在医院、社区和环境储库中具有广泛的适应性。这强调了其在临床环境中的适应性,这是一种进化优势,带来了新的AMR风险并使干预举措复杂化。
如图所示,多样化的移动组由不同家族的质粒、插入序列和转座子代表。IncFII_1_pKP91、IncFIB(K)_1_Kpn3、IncR_1、ColRNAI_1和IncFIB(pKPHS1)是KpSC中最常见的质粒,其他研究也有报道。它们的出现归因于AMR基因的传播,这些基因赋予了对多种β-内酰胺类、氨基糖苷类、磺胺类和大环内酯类等常规抗生素类别的耐药性。因此,这些质粒在坦桑尼亚菌株中的流行对卫生系统构成严重威胁,不仅因为它们可能使肺炎克雷伯菌无法治疗,而且为肠杆菌科内的种间传播提供了支架。
我们表明MGEs的分布范围很广。这可能是观察到的泛基因组可塑性的最主要因素,是高水平基因转移率导致菌株内和菌株间基因组多样性的结果。尽管移动遗传元件的研究在全球仍处于起步阶段,但应强调移动组在病原体基因组多样性及其流行病学影响中的作用,以制定更有效的暴发监测和控制策略。
最重要的是,基于SNP的系统发育清楚地显示了多个进化枝,代表了高达683,177个高质量核心基因组SNPs产生的多样化谱系。除了大量的SNPs和进化枝集群外,我们还发现几个STs之间存在重叠,例如ST45、ST39、ST336和ST14的集群。这表明存在巨大的多样性,这可能反映与各种STs相关的毒力组和耐药组模式。从这些发现来看,仍然需要针对肺炎克雷伯菌的流行病学研究,以建立核心基因组的保守模式,这可能有助于设计广谱疫苗。
根据我们的Kleborate分析,鉴定出184个物种表明,在坦桑尼亚传播的KpSC物种主要由严格意义上的肺炎克雷伯菌组成。仅从四个项目中就回收了90种不同的STs,表明在坦桑尼亚传播的克隆具有巨大的多样性。这表明需要全面的基因组监测研究来证实这种多样性的风险并预测未来的暴发,以便为该国提供更明智的干预措施。
我们表明ST45的流行率最高,占所有198个样本的10%以上。ST45是一个全球性克隆,与新生儿败血症以及ESBLs和碳青霉烯类耐药的传播有关。我们的结果与这些报告一致,表明大多数ST45分离株常见于血液样本,代表败血症休克的重要风险。据姆万扎报道,ST45克隆也从直肠拭子中分离出来,表明该克隆可以通过多个器官和系统传播。此外,ST45已被证明携带IncFIB(K)、IncQ、IncR和/或IncFII(K)/IncR/IncFII(Yp)质粒类型,携带编码aph(3′)-Ia、bleO、tet(A)和dfrA14、blaTEM1B、blaKPC-2和blaCTX-M-15的基因,赋予对氨基糖苷类、四环素类、氟喹诺酮类和第三代头孢菌素的耐药性。该克隆也与ST323和ST340一起被归入导致医院传播集群的21个常见肺炎克雷伯菌谱系。因此,鉴于其高频率和全球分布,ST45作为临床和环境中最可能的风险之一引起关注,具有最高的AMRG传播率。
高风险克隆包括ST11、ST307、ST37、ST348、ST101、ST14、ST147和ST15,这些克隆已被表征为与医院感染相关的MDR。因此,我们的研究结果表明该国存在MDR传播的关键风险,高风险克隆加剧了全国范围内ESBLs的风险。接下来最流行的克隆ST39和ST336及其公共卫生风险已由ESBL基因blaCTX-M-15和碳青霉烯酶耐药基因确定。在坦桑尼亚,Perdersen等人于2020年报告,ST39克隆的发生,其携带IncFII/IncR,归因于ESBLs(包括blaCTX-M-15)在大多数医院儿童中的传播。另一方面,ST336来自其他大陆的报道,包括澳大利亚和欧洲,主要是临床和环境环境中ESBL的blaCTX-M-15形式。这些克隆的高流行率可能解释了相应的对头孢曲松(坦桑尼亚常规应用的第三代头孢菌素)的耐药性流行率。然而,关于AMR谱的研究报道了临床环境中β-内酰胺酶的流行率。严格的监测应结合针对个体STs和基因的湿实验室实验,以提出

生物通微信公众号
微信
新浪微博


生物通 版权所有