来自南非酒精发酵过程的7株Kluyveromyces marxianus菌株的基因组草图

时间:2026年1月30日
来源:Microbiology Resource Announcements

编辑推荐:

基因组多样性分析:南非法定七个酿酒酵母Kluyveromyces marxianus新菌株的 draft 基因组测序完成,揭示其高遗传多样性及与工业菌株驯化相关的重复基因特征。

广告
   X   

摘要

尽管酿酒酵母Kluyveromyces marxianus在工业生物技术和乳糖发酵方面具有显著的潜力,但其基因组多样性尚未得到充分研究,尤其是在非乳制品相关领域。本文报道了从南非分离出的7个菌株的基因组草图,丰富了这一多用途物种的已知遗传多样性。

公告

Kluyveromyces marxianus是一种具有广泛生物技术潜力的酵母,可用于发酵食品和化学生物制造。作为合成生物学中的新兴模型,成功的菌株工程依赖于许多遗传背景的全基因组序列(12)。因此,探索其基因组多样性对于全面揭示其应用潜力至关重要。目前NCBI上仅存35个K. marxianus基因组;尽管样本量有限,但该物种的遗传多样性仍很高,几乎是Saccharomyces cerevisiae(已有数千个基因组)的三倍(3)。本文报道了来自南非的7个菌株的基因组草图,这些菌株分别用于传统啤酒酿造、土壤样本和龙舌兰酒生产(4个、1个和2个)。这些基因组草图为生物技术研究提供了更多资源。
这7个菌株来自南非自由州大学的生物多样性生物库和酵母培养收集中心。最初,通过将培养基稀释后接种到含有酒石酸(pH 4,30°C)的酵母-麦芽提取物琼脂上来分离这些菌株。使用苯酚-氯仿法(4)从过夜培养的YPD菌株(30°C)中提取DNA,并用Qubit荧光计进行定量。使用MGIEasy FS DNA Library Prep试剂盒制备文库,并由中国广东的北京基因组研究所(BGI)的DNBSEQ平台进行测序。碱基调用通过Zebracall软件(BGI)完成,该软件可自动将原始信号数据转换为FASTQ文件(56)。平均每个基因组获得了810万个150 bp的双端读段,与参考基因组(Kmar_1.0,GCF_001417885.1)对齐后的平均深度覆盖率为200×±7%。使用Fastp v0.20.0(7)进行读段修剪,并使用SPAdes v3.12.0(8)在默认参数下进行de novo组装,未进行额外处理。使用通用寡核苷酸(910)从组装结果中in silico提取ITS和D1/D2 rDNA区域,并与模式菌株CBS 712ᵀ(NCBI登录号:KY103793.1KY108075.1)进行比较,确认了物种分类(99–100%的同一性)。使用QUAST v5.2.0(11)评估组装质量;6个基因组的质量相似,含有80–140个contig,N50约为440 kb。基因组长度平均为10.7 Mb,GC含量为40.08%,与参考基因组一致(10.9 Mb,40% GC)。其中一个啤酒菌株(UFSY-1180)的组装结果较为碎片化(>200个contig)。使用BUSCO v5.6.1(12)在Genomes模式下针对Saccharomycetes_odb10(n= 2137个基因模型)进行评估,完整性超过98%。使用FastANI v1.34并设置-kmer大小为20 bp(13)时,发现龙舌兰酒菌株与参考基因组DMKU3-1042的核苷酸同一性较低(ANI约为95.5%,表1)。
表1
表1 南非7个K. marxianus基因组组装的元数据和指标
菌株来源年份覆盖率(%)深度(×)QUAST指标BUSCO评估(%)ANI(%)组装访问号
Contigs大小(Mb)GC含量(%)N50(kb)完整重复碎片化缺失
UFSY-1180啤酒19859819427710.840.1143998.271.926.30.41.497.67GCA_053524955.1
UFSY-1181啤酒1989982088010.740.0644198.472.326.10.6197.66GCA_053524915.1
UFSY-1182啤酒1989982079110.640.0644198.472.326.10.6197.67GCA_053524935.1
UFSY-1183啤酒1987981999310.740.0747798.672.526.10.50.997.66GCA_053524895.1
UFSY-1186土壤19899920614310.740.2027598.47226.40.51.199.63GCA_053524875.1
UFSY-2624龙舌兰20059719111610.740.0259298.37226.30.41.395.53GCA_053524835.1
UFSY-2791龙舌兰20079720113210.740.0442198.271.926.30.51.395.55GCA_053524855.1
覆盖率和深度参数是通过将读段与参考基因组Kmar_1.0(GCF_001417885.1)对齐来估算的。
BUSCO中的“complete”表示包含单个基因和重复基因。
ANI是指将每个基因组与DMKU3-1042参考基因组序列进行比较后的结果。
本文报道的基因组草图为研究K. marxianus的基因组适应性和驯化特征提供了机会。重复基因的比例(表1)特别值得关注,因为在S. cerevisiae中类似的模式与工业菌株中的片段重复有关(1416)。这些重复区域通常出现在非整倍体染色体上,并与酵母驯化过程中的基因组衰退有关(1718)。这些K. marxianus菌株可能具有驯化的基因组特征,但需要进一步的基因组分析来阐明其进化轨迹。

致谢

作者感谢Adepemi Ogundeji在菌株共享行政程序中的支持,Luis Aguilar在计算资源方面的支持,以及Susana Ruiz-Castro在技术上的协助。
本研究得到了SECIHTI项目CF-2023-G-695和CBF-2025-G-838的资助。Jesús Martín Moreno-Hernández、Luis F. García-Ortega和Eugenio Mancera分别获得了SECIHTI的博士奖学金(801248)、博士后奖学金(4133922)以及一次学术休假(I0200/111/2024)的支持。

生物通微信公众号
微信
新浪微博


生物通 版权所有