从日本土壤中分离出的Parageobacillus caldoxylosilyticus菌株的全基因组序列

时间:2026年5月30日
来源:Microbiology Resource Announcements

编辑推荐:

摘要 本文介绍了从日本土壤中分离出的四种Parageobacillus caldoxylosilyticus菌株的完整基因组序列。这些菌株与P. caldoxylosilyticus模式菌株S1812T的平均核苷酸同

广告
   X   

摘要

本文介绍了从日本土壤中分离出的四种Parageobacillus caldoxylosilyticus菌株的完整基因组序列。这些菌株与P. caldoxylosilyticus模式菌株S1812T的平均核苷酸同一性(ANI)≥97.5%,彼此之间的ANI也≥97.0%。

公告

Parageobacillus(NCBI分类ID:1906945)(1)是一种革兰氏阳性、需氧、产孢、非运动性的异养细菌,属于Anoxybacillaceae科(NCBI分类ID:3120669)(2),具有中温嗜热特性(1, 3)。目前Parageobacillus属下有六个有效物种(https://lpsn.dsmz.de/genus/parageobacillus),其中Parageobacillus thermoglucosidasius为模式种(3)。已有15株Parageobacillus的完整基因组序列被报道(https://www.ncbi.nlm.nih.gov/datasets/genome/?taxon=1906945),其中包括我们从日本土壤中分离出的5株(4)。有趣的是,antiSMASH分析(5)在这些基因组中发现了生物合成基因簇,为这类嗜热菌的次级代谢潜力提供了新的见解(6)。例如,该属中发现了非核糖体肽(如bacillibactin 7)以及核糖体合成并经过翻译后修饰的肽(如parageocin I 8)。
样本直接使用玩具铲子从埼玉县Hannō市的一个市政公园的土壤表面采集。将1克样本悬浮在10毫升蒸馏水中,然后涂布在含有TT(8克/升色氨酸、4克/升酵母提取物和2克/升NaCl)培养基的平板上,并用琼脂(1.6克/升)固化。在65°C下培养15小时后,分离出几个分离良好的单菌落。我们使用Bac8f(C)和UN1542r引物对16S rRNA基因进行了菌落PCR分析(9)。对四株被推测属于Parageobacillus属的菌株(NDK1、NDK2、NDK3和NDK6)进行了全基因组分析。本文报告了这些菌株的完整基因组序列。
为了制备基因组DNA,将细胞在5毫升LB(10克/升色氨酸、5克/升酵母提取物和10克/升NaCl)培养基中于65°C下培养15小时,并进行剧烈振荡(200转/分钟)。使用Blood and Cell Culture DNA Midi Kit(Qiagen)纯化基因组DNA。对于长读长测序,未剪切的基因组DNA(1微克)经过短读长消除试剂盒(Circulomics)处理以去除<10 kbp的片段,然后使用连接测序试剂盒(oxford nanopore technologies [ont])构建文库,并在flo-min106 r9.41 revd flow cell(ont)上进行测序。碱基调用使用guppy v.4.0.11进行。原始数据(表1)通过NanoFilt v.2.7.1(10)过滤(Q < 10;长度 <1,000碱基)。对于短读长测序,使用MGIEasy FS PCR Free DNA Library Prep Set(MGI)构建文库,插入片段长度约为400至500 bp。然后在DNBSEQ-400仪器(MGI)上进行配对末端测序(2 × 150碱基)。原始测序数据(表1)通过fastp v.0.20.1(11)过滤(Q < 30;长度 < 20碱基)。使用Unicycler v.0.4.8(12)组装长读长和短读长数据,并使用Pilon v.1.24(13)进行优化;使用Unicycler v.0.4.8(12)确认基因组的环状性。每个菌株包含一个环状染色体和多个环状质粒。使用CheckM v1.2.2(14)在DFAST v.1.6.0(15)中评估完整性。所有软件均使用默认参数。
表1
表1 本研究中的四种Parageobacillus caldoxylosilyticus菌株的测序指标
AP046166 NDK2 DRR915108AP046168AP046170 NDK3 SAMD01829903DRR915105DRR915109AP046171AP046172 NDK6 SAMD01829904DRR915106DRR915110AP046173AP046174AP046175AP046176AP046177
MiSeq(短读长) GridON(长读长) 完整基因组
BioSample访问号 配对末端读数 总长度(Mb) 访问号 读数 N50(碱基) 总长度(Mb) 访问号 长度(bp) G + C(%) cds数量 访问号 平均读深(×)
NDK1 SAMD01829901 12,257,368 1,838.6 DRR915103 152,299 92,834 579.5 DRR915107
染色体 3,750,003 44.3 3,732 AP046161 808.8
pScNDK1b 52,590 40.3 54 AP046162 3,103.1
pScNDK1c 45,671 40.1 46 AP046163 2,872.8
pScNDK1d 44,019 40.3 43 AP046164 358.9
pScNDK1e 38,136 41.5 66 AP046165 1,675.9
pScNDK1f 15,734 40.1 23 11,524.0
pScNDK1g 7,899 42.6 9 AP046167 7,822.7
SAMD01829902 5,059,686 759 DRR915104 675,617 62,657 1,746
染色体 3,780,367 44.3 3,761 356.7
pScNDK2b 69,458 40.2 63 AP046169 1,047.2
pScNDK2c 51,736 38.7 60 1,695.9
5,669,787 850.4 898,682 82,972 1,701.3
染色体 3,785,891 44.3 3,712 435.9
pScNDK3b 50,949 39.3 53 829.9
4,878,791 731.8 400,233 239,302 3,118.4
染色体 3,762,496 44.6 3,800 323.1
pScNDK6b 81,276 40 79 1,125.0
pScNDK6c 67,236 39.9 78 474.4
pScNDK6d 35,627 37.4 45 1,076.4
pScNDK6e 15,733 40.1 24 5,128.4

致谢

本研究得到了日本JST GteX计划(项目编号JPMJGX23B4)和JST SPRING计划(项目编号JPMJSP2138)的支持。
K.M. 感谢电通信大学的Takamatsu Nodoka提供样本并初步分离出本研究中使用的菌株。作者还感谢Maxx Harvey对英文文本的校对。

生物通微信公众号
微信
新浪微博


生物通 版权所有