从日本土壤中分离出的Parageobacillus caldoxylosilyticus菌株的全基因组序列

时间：2026年5月30日

来源：Microbiology Resource Announcements

编辑推荐：

摘要本文介绍了从日本土壤中分离出的四种Parageobacillus caldoxylosilyticus菌株的完整基因组序列。这些菌株与P. caldoxylosilyticus模式菌株S1812T的平均核苷酸同

摘要

本文介绍了从日本土壤中分离出的四种Parageobacillus caldoxylosilyticus菌株的完整基因组序列。这些菌株与P. caldoxylosilyticus模式菌株S1812^T的平均核苷酸同一性（ANI）≥97.5%，彼此之间的ANI也≥97.0%。

公告

Parageobacillus（NCBI分类ID：1906945）（1）是一种革兰氏阳性、需氧、产孢、非运动性的异养细菌，属于Anoxybacillaceae科（NCBI分类ID：3120669）（2），具有中温嗜热特性（1, 3）。目前Parageobacillus属下有六个有效物种（https://lpsn.dsmz.de/genus/parageobacillus），其中Parageobacillus thermoglucosidasius为模式种（3）。已有15株Parageobacillus的完整基因组序列被报道（https://www.ncbi.nlm.nih.gov/datasets/genome/?taxon=1906945），其中包括我们从日本土壤中分离出的5株（4）。有趣的是，antiSMASH分析（5）在这些基因组中发现了生物合成基因簇，为这类嗜热菌的次级代谢潜力提供了新的见解（6）。例如，该属中发现了非核糖体肽（如bacillibactin 7）以及核糖体合成并经过翻译后修饰的肽（如parageocin I 8）。

样本直接使用玩具铲子从埼玉县Hannō市的一个市政公园的土壤表面采集。将1克样本悬浮在10毫升蒸馏水中，然后涂布在含有TT（8克/升色氨酸、4克/升酵母提取物和2克/升NaCl）培养基的平板上，并用琼脂（1.6克/升）固化。在65°C下培养15小时后，分离出几个分离良好的单菌落。我们使用Bac8f(C)和UN1542r引物对16S rRNA基因进行了菌落PCR分析（9）。对四株被推测属于Parageobacillus属的菌株（NDK1、NDK2、NDK3和NDK6）进行了全基因组分析。本文报告了这些菌株的完整基因组序列。

为了制备基因组DNA，将细胞在5毫升LB（10克/升色氨酸、5克/升酵母提取物和10克/升NaCl）培养基中于65°C下培养15小时，并进行剧烈振荡（200转/分钟）。使用Blood and Cell Culture DNA Midi Kit（Qiagen）纯化基因组DNA。对于长读长测序，未剪切的基因组DNA（1微克）经过短读长消除试剂盒（Circulomics）处理以去除<10 kbp的片段，然后使用连接测序试剂盒（oxford nanopore technologies [ont]）构建文库，并在flo-min106 r9.41 revd flow cell（ont）上进行测序。碱基调用使用guppy v.4.0.11进行。原始数据（表1）通过NanoFilt v.2.7.1（10）过滤（Q < 10；长度 <1,000碱基）。对于短读长测序，使用MGIEasy FS PCR Free DNA Library Prep Set（MGI）构建文库，插入片段长度约为400至500 bp。然后在DNBSEQ-400仪器（MGI）上进行配对末端测序（2 × 150碱基）。原始测序数据（表1）通过fastp v.0.20.1（11）过滤（Q < 30；长度 < 20碱基）。使用Unicycler v.0.4.8（12）组装长读长和短读长数据，并使用Pilon v.1.24（13）进行优化；使用Unicycler v.0.4.8（12）确认基因组的环状性。每个菌株包含一个环状染色体和多个环状质粒。使用CheckM v1.2.2（14）在DFAST v.1.6.0（15）中评估完整性。所有软件均使用默认参数。

表1

表1 本研究中的四种Parageobacillus caldoxylosilyticus菌株的测序指标

AP046166 NDK2 DRR915108 AP046168 AP046170 NDK3 SAMD01829903 DRR915105 DRR915109 AP046171 AP046172 NDK6 SAMD01829904 DRR915106 DRR915110 AP046173 AP046174 AP046175 AP046176 AP046177

		MiSeq（短读长）			GridON（长读长）				完整基因组
	BioSample访问号	配对末端读数	总长度（Mb）	访问号	读数	N₅₀（碱基）	总长度（Mb）	访问号	长度（bp）	G + C（%）	cds数量	访问号	平均读深（×）
NDK1	SAMD01829901	12,257,368	1,838.6	DRR915103	152,299	92,834	579.5	DRR915107
染色体							3,750,003	44.3	3,732	AP046161	808.8
pScNDK1b							52,590	40.3	54	AP046162	3,103.1
pScNDK1c							45,671	40.1	46	AP046163	2,872.8
pScNDK1d							44,019	40.3	43	AP046164	358.9
pScNDK1e						38,136	41.5	66	AP046165	1,675.9
pScNDK1f						15,734	40.1	23	11,524.0
pScNDK1g						7,899	42.6	9	AP046167	7,822.7
SAMD01829902	5,059,686	759	DRR915104	675,617	62,657	1,746
染色体						3,780,367	44.3	3,761	356.7
pScNDK2b							69,458	40.2	63	AP046169	1,047.2
pScNDK2c						51,736	38.7	60	1,695.9
5,669,787	850.4	898,682	82,972	1,701.3
染色体						3,785,891	44.3	3,712	435.9
pScNDK3b							50,949	39.3	53	829.9
4,878,791	731.8	400,233	239,302	3,118.4
染色体						3,762,496	44.6	3,800	323.1
pScNDK6b							81,276	40	79	1,125.0
pScNDK6c							67,236	39.9	78	474.4
pScNDK6d							35,627	37.4	45	1,076.4
pScNDK6e							15,733	40.1	24	5,128.4