背景与目的:小肠细菌过度生长(SIBO)与肠道产甲烷菌过度生长(IMO)在功能性和结构性胃肠疾病中日益被认识,但关于呼气试验的准确性、抗生素及非抗生素治疗的真实效果以及根除后的复发风险仍存在不确定性。研究人员进行了一项全面的系统评价与Meta分析,以评估诊断效能、治疗疗效和复发模式,并对这些领域的证据质量进行分级。 方法:研究人员检索了MEDLINE、Embase、Web of Science、CENTRAL和Scopus数据库,检索时间从建库至2025年11月30日,并补充了试验注册库和参考文献列表。纳入的研究包括:将葡萄糖呼气试验(GBT)和/或乳果糖呼气试验(LBT)与小肠抽吸物培养进行比较的前瞻性诊断准确性研究、抗生素、草药抗菌素或要素饮食的干预研究,以及报告SIBO/IMO根除后复发的队列研究。两名研究人员独立进行了筛选、数据提取和偏倚风险评估(采用QUADAS-2、RoB 2、ROBINS-I、AMSTAR 2)。诊断准确性采用随机效应双变量模型,治疗结局采用随机效应Meta分析。证据质量采用GRADE进行评级。 结果:89项研究符合纳入标准:14项诊断准确性研究(n=757)、32项治疗研究、18项系统评价/Meta分析以及25项额外的观察性队列研究。GBT与培养相比的汇总敏感性为54.5%,特异性为83.2%(诊断优势比[DOR]为5.17;曲线下面积[AUC]为0.74),而LBT的敏感性为42.0%,特异性为70.6%,AUC为0.56,表明其性能明显较差。较低的氢气截断值(10–15 ppm)和胃肠术后队列提高了GBT的准确性(AUC可达0.86)。利福昔明(Rifaximin)的意向治疗根除率汇总为70.8%,符合方案根除率为72.9%,不良事件发生率为4–5%。在6项随机试验(n=196)中,抗生素与安慰剂相比提高了总体症状应答(风险比为2.46;95% CI 1.33–4.55)。在甲烷阳性IMO中,利福昔明-新霉素(neomycin)联合治疗的甲烷根除率达87%,且临床应答优于任一单药治疗。观察性队列报告,成功根除后9–12个月内复发率约为40–45%,使用促动力药维持治疗时复发率较低。GBT准确性的GRADE评级为中等,利福昔明根除、症状获益、IMO联合治疗及复发结局的评级为低。 结论:采用当代截断值判读的GBT具有中等、临床有用的准确性,作为SIBO的非侵入性诊断试验优于LBT。利福昔明可提供实质性但非决定性的微生物根除和症状缓解,而联合治疗似乎对于甲烷优势型IMO的最佳管理是必要的。高复发率和低质量的治疗证据支持将SIBO/IMO视为慢性复发性疾病,需要综合策略针对动力、结构危险因素和饮食,同时谨慎使用抗菌药物。迫切需要设计良好、大样本的随机试验,采用标准化的诊断和结局标准,以完善这些估计值并指导精准管理。
引言
小肠细菌过度生长(SIBO)被定义为一种存在于通常不富含细菌的小肠内、结肠特异性细菌数量过多的疾病。肠道产甲烷菌过度生长(IMO),最初被称为甲烷优势型SIBO,指的是产甲烷古菌(特别是史氏甲烷短杆菌(Methanobrevibacter smithii))的过度生长,而非仅细菌。这些古菌产生甲烷,临床上与便秘、肠道转运减慢和腹胀相关。历史上,SIBO被视为明显解剖或动力障碍(如小肠憩室病、狭窄、盲袢、系统性硬化症或短肠综合征)的并发症,但过去二十年来,它越来越多地被认为与肠易激综合征(IBS)、功能性腹胀、不明原因腹痛及其他非特异性胃肠道主诉有关。在选择诊断工具前,应评估患者是否存在易感SIBO的主要危险因素类别:(1)胃肠术后解剖改变或盲袢;(2)狭窄、瘘管或小肠憩室;(3)因糖尿病、系统性硬化症、帕金森病或慢性假性肠梗阻导致的小肠动力受损;(4)肠易激综合征及其他肠脑互动障碍;(5)慢性胰腺炎或胰腺外分泌功能不全;(6)肝硬化和门静脉高压;(7)炎症性肠病,尤其是存在狭窄性疾病或既往手术者;(8)乳糜泻及其他吸收不良性疾病;(9)免疫缺陷或慢性全身性疾病;(10)慢性质子泵抑制剂(PPI)或阿片类药物暴露;(11)慢性肾病、高龄或虚弱;(12)恶性肿瘤或癌症导向治疗干扰肠道动力、解剖或微生物组。SIBO诊断的当前“金标准”仍为小肠抽吸物定量培养。呼气试验具有简便、安全、可重复等实际优势,但其诊断性能备受质疑。葡萄糖在近端小肠被快速吸收,因此主要检测近端过度生长,而乳果糖不被吸收,可能因快速转运和早期结肠发酵产生“假阳性”。几项经培养验证的研究提示,葡萄糖呼气试验(GBT)的特异性和总体诊断准确性优于乳果糖呼气试验(LBT),但报告的敏感性和特异性因队列间底物剂量、采样方案、气体截断值和参考标准不同而差异较大。在检测前应解决葡萄糖呼气试验(GBT)和乳果糖呼气试验(LBT)的重要偏倚来源。假阳性结果可能发生在快速口盲转运、早期结肠发酵、高基线氢气或甲烷、禁食不足、近期摄入可发酵餐、吸烟或采样期间剧烈运动;假阴性结果可能发生在近期使用抗生素、低产气体微生物组、胃排空延迟、严重便秘、底物递送不足或气体测量不完全。与诊断方面的争论平行,SIBO及相关实体肠道产甲烷菌过度生长(IMO)的治疗也备受关注。利福昔明(Rifaximin)是一种几乎不被吸收的广谱利福霉素,已成为最常用的药物。多项随机和非随机研究以及至少一项专门的Meta分析提示,利福昔明可使相当比例患者的呼气试验正常化并改善总体胃肠道症状,尤其是在10–14天内以较高日剂量给药时。尽管数据令人鼓舞,但SIBO和IMO很少表现为简单的、一次性感染。观察性随访研究表明,在看似成功的治疗后复发很常见,某些队列中第一年内复发率接近或超过40%。另一层复杂性源于气体表型。传统以氢气为主的呼气试验现常辅以甲烷测定,最近硫化氢(H
2 S)也作为独特菌群失调模式的潜在标志物出现。基于此,本系统评价与Meta分析旨在实现四个主要目标:第一,比较葡萄糖和乳果糖呼气试验与小肠抽吸物培养的诊断性能,包括按氢气截断值和临床人群定义的关键亚组;第二,量化利福昔明及其他抗生素方案(尤其关注气体表型和甲烷阳性IMO的联合治疗)的疗效和耐受性;第三,总结非抗生素方法(如草药抗菌素和要素饮食)的现有证据;第四,描述复发模式并评估提出的维持策略(包括促动力药和饮食干预)。
材料与方法
研究设计与注册:本工作作为系统评价进行,对小肠细菌过度生长(SIBO)和肠道产甲烷菌过度生长(IMO)的诊断准确性、治疗疗效和复发结局进行定量合成。该评价遵循2020年系统评价和Meta分析优先报告条目(PRISMA 2020)框架,并引用了Page等人的PRISMA 2020声明以及Cochrane手册中关于干预和诊断试验准确性评价的方法学指导。所有关键方法学决策(包括纳入标准、检索策略、计划亚组分析和主要结局)均预先指定并写入方案,该方案已前瞻性注册于国际系统评价前瞻性注册库(PROSPERO;注册号由作者插入)。临床试验编号:不适用。本评价完全基于已发表的匿名数据,未直接接触受试者或访问可识别信息。根据当地规定,无需正式的机构伦理委员会批准。任何与注册方案的偏差均属微小偏差,由现有数据结构驱动,并在结果或补充材料中明确描述,以便读者评估其对发现的影响。
纳入标准:采用人群-索引试验/干预-比较-结局-研究设计(PICOS)框架定义纳入标准,并分别应用于诊断准确性、治疗和复发问题。对于人群,如果研究纳入基于呼气试验和/或小肠抽吸物培养怀疑或确诊SIBO或IMO的成人或青少年,则符合条件。可接受的临床环境包括肠易激综合征、功能性腹胀或消化不良、系统性硬化症、慢性胰腺炎、短肠综合征、缓解期炎症性肠病以及胃肠术后队列的患者,前提是明确评估了SIBO或IMO。仅当诊断和治疗方法与成人实践相似时,儿科系列才被纳入。仅限于危重症、移植或重症监护人群的研究因病理生理不同和使用广谱抗生素而被排除。对于诊断准确性,感兴趣的索引试验是葡萄糖呼气试验(GBT)和乳果糖呼气试验(LBT),使用单独氢气或氢气-甲烷联合测定。研究必须报告呼气试验的明确阳性阈值,并将索引结果与基于空肠或十二指肠抽吸物培养(使用预设细菌计数截断值)的参考标准进行比较。对于治疗,符合条件的干预措施包括用于根除经呼气试验或培养确认的SIBO或IMO的抗生素(如利福昔明、新霉素、诺氟沙星、甲硝唑)、草药抗菌方案和要素饮食。研究必须报告微生物根除、临床应答或两者。复发研究必须纳入初始疗程后记录到根除的患者,并提供关于SIBO或IMO复发比例(伴或不伴维持策略,如促动力药、饮食调整或间歇性抗生素)的随访数据。干预研究的可接受比较对象为安慰剂、无治疗、替代抗生素或给药方案、草药或要素方法,以及甲烷阳性患者中的单药治疗与联合治疗。主要诊断结局是GBT和LBT相对于培养的准确性,以敏感性、特异性、似然比、诊断优势比和受试者工作特征曲线下面积表示。主要治疗结局是意向治疗和符合方案根除率、总体症状应答,以及IMO的甲烷根除。主要复发结局是定义时间点微生物学确认的复发患者比例。次要结局包括不良事件、停药以及气体表型与应答之间的关系。我们纳入了随机对照试验、前瞻性和回顾性队列研究、病例对照设计、横断面诊断准确性研究和要素饮食队列。排除叙述性综述、社论、单病例报告和无完整数据的会议摘要。仅分析以英文发表的同行评审文章;非英文研究在筛选过程中被记录,但未进入数据提取或Meta分析。
信息来源与检索策略:从数据库建库至2025年11月30日进行了全面文献检索。检索了以下电子数据库:通过PubMed的MEDLINE、Embase、Web of Science核心合集、Cochrane对照试验中心注册库(CENTRAL)和Scopus。对于每个数据库,检索策略结合了控制词汇术语(MeSH和Emtree)与涉及小肠细菌过度生长和肠道产甲烷菌过度生长、呼气试验方法学、抗生素和非抗生素治疗以及关注结局(如敏感性、特异性、根除率、症状改善和复发)的自由文本术语。为尽量减少发表偏倚并识别正在进行或未发表的工作,还检索了ClinicalTrials.gov和WHO国际临床试验注册平台中涉及SIBO或IMO、呼气试验或利福昔明的注册试验。手动筛除所有纳入研究和相关既往系统评价及指南的参考文献列表以获取额外引文。对出版年份或原产国未设限制。完整的数据库专属检索字符串见补充材料,以便重复和更新本评价。
研究选择:所有检索结果导入参考文献管理数据库,使用自动算法后通过手动检查去除重复记录。两名研究人员使用试行筛选表独立根据纳入标准筛选标题和摘要。记录被分为“纳入”、“排除”或“不确定”。至少一名研究人员认为可能相关的记录均进入全文评估,以尽量减少筛选阶段的假排除。随后由同一两名研究人员独立检索并详细评估全文文章。此阶段的排除原因被系统记录(例如,错误人群、缺乏呼气试验或培养结局、缺乏原始数据或干预措施不可比)。两个阶段研究人员之间的分歧通过讨论解决,必要时咨询作为仲裁的第三名研究人员。筛选过程以PRISMA 2020流程图总结:简言之,通过数据库检索识别4,847条记录,其他来源156条;去除重复后,筛除4,231条唯一记录,89项研究最终满足至少一个关键问题(诊断、治疗或复发)的纳入标准。
数据提取:使用Microsoft Excel开发结构化数据提取表,参考Cochrane模板并根据SIBO和IMO的具体特征进行定制。该表在一小部分诊断和治疗研究中进行试行,修订以解决歧义或缺失字段,然后在全面提取前最终确定。两名研究人员独立从每篇纳入论文中提取数据,记录提取日期和姓名首字母以保留审计轨迹。研究人员之间的任何分歧通过返回原始文章解决,必要时通过讨论直至达成共识。对于诊断准确性研究,提取的信息包括研究设计和背景、国家、样本量、纳入和排除标准以及人群的临床特征。深入捕获呼气试验的详细信息,包括底物类型和剂量、检测前准备、采样间隔、总检测时长、所测气体以及氢气和甲烷的阳性阈值。参考标准通过抽吸物部位、采样技术、培养方法和用于定义SIBO的细菌计数截断值来表征。在可能的情况下,从文本重建真阳性、假阳性、假阴性和真阴性的二乘二表,或从敏感性、特异性值和样本量推导。对于治疗和复发研究,数据提取包括研究设计、干预措施详情(药物或方案、剂量、给药频率、疗程)、对照组以及微生物根除的定义和时机。症状结局记录为总体应答、验证症状量表的变化或疾病特异性终点(如IBS总体改善)。还提取了随访持续时间、复发时机和定义以及任何报告的危险因素或维持策略。提取不良事件和停药,特别关注严重伤害。当仅报告百分比时,尽可能计算事件的绝对数。当关键数据缺失或不明确时,尝试联系研究作者进行澄清。
偏倚风险评估:使用适用于每种设计的工具分别评估诊断准确性研究、随机对照试验和观察性队列的偏倚风险。两名研究人员在训练研究集校准后独立执行所有评估。对于GBT和LBT的诊断准确性研究,应用QUADAS-2工具,该工具评估患者选择、索引试验的实施和判读、参考标准的适宜性和判读以及患者流程和时机中的偏倚。每个领域被判定为低、高或不明确偏倚风险,并记录对适用性的关切,其中人群或检测条件与当前临床实践有显著偏差。抗生素、草药方案或要素饮食的随机对照试验使用修订版Cochrane偏倚风险工具(RoB 2)进行评估,包括对随机化过程、偏离预期干预、结局数据完整性、结局测量的有效性和盲法以及结果的选择性报告的评价。非随机治疗和复发队列使用与ROBINS-I原则一致的结构化检查表进行评估,考虑混杂、参与者选择、干预分类、偏离预期干预、缺失数据、结局测量和报告偏倚。主要用作背景的系统评价和Meta分析使用AMSTAR 2评估其方法学质量。生成摘要交通灯图和条形图以可视化偏倚风险判断在领域和研究中的分布。
数据合成与统计分析
诊断准确性:对于呼气试验准确性,旨在综合GBT和LBT相对于小肠抽吸物培养的诊断性能。当个体研究提供或允许重建二乘二表时,计算每项研究的敏感性、特异性及其95%置信区间。使用双变量随机效应模型获得汇总估计值,该模型联合建模敏感性和特异性,同时考虑它们之间和研究间异质性的相关性。由此模型推导出汇总受试者工作特征曲线、曲线下面积以及汇总阳性似然比、阴性似然比和诊断优势比。预先指定的亚组分析考察了不同氢气截断值阈值(常规≥20 ppm与较低截断值10–15 ppm)、临床人群(胃肠术后、IBS、无明显易感因素的人群)以及诊断标准中纳入甲烷测量的影响。通过检查森林图和SROC图探索异质性,并在研究数量允许的情况下,将研究水平协变量纳入Meta回归模型。当由于数据稀疏或结局不可比而无法进行定量汇总时,结果进行描述性合成。
治疗疗效与复发:对于具有同期对照臂的治疗研究,二分结局(如根除和症状应答)以风险比及95%置信区间汇总。使用随机效应Meta分析(DerSimonian-Laird)作为主要汇总方法,反映研究间预期的临床和方法学异质性。异质性使用I²统计量和χ²检验进行量化,并通过亚组分析(如利福昔明日剂量、气体表型(氢气优势型与甲烷优势型)或研究设计)探索潜在变异来源。对于单臂试验或队列,在适当时使用logit变换计算汇总比例。复发数据进行描述性合并,因为研究中随访时间和复发的定义差异较大。在存在多个时间点时,重建了近似Kaplan-Meier风格的阶梯曲线,绘制不同维持策略下随时间累积的复发率。对于所有分析,双侧p值<0.05被认为具有统计学显著性,但解释时重点放在效应量及其置信区间而非单纯统计学显著性。分析使用R和/或Stata中的既定Meta分析软件包进行。
证据质量(GRADE):使用GRADE框架评估关键结局的总体证据质量。对于五个核心问题(GBT准确性、利福昔明根除率、抗生素与安慰剂相比的症状改善、甲烷阳性IMO中联合治疗的效果以及成功根除后的复发),我们考虑了研究局限性(偏倚风险)、结果一致性、证据直接性、效应估计精确性和潜在发表偏倚。随机试验最初被评为高质量,观察性研究为低质量;然后根据GRADE标准进行降级或(在特定情况下)升级。降级发生在对一个或多个领域存在严重担忧时,如多数贡献研究存在高或不明确偏倚风险、大量无法解释的异质性、间接人群或结局,或置信区间跨越临床重要获益和伤害。升级在存在大效应量、清晰剂量-反应关系或所有合理混杂可能缩小而非夸大观察效应时考虑。最终评级(高、中、低或极低)及任何变更原因在GRADE“结果总结”表中进行总结,为读者提供每项关键结果可信度的简明概述。
结果
研究选择:PRISMA 2020流程图总结了研究选择过程。初始数据库检索识别4,847条记录,额外156条记录来自其他来源,总计5,003条记录。去除1,582条重复后,筛除3,421条唯一记录。其中,2,987条记录被排除,最常见原因包括与SIBO或IMO不直接相关、涉及儿科人群、动物研究、少于10例患者的极小病例系列、无英文摘要的非英语报告以及无完整同行评审出版的会议摘要。共有434篇全文文章被评估是否符合条件。其中345篇被排除,主要由于缺乏可提取的预设结局数据、缺乏适当比较对象、重复使用相同患者人群或结局与评价问题不符。最终,89项研究满足所有纳入标准并纳入定性合成。这些包括14项诊断准确性研究、32项治疗疗效研究、18项系统评价/Meta分析以及25项队列/其他观察性研究。在纳入的文章中,46项提供了足够同质的定量数据以纳入至少一项Meta分析。
研究特征
诊断准确性研究:14项诊断准确性研究(总n=757)构成了评估葡萄糖和乳果糖呼气试验相对于小肠抽吸物培养性能的核心数据集。所有研究均为前瞻性、单中心研究,于1986年至2018年间进行。地理上,主要来自欧洲和北美,包括美国、德国、意大利、英国、印度、澳大利亚、爱尔兰和瑞典的贡献,反映了西方和南亚实践环境的混合。潜在人群在临床上异质性较大,且富含与SIBO风险经典相关的疾病:术后状态、慢性肝病、糖尿病、系统性硬化症、免疫缺陷、腹泻/吸收不良综合征、IBS(罗马II/III)以及因疑似SIBO转诊的患者。这种谱系支持对高危表型的通用性,但也引入了谱系偏倚。葡萄糖呼气试验(GBT)是主要的索引试验:14项研究中有10项仅评估GBT,4项在同一队列中评估了GBT和LBT。大多数方案给予50–75克葡萄糖,每隔10–15分钟进行连续氢气(以及后期研究中甲烷)测量。所有研究中的参考标准均为小肠抽吸物培养,通过内镜或放射学插管获得。12项研究使用空肠抽吸物,而两项较新的研究依赖十二指肠抽吸物,反映了向较少侵入性采样的逐步转变。呼气试验阳性阈值存在显著差异。经典氢气标准(ΔH
2 >10、>12、>15或>20 ppm高于基线)被单独或联合使用,有时辅以甲烷截断值(如ΔCH
4 >10–15 ppm)。培养阳性最常定义为>10
5 CFU/mL(9项研究),三项研究保留了较老的>10
6 CFU/mL阈值,两项采用了更宽松的>10
3 CFU/mL,这可能夸大明显的呼气试验敏感性。
治疗疗效研究:32项干预性研究符合治疗疗效纳入标准;其中,16项聚焦利福昔明及相关试验被总结。9项为随机对照试验,5项为前瞻性开放标签研究,2项为回顾性队列分析,反映了总体中等偏倚风险但对核心终点具有合理内部效度。地理上,意大利和美国占主导。纳入人群再次涵盖经典SIBO相关表型:IBS伴或不伴便秘、“IBS样”症状、克罗恩病、憩室病、囊性纤维化、伴SIBO的玫瑰痤疮、各种功能性胃肠疾病以及已确认的肠道产甲烷菌过度生长(IMO)。利福昔明是主要干预措施,剂量范围为400 mg每日两次至1,200 mg/天以及囊性纤维化中的10 mg/kg每日三次,疗程7–14天。在开放标签利福昔明队列中,呼气试验根除率通常在60–84%之间。随机试验如Di Stefano等人展示了清晰的剂量-反应梯度。除根除外,大型IBS试验侧重于症状复合改善。额外抗生素(新霉素、诺氟沙星、利福昔明-新霉素联合)特别是在甲烷阳性或便秘优势型队列中进行评估。Low等人2010年的回顾性系列对于IMO至关重要:利福昔明加新霉素在87%中实现甲烷根除,明显优于任一单药。替代策略包括草药抗菌制剂,其根除率在数值上与利福昔明相当,但抢救性治疗的使用更高且方案标准化程度较低。
偏倚风险
诊断准确性研究:使用QUADAS-2工具对14项诊断准确性研究在四个领域(患者选择、索引试验、参考标准、流程和时机)进行偏倚风险评估。总体而言,患者选择是最弱的领域:仅35.7%的研究被评为低风险,28.6%为“一些关切”,35.7%为高风险。这反映了频繁使用高度选择或便利样本(如术后队列、结缔组织病、肠衰竭)而非真正连续转诊,以及偶尔事后排除不确定的呼气试验,引起对谱系和选择偏倚的担忧。相比之下,大多数研究在索引试验和参考标准方面方法学上稳健。对于索引试验领域,78.6%为低风险,21.4%有一些关切,通常由于培养结果盲法不完整或检测前准备细节不足。对于参考标准,85.7%使用了明确描述的空肠或十二指肠抽吸物培养,具有预设菌落计数阈值和盲法微生物学评估,导致低风险评级,仅14.3%降级为一些关切。流程和时机表现最佳:92.9%为低风险,因为呼气试验和抽吸物采样在短间隔内进行,所有参与者均使用相同参考标准验证,且退出率低;仅一项研究(7.1%)因验证不完整而有轻微关切。总体而言,这些发现表明诊断数据集效度的主要威胁来自非代表性抽样而非试验本身的技术操作。
干预研究:使用Cochrane RoB 2工具评估随机对照试验。随机化过程在66.7%的试验中被评为低风险;其余缺乏足够方法学细节。偏离预期干预不常见:83.3%的试验保持良好依从性和适当盲法,评为低风险。缺失结局数据是更重要的偏倚来源:66.7%的试验有较低且组间平衡的退出率,但33.3%有显著或差异性的脱落,该领域评为高风险。对于结局测量,一半试验因依赖客观终点(如呼气试验正常化)以盲法评估而评为低风险,而另一半主要使用主观症状量表无稳健盲法,导致一些关切。所有RCT明确预先指定主要结局并透明报告,报告结果的选择性一致评为低风险。总体而言,三项试验被判断为跨领域低偏倚风险,两项有一些关切,一项因缺失数据而处于高风险,表明汇总治疗估计值相当可靠,但应在退出率和主观结局占主导的情况下谨慎解释。
呼气试验诊断准确性
葡萄糖呼气试验(GBT)的总体表现:在14项培养验证研究(包括668名参与者)中,葡萄糖呼气试验检测SIBO显示出中等敏感性和高特异性。汇总敏感性为54.5%(95% CI 48.2–60.7),特异性为83.2%(95% CI 79.1–86.9)。这对应于阳性似然比(PLR)为2.45,阴性似然比(NLR)为0.60,诊断优势比(DOR)为5.17,AUC为0.74,表明中等判别能力。实际上,阳性GBT结果约使SIBO概率增加2–3倍,而阴性结果仅适度降低;GBT因此更适用于确诊而非排除。相当大的异质性(I² ~75–80%)反映了患者谱系、底物剂量和采样方案、氢气截断值(10–20 ppm)、甲烷测量以及培养阈值(10³–10⁶ CFU/mL)的差异。
乳果糖呼气试验(LBT)的性能:仅四项研究(214名参与者)将乳果糖呼气试验与培养直接比较。汇总敏感性为42.0%(95% CI 31.6–53.0),特异性为70.6%(95% CI 61.9–78.4),PLR为1.30,NLR为0.79,DOR为1.77,AUC为0.56。这些值仅略优于随机,且在各项指标上均显著劣于GBT,证实当以培养作为判断标准时,LBT的诊断价值有限。Meta分析中的直接比较显示GBT在敏感性和特异性方面均具有统计学显著优势(p<0.05)。
亚组分析:亚组分析表明,葡萄糖呼气试验(GBT)的诊断性能受氢气截断值阈值和研究临床人群的强烈影响。当使用较低氢气阈值(<20 ppm;通常为10–15 ppm)解释GBT时,汇总敏感性从47.3%提高至61.7%,特异性从80.9%提高至86.0%,相应的诊断优势比(DOR)从3.35上升至8.11,SROC曲线下面积从0.70上升至0.79。这表明采用较低截断值可能在不牺牲特异性的情况下有意义地增强判别性能。按患者人群分层时,GBT在胃肠术后队列中表现最佳,敏感性达81.7%,特异性78.8%,DOR 18.58,AUC 0.86。相比之下,准确性在IBS队列中更为适中(AUC 0.65),在无明确易感因素的患者中较低(AUC 0.59),主要由敏感性大幅降低(约40–42%)驱动,尽管特异性仍较高(>80%)。这些模式提示GBT在解剖高危人群中特别有信息价值,而在低风险或IBS人群中,阴性试验应更谨慎地解释。
治疗疗效
总体而言,SIBO和肠道产甲烷菌过度生长(IMO)的治疗证据基础集中于利福昔明、联合抗生素治疗以及新兴的非抗生素策略。Meta分析一致表明,利福昔明实现约70%的微生物根除且不良事件率低,抗生素使症状改善几率相比安慰剂约增加2–3倍,而联合治疗对于IMO的最佳甲烷根除是必要的。
SIBO的利福昔明治疗:Gatta等人2017年的Meta分析(32项研究,1,331例患者)确立了利福昔明作为SIBO研究最充分的药物。汇总意向治疗(ITT)根除率为70.8%(95% CI 61.4–78.2;I²=89.4%),符合方案(PP)根除率为72.9%(95% CI 65.5–79.8;I²=87.5%)。在确认根除的患者中,67.7%(95% CI 44.7–86.9%)报告症状缓解。利福昔明耐受性良好,总体不良事件率为4.6%(95% CI 2.3–7.5%),无严重事件报告。存在清晰的剂量-反应关系:汇总ITT根除率从600 mg/天的54.3%上升至1600–1650 mg/天(标准550 mg每日三次)的76.2%,800和1200 mg/天时疗效居中。
抗生素改善症状:Takakura等人2024年的Meta分析纳入了6项随机试验(196例患者),显示抗生素与安慰剂或无治疗相比显著改善总体症状,相对风险(RR)为2.46(95% CI 1.33–4.55;p=0.004),NNT≈2.8,异质性低(Q=6.37,p=0.27)。个体RCT说明这一效应:新霉素、诺氟沙星和利福昔明试验通常显示抗生素组应答率较高(36–83%)而安慰剂组较低(0–31%),尽管少数小型研究报告了中性结果。
肠道产甲烷菌过度生长(IMO)的联合治疗:对于甲烷阳性患者(IMO),利福昔明单药治疗往往不充分。Low等人具有里程碑意义的回顾性研究(74例甲烷呼气试验阳性的IBS患者)比较了利福昔明+新霉素与任一单药。联合治疗实现87%的甲烷根除率和85%的临床应答,而利福昔明单药为28%根除率/56%应答率,新霉素单药为33%根除率/63%应答率(p=0.001和p=0.01 vs.联合治疗)。值得注意的是,66%的利福昔明失败者随后在升级为联合治疗后实现根除,强调双药治疗应被视为甲烷优势型表现的标准方案。
草药抗菌素和要素饮食:非抗生素方法为抗生素不耐受、既往治疗失败或倾向避免全身性抗生素的患者提供了替代选择。在Chedid等人的研究中,104例呼气试验确认SIBO的患者接受了标准化草药抗菌方案或利福昔明。呼气试验正常化率在草药治疗组为46%(17/37),利福昔明组为34%(23/67),绝对值差异12%有利于草药但未达统计学显著性(p=0.24)。Min等人2024年的植物学研究报告了亚型特异性根除率:H
2 -SIBO为42.8%,H
2 S-SIBO为66.7%,IMO为26.7%,提示某些草药配方可能对H
2 S优势型疾病特别有前景。一项前瞻性Cedars-Sinai要素饮食队列(2025年)显示,在2–3周内,73%的呼气试验正常化,83%的总体症状改善,IMO患者甲烷降低89%,仅3%因口味相关不耐受停药。这些数据支持草药抗菌素和要素饮食作为抗生素的可行替代或辅助——特别是在复杂或复发性病例中——但总体证据质量仍低。
复发与维持策略
复发率:观察性队列的随访数据确认SIBO表现为慢性复发性疾病而非一次性感染事件。在Lauritano等人具有里程碑意义的前瞻性研究中(意大利,n=142;玫瑰痤疮伴SIBO患者接受利福昔明1200 mg/天治疗10天),80例记录到治疗后呼气试验正常化的患者随访9个月。复发发生在43.7%(35/80),多数复发集中在第一年。多变量分析识别出高龄、既往阑尾切除术和慢性质子泵抑制剂使用为复发的独立预测因子。这支持将SIBO视为需要长期策略的慢性疾病,尤其在高龄、解剖改变或慢性酸抑制患者中。
维持干预措施:维持策略的证据有限且多为观察性,但汇聚于动力增强、饮食调整和谨慎使用重复抗生素的重要性。促动力药:低剂量红霉素(通常50–125 mg睡前)已用作胃动素受体激动剂以增强移行性运动复合波(MMC)活动。利福昔明后队列的观察性数据提示,在数月内夜间服用红霉素可减少短期复发,尽管尚无专门针对SIBO复发的RCT。普芦卡必利(Prucalopride),一种选择性5-HT
4 受体激动剂,越来越多地用于便秘优势型或动力迟缓表型。初步系列报告改善排便频率和减少腹胀,并提示复发率降低的信号,但数据仍稀少。草药促动力剂(如含姜的混合物、Iberogast)在临床实践中广泛应用。饮食策略:虽然无高质量复发试验,但要素饮食和低可发酵寡糖、二糖、单糖和多元醇(低FODMAP)或低渣饮食模式的更广泛数据集提示,减少可发酵底物负荷可能有助于在根除后维持症状控制。重复或轮换抗生素:Richard等人的队列表明,与单一抗生素疗程相比,轮换抗生素方案可改善短期缓解,但该研究并未证明轮换抗生素能预防已确认根除后的复发。综合来看,现有数据支持通过慢性疾病视角看待SIBO:有效的急性根除阶段(利福昔明±联合治疗)后应继以维持性促动力药、个体化饮食调整以及纠正结构性或药理学驱动因素(如慢性PPI治疗),以有意义地降低复发风险。
证据质量(GRADE)
使用GRADE框架评估了本评价关键结局的证据质量。总体而言,葡萄糖呼气试验(GBT)的诊断证据达到中等质量,而大多数治疗和复发结局被评为低质量,主要由于观察性设计、异质性和效应估计的不精确性。对于GBT诊断准确性,14项研究(668名参与者)显示GBT一致优于LBT,汇总敏感性54.5%,特异性83.2%。质量被评为中等,由于不一致性(阈值、人群和方案的研究间显著异质性)而降一级,但因支持GBT的连贯模式而未进一步降级。对于利福昔明根除,大型Meta分析(32项研究,1,331名参与者)一致显示ITT根除率约70.8%且安全性极佳。然而,多数贡献研究为非随机或小型RCT,存在设计局限性和高异质性(I²>80%),导致总体低质量评级,因偏倚风险和不一致性而降级。抗生素症状应答结局(6项RCT,196名参与者;RR 2.46,95% CI 1.33–4.55)起始为高质量,但因不精确性(总样本量小,宽CI)和间接性(混合人群和症状定义)而降级,尽管效应方向稳健,仍产生低质量证据。肠道产甲烷菌过度生长(IMO)的联合治疗和复发率证据基于少数、主要为观察性队列。IMO联合治疗数据来自单项目回顾性研究(74例患者),显示利福昔明+新霉素相比单药治疗有较大获益(87% vs. 28%甲烷根除率)。复发估计来自三个小型队列,随访间隔和维持策略不同,代表性无预防下9个月复发率为43.7%。两个结局均因观察性设计、不一致性和有限精确性被评为低质量;IMO联合治疗的较大表观效应量可能值得临床密切注意,但鉴于潜在的混杂,未达到正式GRADE升级标准。综合来看,GRADE评估支持对GBT作为首选非侵入性诊断工具的中等信心,但对根除率、症状获益、IMO联合治疗和复发率的当前估计仅有低信心,强调需要更大规模、设计良好的RCT和标准化诊断/治疗方案。
讨论
本系统评价与Meta分析使用当代PRISMA 2020方法、结构化偏倚风险工具和GRADE评估,汇集了关于SIBO和IMO的诊断、治疗和纵向数据。总体而言,研究结果支持使用葡萄糖呼气试验(GBT)作为首选非侵入性诊断手段,确认利福昔明为研究最充分的治疗选择,突出联合治疗对于甲烷阳性患者的重要性,并强调SIBO表现为慢性复发性疾病,除非处理潜在驱动因素,否则复发率很高。同时,大多数效应估计仅得到低至中等质量证据的支持,强调需要更严格的试验和标准化诊断标准。
呼气试验诊断性能:诊断数据确认GBT相对于小肠抽吸物培养具有中等敏感性和良好特异性。约55%的汇总敏感性和80%以上的特异性表明,阳性GBT结果有意义地增加SIBO概率,而阴性结果不能可靠排除疾病。此概况与高危人群(如既往胃肠手术、系统性硬化症或慢性动力障碍患者)的典型检测前概率很好匹配。相比之下,乳果糖呼气试验(LBT)表现不佳,敏感性和特异性分别集中在40%和70%左右,AUC接近0.5,LBT在临床怀疑之外增加的诊断价值很小。亚组分析提供了重要细微差别。当使用较低氢气阈值(10–15 ppm而非≥20 ppm)时,GBT准确性提高,敏感性和特异性均增加,DOR增加一倍以上。该试验在术后人群中也表现明显更好(AUC接近0.86),而在IBS或低风险队列中AUC接近0.6–0.65。实际上,GBT在应用于具有明确结构或动力危险因素的患者并使用较低氢气截断值解释时最为有用,而在非选择性IBS中的价值非常有限。
抗生素治疗:利福昔明是研究最充分且临床最具吸引力的药物。在32项研究中,汇总意向治疗根除率约70%,不良事件率低且无严重安全信号。清晰的剂量-反应梯度(根除率从600 mg/天的约54%上升至1,600–1,650 mg/天的超过75%)支持临床实践中常用550 mg每日三次的用法。然而,利福昔明信号的明显强度必须在重要方法学注意事项下解释。许多贡献研究为非随机、开放标签或小型单中心RCT,结局定义和随访时长各异。异质性高,微生物根除与症状缓解之间的相关性不完美。因此,根除结局的GRADE质量保持低水平。症状数据更有限但令人放心。汇总六项RCT得到抗生素与安慰剂相比总体症状改善的相对风险约2.5,需治疗人数较少且研究间异质性低。即便如此,由于总样本量适中、症状量表可变以及纳入不同诊断标签,质量被评为低。
肠道产甲烷菌过度生长与联合治疗:可用证据表明,甲烷优势型过度生长在微生物学和治疗学上与氢气优势型SIBO不同。在关于甲烷阳性IBS的关键回顾性研究中,利福昔明单药治疗产生相对较差的甲烷根除率(约28–33%),而利福昔明加新霉素联合治疗在近90%的患者中实现根除且临床应答率大幅提高。尽管这些数据来自单一回顾性队列,效应的大小和内部一致性强烈影响了临床实践和近期指南。它们支持实用观点,即甲烷阳性患者应从初始即考虑联合治疗,尤其是当便秘、腹胀和缓慢转运主导临床表现时。然而,不能排除由指征引起的混杂,该结局的GRADE质量仍低。
非抗生素策略:草药抗菌素和要素饮食作为替代或辅助手段越来越受关注。利福昔明与草药方案之间的比较数据提示,某些植物学方案可获得相似的呼气试验正常化率,有些系列甚至显示草药根除率数值更高,但差异未达统计学显著性。要素饮食是更激进但可能有用的选择。短期要素喂养旨在通过提供完全可吸收形式的营养素来“饿死”小肠微生物,留下最少发酵底物。权衡是患者负担:口味、成本和依从性限制。非抗生素疗法似乎有前景但证据质量低,短期内不太可能完全替代抗生素。
复发、慢性化与维持策略:SIBO在看似成功治疗后具有高复发率。无结构化维持时,约40–50%的患者在第一年内复发,有些队列早在三个月时复发率即达30–51%。已识别的危险因素包括高龄、既往腹部手术(包括阑尾切除术)和慢性质子泵抑制剂使用——这些特征与动力受损、解剖改变或管腔pH和微生物组成的持续变化一致。基于生物学原理,对于复发性或动力相关性SIBO患者,维持性促动力药是合理的干预措施,但高质量的复发预防试验有限。轮换抗生素方案可在选定患者中改善短期缓解,但尚未证明为常规复发预防疗法。饮食调整如低FODMAP、低渣模式和周期性要素营养具有机制合理性且广泛使用,但尚未在良好对照的复发试验中进行测试。总体而言,复发文献强化了将SIBO视为慢性、多因素疾病而非一次性感染的必要性。
本评价的优势与局限性:本评价具有若干显著优势。它采用了跨多个数据库和灰色文献来源的全面检索策略,遵循PRISMA 2020指导,并使用预设标准、重复筛选和标准化数据提取。诊断、治疗和复发问题整合在单一分析框架内。偏倚风险使用验证工具评估,总体质量通过GRADE正式分级。然而,必须承认重要局限性。许多纳入研究为小型、单中心、观察性研究,具有不一致的SIBO定义、多变的呼气试验方案和异质人群。难以排除发表偏倚,尤其对于非抗生素策略。即使作为诊断准确性参考标准的抽吸物培养本身也是不完美的金标准,意味着一些误分类不可避免。Meta分析必然汇集不同时代、微生物学方法和临床背景的研究,这增加了通用性但也贡献了异质性。最后,由于多数证据涉及三级医疗环境中的成人人群,外推至初级保健或儿科实践时应谨慎。
结论
本系统评价与Meta分析支持若干清晰、临床相关的结论:
1. 葡萄糖呼气试验是SIBO首选的非侵入性诊断工具。它提供中等敏感性和良好特异性,使用较低氢气截断值(10–15 ppm)并应用于高危人群时性能提高。
2. 利福昔明仍是SIBO研究最充分的一线治疗。在约1,600–1,650 mg/天的剂量下,利福昔明在约70–75%的患者中实现微生物根除,安全性极好。抗生素整体上使总体症状改善几率约为安慰剂的两倍,但证据质量仍低。
3. 甲烷优势型过度生长(IMO)需要不同的治疗方法。现有数据(尽管为观察性)强烈提示利福昔明加新霉素联合治疗提供的甲烷根除率和症状应答高于任一单药。
4. SIBO是一种慢性复发性疾病,复发常见。无结构化维持时,许多成功治疗的患者在第一年内复发。针对动力的管理(尤其是选定患者的促动力药)具有生物学合理性,但需要前瞻性复发预防试验才能被视为确定性预防。
5. 非抗生素策略有前景但尚未确定。草药抗菌素和要素饮食可在相当比例的患者中实现根除和症状改善,为抗生素不耐受或复发性疾病提供了有价值的替代选择。
从方法学角度,GRADE框架强调仅GBT准确性证据达到中等质量;大多数治疗和复发结局仍为低质量,应在实践中用以指导但不视为不可改变的事实。该领域的下一步明确:迫切需要设计良好、检验效能充分、使用标准化诊断标准、气体表型分层和临床相关终点的随机试验。这些试验应直接比较利福昔明剂量、IMO中联合治疗与单药治疗、维持策略以及非抗生素替代方案。在获得此类数据之前,临床医生应采用个体化、逐步的方法:在可行时使用GBT确认SIBO或IMO,使用适当剂量的利福昔明(以及IMO的联合治疗)进行治疗,预期并计划复发,并将动力支持和饮食调整纳入长期照护。这一基于最佳现有证据且对未来改进开放的综合策略,为改善SIBO和肠道产甲烷菌过度生长患者预后提供了最理性的路径。
打赏