综述：重复经颅磁刺激治疗轻度认知障碍的疗效：一项随机对照试验的系统评价与荟萃分析

时间：2026年5月18日

来源：Frontiers in Neurology

编辑推荐：

背景：重复经颅磁刺激（repetitive transcranial magnetic stimulation, rTMS）作为轻度认知障碍（mild cognitive impairment, MCI）的非侵入性干预手段已被探索，但其总体疗效证据尚不一致。本

背景：重复经颅磁刺激（repetitive transcranial magnetic stimulation, rTMS）作为轻度认知障碍（mild cognitive impairment, MCI）的非侵入性干预手段已被探索，但其总体疗效证据尚不一致。本研究旨在评估rTMS对MCI患者认知结局的总体效应。方法：研究人员依据PRISMA指南及PROSPERO注册方案（CRD420251274531），检索PubMed、CENTRAL和Embase数据库中截至2025年11月10日仅纳入MCI受试者的随机对照试验（randomized controlled trials, RCTs）。预先设定的认知结局按领域合成，包括整体认知和执行功能（主要焦点）、记忆、语言/命名及神经精神量表。采用固定效应模型或随机效应模型计算合并效应量，报告均数差（mean difference, MD）或标准化均数差（standardized mean differences, SMDs）（计算为Hedges' g）及95%置信区间。采用RoB 1、PEDro量表和GRADE系统分别评估偏倚风险、方法学质量和证据质量。结果：共纳入11项RCTs（532例MCI受试者）。rTMS改善了简易精神状态检查（mini-mental state examination, MMSE）评分（MD = 2.35, 95% CI 1.74–2.96; k = 5, n = 120）和蒙特利尔认知评估（montreal cognitive assessment, MoCA）评分（MD = 1.31, 95% CI 0.80–1.82; k = 6, n = 337）。基于听觉词语学习测验（auditory verbal learning test, AVLT）的言语记忆亦得到改善（延迟回忆：k = 5, n = 125；再认：k = 4, n = 103）。注意力/执行功能指标支持rTMS获益，包括数字广度测验（digit span test, DST）（MD = 0.62, 95% CI 0.37–0.87），连线测试A（trail making test-A, TMT-A）（MD = −3.33, 95% CI −3.76至−2.90）和TMT-B（MD = −4.08, 95% CI −7.92至−2.23）完成时间缩短。命名能力和神经精神结局亦改善，而语言流畅性未见显著组间差异。总体偏倚风险较低，但受限于样本量较小，GRADE证据质量多为中等。结论：在仅纳入MCI的RCTs中，rTMS改善了整体认知（MMSE/MoCA）和基于AVLT的言语记忆（延迟回忆/再认）。部分执行/注意力、命名及神经精神结局亦改善，而语言流畅性未改变。证据质量多为中等，仍需更大规模的高质量RCTs验证。

1 引言

痴呆已成为全球重大公共卫生挑战，给个体、照护者及社会带来沉重负担。轻度认知障碍（mild cognitive impairment, MCI）指个体认知衰退程度超过其年龄和教育背景预期，可累及记忆、语言、注意力、视空间能力及执行功能等多领域，同时基本日常生活独立性大多得以保留。临床研究中常依据Petersen标准、美国国立老化研究所-阿尔茨海默病协会（National Institute on Aging–Alzheimer's Association, NIA-AA）标准及DSM-5轻度神经认知障碍概念界定MCI。MCI被视为正常衰老与痴呆之间的中间临床状态，具有异质性：部分遗忘型MCI可能是阿尔茨海默病（Alzheimer's disease, AD）或其他神经退行性疾病的临床前阶段，另一部分可长期稳定或逆转为正常认知。流行病学数据显示，60岁以上人群MCI患病率约为12%至18%，年进展为痴呆的风险约为10%至18%。尽管MCI患者基本日常生活能力通常保留，但认知主诉、情绪困扰及复杂日常活动中的细微困难仍可降低生活质量。

目前AD的药物治疗反应不一，且在常规护理中的应用受限于适应症、成本、可及性及安全性监测需求。相比之下，MCI尚无明确疾病修饰药物，药物管理存在不确定性。因此，MCI管理主要依赖非药物策略，如增强认知储备、增加体力活动及认知训练，但这些获益通常有限且变异大，维持长期参与和结构化的项目存在现实困难。这促使研究人员探索不依赖持续行为参与、可直接调控早期认知衰退相关神经网络的辅助干预手段。重复经颅磁刺激（repetitive transcranial magnetic stimulation, rTMS）及间歇性θ短阵脉冲刺激（intermittent theta burst stimulation, iTBS）作为一种非侵入性神经调控技术，能够调节大规模认知控制网络，日益受到关注。

经颅磁刺激（transcranial magnetic stimulation, TMS）是一种通过电磁感应调节皮质兴奋性和大规模脑网络的非侵入性神经调控技术。rTMS可在刺激后产生持续性的神经可塑性效应，这被认为与其治疗潜力密切相关。基于此，rTMS作为认知障碍（包括MCI和早期AD）的干预手段被日益广泛地研究。多项随机对照试验（randomized controlled trials, RCTs）和系统评价评估了其对认知结局的影响，虽提示潜在获益，但在刺激靶点、方案和测量工具上存在显著异质性。既往许多综述将MCI与早期AD合并分析，或主要依赖整体认知量表，限制了针对MCI内特定领域反应的推断。因此，rTMS在MCI人群中认知改善的程度、领域特异性和一致性仍不明确。尽管rTMS在认知干预中显示出良好的安全性和可行性，其在MCI中的疗效仍存争议。多项RCTs报道高频rTMS（最常用于背外侧前额叶皮质，dorsolateral prefrontal cortex, DLPFC）可能改善MCI患者的整体认知和执行功能，但对记忆和语言结局的影响则不一致或无统计学意义。现有系统评价和荟萃分析虽提示潜在获益，但受限于诊断构成异质性（如合并MCI与早期AD）、刺激方案/靶点和结局指标的多样性，以及样本量小和方法学质量参差不齐。由于MCI作为临床前阶段的基线表现和治疗反应均不同于痴呆谱系，混合分析会掩盖效应并削弱针对MCI的临床可解释性。

为超越既往综合，研究人员开展了一项仅纳入MCI受试者RCTs的系统评价与荟萃分析，并进行领域特异性合成，以明确哪些认知功能对rTMS产生反应，而非仅依赖整体认知量表。与以往侧重整体认知的综述不同，本研究预先设定了基于机制的假设：鉴于大多数MCI的rTMS试验靶向与执行控制相关的额叶控制网络，研究人员预期rTMS对执行功能的改善将比对整体认知或其他领域更显著且一致。该框架指导了本研究的结局选择和结果解释。

2 方法

本研究遵循系统评价和荟萃分析优先报告条目（Preferred Reporting Items for Systematic Reviews and Meta-Analyses, PRISMA）指南，并在PROSPERO前瞻性注册（CRD420251274531）。

2.1 检索策略

检索分为识别、筛选和纳入三个阶段。系统检索了从建库至2025年11月10日PubMed、Embase和Cochrane Library（CENTRAL）中的RCTs，限定为英文文献。检索词包含疾病相关术语（如MCI）、干预相关术语（如非侵入性脑刺激、经颅磁刺激、θ短阵脉冲刺激、非侵入性神经调控）和研究设计术语（RCTs），结合主题词（如MeSH）和自由词，并使用截词符覆盖词形变化。同时人工筛查纳入研究的参考文献，必要时联系会议摘要作者。完整检索策略见补充表1。

2.2 纳入与排除标准

由两名研究者独立筛选和评估RCTs。纳入标准为：根据既定诊断标准（如Petersen标准、NIA-AA标准或DSM-5轻度神经认知障碍）诊断为MCI（任何亚型，如遗忘型或非遗忘型、单领域或多领域）的受试者，且不合并AD；采用合格的随机设计；以rTMS（含常规rTMS和iTBS）作为主动干预；至少报告一项标准化神经心理学认知结局；研究对象为人类且以英文发表。排除标准包括：非原始研究（如综述、荟萃分析、社论、会议摘要、病例报告或方案）；涉及AD（含早期AD）或其他神经退行性疾病患者；由其他神经系统疾病（如帕金森病或卒中）导致的认知损害；TMS非主要干预措施；认知结局数据不足以提取。

2.3 研究筛选与数据提取

两名研究者使用预定义标准独立筛选记录，使用EndNote去重，先初筛标题和摘要，再对潜在合格研究进行全文审查以确定最终纳入。分歧通过讨论解决，必要时由第三位研究者裁决。数据提取由两名研究者独立完成，使用预定义的标准化表格，分歧通过讨论解决。提取信息包括第一作者、发表年份、国家、研究设计、样本量、干预和对照细节、主要结局指标和随访时间。认知结局的均值和标准差主要从研究表格中提取；两项研究结果为图形展示，使用GetData Graph Digitizer软件数字化提取数据。若相关数据未明确报告，联系通讯作者获取；若无法获得，则依据Cochrane干预措施系统评价手册建议估算。所有数据由两名研究者独立核对，筛选和提取阶段的一致性良好（Cohen's κ值分别为0.83、0.86和0.79）。除结局数据外，还预先设定并提取非结局变量以描述试验特征和rTMS方案，包括受试者特征（平均年龄、性别分布、MCI诊断标准和可用基线认知状态）、干预特征（线圈类型、刺激靶点/部位、刺激频率类型、强度（如静息运动阈值百分比）、每节脉冲数、总疗程和是否使用神经导航）及对照特征（假刺激或对照类型及联合干预）。这些条目对应表1的研究特征总结。

2.4 偏倚风险评估

使用Cochrane偏倚风险工具评估研究质量，涵盖随机序列生成、分配隐藏、参与者与人员盲法、结局评估盲法、不完整结局数据、选择性报告和其它偏倚。鉴于rTMS等非药物干预特别容易出现实施和检测偏倚，重点关注盲法程序和对照条件特征（如假刺激或常规护理）。对于选择性报告领域，检查试验注册记录、已发表方案和统计分析计划；若无预注册或协议信息且无法排除选择性报告，则该领域判定为不清楚风险。由两名研究者独立评估，分歧由第三位研究者裁决。同时使用物理治疗证据数据库（Physiotherapy Evidence Database, PEDro）量表作为方法学质量的补充评估。

2.5 结局指标

结局指标预先设定并按整体认知和领域特异性认知领域分组。整体认知采用简易精神状态检查（mini-mental state examination, MMSE）和蒙特利尔认知评估（montreal cognitive assessment, MoCA）评估，分值越高表示表现越好。领域特异性结局包括执行功能/注意力（数字广度测验；连线测试[trail making test, TMT]-A和-B）、记忆（听觉词语学习测验[auditory verbal learning test, AVLT]，含即刻回忆、延迟回忆和再认）及语言相关能力（言语流畅性和命名任务）。神经精神结局（如抑郁/焦虑量表）在报告时予以提取。对于计时测试（如TMT），完成时间越短表示表现越好，效应方向已标准化以确保数值一致反映改善。相同工具的结果合并为均数差；否则使用标准化均数差。各结局的贡献试验总结于补充表3。

2.6 证据质量评估

使用GRADE方法和GRADEpro GDT平台评估每个结局的证据质量。RCTs证据初始评级为高，再根据偏倚风险、不一致性、间接性、不精确性或报告偏倚适当降级1或2级。证据质量针对每个结局分别评估。本综述中降级主要源于总样本量小和/或置信区间宽导致的不精确性，以及观察到显著的异质性。因每个结局的荟萃分析贡献研究少于10项，未进行正式发表偏倚评估，故不作为降级依据，除非有明确报告偏倚嫌疑。汇总结局特异性质量评级和降级原因总结于GRADEpro生成的证据概要表。

2.7 荟萃分析

使用RevMan 5.4进行荟萃分析。效应量根据干预后均值、标准差及干预组和对照组样本量计算。连续变量结局合并为均数差（MDs）或标准化均数差（计算为Hedges' g）及95%置信区间（CIs），相同量表使用MDs，不同工具评估同一结构时使用Hedges' g（因其小样本校正）。对于低分值表示表现更好的结局（如TMT完成时间），效应方向已标准化。若试验包含两个以上组别，在不重复计数受试者的前提下纳入相关比较。使用Cochran's Q检验和I²统计量评估统计异质性。对于相同量表测量的结局，异质性低（I²≤ 50%）时使用固定效应模型，异质性显著（I²> 50%）时使用随机效应模型。对于跨不同评估工具合成的结局，使用随机效应模型以考虑潜在的试验间变异性。结果以森林图呈现，双侧P值≤0.05被认为具有统计学显著性。由于各结局特异性荟萃分析纳入研究均少于10项（k < 10），未评估发表偏倚（如漏斗图或Egger/Begg检验），符合Cochrane手册指南。

2.8 敏感性分析

对主要结局（整体认知表现）进行敏感性分析。采用留一法评估稳健性，每次剔除一项研究后重新计算合并效应量。此外，因两项试验的SDs从图中数字化提取，补充分析了剔除这两项试验后对合并估计值的影响。

3 结果

3.1 研究筛选流程

研究筛选流程见图1。共识别出13,586条记录，去重后10,535条进入标题和摘要筛选，25项研究接受全文评估。其中14项因非随机设计（n=5）、仅为会议摘要（n=2）、非英文发表（n=2）、缺失主要结局/数据不足（n=4）或无法获取全文（n=1）被排除。最终纳入11项RCTs，未发现交叉设计。

3.2 研究特征

共纳入11项研究，一项三臂试验拆分为两个独立比较，形成12个随机对照比较。诊断标准方面，两项研究仅纳入遗忘型MCI（aMCI），其余研究招募MCI未限制亚型。刺激模式上，多数试验采用常规rTMS方案（主要为高频，一项为低频），两项试验使用iTBS。刺激靶点主要集中于背外侧前额叶皮质（DLPFC）：四项研究靶向左侧DLPFC，三项靶向右侧DLPFC，三项靶向双侧DLPFC；两项研究靶向非DLPFC顶叶区域。仅一项试验将rTMS与太极拳结合，其余试验评估rTMS单独干预。刺激强度方面，三项研究使用80%静息运动阈值（resting motor threshold, RMT），一项低于80% RMT，其余≥80% RMT。详细特征见表1。

3.3 偏倚风险

使用Cochrane偏倚风险工具评估11项RCTs的方法学质量。总体而言，大多数研究在各领域的偏倚风险为低或不清楚。两项研究在序列生成和/或分配隐藏方面信息不足，导致选择偏倚风险不清楚。选择性报告领域经重新评估，部分研究因无预注册或公开方案信息且无法排除选择性报告，被判定为该领域风险不清楚。

3.4 结果合成

3.4.1 整体认知

五项比较使用MMSE进行荟萃分析（k=5; n=120），固定效应模型显示rTMS组MMSE评分显著高于对照组（MD = 2.35, 95% CI 1.74–2.96, P < 0.0001），异质性低（I²= 0.00%）。六项比较使用MoCA进行荟萃分析（k=6; n=337），固定效应模型亦显示rTMS显著改善MoCA评分（MD = 1.31, 95% CI 0.80–1.82, P < 0.0001），异质性中等（I²= 45.87%）。

3.4.2 注意力与执行功能

六项比较使用数字广度测验（DST）评估注意力（k=6; n=297），固定效应模型显示rTMS组较对照组有适度改善（MD = 0.62, 95% CI 0.37–0.87, P < 0.001; I²= 0.00%）。五项比较使用TMT-A评估注意力和处理速度（k=5; n=108），因TMT-A为计时指标，固定效应模型显示rTMS组完成时间显著缩短（MD = −3.55, 95% CI −3.76至−3.33, P < 0.001; I²= 39.87%）。七项比较使用TMT-B评估执行功能（k=7; n=245），因TMT-B为计时指标且异质性显著（I²= 54.49%），使用随机效应模型，结果显示rTMS组完成时间显著短于对照组（MD = −4.08, 95% CI −7.92至−2.23, P = 0.04）。

3.4.3 言语记忆

言语记忆主要通过AVLT评估。三项研究贡献即刻回忆分析（k=3; n=111），因异质性显著使用随机效应模型，显示rTMS组即刻言语记忆显著改善（MD = 2.96, 95% CI 1.52–4.41, P < 0.001; I²= 52.55%）。五项比较贡献延迟回忆分析（k=5; n=125），固定效应模型显示rTMS组延迟言语记忆显著改善（MD = 3.21, 95% CI 2.85–3.58, P < 0.001），无异质性（I²= 0.00%）。四项比较贡献再认分析（k=4; n=103），固定效应模型显示rTMS组再认得分显著更高（MD = 2.39, 95% CI 1.76–3.03, P < 0.001），异质性低至中等（I²= 43.12%）。

3.4.4 语言功能

语言功能通过语义流畅性任务和命名任务评估。六项比较贡献语义流畅性分析（k=6; n=134），因使用不同测量工具，使用随机效应模型和Hedges' g合并，结果显示rTMS组语言流畅性无显著改善（SMD = 0.06, 95% CI −0.31至0.43, P > 0.05），异质性低至中等（I²= 37.76%）。三项研究贡献命名能力分析（k=3; n=69），因使用不同工具，使用随机效应模型和Hedges' g合并，结果显示rTMS组命名表现显著改善（SMD = 0.68, 95% CI 0.25–1.12, P < 0.001），无异质性（I²= 0.00%）。

3.4.5 情绪症状

情绪结局使用贝克焦虑量表（Beck Anxiety Inventory, BAI）和汉密尔顿焦虑量表（Hamilton Anxiety Rating Scale, HAMA）评估焦虑；抑郁结局合并自评和他评工具，包括贝克抑郁量表-II（Beck Depression Inventory-II, BDI-II）和汉密尔顿抑郁量表（Hamilton Depression Rating Scale, HAMD）。三项研究贡献抑郁分析（k=3; n=150），因使用不同工具，使用随机效应模型和Hedges' g合并，显示rTMS组抑郁严重程度显著降低（SMD = −0.79, 95% CI −1.19至−0.39, P < 0.001），异质性中等（I²= 51.56%）。三项研究贡献焦虑分析（k=3; n=150），同样使用随机效应模型和Hedges' g合并，显示rTMS组焦虑显著改善（SMD = −0.48, 95% CI −0.72至−0.24, P < 0.001），无异质性（I²= 0.00%）。

3.5 敏感性分析

所有结局的留一法敏感性分析显示合并估计值稳定。对于整体认知，剔除两项使用图像评估的研究后结果与主分析一致，MMSE（MD = 1.95, 95% CI 1.26–2.67）和MoCA（MD = 1.26, 95% CI 0.83–1.52）均显著改善。结果表明结果对研究纳入和评估方法的变化具有稳健性。

3.6 GRADE证据评价

GRADE评估和证据概要见表2。各结局证据质量不同：MMSE、MoCA、DST、TMT-A、AVLT延迟回忆、AVLT再认、命名能力和焦虑多为中等；TMT-B、AVLT即刻回忆和抑郁为低；言语流畅性为极低。降级主要源于样本量小导致的不精确性，部分结局因不一致性或置信区间过宽降级。

3.7 不良事件

11项研究中7项报告了不良事件。1项研究报告无不良事件，其余6项描述了轻度不良反应，最常见为刺激部位不适或头痛、短暂头晕、面部抽动，均耐受良好并在休息后缓解。部分研究报告轻度恶心、呕吐、腹泻、电击感和失眠，均不严重。总体无严重不良事件报告。但部分研究不良事件报告不完整，限制了对rTMS安全性的全面评估。需要更大规模、设计良好的RCTs和标准化的安全性报告来进一步确认rTMS在MCI中的疗效和安全性。

4 讨论

本系统评价与荟萃分析综合了仅纳入MCI样本的RCTs，明确了rTMS在认知、情感和安全性方面的领域特异性效应。总体而言，rTMS与MMSE和MoCA评估的整体认知显著改善相关。在使用AVLT的研究中，rTMS对言语记忆（尤其是延迟回忆和再认）显示出更显著的获益，提示可能影响记忆巩固。在注意力、执行功能和命名能力的部分结局中也观察到获益，而语言流畅性未见显著改善。抑郁和焦虑症状减轻，这与rTMS对同时参与认知和情感的前额叶环路的调控一致。rTMS总体耐受良好，仅报告轻度短暂不良事件。通过报告各结局的贡献试验和样本量，并使用敏感性分析和GRADE评估稳健性和证据质量，提高了透明度。然而，样本量小、方案变异大以及刺激特征报告不一致限制了参数推断；因此，当前证据尚未确立“最优”刺激方案，应主要解释为领域水平的效应证据。

与既往综述相比，本研究在两个重要方面拓展了证据基础。首先，通过限制纳入仅MCI的RCTs，减少了将MCI与早期AD/痴呆谱系混合带来的诊断异质性，从而提高了专门针对临床前阶段的合并效应的临床可解释性。其次，未仅聚焦整体认知量表，而是合成了领域特异性结局，有助于阐明不同认知功能的差异性反应，并与预先假设（即靶向额叶控制网络的rTMS将优先改善执行/注意力过程）一致。在此背景下，本研究结果表明rTMS可能改善MCI患者的整体认知功能，反映在MMSE和MoCA评分的改善上。由于整体认知量表涵盖多个领域（记忆、注意力、执行功能和语言），这些增益可能反映了广泛但适度的改善，而非单一功能的显著变化。结果与既往RCTs和系统评价一致，这些研究报道了前额叶rTMS在MCI中的有益效应，特别是在基线损害较轻或干预持续时间较长的个体中。从临床角度看，观察到的改善可能具有意义：MMSE的最小临床重要差值（minimal clinically important differences, MCIDs）约为1–3分，MoCA约为1–2分，本分析中改善幅度接近或达到这些阈值。敏感性分析支持这些发现的稳健性。机制上，rTMS可调节皮质兴奋性并影响刺激部位以外的大规模网络。虽然最佳参数尚待确立，但大多数纳入试验对DLPFC应用高频刺激，该区域是工作记忆和认知控制的核心，这与观察到的整体认知和部分领域特异性测量的获益一致。

关于记忆结局，本研究发现rTMS与相对一致且稳定的言语记忆改善相关，特别是AVLT延迟回忆和再认。延迟回忆反映记忆巩固和保留，再认反映记忆痕迹的保存；两者常用于区分MCI与正常衰老，并与纵向认知轨迹密切相关。这些结局的低试验间异质性表明研究结果一致性良好。尽管AVLT延迟回忆或再认尚未确立MCID，但既往研究表明，在MCI阶段，这些记忆指标的适度但持续的改善可能具有临床意义，因其与疾病进展密切相关。先前研究也报道了rTMS（特别是高频刺激DLPFC）对记忆

引领行业 | 聚焦麦特绘谱代谢组学整体解决方案>>

揭秘单细胞测序-深入了解这项正在改变我们开展科学研究的技术>>

对同一细胞中的转录组和表观基因组进行同时分析（使用细胞核分离试剂盒简化样本制备工作流程）>>

「大小鼠繁育与健康管理」指导海报，点击即可免费领取电子版或实体海报>>

热点排行

生物通微信公众号

在线客服

微信

新浪微博

我要投稿

返回顶部