在我们所处的世界中,信息常常是模糊、充满噪音且不确定的。为了生存,大脑必须依赖从过往经验中积累的关于世界规律和统计结构的“先验知识”,来预测未来事件并指导行为。这一基本原则已被贝叶斯推断理论所形式化,并得到了大量行为和神经科学证据的支持。然而,关于大脑中是否存在先验知识、神经环路如何编码环境统计特征的直接证据仍然有限。特别是,我们尚不清楚神经环路究竟通过何种机制来学习世界中的概率分布,并利用这些知识在不确定的环境中生成预测。
为了回答这些问题,一项发表于《自然·神经科学》(Nature Neuroscience)的研究将目光投向了小脑。小脑长期以来被认为与计时行为和感觉运动学习密切相关,其独特的神经元类型和连接模式使其成为研究概率性时间统计学习的理想模型。研究人员在小鼠的瞬膜条件反射范式中,巧妙地引入了不同的刺激间期(ISI)概率分布,探究了小脑环路如何学习并编码时间变量的先验概率,从而塑造预测性运动行为。
研究者们运用了一系列关键技术来揭示这一过程。他们使用了头固定小鼠的行为训练系统,结合高速红外摄像头记录瞬膜运动,以量化预测性眨眼反应的各项指标。通过大规模在体电生理记录技术,使用多通道硅探针从小脑皮层(小叶IV/V和Simplex)记录神经元活动。对记录的神经信号,他们采用了Kilosort 2.0和Phy进行尖峰排序,并利用先进的深度学习方法C4进行细胞类型鉴定,辅以ZETA检验进行任务相关调制分析。为了探究神经活动与行为的因果关系,他们在表达Channelrhodopsin-2 (ChR2)的浦肯野细胞特异性转基因小鼠中进行了光遗传学干预,在行为任务期间特定时间窗内激活浦肯野细胞。此外,他们还构建了一个计算模型,模拟小脑皮层微环路中长时程抑制(LTD)和长时程增强(LTP)的相互作用,以阐释学习概率分布的潜在机制。
研究结果
预测性瞬膜行为随时间统计特征的变化而调节
研究人员开发了概率性痕迹瞬膜条件反射范式,其中条件刺激(光)与非条件刺激(气流)之间的间期从几种预先定义的概率分布中采样,包括固定单一间期、窄分布、宽分布、短间期和双峰分布。他们训练了“专家”组小鼠(始终接受一种分布训练)和“切换”组小鼠(从单一分布训练后切换到宽分布)。通过分析在测试试次(省略气流)中预测性眨眼反应的各项指标,如反应起始时间(Tonset)、反应幅度(ACR)、曲线下面积(AUC)和峰值速度,他们发现这些行为指标系统地随着底层时间分布的统计特性而变化。例如,当分布中可能出现的最早期更早时,Tonset相应提前;在更宽的分布下,ACR、峰值速度和AUC增加。控制实验表明,行为反映的是对完整概率分布的学习,而非仅对最早间期的学习。在双峰分布条件下,预测性眨眼甚至表现出与高概率间期对应的双峰结构。这些结果表明,预测性瞬膜反应反映了完整刺激概率分布所固有的不确定性。
小脑皮层活动随行为和时间统计特征发生协同变化
通过对小鼠小脑小叶IV/V和Simplex进行急性大规模电生理记录,并结合细胞类型鉴定,研究人员聚焦于浦肯野细胞简单锋电位(SSpks)和复杂锋电位(CSpks)以及假定的分子层中间神经元(pMLIs)。他们发现,尽管存在功能异质性,但相当一部分浦肯野细胞SSpks的调谐曲线紧密追踪了先验分布的一阶统计特征(如均值、标准差和整体宽度)。主成分分析显示,小脑皮层群体内存在低维动力学,其调谐特性随着先验分布变宽而系统性拓宽。在“切换”组小鼠中,从单一分布切换到宽分布时,也观察到了浦肯野细胞SSpks调谐的相应拓宽。利用LFADS(通过序列自编码器推断单次试验神经群体动力学)方法估计单次试验的神经活动,并从中提取神经指标,发现这些指标与行为学指标显著相关,并且其变化模式与行为结果相匹配。这表明小脑皮层活动在单次试验水平上,与小鼠的行为及刺激先验分布存在系统性的协同调制。
编码先验分布起始的新型浦肯野细胞复杂锋电位信号
除了在快速发放的浦肯野细胞SSpks中观察到时间统计特征,研究人员还在经历长时间高时间不确定性的小鼠中,发现了一种与先验分布相关的新型浦肯野细胞复杂锋电位(CSpk)信号。在经典的延迟条件反射中已知存在光相关CSpk(CSpklight)和气流水相关CSpk(CSpkairpuff),本研究重现了这些信号。然而,在宽分布专家小鼠中,他们意外地发现了一种时间锁定于先验分布最早可能间期起始的CSpk信号,称之为“先验相关CSpk”(CSpkprior)。该信号约占宽分布专家中所有功能显著CSpks的15%。与CSpklight和CSpkairpuff不同,CSpkprior附近没有明确的外部感觉事件与之关联,且其相对于最早间期起始的潜伏期更短。在控制实验中,他们发现在从单一分布切换到宽分布的初期,并未出现CSpkprior信号,表明该信号并非一开始就存在,而可能是通过长期暴露于高不确定性分布的经验获得的。研究人员推测,CSpkprior可能是一个内源性产生的预测信号,通过促进长时程抑制(LTD)来增强在刺激不常出现的最早期对预测性眨眼的学习。
小脑皮层参与先验相关活动和行为
为了确立浦肯野细胞在此概率性痕迹条件反射中的因果作用,研究人员使用光遗传学策略,在表达ChR2的浦肯野细胞转基因小鼠中,于先验分布相关的时间窗内随机激活浦肯野细胞。他们发现,这种在Simplex小叶浦肯野细胞中精准定时的易化性扰动,严重且可逆地损害了习得的瞬膜反应中依赖于先验的预测性成分,而同一行为的反射性成分则保持完整。在光遗传刺激期间,被鉴定的浦肯野细胞发放率显著增加,但神经活动并未受到长期干扰。该结果直接证明,浦肯野细胞在小脑Simplex小叶的抑制性活动是产生先验依赖性预测行为所必需的。
用于获取时间统计特征的橄榄-小脑机制
研究人员构建了一个小脑环路计算模型,以理解长时程抑制和长时程增强在概率分布学习过程中的相互作用如何促使浦肯野细胞产生先验依赖性记忆。模型假设,条件刺激(光)触发颗粒细胞(GC)级联激活,产生一个衰减的时间基,该基的形状适应计时中的标量变异性。空气流(非条件刺激)激活下橄榄核,在浦肯野细胞中引发复杂锋电位。颗粒细胞和爬行纤维的联合激活被认为会导致在气流前特定时间窗内活跃的颗粒细胞-浦肯野细胞突触发生长时程抑制,而缺乏爬行纤维信号时,长时程增强机制使系统恢复稳态。模型中的长时程抑制和长时程增强速率与不同持续时间下颗粒细胞的净活动成正比。在概率性痕迹条件反射中,气流在不同时间以不同概率出现,通过长时程抑制(学习)或长时程增强(遗忘)影响颗粒细胞-浦肯野细胞突触的修饰,修饰程度与不同时间出现爬行纤维输入的概率成正比。此外,CSpkprior的发生进一步促进了高不确定性先验最早间期的长时程抑制。建模结果表明,这导致了对相关间期周围传入颗粒细胞输入的选择性门控,其突触权重反映了分布中间期出现的概率。当对这些输入进行时间平均时,模型预测的行为变化(ACR增加、Tonset降低、峰值速度和AUC增加)与在单一、窄和宽先验专家中观察到的结果相匹配,并且也再现了小鼠从单一分布切换到宽分布时的行为模式。
研究结论与讨论
这项研究提供了早期报告之一,表明刺激概率统计的先验知识能一致地塑造神经活动和相关行为结果。研究结果表明,神经环路能将外部刺激的概率表征印记为记忆,并利用这些记忆在不确定性条件下塑造预测性运动输出。具体而言,研究发现小脑浦肯野细胞不仅能通过其简单锋电位信号编码先验概率,而且随着时间的推移,还会发展出标志不确定先验分布起始的复杂锋电位信号。研究人员提出,小脑皮层环路中长时程可塑性规则与时间内部表征的并置,可以解释具有不同统计特征的刺激概率分布如何作为先验知识内化于浦肯野细胞活动中。
该计算模型结合了先前理论工作,提供了概率分布学习的机制。然而,该模型对小脑可塑性机制的看法是有限的,且痕迹瞬膜条件反射也可能涉及大脑其他区域,皮层-小脑通信在此类行为中的作用尚不清楚。此外,先前关于小脑学习的研究其特征是通过微小试次增量累加发生的,本研究部分结果反映了这一现象,但并未发现与概率性版本中引入更多试次类型相关的进一步单试次学习效应。
一个关键发现是,小脑浦肯野细胞不仅通过其简单锋电位信号编码先验概率,而且随着时间的推移,还会发展出标志不确定先验分布起始的复杂锋电位信号。研究人员假设,这种先验相关的复杂锋电位是一种内源性产生的预测信号,它通过促进长时程抑制,即使在刺激不常出现时也能实现预测性眨眼的稳健学习,这或许解释了为何预测性眨眼反应的幅度在分布条件下不仅没有减小,反而可能因为不确定性而增大。这一发现可能与之前发现的对刺激分布起始产生调制的大脑皮层神经元活动有关,这些区域与小脑通过双突触连接,橄榄-小脑系统可能产生标志高不确定性分布起始的预测信号,供下游皮层区域执行复杂行为。
总之,这项研究论证了大脑在信息不确定且具有概率性的环境中进化而来。神经环路有能力学习世界中任务相关变量的概率分布,并利用这些知识塑造内隐的预测行为——这是行为学、进化学和神经科学领域的贝叶斯主义者长期持有的前提。探索概率性行为可能会揭示在不确定性下优化预测的神经机制的新层面。