神经群体几何与共享潜在结构任务的最优编码

时间:2026年2月5日
来源:Nature Neuroscience

编辑推荐:

本研究针对大脑如何通过神经活动几何特征支持跨任务泛化这一关键问题,通过理论推导与实验验证相结合,揭示了神经活动相关性、维度及因子化结构等四个几何统计量共同决定线性读出头泛化性能的机制。研究发现学习过程中神经表征几何呈现动态演变,早期学习阶段最优表征具有低维、高相关性特征,而后期则趋向高维与因子化。该成果发表于《Nature Neuroscience》,为理解神经编码如何支持行为灵活性提供了统一的理论框架。

广告
   X   

动物能够识别环境中的潜在结构并利用这些信息高效应对世界。多项研究表明,大脑通过形成神经表征来支持这种能力,使得行为相关变量能够在不同情境和任务中被读取。然而,究竟是神经活动的哪些特征促进了这种下游读出的效率,至今仍不明确。
近日发表在《Nature Neuroscience》上的研究论文《神经群体几何与共享潜在结构任务的最优编码》对这一难题进行了深入探索。研究人员通过理论分析确定了神经活动几何特性如何共同决定线性读出头在一组共享共同潜在结构的任务上的泛化能力。他们发现,总结神经活动维度、因子化和相关性结构的四个统计量共同决定了泛化性能。
为了验证理论预测,研究团队构建了多层感知机模型,并分析了生物和人工神经网络数据。结果显示,学习早期的最优神经表征具有较低维度,且单个单元与任务变量之间的相关性高于学习后期。这一发现揭示了学习过程中神经几何特征的动态演变规律。
该研究的主要创新点在于首次建立了神经群体活动几何与线性可解码信息之间的直接理论联系。通过推导出的泛化误差公式,研究人员能够量化分析不同几何特征对多任务学习性能的贡献程度。这不仅为理解大脑如何高效处理相似任务提供了新视角,也为人工神经网络的设计提供了重要启示。
研究采用的关键技术方法包括:理论推导神经群体几何与读出头泛化性能的数学关系;构建多层感知机模型进行数值验证;利用DeepLabCut框架训练深度卷积神经网络分析动物姿态参数表征;处理恒河猴V4区和颞叶皮层多单元记录数据;分析大鼠前额叶皮层和海马CA1区空间表征在学习过程中的几何变化。
几何度量决定线性读出头泛化
研究团队开发了一个分析理论,用于研究依赖于共同潜在结构的二元决策任务的学习过程。他们证明,神经群体反应的四个统计量——维度、总相关性、信号-信号因子化和信号-噪声因子化——共同决定了跨任务的泛化误差。通过数学推导,研究人员得出了泛化误差的精确表达式,发现这些几何项以可分离的方式贡献于误差。
多层感知机中的多任务学习几何
为了在非线性系统中验证理论,研究人员将理论框架应用于随机和训练过的非线性多层感知机。结果显示,理论预测与经验泛化误差高度吻合。有趣的是,在训练网络中,线性和ReLU层协调了几何项之间的权衡,共同导致多任务泛化误差的降低。这种模式在随机网络中并未出现,表明训练过程确实优化了表征几何。
深度姿态估计网络中的解纠缠
研究还将理论应用于更复杂的自然数据,分析了深度卷积神经网络中对动物姿态参数的表征。发现网络通过各层逐渐改善任务平均泛化误差,其中维度扩展策略与相关性降低形成权衡。尽管潜在变量分布高度非高斯,理论预测仍然能够解释几乎所有的经验误差方差。
恒河猴视觉表征的读出头性能预测
应用该理论到生物神经数据,研究人员分析了恒河猴V4区和颞叶皮层的多单元记录。研究发现,理论公式能够准确预测Hebbian读出头误差,特别是对神经反应读出头。随着信息在腹侧通路中的传递,泛化误差逐步改善,同时信号-噪声因子化显著增加,表明与潜在变量无关的变异性逐渐与编码方向正交。
最优潜在变量表征
研究还探讨了多任务学习中的规范性问题,发现最优表征会解纠缠潜在变量,且学习过程中最优神经编码的几何特征呈现规律性变化。早期训练阶段的最优神经编码具有较低维度和较高神经-潜在相关性,而后期则相反。这一预测在后续的生物学数据分析中得到了支持。
前额叶皮层和海马CA1空间表征在学习过程中的几何
最后,研究人员分析了大鼠前额叶皮层和海马CA1区导航表征在学习过程中的几何变化。发现读出头误差与单次会话行为任务表现显著相关。学习初期,几乎所有几何度量都增加,而总体神经维度下降主要是由导航无关活动的压缩驱动。一旦读出头和行为误差开始稳定,后续的几何变化趋势与最优表征的预测一致:维度度量和信号-信号因子化随学习增加,而神经-潜在相关性降低。
研究结论强调,这项工作通过理论分析和实验验证,建立了神经群体几何与多任务学习性能之间的直接联系。发现的四个几何统计量为理解神经编码如何支持行为灵活性提供了统一框架。特别值得注意的是,学习过程中神经几何特征的动态变化规律揭示了大脑优化表征以适应不同学习阶段需求的重要机制。
讨论部分指出,该研究补充了先前关于多任务学习和神经相关性的工作,首次通过解析方法描述了噪声相关性结构如何与信号相关性、维度和信号因子化相互作用,共同决定读出头泛化性能。与专注于不变物体识别中单个对象类表征的研究不同,本工作发现不同的几何项可能以受系统额外约束的方式相互竞争。
这些发现对理解大脑如何处理相似任务具有重要意义,也为人工神经网络的设计提供了新思路。未来工作可以扩展到考虑更符合实验设置的潜在变量和任务分布,以及研究常见非线性解码器的相关几何度量。该理论框架为系统研究神经计算如何支持灵活行为开辟了新途径。

生物通微信公众号
微信
新浪微博


生物通 版权所有