在探索大脑如何指挥行为的复杂图景中,有一个有趣的谜题:即使是完成同一个看似简单的任务,大脑内部可能运行着截然不同的策略。打个比方,两个人可能通过完全不同的心算路径得出相同的答案。然而,当我们仅观察最终的行为结果——比如正确率或反应时间——时,这些隐藏在深处的“潜在策略”往往难以被直接窥见。这就像只看到舞台上的完美演出,却对后台排练的无数种方案一无所知。这种“一果多因”的现象,尤其是当这些不同的策略导向相同的行为表现时,为理解高级认知功能的神经机制带来了巨大挑战。那么,我们如何才能穿透行为表象的迷雾,直接读取大脑在执行任务时真正采用的“思维策略”呢?为了解决这个问题,一个由认知神经科学家和计算神经科学家组成的团队,将目光投向了复杂认知功能的核心中枢——前额叶皮层。
他们设计了一项精巧的研究,旨在破译猕猴在执行一项涉及信息更新的工作记忆任务时所采用的潜在策略。这项研究已于《Nature Communications》期刊上发表。研究人员开发了一种创新的分析方法:他们不再仅仅关注单个神经元的放电率或群体的平均活动,而是深入到更高维度的“表征几何学”层面。他们将猴类在执行任务时两个关键前额叶脑区——侧前额叶皮层(LPFC)和弓状前皮层(PAC)——记录的神经群体活动模式,转化为一种抽象的几何结构。与此同时,他们在计算机中训练了多组循环神经网络模型(RNN),每组装载了不同的问题解决策略来模拟同一任务。研究的关键一步在于比较这两种几何结构:来自真实大脑神经活动的几何表征,与来自不同策略的“人工大脑”模型的几何表征。通过这种精密的匹配比对,研究者们能够像指纹识别一样,推断出哪种计算策略最贴近大脑的实际运作模式。最终,他们惊讶地发现,无论来自LPFC还是PAC的神经活动模式,其表征几何结构都只与其中一种预设策略模型完美吻合。这强有力的证据表明,猴群在完成这项任务时,不约而同地采用了这种特定的潜在策略。这一发现不仅为解码高级认知的“黑箱”提供了新工具,更重要的是,它打开了一扇窗,让我们得以探究大脑是如何学会特定策略的,以及当面临多种可能的解决路径时,它背后的决策机制又是如何做出最终选择的。
为开展这项研究,研究人员主要应用了几个关键技术方法。首先,他们利用行为训练和电生理记录技术,让猕猴执行工作记忆更新任务(具体任务范式基于“O-规则”和“B-规则”的序列更新),并同步从LPFC和PAC区域采集了多通道神经元活动数据。其次,他们构建并训练了具有特定架构的循环神经网络(RNN)模型,通过调整训练目标,使不同的RNN模型分别学习到“独立-记忆”或“整合-记忆”等不同的潜在计算策略来完成任务。最后,核心的分析方法是表征相似性分析,通过计算神经活动模式和模型内部状态之间的表征相似性矩阵,并比较其几何结构,从而将大脑活动与计算模型策略进行定量化匹配。模型的训练和数据分析均基于猴类的行为与神经数据。
研究结果
1. 构建具有不同潜在策略的RNN模型
为了提供一个可与神经数据对比的计算框架,研究人员训练了RNN模型来解决与猕猴相同的工作记忆更新任务。他们通过操控模型的训练过程,成功地获得了采用不同内部策略的模型家族。关键的策略区分在于模型如何处理任务规则(O或B)与序列位置信息的整合。一种是“独立-记忆”策略,模型分别独立地表征规则和序列信息;另一种是“整合-记忆”策略,模型将规则与序列信息整合成一个统一的、依赖于具体情境的表征。尽管这些策略在输入-输出层面都能产生相同、正确的行为,但其内部的信息处理动力学和表征结构存在根本差异,这为后续与神经数据的比对奠定了基础。
2. LPFC和PAC的活动几何学只与一种策略模型匹配
研究团队接下来分析了从猕猴LPFC和PAC记录到的神经群体活动。他们计算了在不同任务条件下(不同规则、不同序列位置)神经活动模式之间的表征相似性,从而构建出神经数据的表征几何学。通过将这种神经几何与不同策略RNN模型的内部状态几何进行定量比较,他们发现了一个一致且清晰的结果:无论是LPFC还是PAC的神经活动模式,其表征相似性结构都只与采用“整合-记忆”策略的RNN模型的内部几何高度一致,而与“独立-记忆”策略模型的几何结构显著不同。这种匹配不是全局活动水平的相似,而是体现在高维表征空间关系上的精确对应。
3. 在单次试验水平上解码潜在策略
为了进一步验证推断的稳健性,研究者在单次试验的层面上进行了分析。他们训练了分类器,试图根据单次试验中观测到的神经活动模式,来区分该试验是由哪种策略模型所生成。结果显示,基于真实神经活动数据的分类器,能够以高于随机水平的准确度,将试验归类为源自“整合-记忆”策略模型。这提供了更强的证据,表明在每一次具体的任务执行中,大脑都可能稳定地采用这种特定的潜在策略。
4. 策略特定表征在任务过程中的动态演化
通过分析神经活动在单个试验时间进程中的动态变化,研究人员揭示了“整合-记忆”策略是如何在大脑中实现的。他们发现,LPFC和PAC中的神经元群体表现出对规则和序列位置信息的混合选择性,即单个神经元的活动同时受到这两种因素的调制。更重要的是,这种混合表征不是静止的,而是随着任务进程(从线索呈现到反应期)动态演化的。这种动态的、情境依赖的表征模式,正是“整合-记忆”策略计算模型的核心特征,从而在时间动力学层面也支持了策略推断的结论。
结论与讨论
本研究成功地通过将大脑神经活动的“表征几何学”与计算模型的“策略几何学”相结合,发展出一种强大的新方法来推断隐藏在相同行为表现下的潜在认知策略。研究得出的核心结论是:在执行特定的工作记忆更新任务时,猕猴的LPFC和PAC脑区采用了一种“整合-记忆”策略,即将任务规则与序列信息整合进一个统一的情境依赖表征中,而非分别独立处理它们。
这一发现具有多重重要意义。首先,在方法论上,它突破了传统行为分析的限制,为研究无法通过外显行为区分的内部认知过程提供了全新的、基于神经计算的解码工具。其次,在理论层面,它直接证明了即使在相对简单的认知任务中,大脑也可能采用特定且一致的复杂计算策略,这挑战了大脑可能使用多种等效策略的简单假设。最后,也是最具启发性的一点在于,这项工作开辟了未来研究的两个关键方向:一是策略的习得过程,即大脑是如何通过学习和经验最终锁定并优化某一特定策略的;二是策略的选择机制,即当面对一个新任务或多个可行策略时,大脑内部的决策系统是如何评估并最终采纳某一策略的。理解这些过程,对于揭示高级认知功能的构建原理、以及开发更贴近人脑智能的人工智能算法,都将产生深远影响。