心智表征引导监督学习:赋能大模型实现类人认知泛化

时间:2026年4月2日
来源:Nature Communications

编辑推荐:

当前,深度神经网络(DNNs)在图像和自然语言理解方面展现出强大能力,但使其具备理解抽象概念、推理和适应新场景等类人复杂认知能力仍是一大挑战。为此,研究人员探索利用少量脑信号进行心智表征引导的监督学习,成功将人类概念结构迁移至DNNs,显著提升其对抽象及未见概念的理解。实验表明,增强的认知能力可大幅提升模型在少样本/零样本学习和分布外识别等挑战性任务中的表现,并产生高度可解释的概念表征。这项研究为开发具备更类人认知能力的人工系统提供了新途径。

广告
   X   

在人工智能领域,深度神经网络(Deep Neural Networks, DNNs)的发展日新月异,特别是大规模语言模型(Large Language Models),它们在图像理解和自然语言处理方面已经取得了令人惊叹的成就。然而,一个核心的难题依然横亘在研究者面前:如何让这些“聪明”的模型真正像人类一样思考?人类认知的魅力在于其能够轻松理解抽象概念(如“正义”、“自由”),进行逻辑推理,并快速适应从未见过的新奇场景。而现有的大模型,尽管参数规模和数据量不断攀升,在这些复杂认知任务上仍然显得笨拙。这就像给一台计算机灌输了海量百科全书,但它依然无法理解一则寓言故事的深层寓意。这种“认知鸿沟”限制了大模型在需要高阶智能的真实场景中的应用,例如,在只有极少示例(少样本学习)甚至没有示例(零样本学习)的情况下准确识别物体,或者可靠地处理与训练数据分布迥异(分布外识别)的新情况。为了弥合这一鸿沟,一项发表于《自然-通讯》(Nature Communications)的研究独辟蹊径,不再仅仅依赖于扩大数据和模型规模,而是转向探索人类智能的生物学本源——大脑。研究人员提出,或许可以借鉴大脑处理信息的“蓝图”,来直接指导和增强人工模型的认知结构。
为探索心智表征(Mental Representation)能否引导并提升大模型的认知能力,该研究采用了心智表征引导的监督学习(Mental Representation-guided Supervised Learning)这一核心方法。其关键点在于利用功能性磁共振成像(fMRI)采集的人类受试者在进行概念思考时的大脑活动信号(即神经信号),并将这些信号作为监督信息来训练深度神经网络。具体而言,研究构建了概念-脑信号配对的数据集,通过设计特定的学习目标,使模型在学习标准任务(如图像分类)的同时,其内部表征与人类的神经表征对齐。研究团队并未使用大规模的脑数据,而是证明了仅需少量脑信号即可实现有效迁移。这种方法的优势在于直接利用大脑对概念的编码模式作为“教师信号”,从而有可能将人类的概念结构和抽象理解能力“灌输”给模型。
心智表征对齐增强模型概念编码
研究者首先训练深度神经网络完成一项概念分类任务,同时利用从人类大脑腹侧视觉通路(Ventral Visual Pathway)解码出的概念神经表征作为额外的监督信号。通过分析模型中间层的激活模式,他们发现,接受了脑信号引导的模型,其内部形成的概念表征空间与人类大脑的概念表征结构表现出更高的一致性。这表明,心智表征引导成功地使模型学习到了一种更接近人类的概念组织方式。
提升对抽象及未见概念的理解
为了检验这种对齐带来的认知提升,研究评估了模型在处理抽象概念(如“民主”)和未见过的全新概念时的表现。实验结果显示,相较于传统监督学习训练的基线模型,经过心智表征引导的模型在理解这些概念的语义内涵时准确率显著更高。特别地,在需要模型根据已学概念推断出新概念属性的任务中,引导模型的泛化能力优势尤为明显。这表明从大脑迁移而来的概念结构,帮助模型建立了更稳健和可泛化的概念基础。
显著增强少样本、零样本与分布外识别性能
认知能力的提升最终需要体现在解决实际难题上。研究在多个具有挑战性的机器学习基准任务上进行了系统评测。在少样本学习(Few-shot Learning)场景中,引导模型仅用极少量的样本就能快速适应新类别。在零样本学习(Zero-shot Learning)中,模型对于在训练中从未出现过的类别也能进行合理推断。更重要的是,在面对来自不同分布的测试数据(Out-of-distribution Recognition)时,引导模型表现出更强的鲁棒性和更高的识别准确率。这些结果证明,通过心智表征增强的认知基础,直接转化为了更优越的实用性能。
产生高度可解释的概念表征
除了性能提升,该研究另一个重要发现是模型表征可解释性(Interpretability)的增强。通过可视化技术分析模型内部的概念表征,研究者发现引导模型所形成的表征簇(Clusters)与人类对概念的语义分类高度吻合,且不同抽象层次的概念在表征空间中呈现出清晰的层次结构。这种高度可解释的表征不仅有助于理解模型决策的依据,也为后续的模型诊断和优化提供了便利。
本研究的结论表明,利用少量人类脑信号进行心智表征引导的监督学习,是一种有效提升大规模深度神经网络复杂认知能力的方法。这种方法成功地将人类的概念结构迁移至人工模型,显著增强了模型对抽象概念的理解、对新场景的泛化能力,并在少样本学习、零样本学习及分布外识别等挑战性任务上带来了实质性的性能提升。同时,该方法还能促使模型形成高度可解释的内部表征。这些发现具有双重重要意义:在方法论上,它开辟了一条名为“神经增强人工智能”(Neurally Augmented AI)的新路径,即利用神经科学发现直接指导人工智能模型的设计与训练;在愿景上,它为开发具备更接近人类的认知与适应能力的人工智能系统提供了一个极具前景的可行方向,推动了人工智能从“大数据拟合”向“类人认知理解”的范式演进。

生物通微信公众号
微信
新浪微博


生物通 版权所有