-
综述:基于查询蒸馏和不对称融合的多模态情感分析
多模态情感分析中提出QAF-NET模型,通过query-based distillation将长序列压缩为高密度摘要,结合不对称跨模态注意力机制,以文本为锚点精准对齐音视频特征,解决传统align-then-fuse范式的高计算成本和噪声敏感问题,在CMU-MOSI、CMU-MOSEI、AVEC2019等数据集上实现SOTA性能。
来源:Neurocomputing
时间:2026-04-06
-
一种用于监控视频中暴力行为识别的多模态框架
暴力行为识别框架融合视觉、听觉与语义模态,采用分层融合策略和Transformer时序编码器,结合对比学习优化起点对齐,提升实时检测与噪声鲁棒性,实验验证在多指标上达到最优性能。
来源:Neurocomputing
时间:2026-04-06
-
纯粹的意识、熵以及感知的基础
意识计算模型与最小现象体验的生成机制研究,提出基于贝叶斯和主动推理的框架解释MPEs的神经基础。当精度分配向层级底端偏移时,系统熵增导致表征内容极简,但通过认知深度实现自我模型递归共享,形成意识存在的闭环。计算机仿真验证了精度分布与神经熵变的关系,为意识研究提供跨学科方法论。
来源:Neurocomputing
时间:2026-04-06
-
阅读障碍儿童中适应能力缺陷的证据极少:一项带有控制性预期的脑电图研究
阅读障碍儿童与正常儿童在纯音连续刺激的神经适应和MMN响应上无显著差异,表明实验条件或语言背景可能影响差异表现。
来源:Neuropsychologia
时间:2026-04-06
-
通过全局语义感知和帧间语义一致性检测人工智能生成的视频
AI生成视频检测方法研究:提出SemaDet双分支框架,通过全局语义异常和帧间语义不一致性分析,有效提升检测性能。实验表明其优于现有方法如AIGVDet和DeCoF。
来源:Neurocomputing
时间:2026-04-06
-
数据驱动建模中的交互式可解释性:以神经网络为中心的综述
基于神经网络的交互可解释性研究提出四层框架,覆盖数据、问题、模型和后处理层面,整合Poznyak的动态神经网络与稳定性分析,探索解释结果向部署调整的闭环机制。
来源:Neurocomputing
时间:2026-04-06
-
最小神经元电路——第一部分:谐振器
本文提出一种基于I_Na,p+I_K模型的可扩展硬件spiking神经元设计方法,通过类型-N负微分电阻(NNDR)器件或电路模拟钠通道,构建包含11种新型最小化神经元电路(分共振器和积分器两类),在保持生物合理性的同时优化器件数量和计算效率,并比较了与传统模型(HH、LIF)的性能差异。
来源:Neurocomputing
时间:2026-04-06
-
BinParam:通过分布对齐和正交残差实现二值化的人类参数建模
二进制卷积神经网络参数化人体/手部网格重建框架提出熵蒸馏特征对齐和正交残差补偿模块解决二值化带来的分布偏移与表示退化问题 在计算效率提升近九倍的同时保持与全精度模型相当的重构精度
来源:Neurocomputing
时间:2026-04-06
-
LG-RobustSAM:一种适用于退化场景的轻量级且鲁棒的分割模型
提出基于知识蒸馏和渐进式鲁棒提示蒸馏的轻量级模型LG-RobustSAM,在降低79%参数量的同时实现15倍加速推理,有效缓解图像退化导致的分割不稳定问题。
来源:Neurocomputing
时间:2026-04-06
-
动态提示增强型多模态双分支小样本时间序列预测
动态提示生成与多模态融合的时间序列预测模型Time-DPMB,通过对比学习构建异构特征空间,采用平行协注意力机制实现多模态渐进式融合,有效缓解少样本场景下的数据稀缺问题,实验表明在多种基准数据集上均优于基线模型。
来源:Neurocomputing
时间:2026-04-06