在金融风险管理的核心领域,企业破产预测一直被视为维护经济稳定的重要防线。传统方法高度依赖结构化财务比率(如Altman Z-score模型),尽管这些模型具有可解释性强的优点,却难以捕捉企业运营中复杂的非线性关系及管理层通过文本披露传递的质性风险信号。尤其在企业危机爆发前,管理层讨论与分析(Management Discussion and Analysis, MD&A)章节中往往已隐含关键风险提示,例如对流动性压力、经营不确定性的描述,这些信息在纯数值模型中易被忽略。随着多模态学习与深度神经网络的发展,整合异构数据源以提升预测精度已成为可能,然而现有研究多采用简单的特征拼接策略,未能有效协调数值序列与自然语言文本之间的语义鸿沟与动态交互。为此,来自西伊利诺伊大学与孟加拉国多所高校的研究团队在《IEEE Open Journal of the Computer Society》上发表了一项创新研究,提出了一种基于双编码器架构的多模态破产预测模型。该模型通过并行处理结构化财务比率序列与非结构化MD&A文本,并引入门控融合机制实现跨模态信息的自适应加权,显著提升了预测的准确性与泛化能力。研究团队采用三项公开数据集——美国企业破产数据集、波兰企业破产数据集及ECL数据集进行验证。模型的核心架构包含两个分支:财务编码器使用双向长短期记忆网络(Bi-directional LSTM, Bi-LSTM)提取多年度财务比率的时间动态特征,并引入注意力机制聚焦关键时间点;文本编码器则基于预训练金融领域语言模型FinBERT,将MD&A文本转化为语义向量。随后,通过门控单元动态调节两类表征的贡献度,生成融合特征以供分类。在技术方法上,作者重点优化了多模态对齐与数据增强策略。针对类别不平衡问题,对数值数据采用SMOTE过采样,对文本数据实施回译增强;模型训练使用加权交叉熵损失函数,并以Adam优化器进行端到端学习。此外,通过t-SNE可视化与注意力热力图分析,揭示了多模态表征较单模态文本或数值模型具有更清晰的类别边界,且模型能自动聚焦MD&A中与破产风险相关的关键句段(如关于“流动性风险”“债务重组”的叙述)。