基于双编码器与门控融合的财务比率和文本披露多模态破产预测研究

时间:2025年12月2日
来源:IEEE Open Journal of the Computer Society

编辑推荐:

本研究针对传统破产预测模型仅依赖结构化财务比率而忽视非结构化文本信息的问题,提出了一种融合财务比率与管理层讨论与分析(MD&A)文本的双编码器深度学习框架。通过门控融合机制动态整合数值与文本表征,模型在多个公开数据集上显著超越了传统统计方法与单模态基线,准确率提升至90%,ROC-AUC达0.91,证明了多模态学习在提升金融风险预测时效性与鲁棒性方面的重要价值。

广告
   X   

在金融风险管理的核心领域,企业破产预测一直被视为维护经济稳定的重要防线。传统方法高度依赖结构化财务比率(如Altman Z-score模型),尽管这些模型具有可解释性强的优点,却难以捕捉企业运营中复杂的非线性关系及管理层通过文本披露传递的质性风险信号。尤其在企业危机爆发前,管理层讨论与分析(Management Discussion and Analysis, MD&A)章节中往往已隐含关键风险提示,例如对流动性压力、经营不确定性的描述,这些信息在纯数值模型中易被忽略。随着多模态学习与深度神经网络的发展,整合异构数据源以提升预测精度已成为可能,然而现有研究多采用简单的特征拼接策略,未能有效协调数值序列与自然语言文本之间的语义鸿沟与动态交互。
为此,来自西伊利诺伊大学与孟加拉国多所高校的研究团队在《IEEE Open Journal of the Computer Society》上发表了一项创新研究,提出了一种基于双编码器架构的多模态破产预测模型。该模型通过并行处理结构化财务比率序列与非结构化MD&A文本,并引入门控融合机制实现跨模态信息的自适应加权,显著提升了预测的准确性与泛化能力。
研究团队采用三项公开数据集——美国企业破产数据集、波兰企业破产数据集及ECL数据集进行验证。模型的核心架构包含两个分支:财务编码器使用双向长短期记忆网络(Bi-directional LSTM, Bi-LSTM)提取多年度财务比率的时间动态特征,并引入注意力机制聚焦关键时间点;文本编码器则基于预训练金融领域语言模型FinBERT,将MD&A文本转化为语义向量。随后,通过门控单元动态调节两类表征的贡献度,生成融合特征以供分类。
在技术方法上,作者重点优化了多模态对齐与数据增强策略。针对类别不平衡问题,对数值数据采用SMOTE过采样,对文本数据实施回译增强;模型训练使用加权交叉熵损失函数,并以Adam优化器进行端到端学习。此外,通过t-SNE可视化与注意力热力图分析,揭示了多模态表征较单模态文本或数值模型具有更清晰的类别边界,且模型能自动聚焦MD&A中与破产风险相关的关键句段(如关于“流动性风险”“债务重组”的叙述)。
实验结果部分显示,多模态模型在1年预测窗口下准确率达90%,F1分数为0.88,ROC-AUC为0.91,均显著优于逻辑回归、随机森林及单模态深度学习基线。随着预测时间窗口延长至2年与3年,模型性能虽逐步下降(3年窗口的ROC-AUC为0.85),但仍保持较高判别力,证明其适用于中短期风险预警。在跨数据集泛化测试中,使用美国数据训练后直接预测波兰企业破产,模型仍取得0.86的准确率与0.85的ROC-AUC,凸显其强大的领域适应能力。
消融实验进一步验证了各组件的必要性:移除MD&A文本或财务数据均导致性能下降(F1分数分别降低0.05与0.04),而替换门控融合为简单拼接或注意力融合亦使ROC-AUC减少0.03–0.04。混淆矩阵分析表明,多模态模型在真实阳性(TP=188)与真阴性(TN=297)数量上均优于对比模型,同时将误报(FP=22)与漏报(FN=24)控制在较低水平。
在模型鲁棒性方面,作者测试了输入噪声与数据缺失的影响。当数值特征缺失比例达40%时,模型准确率仍保持在80%以上,表明其具备良好的容错性。训练动态曲线显示,训练与验证损失收敛平稳,未见过拟合现象,且精确度、召回率与F1分数在迭代过程中同步提升,证明学习过程稳定有效。
本研究通过系统验证表明,融合多源信息的深度学习框架能够显著提升破产预测的时效性与可靠性。其重要意义在于:第一,突破了传统模型对结构化数据的依赖,通过引入MD&A文本挖掘提前捕捉风险信号;第二,门控融合机制赋予模型动态权衡模态贡献的能力,增强了解释性与实用性;第三,跨数据集与跨时间窗口的稳健性能为其在真实金融场景中的应用提供了有力支撑。尽管模型在数据质量假设、计算效率等方面存在局限,但其整体架构为金融风险建模提供了可扩展的多模态学习范式,未来可通过引入外部经济指标、改进领域自适应机制进一步优化其部署效果。

生物通微信公众号
微信
新浪微博


生物通 版权所有