编辑推荐:
本研究探讨在线支付欺诈暴露与数字金融素养(Digital Financial Literacy, DFL)之间的关系,并引入可解释人工智能(Explainable Artificial Intelligence, XAI)框架进行分析。随着数字支付方式的普及,
本研究探讨在线支付欺诈暴露与数字金融素养(Digital Financial Literacy, DFL)之间的关系,并引入可解释人工智能(Explainable Artificial Intelligence, XAI)框架进行分析。随着数字支付方式的普及,金融素养不足或数字行为欠佳的用户面临的欺诈风险显著上升。为量化此类风险,研究人员提出“金融疏忽评分”(Financial Negligence Score, FNS)作为行为代理指标,用于衡量交易过程中的情境脆弱性、用户注意力及风险意识。研究采用随机森林(Random Forest)、极端梯度提升(XGBoost)、类别提升(CatBoost)及逻辑回归(Logistic Regression)等机器学习算法与统计模型,评估行为指标的预测能力。实证结果表明,表现出财务注意力不足的交易具有显著更高的欺诈概率。将FNS纳入模型后,尤其在集成学习架构中,欺诈检测的预测性能与可靠性显著提升。基于沙普利值(SHapley Additive exPlanations, SHAP)的分析进一步证实,行为特征在欺诈分类中起关键作用。本研究贡献在于:(1)提出了一种创新的数据驱动型DFL行为代理指标;(2)利用XAI技术阐明欺诈预测的潜在机制;(3)提供了稳健的实证证据,表明较高的数字金融意识与较低的欺诈受害概率直接相关。这些发现可为针对性金融教育、动态欺诈防控策略设计以及构建更安全的数字金融生态系统提供重要参考。
研究背景与意义
全球金融体系的技术进步推动了快速支付系统的发展,实现了全天候即时交易。然而,这种高速与便捷性同时吸引了恶意行为者,使得资金盗窃可在单次交易中迅速完成,且难以被及时检测。欧洲银行业管理局(European Banking Authority, EBA)与欧洲中央银行(European Central Bank, ECB)数据显示,2022年欧洲经济区内支付欺诈损失达43亿欧元,仅2023年上半年就新增约20亿欧元。与此同时,预计到2028年全球因在线支付欺诈造成的累计商户损失将超过3620亿美元。传统金融素养(Financial Literacy, FL)虽与审慎经济决策相关,但在数字环境下的具体作用尚未得到充分研究,尤其是缺乏针对数字金融素养(DFL)的可操作化测量工具。现有评估多依赖主观问卷调查,无法捕捉真实交易情境下的行为异常与风险感知。因此,研究人员提出基于交易数据的行为代理指标,结合可解释人工智能(XAI)技术,深入揭示DFL与欺诈受害之间的关联机制。该研究成果发表于《Borsa Istanbul Review》。
主要技术方法
研究人员采用来自Kaggle平台的“在线支付欺诈检测数据集”,包含636万余条交易记录,特征涵盖交易类型、金额、账户余额变化及欺诈标签。数据预处理包括缺失值与重复值检查、无关列删除、类别变量独热编码(One-Hot Encoding)及标准化处理。在此基础上,构建了三个行为指标:赤字交易(deficit_transaction)、零余额交易(zero_post_transaction)与高风险交易类型(risky_type),并通过等权聚合形成金融疏忽评分(FNS)。建模阶段采用逻辑回归(LR)、随机森林(RF)、XGBoost与CatBoost四种算法,结合类别权重优化应对严重类别不平衡问题,并利用五折分层交叉验证进行超参数调优。为增强模型可解释性,使用沙普利值(SHAP)方法分析特征贡献。此外,通过倾向得分匹配(Propensity Score Matching, PSM)与时间序列稳健性检验确保结果稳定性。
研究结果
非线性关系分析
FNS与欺诈风险之间呈非线性凹形关系,风险在FNS从0升至1时急剧上升,随后增速放缓。似然比检验证实非线性模型拟合显著优于线性模型(χ2 =31497, p<0.001),Akaike信息准则(AIC)由123668降至92173。
SHAP可解释性分析
SHAP条形图显示,交易后余额(newbalanceOrig)是影响欺诈预测的最强特征,FNS相关行为指标亦位列前茅。蜂群图进一步表明,高余额用户欺诈概率较低,而赤字交易、零余额交易与高风险交易类型均正向贡献于欺诈预测。支付类交易通常关联负SHAP值,反映其较低的风险水平。
模型性能比较
在集成模型中加入FNS显著提升预测表现,尤其对CatBoost与XGBoost而言。CatBoost在包含FNS时达到精确率0.97、召回率1.00、F1值0.98及ROC AUC 0.9999;无FNS时精确率降至0.27。XGBoost在含FNS时的F1值为0.94,显著高于无FNS时的0.75。随机森林对FNS的响应较小,性能基本持平。
倾向得分匹配检验
在控制交易类型、金额与账户余额后,FNS≥1组的欺诈率仍为0.188%,显著高于FNS=0组的0%,差异具有统计学意义(χ2 =8218.74, p<0.001),支持行为与欺诈风险之间的稳健关联。
讨论与结论
讨论部分指出,FNS有效捕捉了传统欺诈检测系统常忽略的认知局限,如有限注意力与有限理性导致的结构性漏洞。尽管研究基于观测数据无法直接确立因果关系,但通过PSM与时间稳健性检验增强了结果的可靠性。研究人员强调,FNS应被视为一种概率性行为信号,而非绝对的心理测量指标,其解释需结合具体情境。在应用层面,FNS可用于识别高风险用户群体,并辅助制定针对性的金融教育与实时风险预警策略。政策建议包括推动DFL培训、优化监管框架及促进公私部门合作以提升数据共享与AI反欺诈技术部署。未来研究应关注公平性(Fairness-aware ML)评估,避免模型在不同社会经济群体间产生歧视效应,并探索纵向数据以进一步验证因果机制。
打赏