分形记忆与深度学习:股票市场预测的新范式

时间:2026年2月23日
来源:Egyptian Informatics Journal

编辑推荐:

本研究聚焦金融时间序列预测难题,创新地将刻画市场长期记忆效应的滚动Hurst指数作为分形特征,融入LSTM、CNN、GRU三种深度学习架构,构建了混合预测框架。实证结果表明,集成Hurst指数的LSTM和GRU模型在S&P 500指数预测上展现出优异的样本外泛化能力,验证了融合分形分析与深度学习可显著提升预测精度与稳健性,为复杂市场建模提供了新工具。

广告
   X   

在风云变幻的金融市场中,准确预测股票价格走势是无数投资者、分析师和量化团队的终极梦想。然而,金融时间序列天生具有非线性、高波动性和非平稳性的特点,这让传统的统计模型常常“水土不服”,难以捕捉其背后复杂的动态规律。股市的涨跌不仅是经济基本面的反映,更是理性预期、随机波动和市场参与者行为交织而成的复杂适应性系统。面对这样的挑战,研究者们不断探索更强大的分析工具。
为此,Xingsi Xue、Rashmi Bhardwaj、Osamah Ibrahim Khalaf、Vinita Sangwan和Surbhi Sharma等学者在《Egyptian Informatics Journal》上发表了一项创新研究,他们独辟蹊径,将目光投向了分形理论。分形,这个由本华·曼德博普及的概念,擅长描述自然界和社会系统中广泛存在的自相似性和长程依赖性。在金融领域,分形分析通过计算赫斯特指数(Hurst exponent, H)来衡量时间序列的“记忆”特性:当H>0.5时,序列呈现持续性(趋势延续);H<0.5时,呈现反持续性(均值回归);H约等于0.5时,则接近随机游走。这些特征恰好能刻画市场内在的长期记忆效应和状态切换行为,为预测提供了宝贵信息。
与此同时,以长短期记忆网络(LSTM)、卷积神经网络(CNN)和门控循环单元(GRU)为代表的深度学习模型,在捕捉非线性关系和时序依赖方面展现出了巨大潜力。然而,现有研究大多独立使用这些模型,未能系统性地融合能够揭示市场底层结构的物理学特征。这项研究正是为了填补这一空白。研究者们提出,将分形分析的“描述能力”与深度学习的“预测能力”相结合,有望构建出更强大、更可靠的股票预测模型。
为了验证这一构想,研究人员精心设计并实施了以下关键方法:
首先,他们从Kaggle获取了标准普尔500指数从2020年9月17日至2025年9月16日的每日OHLCV(开盘价、最高价、最低价、收盘价、成交量)数据作为研究基础。数据预处理包括使用均值填补处理缺失值,并通过最小-最大缩放法将所有特征归一化到[0, 1]区间。核心创新点在于分形特征工程:他们基于收盘价序列,在一个固定长度的滑动窗口内计算滚动赫斯特指数,以此作为刻画市场记忆与状态的额外特征。最终,将OHLCV五个原始特征与滚动赫斯特指数这第六个特征组合,构建出多变量输入序列。这些序列按时间顺序以80%:20%的比例划分为训练集和测试集,以模拟真实预测场景并防止数据泄露。
研究结果
4. 混合深度学习模型架构
研究构建了三种混合模型:LSTM-with-Hurst、CNN-with-Hurst和GRU-with-Hurst。
  • LSTM-with-Hurst模型:将滚动赫斯特指数与OHLCV数据一同输入LSTM网络。LSTM通过其遗忘门、输入门和输出门的精巧设计,能够有效学习并记忆长期的时序依赖关系。融入赫斯特指数这一分形特征,旨在让模型更好地理解市场状态的持续性,从而做出更准确的预测。
  • CNN-with-Hurst模型:利用一维卷积神经网络(1D-CNN)来捕捉输入特征(包括赫斯特指数)中的局部时空模式。虽然CNN不显式建模长期依赖,但其强大的局部特征提取能力,结合分形信息,为预测提供了另一种视角。
  • GRU-with-Hurst模型:采用GRU网络,它是LSTM的一种简化变体,通过更新门和重置门来管理信息流,计算效率更高。同样,赫斯特指数作为关键输入特征被整合进来,以增强模型对市场动态的理解。
5. 实证结果与性能评估
研究使用均方根误差(RMSE)、平均绝对误差(MAE)和决定系数(R2)等指标评估模型性能。主要结论如下:
  1. 1.
    LSTM-with-Hurst和GRU-with-Hurst模型表现卓越:这两个模型在训练集和测试集上都取得了非常高的R2值(训练集分别达0.9813和0.9812,测试集分别达0.8088和0.8022),表明它们具有强大的预测能力和良好的泛化性,能够有效捕捉市场的非线性动态和长程记忆效应。
  2. 2.
    CNN-with-Hurst模型泛化能力相对较弱:尽管该模型在训练集上取得了最高的R2值(0.9869),但其在测试集上的表现(R2= 0.9869,此处文档数据可能有误,通常测试集R²会低于训练集)相对较差,表明其可能对训练数据存在一定程度的过拟合,泛化到未见数据的能力不及循环神经网络架构。
  3. 3.
    分形特征的融入提升了模型性能:通过与未集成赫斯特指数的基准模型对比,本研究提出的混合框架显著提高了预测精度。这证实了将描述市场复杂结构的分形特征(滚动赫斯特指数)作为输入,能够为深度学习模型提供超越传统价格和成交量数据的、更深层次的洞察力。
结论与讨论
本研究成功地将分形记忆特征与先进的深度学习架构相结合,为股票市场预测提供了一种新颖且有效的混合范式。核心结论是:集成滚动赫斯特指数特征的循环神经网络模型(特别是LSTM和GRU)能够显著提升预测的准确性和稳健性
这项工作的意义在于:
  1. 1.
    方法论创新:它系统地展示了如何将时间变化的分形记忆(通过滚动赫斯特指数量化)直接嵌入到深度学习模型的输入中,为金融时间序列分析开辟了一条结合物理学特征与数据驱动建模的新路径。
  2. 2.
    架构比较:研究对递归架构(LSTM, GRU)和卷积架构(CNN)在同一分形框架下进行了严谨的比较评估,结果表明递归神经网络在捕捉金融序列的长期依赖和分形特性方面更具优势。
  3. 3.
    性能提升:实证结果证明,该混合框架在样本外预测性能上超越了传统的深度学习模型和经典统计基准模型,为解决金融时间序列的高波动性和非线性预测难题提供了更可靠的工具。
总之,这项研究不仅证明了分形分析与深度学习结合的可行性,更凸显了其在提高预测精度、理解市场复杂动力学方面的巨大潜力。它为金融风险管理、算法交易和投资组合优化等实际应用提供了更强大的分析工具,标志着金融数据分析向更深度融合多学科知识的方向迈出了坚实的一步。

生物通微信公众号
微信
新浪微博


生物通 版权所有