引言
开发自动化交易策略是一项具有挑战性的任务,长期以来一直吸引着机构投资者和个人研究人员。随着计算能力的提升和机器学习(ML)的发展,越来越多的自动化算法被开发并应用于市场。据估计,目前70%到80%的市场交易是由自动化交易软件完成的(Yadav, 2015),预计这一比例在未来几年还会继续增加。
尽管过去许多系统能够处理日常市场数据,但在高频交易和先进计算能力的时代,这已经不够了。特别是在比特币等资产的交易中尤为明显。比特币(BTC)是一种去中心化的数字货币,允许通过比特币网络进行点对点交易,该网络使用区块链技术构建了一个安全的公共账本。它最初由一位或一群使用化名“中本聪”的人在2009年发布的一篇匿名白皮书中提出(Nakamoto, 2009)。自那时起,比特币的受欢迎程度不断提高,出现了许多促进比特币买卖的加密货币交易所。这种资产以其高波动性而闻名;例如,2017年比特币价格上涨了近20倍,达到19,497美元,随后下跌了84%;2021年比特币再次创下历史新高,达到63,314美元,但随后又跌至34,770美元,跌幅接近55%(1)。自从比特币现货ETF获得批准后,其价格波动性有所减弱。尽管如此,与更传统的投资工具相比,比特币的价格波动仍然很大。
本研究探讨了为比特币构建自动化交易策略的想法。基于2019年8月21日至2024年7月24日的高频比特币历史数据(5分钟、15分钟和30分钟间隔),提出了五种策略并进行评估。前两种策略作为基准策略,基于经典的技术指标,即移动平均收敛发散(MACD)和相对强弱指数(RSI)。其余三种策略则采用了Zhou等人(2021)提出的Informer模型,这是一种先进的基于注意力的神经网络模型,旨在有效处理长时间序列数据,从而根据模型预测结果选择交易头寸。
本研究旨在回答以下研究问题:
- 问题:
是否可以创建一种比“买入并持有”方法更高效的比特币交易算法?
- 问题:
Informer模型的信号是否可以帮助我们创建比基于技术指标的策略更高效的比特币交易策略?
- 问题:
选择机器学习模型的损失函数如何影响策略的表现?
- 问题:
使用更高频率的数据是否能够创建更高效的策略?
回答这些问题需要设计和实施一种方法来比较各种交易策略。这种比较是本研究的主要贡献。据我们所知,目前还没有其他研究使用分位数或GMADL损失函数训练Informer模型,并将其预测结果用于生成买卖信号以开发自动化交易策略(Michańków, Sakowski, & Ślepaczuk, 2024)。本研究对该方法进行了全面分析,包括与“买入并持有”策略和两种基于技术指标的策略的对比,使用了不同时间间隔的数据以及多个时间段的数据。最后,还进行了敏感性分析,以展示参数变化对测试策略表现的影响。此外,本研究还提供了一个开源的框架,用于高效比较交易策略,该框架可在GitLab上获取,便于重现研究结果(2)。
本研究的新颖之处不在于提出了一种新的架构或损失函数本身,而在于系统地将Informer模型与不同的损失函数(RMSE、分位数、GMADL)结合在一起,用于设计交易策略。虽然这些组件在文献中都曾被单独研究过,但据我们所知,这是首次将它们结合应用于高频比特币交易场景,并将其性能与基于技术指标的策略和“买入并持有”基准策略进行对比。
论文的结构如下:第2章回顾了相关文献,并简要概述了以往的类似研究。第3章解释了数据的获取和预处理过程,并分析了研究中使用的数据集。第4章正式定义了交易策略的概念,介绍了比较指标,并详细介绍了每种策略的细节。第5章展示了实验结果,详细说明了策略超参数的选择过程,并展示了策略评估的结果及敏感性分析。第7章总结了整个研究。