金融中的三种深度学习用例及这些模型优劣的证据

发布于 2023-10-15 01:54

在今天我们发布的这篇文章中，作者 Sonam Srivastava 介绍了金融中的三种深度学习用例及这些模型优劣的证据。

我们跟随 Sonam Srivastava 的分析，并展望深度学习在金融领域的运用前景。虽然金融是计算密集型最多的领域，但广泛使用的金融模型：监督和无监督模型、基于状态的模型、计量经济学模型甚至随机模型都受到过度拟合和启发式问题带来的影响，抽样结果很差。因为金融生态圈异常复杂，其非线性充斥着大量的相互影响的因素。

要解决这个问题，如果我们考虑到深度学习在图像识别、语音识别或情感分析方面所做的研究，我们就会看到这些模型能够从大规模未标记数据中学习，形成非线性关系的递归结构，可以轻松予以调整以避免发生过度拟合。

如果金融生态圈能够使用这些网络进行建模，应用领域就会深远而广泛。这些模型可用于定价、投资组合构建、风险管理甚至高频交易等领域，让我们来解决这些问题。

收益预测

以预测每日黄金价格的抽样问题为例，我们首先看看传统的方法。

ARIMA 模型

ARIMA 模型（Autoregressive Integrated Moving Average model），差分整合移动平均自回归模型，又称整合移动平均自回归模型（移动也可称作滑动），时间序列预测分析方法之一。ARIMA（p，d，q）中，AR 是“自回归”，p 为自回归项数；MA 为“滑动平均”，q 为滑动平均项数，d 为使之成为平稳序列所做的差分次数（阶数）。“差分”一词虽未出现在 ARIMA 的英文名称中，却是关键步骤。

ARIMA 模型的基本思想是：将预测对象随时间推移而形成的数据序列视为一个随机序列，用一定的数学模型来近似描述这个序列。这个模型一旦被识别后就可以从时间序列的过去值及现在值来预测未来值。现代统计方法、计量经济模型在某种程度上已经能够帮助企业对未来进行预测。利用整合移动平均自回归模型，来尝试预测季节性平稳时间序列，我们得到结果如下图所示：

VAR 模型

VAR 模型，（Vector Autoregression model）向量自回归模型，是一种常用的计量经济模型，由计量经济学家和宏观经济学家 Christopher Sims 提出。它扩充了只能使用一个变量的自回归模型（简称：AR 模型），使容纳大于 1 个变量，因此经常用在多变量时间序列模型的分析上。

如果我们将相关的预测变量添加到我们的自回归模型中并移动到向量自回归模型，我们得到结果如下图所示：

深度回归模型

如果在数据上使用简单的深度回归模型，使用相同的输入，会得到更好的结果，如下图所示：

卷积神经网络

卷积神经网络（Convolutional Neural Network, CNN）是一种前馈神经网络，它的人工神经元可以响应一部分覆盖范围内的周围单元，对于大型图像处理有出色表现。

卷积神经网络由一个或多个卷积层和顶端的全连通层（对应经典的神经网络）组成，同时也包括关联权重和池化层（pooling layer）。这一结构使得卷积神经网络能够利用输入数据的二维结构。与其他深度学习结构相比，卷积神经网络在图像和语音识别方面能够给出更好的结果。这一模型也可以使用反向传播算法进行训练。相比较其他深度、前馈神经网络，卷积神经网络需要考量的参数更少，使之成为一种颇具吸引力的深度学习结构。

修改我的架构，使用卷积神经网络来解决同一个问题，得到结果如下图所示：

所得结果大为改善。但最好的结果还在后头。

长短期记忆网络

长短期记忆网络（Long Short-Term Memory， LSTM）是一种时间递归神经网络 (RNN)，论文首次发表于 1997 年。由于独特的设计结构，LSTM 适合于处理和预测时间序列中间隔和延迟非常长的重要事件。

LSTM 的表现通常比时间递归神经网络及隐马尔科夫模型（HMM）更好，比如用在不分段连续手写识别上。2009 年，用 LSTM 构建的人工神经网络模型赢得过 ICDAR 手写识别比赛冠军。LSTM 还普遍用于自主语音识别，2013 年运用 TIMIT 自然演讲数据库达成 17.7% 错误率的纪录。作为非线性模型，LSTM 可作为复杂的非线性单元用于构造更大型深度神经网络。

使用循环神经网络（RNN）的变种后，我得到结果如下所示：

因此，整体来说均方误差的趋势出乎意料。

投资组合构建

我们尝试使用深度学习解决的第二个金融问题是投资组合构建。在这个问题上，深度学习的实际应用效果很好。我的研究灵感来自这篇论文：《深度投资组合》（https://0x9.me/8uOBt）

这篇论文的作者尝试构建自动编码器，将时间序列映射到自身。使用这些自动编码器的预测误差成为股票测试版（与市场相关）的代用指标，自动编码器用作市场的模型。

自动编码器（auto-encoder），是一种无监督的学习算法，主要用于数据的降维或者特征的抽取，在深度学习中，自动编码器可用于在训练阶段开始前，确定权重矩阵 W 的初始值。基于上述自动编码器的误差选择不同的股票，我们可以使用另一个深度神经网络来构建深度指标，结果相当不错，如下图所示：

深度神经网络已成为利用股票复制指数的指数构建方法。

但这只是它的开始！如果我们应用智能索引，在我去掉指数的极端下降期，并在智能索引上训练我的指数映射深度神经网络时，我就能以惊人的速度超过指数！

这种技术在证券投资组合领域有着巨大的潜力！

结论

目前金融业的趋势是朝更复杂、更健全的的模式发展。随着大量数据科学家涌入该行业，对所有银行来说，技术是一个巨大的压力。像 RelTec、Worldquant 这样的对冲基金，在其交易中已经使用这种技术。由于这些复杂模型在其他领域所表现出的优异结果，以及在金融建模领域的巨大差距，将会有一系列的戏剧性的创新涌现！

更好地解决金融和贸易领域的关键问题，将会提高效率、提高透明度、加强风险管理和新的创新。

译者感言：

深度学习的一大优势在于可以大幅减少人工参与的特征工程去“拟合”训练数据，但这也不是说完全不需要人去参与特征的选取，尤其是金融市场，数据简直是海量，并且大都高噪声，非稳定，所以除非你能够清楚哪些数据具有潜在价值、如何做适当的预处理和如何转化并达成哪些目标，否则深度学习在金融领域是无法应用的。

如果设计得当，增加神经网络的深度可以对更复杂的模式进行映射，因此可对金融数据的训练产生更好效果。

例如 CNN 适合处理图像一类的大数据，不一定直接适用于金融数据。金融数据虽然也可以很大，但通常不在一个数量级上——一幅图像中的样本数（像素、颜色）很容易上百万，要训练一个模型又要用到成千上万个图像，为了找到高效办法提取特征，于是计算机科学家想出了卷积神经网络通过抽取特征值来简化运算复杂度。而我们处理的金融时间序列数据，单组样本的数量常在百万以下，规模上往往不需要卷积。进一步比较，相对于金融数据，图像识别的特点是数据量庞大、特征明显、特征重复次数多、特征组合性强、出现的次序性、特征呈现的方向性有时不强，这与金融数据噪音大、数量较小的特点有所不同。因此，在训练金融数据时很有必要设计有针对性的深度机器学习模型。

本文涉及到的代码可在作者的 GitHub Repo 中找到 https://0x9.me/P5ahd

原文地址：https://medium.com/towards-data-science/deep-learning-in-finance-9e088cb17c03

原文作者：Sonam Srivastava

译者：sambodhi ，编辑： Vincent

来源：微信公众号“AI前线（ ID：ai-front）”

本文来自网络或网友投稿，如有侵犯您的权益，请发邮件至：aisoutu@outlook.com 我们将第一时间删除。