知方号

知方号

基于LSTM、RNN及滑动窗口CNN模型的股票价格预测<股票预测算法分析方法>

基于LSTM、RNN及滑动窗口CNN模型的股票价格预测

  Abstract

原文:Stock price prediction using LSTM, RNN and CNN-sliding window model

股票市场或股票市场对当今经济产生深远影响。股价的上涨或者下跌对投资者的收益具有重要的决定作用。现有的预测方法使用线性(AR,MA,ARIMA)和非线性算法(ARCH,GARCH,神经网络),但它们侧重于使用每日结算预测单个公司的股票指数变动或价格预测 价钱。 所提出的方法是独立于模型的方法。 在这里,我们不是将数据拟合到特定模型,而是使用深度学习架构来识别数据中存在的潜在动态。 在这项工作中,我们使用三种不同的深度学习架构来预测NSE上市公司的价格,并比较它们的表现。 我们正在应用滑动窗口方法来短期预测未来值。最后使用百分比误差去量化模型的性能。

1.Introduction

预测问题可以定义为通过分析历史数据进行对未来事件的预测与分析。它涵盖了许多领域,包括工商业、经济学、环境科学和金融等。 预测问题可归类为

•短期预测(预测几秒,几分钟,几天,几周或几个月)

•中期预测(预测1至2年)

•长期预测(预测超过2年)

许多预测问题涉及时间分析。时间序列数据可以定义为所选变量的时间顺序的观察序列。 在我们的例子中,变量是股票价格。它可以是单变量或者多变量。 单变量数据仅包括一个特定的股票信息,而多变量数据包括不同时间的多个公司的股票价格。时间序列数据分析有助于识别数据中存在的模式、趋势或者周期。 在股票市场中,尽早的了解股票看涨或者看跌模式有助于明智地进行风险投资。此外,模式分析有助于确定在特定时期内表现最佳的公司。这使得时间序列分析和预测成为一个重要的研究领域。

现有的股票价格预测方法可分为以下几种[1]

•基本面分析

•技术分析

•时间序列预测

基本面分析是一种投资分析,通过分析其销售额、收益、利润和其他经济因素来估算公司的股票价值,此方法最适合做股票的长期预测。技术分析使用股票的历史价格来确定未来价格。 移动平均线是一种常用的技术分析算法。它可以被认为是过去n个数据点的未加权平均值。该方法适用于短期预测。第三种方法是分析时间序列数据。它基本上涉及两类算法,它们是

•线性模型

•非线性模型

不同的线性模型有AR、ARMA、ARIMA及其变体[2] [3] [4]。 这些模型使用一些预定义的方程来将数学模型拟合到单变量时间序列。这些模型的主要缺点是,它们不能解释数据中存在的潜在动态。由于他们只考虑单变量时间序列,因此这些模型不能识别各种股票之间的相互依赖关系。同时,为一个系列确定的模型也不适合另一个。 由于这些原因,不可能识别整个数据中存在的模式或动态。

非线性模型涉及ARCH,GARCH,[3] TAR,深度学习算法[5]等方法。在[6]中,对NIFTY 50中列出的29家选定公司的股票价格和库存量之间的依赖性进行了分析。 这项工作主要集中在深度学习算法在股票价格预测中的应用[7] [8]。 深度神经网络可以被认为是能够映射非线性函数的非线性函数逼近器。 基于应用类型,使用各种类型的深度神经网络架构。 这些包括多层感知器(MLP),递归神经网络(RNN),长期短期记忆(LSTM),CNN(卷积神经网络)等[9]。它们已经应用于图像处理,自然语言等各个领域。 处理,时间序列分析等。深度学习算法能够通过自学习过程识别数据中的隐藏模式和潜在动态。

在股票市场的情况下,产生的数据是巨大的并且是高度非线性的。 为了模拟这种动态数据,我们需要能够分析隐藏模式和潜在动态的模型。 深度学习算法能够通过自学习过程识别和利用数据中存在的交互和模式。 与其他算法不同,深度学习模型可以有效地模拟这些类型的数据,并且可以通过分析数据中的交互和隐藏模式来提供良好的预测。 在[5]中,我们可以看到各种深度学习模型在多变量时间序列分析中的应用。 [10]中介绍了使用神经网络模型对金融时间序列建模的第一次尝试。 这项工作试图模拟神经网络模型,以解码IBM资产价格变动的非线性规律。 然而,工作范围有限,但它有助于建立针对EMH的证据[11]。

使用NN模型的金融时间序列分析领域的研究使用不同的输入变量来预测股票收益。 在一些工作中,来自单个时间序列的数据被用作输入[10],[8]。 某些作品考虑了包含异构市场信息和宏观经济变量。 在[12]中,引入了金融时间序列分析和NLP的组合。 在[13]和[7]中,深度学习架构已被用于多元金融时间序列的建模。 在[14]中,已经实施了一个使用技术分析变量的NN模型来预测上海股市。 该工作比较了两种学习算法和两种权重初始化方法的性能。 结果表明,通过多重线性回归权重初始化的共轭梯度学习可以提高反向传播的效率。

1996年,[15]使用反向传播和RNN模型来预测五个不同股票市场的股票指数。在[16]中,引入了时间延迟,循环和概率神经网络模型的应用,用于每日股票预测。在[17]中,PSO和LS-SVM等机器学习算法的应用已被用于标准普尔500股票市场的预测。 [18]中介绍了遗传算法和神经网络模型的实现。该工作结合了遗传算法和人工神经网络在预测中的应用。在这项工作中,NN的权重是从遗传算法中获得的。然而,该模型的预测精度很低。在[19]中介绍了小波变换在预测中的应用。该工作使用小波变换来描述股票趋势中的短期特征。随着LSTM [20]的引入,对时间相关数据的分析变得更加有效。这些类型的网络具有保存过去信息的能力。它们已被用于股票价格预测[8],[7]。

该方法的重点是预测NSE(国家证券交易所)上市公司的股票价格。我们采用的方法是数据重叠的滑动窗口方法。 该数据集包含NSE上市公司的分钟数据。 在这里,我们试图获得用于预测目的的通用模型,其可以使用分钟数据作为输入。 这种建模在算法交易中具有应用,其中发生高频交易。

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至lizi9903@foxmail.com举报,一经查实,本站将立刻删除。