实施一个隐马尔可夫模型的预测在MATLAB环境下对大宗商品价格 下载本文

创造转移概率矩阵在a_ij = P(q_(t + 1)= S_j│q_t = S_i)1≤我,j≤N。在该模型中,概率保持离散。因此,除零的问题出现。为了解决这个问题,一个环代替了过渡的价值观与零。

创造发射概率矩阵。这些价值观被认为是正常的在均值和方差都源自矩阵M。

创建一个先验概率矩阵在离散概率矩阵M衍生。

默认情况下,开始HMM算法MATLAB国家1。指定一个不同的机率的分布、传递和发射矩阵的增量包括前矩阵。

产生一系列问“州和“O”观察”,功能hmmgenerate(长度,a,B)使用;在a和B代表过渡和发射矩阵分别Jaroslav)。

摘要利用数列的州和观察,hmmtrain(O,A,B)计算的最大似然估计的概率转换和观察的方式Baum-Welch算法给出初始过渡和发射矩阵(Jaroslav)。

预测未来国家及相关的价格,估计是随着矩阵使用现状。一个算法考察当前国家然后搜索通过矩阵的最大似然,找到下一个状态。一经确定,未来的状态和相关的价格是储存在矩阵,仍然不受backtesting过程。换句话说,它不更新随着矩阵转换和排放过程中。

重覆执行步骤第4至11 backtesting,直到所有的数据都有一个相关的预测状态和价格。

进行了较为深入的综述见附件。 隐马尔可夫模型(HMM)

基于隐马尔可夫链的证券价格模型及实证分析 4。数据分析和结果

探讨HMM模型的性能,预测产生的玉米现货价格在20天的时期。最初的训练的日子开始每日价格包括2005年1月和2011年9月结束。这一时期是由于委托书选择玉米乙醇,开始于2005年。自2005年以来,40%的玉米生产乙醇的需求被火烧尽,这导致了一场激烈的价格上涨,导致价格进入了一个新的制度。应该指出的是,所有的数据都聚集通过DataStream时期一直预测最小由于计算能力的限制。

对玉米价格,一步或“桶”大小。005年是使用。这是由于价格的half-cent报道发生在商品市场。也是一个最大价格为$ 8和最低价格为1.50美元的被选出来训练数据集。这确保了所有过去的数据将被包围。 4.1性能指标

几个性能指标应用于该研究中。第一,平均绝对偏差和标准差为预测和实际价格计算。第二,在预测精度的方向确定价格的变动,并记录作为一个百分比值。 4.2结果

超过20天的backtesting期间,HMM模型的平均绝对偏差结果了0.149美元和0.117美元的标准偏差预测价格。该模型也能预测33%的期间的价格变动的时期。如果这些结果来确定任何有价值的一个商人或研究员,一个随机游动模型被创造的结果进行了比较。在该模型的价格变动所预测的使用比前一日的价格为当前日期的价格。从该方法预测有所发

生病变。随机游动的平均绝对偏差为$ 0.100,标准偏差为0.098美元。当随机漫步方法降低了预测误差,进行了two-sample意味着假设检验确定是否存在明显差距。测试统计值会来自t =((X_1)-(X_2))/√(S_1 ^ 2)/ n_1 +(S_2 ^ 2)/甲烷),X_1represents HMM偏差和X_2代表随机游动的偏差。自由的程度可以计算

自由度=(S_1 ^ 2)/ n_1 +(S_2 ^ 2)/甲烷)^ 2(1 /(n_1-1)*(S_1 ^ 2)/ n_1)^ 2 + 1 /(n_2-1)*(S_2 ^ 2)/甲烷)^ 2)。

通过采用事先计算,结果为0.1597 p-value小动物——一张长有测试(Wackerly)。这个测试显然无法拒绝原假设。因此,没有足够的证据来支持一个显著区别两个平均偏差。 4.3时,考虑的问题

由于该模型检验的唯一的价格,赢得了广大数据点的火车在模型无关的backtesting时期。基于这一原理,它会更相关训练只可能有一个影响价格的预测未来价格。因此,一个政权转换模型可以被纳入嗯,因此只有相关数据是用来训练。这也会降低整体计算使潜在的高阶过程才能进行。另一个问题可能会出现在桶大小。利用最小的尺寸。005年,overfitting可能发生导致模型的失败。为解决这类问题,需要进行更进一步的研究以选择最佳尺寸。 5.0的交易策略

只要有一个缺少统计学意义之间的随机游动模型,嗯,一个交易策略是为了确定模型还提供价值。在设计一种策略,一个HMM过程的问题必须

得到处理。在训练数据,如果一个国家尚未被观察到,过渡预测是国家依然是相同的。即它表现相同的随机游动模型。这是关联的,因为一个医生不想贸易对不谙内情的揣测的信息。因此,一个逻辑过滤器用来决定模型预测一个静止不动的状态。这主要表现在:1 stationarity发生或0它不发生。

如果先前的过滤器是满意,于是几个标准必须见过一个贸易起步。首先,计算预测必须为所有回报的地方backtested时期上次过滤是令人满意的。这些回报进一步相比,所设定的要求回报用户。为我们的测试,所要求的回报是1%,这将是一个相当大的获得日常的价格。最后一步必须比较前一天的价格预期为了确定的价格购买或出售的行动。这些价值观是一个矩阵,然后储存在summated确定的总利润的交易策略。 backtesting超过20天期间,发起对交易策略等五大行业完全丧失为0.265美元。这不是惊人的考虑的模型预测价格方向正确的33%的时间。一种视觉表现的价格走势的预测,误差,并可以看到交易分以下。 6.0结论

本文采用离散时间序列隐马尔可夫模型,试图预测玉米现货价格。backtesting在韩国期间,模型结果了0.149美元的平均绝对偏差、标准偏差0.117美元的价格在预测。此外,模型预测正确的价格运动的33%的时间。然而,一个随机游走模型构建了平均绝对偏差,0.100美元和标准偏差为0.098美元。当随机游动模型出现更好的,一个缺乏研究结果

之间的统计意义的随机漫步,嗯模型。最后一步是确定执行交易策略的价值模型HMM。经过一系列的过滤器,策略导致了0.265美元的损失。 而模型并没有产生有利的结果,提出了几个改进未来的研究方向。首先,如前所述,程序应该产生一种最佳的大小确定桶来防止overfitting模型。第二,该模型只需要包括防止有关价格计算滞后。这个过程可以通过一个regime-switching实现算法。第三,高阶方法可以被加到一个哦。由包括美国的概率高于和低于目前的状态,这一预测可能导致更多的信息。相似的桶尺寸标准,一种最佳的数量的邻国之间需要被选上。第四,提高交易策略,布尔滤可以改善需要最少的以往的观察。例如,一个贸易将不会发生,如果一个国家没有被观察到三次。这将使战略贸易对消息灵通的预测。只有总之,第一次尝试用一个HMM来预测会出现轻微的商品价格提供有益的结果,值得进行深入的研究。 参考

Jaroslav Lajos,k . m .乔治:公园。2011。嗯,一个六个状态标准普尔500股票指数。俄克拉何马州立大学数学科学。218年。Stillwater,好吧。

张国煊。1990 .劳伦斯r .讲解隐马尔可夫模型应用于语音识别和选择。阅读在语音识别,亚历克斯Waibel和李开复(Eds)。摩根公司面临出版商、旧金山、钙、美国267 - 296。