实施一个隐马尔可夫模型的预测在MATLAB环境下对大宗商品价格 下载本文

利用主成分分析法对流动性统一度量的研究

中国股票市场收益、波动性与投资者情绪的实证研究

基于高频数据的中国证券市场特征研究

实施一个隐马尔可夫模型的预测在MATLAB环境下对大宗商品价格 2011年报告 准备: 泰勒Sauder 培育大学企业管理 布拉德利大学

报告分布于2011年12月7日 文摘

隐马尔可夫模型建模提供了一个途径,通过动态系统观测时序。本文提出一种的概述,提出了隐马尔可夫模型,其次是教程在MATLAB来实现一个模型。为了说明应用该模型,用来预测技术是大宗商品价格。除了预言,交易策略来确定整个生产利润/亏损在backtesting时期。 1。介绍

分析和预测金融时间序列的重要性是为专家和学者)金融领域的。利用离散时间序列的概念,一个隐马尔可夫模型(HMM)技术应用到模型的动态特性的大宗商品价格。首先,一套历史数据被用来初始化和火车的哦。其次,训练有素HMM模型被用来预测未来的商品价格在选定的返回检验时期。最后确定模型的准确性和价值,一个随机游动模型将对比产生HMM和交易策略将实施返回检验时期。

第二部分介绍了隐马尔可夫模型过程一般上下文。第2.1节提供了一个正式的、数学解释模型;2.2节描述所发生的矛盾提供了良好的在HMM的解决方案。第3章深入总结HMM方法,使用MATLAB建模商品价格。第四章描述了数据分析和一般投入的模型。几个性能指标显示在4.1节所遵循的结果在4.2节。在总结结果第4.3节要求注意几个问题的建模过程。利用HMM的输出,被创建和执行交易策略在第五部分。最后,总结了研究成果和未来的讨论提供第6部分。 2。隐马尔可夫模型综述

过程的工作经常被视作信号,这来自任何一个或多个来源。这些信号可以定期或不定期参数,也可能会破坏的时候。因此,数学信号模型可以用来处理信号,希望获得统计过程描述的来源。第一个导致马尔可夫链理论,可以进一步地推广到隐马尔可夫模型。李奥纳德大肠食物链造成一连串的影响和几个同事2第一次出版的理论在1960年代。在1989年,劳伦斯张国煊发表了他在2教程,这说明该理论的在一个更普遍的上下文(劳伦斯)。这容易理解使用2推进跨越几个的研究领域包括语音识别,

语音分析、视频分析、照片分析,和生物。虽然大多数研究是金融领域的应用之外,它经常处理时间序列分析,因此不需要努力的过渡。 2.1正式的定义

而非齐次马尔可夫过程模型是一个随机过程,它所观察到的,而不是描述或预测过程中,生成的观察。在这里的重要性在于隐马尔可夫模型。HMM记录观察国家作为概率函数,在源被描述为一个隐藏的随机过程。 嗯的特征主要由以下五个特点:

N隐状态的数量模型里面。每个州对应一个独特的国家所提供的模型。在模拟试验中,美国被定义为价格桶。

独特的观测量的米每状态。这些符号是作为属性,v_2 V = { v_1…,专家。,v〗_M }。这可以被认为方面的研究很多,每一个价格下跌桶。 一个状态转移概率分布在a_ij = { a_ij } = P(q_(t + 1)= S_j│q_t = S_i)1≤我,j≤N

发射概率分布在国家j,B = { b_j(k)}的地方 b_j = P(v_k在t = S_j│q_t)1≤j≤N、1≤k≤

先验概率的π_i = {π_i }被国家我当初的观测在π_i = P(q_1 = S_i)1≤我≤N。

N的价值观,M,A,B,”和“π可以用来生成观察序列

啊…= O_1 O_3 O_T成分在一个观测O_tis V,T是在序列号码的观察(Md、股票)。发起一个HMM,一个初始的状态会被选择基于先验分布、

tπ被设置为1。O_t = v_k选择S_i根据分布。该模型移动到国家q_(t + 1)= S_j基于转移概率分布的S_i。这个程序会继续增加t或直到终止。更正式的,在这个过程中,通过引入λ=(A,B,π)地点:∑_j专家?a_ij = 1,?b_i∑_t专家(O_t)= 1,?∑专家对π_i = 1〗,〗〗a_ij,b_i(O_t),π_i≥0”“我,j,t 嗯基本问题2.2

有三个基本问题必须解决关于2之前,嗯都可以使用。 给λ=(A,B,π如何P(O│λ)为每一个观察序列计算吗?

一个国家如何问= q_1 q_2…序列。q_T入选观察序列模型和λ啊? 我们如何最大化P(O│λ)通过调整模型参数A、B”和“π吗?

第一个问题的解决方案可以解决一个直截了当的方式,但计算量太笨重,一个更有效率的过程必须找到(劳伦斯)。因此,Forward-Backward算法(FB)使用。弗拉维奥-布里亚托利使用诱导的创造两套概率,向前和向后。总之,这些是用来创建一个平滑的所有值的集合。在这一特定的情况下,只有向前的概率被用于创建∝_T(i)= P(O_1…O_T成分,q_T = S_i│λ),P(O│λ)之和_T∝’s ^(我)”和“α_1(i)=π_i b_i(O_1)\为\我≤1≤N。

第二个问题的答案用Viterbi算法。Viterbi常用的,因为它考虑到最可能在任何时刻,国家发生的概率在序列的状况。该算法将找到的麦克斯问对一个给定的观察序列,利用阿感应。一个数组ψ_t(j)是用来存储最高的概率路径(劳伦斯)。

第三个问题可以回答或者通过一个Baum-Welch方

法,Expectation-Modification法或梯度技术。张国煊声称,“没有已知的方法分析解决的最大概率模型,观察到的序列。事实上,鉴于观察序列作为训练数据有限,没有最优的模型参数的估计和”(劳伦斯)。Baum-Welch的方法可以用来选择λ=(A,B,π),P(O│λ)是一个问题,利用局部最大化的过程。方法采用的Baum-Welch向前向后算法模型的创建一个re-estimationλ=(,B,π)。利用λ代替λ,概率的O被观察到的模型能提高一些观点。这可以被定义为马克斯┬λ?专家问(λ,λ)〗= P(O│λ)≥P(O│λ)的似然函数收敛到一个临界点(劳伦斯)。 3。在MATLAB环境下实现HMM

实现HMM的过程,用MATLAB提供各种算法在统计工具箱包裹。总结了实现下述12步骤。

选择一个数据集模型,把它引入到结构型式。

选择一个时间的框架模型和训练期间backtest结束。这就要求数据集的知识并可能受计算的能力。注:每个阶段的整个过程backtesting需要重复。

高、低价格确定窗户和桶子尺寸观察价格。例如,一桶1.00美元的大小与windows - 5美元,5美元将创造桶:5:4、4号;3号和…。,1:0,0:1,…。,4、4:5。 观测系统状态矩阵计算每米。