MBA统计学15时间序列分析mot.pptx
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_05.gif)
《MBA统计学15时间序列分析mot.pptx》由会员分享,可在线阅读,更多相关《MBA统计学15时间序列分析mot.pptx(74页珍藏版)》请在得力文库 - 分享文档赚钱的网站上搜索。
1、统计学从数据到结论第十五章 时间序列分析时间序列分析 横截面数据时间序列数据横截面数据时间序列数据l人们对统计数据往往可以根据其特人们对统计数据往往可以根据其特点从两个方面来切入,以简化分析点从两个方面来切入,以简化分析过程。过程。l一个是研究所谓横截面一个是研究所谓横截面(cross section)数据,也就是对大体上同数据,也就是对大体上同时,或者和时间无关的不同对象的时,或者和时间无关的不同对象的观测值组成的数据。观测值组成的数据。横截面数据时间序列数据横截面数据时间序列数据l另一个称为时间序列另一个称为时间序列(time series),也就是由对象在不同时间的观测,也就是由对象在不
2、同时间的观测值形成的数据。值形成的数据。l前面讨论的模型多是和横截面数据前面讨论的模型多是和横截面数据有关。这里将讨论时间序列的分析。有关。这里将讨论时间序列的分析。我们将不讨论更加复杂的包含这两我们将不讨论更加复杂的包含这两方面的数据。方面的数据。时间序列和回归时间序列和回归l时间序列分析也是一种回归。时间序列分析也是一种回归。l回回归归分分析析的的目目的的是是建建立立因因变变量量和和自自变变量量之之间间关关系系的的模模型型;并并且且可可以以用用自自变变量量来来对对因因变变量量进进行行预预测测。通通常常线线性性回回归归分分析析因因变变量量的的观观测测值值假假定定是互相独立并且有同样分布。是互
3、相独立并且有同样分布。时间序列和回归时间序列和回归l而而时时间间序序列列的的最最大大特特点点是是观观测测值值并并不不独独立立。时时间间序序列列的的一一个个目目的的是是用用变变量量过过去去的的观观测测值值来来预预测测同同一一变变量量的未来值。的未来值。l即即时时间间序序列列的的因因变变量量为为变变量量未未来来的的可可能能值值,而而用用来来预预测测的的自自变变量量中中就就包含该变量的一系列历史观测值。包含该变量的一系列历史观测值。l当当然然时时间间序序列列的的自自变变量量也也可可能能包包含含随着时间度量的独立变量。随着时间度量的独立变量。例例tssales.txtl下下面面看看一一个个时时间间序序
4、列列的的数数据据例例子子。这这是是某某企企业业从从1990年年1月月到到2002年年12月月的销售数据的销售数据(tssales.txt)。l我我们们希希望望能能够够从从这这个个数数据据找找出出一一些些规规律律,并并且且建建立立可可以以对对未未来来的的销销售售额额进进行预测的时间序列模型。行预测的时间序列模型。从该表格中的众多的数据只能够看出个大概;从该表格中的众多的数据只能够看出个大概;即总的趋势是增长,但有起伏。即总的趋势是增长,但有起伏。例例tssales.txtl利用点图则可以得到对该数据更加直观的印象:利用点图则可以得到对该数据更加直观的印象:某企业从某企业从1990年年1月到月到2
5、002年年12月的销售数据图(单位:百万元)月的销售数据图(单位:百万元)例例tssales.txtl从从这这个个点点图图可可以以看看出出。总总的的趋趋势势是是增增长长的的,但但增增长长并并不不是是单单调调上上升升的的;有有涨涨有有落落。但但这这种种升升降降不不是是杂杂乱乱无无章章的的,和和季季节节或或月月份份的的周周期期有有关关系系。当当然然,除除了了增增长长的的趋趋势势和和季季节节影影响响之之外外,还还有有些些无无规律的随机因素的作用。规律的随机因素的作用。SPSS的的实现实现:时间序列数据的产生时间序列数据的产生lSPSS并不会自动把某些变量看成带有某些并不会自动把某些变量看成带有某些周
6、期的时间序列;需要对该变量的观测值周期的时间序列;需要对该变量的观测值附加上时间因素。附加上时间因素。l例数据例数据tasales.sav原本只有一个变量原本只有一个变量sales。这样就需要附加带有周期信息的时间。这样就需要附加带有周期信息的时间。l方法是通过选项方法是通过选项DataDefine Dates,l然后在然后在Cases Are选择选择years,months(年年月月),l并指定第一个观测值(并指定第一个观测值(First Case Is)是)是1990年年1月。月。SPSS的的实现实现:时间序列数据的点图时间序列数据的点图l对时间序列点图可以选择对时间序列点图可以选择Gra
7、phsSequence,对,对本例选择本例选择sales为变量,为变量,months为时间轴的标记为时间轴的标记即可。即可。15.1 15.1 时间序列的组成部分时间序列的组成部分 l从从该该例例可可以以看看出出,该该时时间间序序列列可可以以有有三三部部分分组组成成:趋趋势势(trend)、季季节节(seasonal)成成分分和和无无法法用用趋趋势势和和季季节节模模式式解解释释的的随随机机干干扰扰(disturbance)。)。l例例中中数数据据的的销销售售就就就就可可以以用用这这三三个个成成分分叠叠加而成的模型来描述。加而成的模型来描述。l一一般般的的时时间间序序列列还还可可能能有有循循环环
8、或或波波动动(Cyclic,or fluctuations)成成分分;循循环环模模式式和和有有规规律律的的季季节节模模式式不不同同,周周期期长长短短不不一一定定固固定定。比比如如经经济济危危机机周周期期,金金融融危危机机周周期等等。期等等。时间序列的组成部分时间序列的组成部分 l一一个个时时间间序序列列可可能能有有趋趋势势、季季节节、循循环环这这三三个个成成分分中中的的某某些些或或全全部部再再加上随机成分。因此,加上随机成分。因此,l如如果果要要想想对对一一个个时时间间序序列列本本身身进进行行较较深深入入的的研研究究,把把序序列列的的这这些些成成分分分分解解出出来来、或或者者把把它它们们过过虑
9、虑掉掉则则会会有很大的帮助。有很大的帮助。时间序列的组成部分时间序列的组成部分 l如如果果要要进进行行预预测测,则则最最好好把把模模型型中中的的与与趋趋势势、季季节节、循循环环等等成成分分有有关关的参数估计出来。的参数估计出来。l就就例例中中的的时时间间序序列列的的分分解解,通通过过计计算算机机统统计计软软件件,可可以以很很轻轻而而易易举举地地得得到到该该序序列列的的趋趋势势、季季节节和和误误差差成成分。分。时间序列的组成部分时间序列的组成部分 l下图表示了去掉季节成分,只有趋势和误差成分的序列。下图表示了去掉季节成分,只有趋势和误差成分的序列。时间序列的组成部分时间序列的组成部分 l下图用两
10、条曲线分别描绘了趋势成分和季节成分。下图用两条曲线分别描绘了趋势成分和季节成分。时间序列的组成部分时间序列的组成部分 l下图用两条曲线分别描绘了趋势成分和误差成分。下图用两条曲线分别描绘了趋势成分和误差成分。SPSS的的实现实现:时间序列的分解时间序列的分解l前面前面对例对例tssales.sav数据进行分解利用数据进行分解利用SPSS的的选项选项Analyze-Time Series-Seasonal Decomposition,l然后在然后在Variable(s)(变量变量)处选择处选择sales,l在在Model选择选择Additive(可加模型,也可以试可可加模型,也可以试可乘模型乘模
11、型Multiplicative),l最后得到四个附加变量,它们是:最后得到四个附加变量,它们是:l误差(误差(err_1)、)、l季节调整后的序列(季节调整后的序列(sas_1)、)、l季节因素(季节因素(saf_1)l去掉季节后的趋势循环因素(去掉季节后的趋势循环因素(stc_1)。)。l前面图都是利用前面图都是利用GraphsSequence选项所做。选项所做。l注意附加变量的名字根据前面已经得到过的附加变量数注意附加变量的名字根据前面已经得到过的附加变量数目而调整目而调整(按照性质及顺序按照性质及顺序)15.2 15.2 指数平滑指数平滑 l如如果果不不仅仅满满足足于于分分解解现现有有的
12、的时时间间序序列列,而而想想要要对对未未来来进进行行预预测测,就就需需要要建建立立模模型型。这这里里先先介介绍绍比比较较简简单单的的指指数数平平滑滑(exponential smoothing)。l指指数数平平滑滑只只能能用用于于纯纯粹粹时时间间序序列列的的情情况况,而而不不能能用用于于含含有有独独立立变变量量时时间间序序列的因果关系的研究。列的因果关系的研究。15.2 15.2 指数平滑指数平滑 l指指数数平平滑滑的的原原理理为为:当当利利用用过过去去观观测测值值的的加加权权平平均均来来预预测测未未来来的的观观测测值值时时(这这个个过过程程称称为为平平滑滑),离离得得越越近近的的观测值要给以
13、更多的权。观测值要给以更多的权。l而而“指指数数”意意味味着着:依依已已有有观观测测值值“老老”的程度,其权数按指数速度递减。的程度,其权数按指数速度递减。l以以简简单单的的没没有有趋趋势势和和没没有有季季节节成成分分的的纯纯粹粹时时间间序序列列为为例例,指指数数平平滑滑在在数数学学上是一个几何级数。上是一个几何级数。指数平滑指数平滑 l这这时时,如如果果用用Yt表表示示在在t时时间间的的平平滑滑后后的的数数据据(或或预预测测值值),而而用用X1,X2,Xt表表示示原始的时间序列。那么指数平滑模型为原始的时间序列。那么指数平滑模型为 或者,等价地,或者,等价地,这里的系数为几何级数。因此称之为
14、这里的系数为几何级数。因此称之为“几何几何平滑平滑”比使人不解的比使人不解的“指数平滑指数平滑”似乎更有似乎更有道理。道理。指数平滑指数平滑 l自自然然,这这种种在在简简单单情情况况下下导导出出的的公公式式(如如上上面面的的公公式式)无无法法应应对对具具有有各种成分的复杂情况。各种成分的复杂情况。l后后面面将将给给出出各各种种实实用用的的指指数数平平滑滑模模型的公式。型的公式。l根根据据数数据据,可可以以得得到到这这些些模模型型参参数数的估计以及对未来的预测。的估计以及对未来的预测。指数平滑指数平滑 l在在和和我我们们例例子子有有关关的的指指数数平平滑滑模模型型中中,需需要要估估计计1212个
15、个季季节节指指标标和和三三个个参参数数(包包含含前前面面公公式式权权重重中中的的a a,和和趋趋势势有有关的关的g g,以及和季节指标有关的,以及和季节指标有关的d d)。)。l在在简简单单的的选选项项之之后后,SPSSSPSS通通过过指指数数平平滑滑产产生生了了对对20032003年年一一年年的的预预测测。下下图图为为原原始始的的时时间间序序列列和和预预测测的的时时间间序序列列(光光滑滑后后的的),其其中中包包括括对对20032003年年1212个月的预测。图下面为误差。个月的预测。图下面为误差。我们例中时间序列数据的指数平滑和对未来的预测我们例中时间序列数据的指数平滑和对未来的预测 SPS
16、S的的实现实现:指数平滑指数平滑:tssales.sav数据数据l用选项用选项AnalyzeTime SeriesExponential Smoothing,然后在,然后在Variable(s)(变量变量)处选择处选择sales,在在Model选择选择custom(自选模型自选模型),再点,再点Custom之后之后再在再在Trend Component选选Exponential(这主要是因为这主要是因为看到序列原始点图趋势不象直线看到序列原始点图趋势不象直线,其实选其实选Linear也差不也差不多多;此外还有此外还有Damped(减幅减幅)选项选项)l在在Seasonal Component选
17、选Additive(这是可加模型,这是可加模型,也可以试选可乘模型:也可以试选可乘模型:Multiplicative,细节可参看公,细节可参看公式式)lContinue之后,再点击之后,再点击Parameters来估计参数,在三来估计参数,在三个有关参数选项上:个有关参数选项上:General(Alpha)、Trend(Gamma)和和Seasonal(Delta)可均选可均选Grid Search(搜寻,这是因为不知道参数是多少合适,参(搜寻,这是因为不知道参数是多少合适,参数意义参见后面公式),然后数意义参见后面公式),然后Continue。最后如果要。最后如果要预测新观测值,在主对话框点
18、击预测新观测值,在主对话框点击Save,在,在Predict Cases中选择中选择Predict through下面的截止年月(这里下面的截止年月(这里选了选了2003年年12月)。这样就可以得到各种结果了。月)。这样就可以得到各种结果了。SPSS的的实现实现:指数平滑指数平滑l结果中增加的变量有误差结果中增加的变量有误差(err_1)和拟合(预测)和拟合(预测)值值fit_1。这在前面图中绘。这在前面图中绘出。在出。在SPSS输出文件中输出文件中还有那些估计的参数值还有那些估计的参数值(三个参数加上季节因子)(三个参数加上季节因子)。15.3 Box-Jenkins 方法方法:ARIMA模
19、型模型 l如如果果要要对对比比较较复复杂杂的的纯纯粹粹时时间间序序列列进进行行细细致致的的分分析析,指指数数平平滑滑往往往往是是无无法法满足要求的。满足要求的。l而而若若想想对对有有独独立立变变量量的的时时间间序序列列进进行行预测,指数平滑更是无能为力。预测,指数平滑更是无能为力。l需需要要更更加加强强有有力力的的模模型型。这这就就是是下下面面要介绍的要介绍的Box-Jenkins ARIMA模型。模型。l数数学学上上,指指数数平平滑滑仅仅仅仅是是ARIMA模模型型的特例。的特例。ARIMA模型模型:AR模型模型l比比指指数数平平滑滑要要有有用用和和精精细细得得多多的的模模型型是是Box-Je
20、nkins引引入入的的ARIMA模模型型。或或称称为为整整合合自自回回归归移移动动平平均均模模型型(ARIMA 为为Autoregressive Integrated Moving Average一一些些关关键字母的缩写键字母的缩写)。l该该模模型型的的基基础础是是自自回回归归和和移移动动平平均均模模型型 或或 ARMA(Autoregressive and Moving Average)模型。模型。ARIMA模型模型:AR模型模型lARMA由由两两个个特特殊殊模模型型发发展展而而成成,一一个个是是自自回回归归模模型型或或AR(Autoregressive)模模型型。假假定定时时间间序序列列用
21、用X1,X2,Xt表表示示,则则一一个个纯纯粹粹的的AR(p)模模型型意意味味着着变变量量的的一一个个观观测测值值由由其其以以前前的的p个个观观测测值值的的线线性性组组合合加加上上随随机机误误差差项项at(该该误误差差为为独独立无关的)而得:立无关的)而得:这看上去象自己对自己回归一样,所以称为自回归这看上去象自己对自己回归一样,所以称为自回归模型;它牵涉到过去模型;它牵涉到过去p个观测值(相关的观测值间个观测值(相关的观测值间隔最多为隔最多为p个个.ARIMA模型模型:MA模型模型lARMA模模型型的的另另一一个个特特例例为为移移动动平平均均模模型型或或MA(Moving Average)模
22、模型型,一一个个纯纯粹粹的的MA(q)模模型型意意味味着着变变量量的的一一个个观观测测值值由由目前的和先前的目前的和先前的q个随机误差的线性的组合:个随机误差的线性的组合:由于右边系数的和不为由于右边系数的和不为1(q q 甚至不一定是正甚至不一定是正数),因此叫做数),因此叫做“移动平均移动平均”不如叫做不如叫做“移移动线性组合动线性组合”更确切;虽然行家已经习惯于更确切;虽然行家已经习惯于叫叫“平均平均”了,但初学者还是因此可能和初了,但初学者还是因此可能和初等平滑方法中的什么等平滑方法中的什么“三点平均三点平均”之类的术之类的术语混淆。语混淆。ARIMA模型模型:ARMA模型模型l显显然
23、然,ARMA(p,q)模模型型应应该该为为AR(p)模模型和型和MA(q)模型的组合了:模型的组合了:ARMA(p,0)模型就是模型就是AR(p)模型,而模型,而ARMA(0,q)模型就是模型就是MA(q)模型。这个模型。这个一般模型有一般模型有p+q个参数要估计,看起来很个参数要估计,看起来很繁琐,但利用计算机软件则是常规运算;繁琐,但利用计算机软件则是常规运算;并不复杂。并不复杂。ARIMA模型:平稳性和可逆性模型:平稳性和可逆性l但但是是要要想想ARMA(p,q)模模型型有有意意义义则则要要求求时时间间序序列列满满足足平平稳稳性性(stationarity)和和可可逆逆性性(invert
24、ibility)的条件,的条件,l这这意意味味着着序序列列均均值值不不随随着着时时间间增增加加或或减减少少,序序列列的的方方差差不不随随时时间间变变化化,另另外外序序列列本本身身相相关的模式不改变等。关的模式不改变等。l一一个个实实际际的的时时间间序序列列是是否否满满足足这这些些条条件件是是无无法法在在数数学学上上验验证证的的,但但模模型型可可以以近近似似地地从从后后面面要要介介绍绍的的时时间间序序列列的的自自相相关关函函数数和和偏偏相相关关函数图来识别。函数图来识别。ARIMA模型:差分模型:差分l一一般般人人们们所所关关注注的的的的有有趋趋势势和和季季节节/循循环环成成分分的的时时间间序序
25、列列都都不不是是平平稳稳的的。这这时时就就需需要要对对时时间间序序列列进进行行差差分分(difference)来来消消除除这这些些使使序序列列不不平平稳稳的的成成分分,而而使使其其变变成成平平稳的时间序列,并估计稳的时间序列,并估计ARMA模型,模型,l估估计计之之后后再再转转变变该该模模型型,使使之之适适应应于于差差分分之之前前的的序序列列(这这个个过过程程和和差差分分相相反反,所所以以称称为为整整合合的的(integrated)ARMA模模型型),得得到的模型于是称为到的模型于是称为ARIMA模型。模型。ARIMA模型:差分模型:差分l差差分分是是什什么么意意思思呢呢?差差分分可可以以是是
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- MBA 统计学 15 时间 序列 分析 mot
![提示](https://www.deliwenku.com/images/bang_tan.gif)
限制150内