海归讲授博士高级计量经济学.doc
《海归讲授博士高级计量经济学.doc》由会员分享,可在线阅读,更多相关《海归讲授博士高级计量经济学.doc(83页珍藏版)》请在得力文库 - 分享文档赚钱的网站上搜索。
1、【精品文档】如有侵权,请联系网站删除,仅供学习与交流海归讲授博士高级计量经济学.精品文档.2009级博士高级计量经济学学习指南第一部分 条件期望与条件方差第二部分 古典假设与最小二乘第三部分 最小二乘的有限样本第四部分 最小二乘的大样本性质第五部分 非球型扰动与广义回归模型第六部分 异方差与自相关第七部分 工具变量和两阶段最小二乘第八部分 广义矩估计第九部分 极大似然估计第十部分 检验与推断(Wald检验、LM检验和LR检验)第十一部分 模型的设定和检验(第十二部分 上机操作)第一部分 条件期望与条件方差在正式进入计量经济学的学习之前,需要对条件期望以及条件方差熟练掌握,它们将在以后的学习中经
2、常遇到。一、条件期望1、条件均值的定义条件均值的定义为:应当指出的是,条件期望是谁的函数。 2、条件均值的性质条件均值有几个简单而有用的性质:(1)迭代期望律 ( Law of Iterated expectations, LIE)条件期望的条件期望等于无条件期望。,其中,记号表示关于x值的期望。Interpretation: the expectation of Y can be calculated by first conditioning on X, finding E(Y |X) and then averaging this quantity with over X.Proof:离
3、散情形:We need to show: Where .We haveContinuous Case:,and Q.E.D.迭代期望律的一般表述方式其中,是的子集,为非随机函数。语义:若已知的结论,我们也就知道的结论。记: 则:Proof 需要较多的测度论的知识,这里只是加以说明证明的思路。 中,的信息多于。因此,当时,运用的信息,也可描述。例如,和分别为天平的砝码,为1克的集合,为5克的集合,因此,有。当我们用的信息描述时,也可以用的信息加以描述。 特例: 另外,也成立。(2)(3) (4)更为一般的情形:设,为的标量函数,为随机变量,那么:(5),表示时刻的信息集。(6)对于任何二元变量的
4、分布,证明:从这个公式中,我们需要理解线性回归中的两个古典假设:由此,零均值假定(在给定的条件下,的条件均值为零)(强外生),与随机扰动项与解释变量不相关的假定(弱外生),这将在以后的学习中经常提及。(7)若定义,在假设和条件下,有。其中,为任意函数。特殊情形,。证明:又 3、条件方差的定义条件方差的定义为:它的简化公式为:可认为是:分组条件下的集中程度的度量,或者,分组条件下的差异程度的度量。同理,条件期望为总体分组条件下的分门别类地求期望(学校教师的平均年龄=各院系教师平均年龄的平均)。(1) 证明:(作业?)(2)一个重要的方差分解定理:在一个联合分布中有, 它表示,在一个二元分布中,y
5、的方差可分解为条件均值函数的方差加上条件方差的期望。将此式变形即可得到:它表示从平均意义上看,在条件约束下,条件化减少了变量的方差。我们有清楚的结论:y的条件方差不大于y的无条件方差。证明(3)证明:利用性质:,则:小结: 1、方差分解定理可以表述为: 它表示,在一个二元分布中,y的方差可分解为条件均值函数的方差加上条件方差的期望。在方差分解定理的公式中,是的方差,也就是回归式中的总离差平方和TSS。条件均值的方差是回归式中的回归平方和ESS;条件方差的期望是回归的残差平方和RSS。 (注意总体与样本的区别)2、依据方差分解定理,可以构造R2统计量:3、对方差分解定理进行简单的扩展,得到如下的
6、表达式:两边取期望,由迭代期望定理得到:由于回归方程的总离差平方和TSS是不变的,因此,上式说明,在回归式中增加新的变量会使得可决系数增大。第二部分 古典假设与最小二乘一、背景本部分开始我们正式进入计量经济学的学习。在计量经济学中,我们考察经济变量之间的相互关系,最基本的方法是回归分析。回归分析是计量经济学的主要工具,也是计量经济学理论和方法的主要内容。本部分从多元回归模型入手,对古典假设进行复习,然后就最小二乘估计法的算法、双残差回归和模型拟合优度的一些问题进行探讨。二、知识要点1、回归模型2、古典假设3、最小二乘法4、双残差回归5、方差分解和拟合优度参考章节:Chapter2,Chapte
7、r 3三、要点细纲1、回归模型一般的,我们可以将回归模型写为条件期望和条件异方差的和,即:。对于的讨论构成条件异方差自回归模型,我们这里仅考虑当条件方差为常数1时的情形,即:。当取不同的形式时,也就构成了不同的模型,包括:线性、非线性和非参数等。我们这里主要讨论的是线性模型(一元或多元):,则总体回归方程可表示为:。其中:表示样本数量,表示解释变量个数(包含了常数项),当时就是一元线性回归模型。而表示的是随机扰动项,包含了除了解释变量以外的其他影响因素。若遗漏变量,则这个变量也将被扰动项所包含。这里有个回归和投影的概念,简单的说回归是相对总体而言,而投影是相对样本而言,线性投影总是存在的,而且
8、是唯一的。2、古典假设在初级计量经济学中,我们可以看到对于回归模型的假设条件包括:(1)零均值,即;(2)同方差与无自相关假定,即随机扰动项的方差;(3)随机扰动项与解释变量不相关,即;(4)无多重共线性,即各解释变量之间线性无关,;(5)正态性假定,即。在格林(W. Greene)教材上将以上假设条件总结为:线性;满秩;解释变量的外生性;球形扰动;数据生成过程的外生性;正态性。比较这些假定可以发现,原来初等计量上的(1)和(3)假定没有了,新的假定是解释变量的外生性和数据生成过程的外生性。由之前条件期望的部分,我们已经看到初级计量中的(1)和(3)假设是重复的,它们都是属于外生性条件。格林教
9、材上的假设也就把它们合二为一了。学习中需要理解和掌握格林教材中的这些假设条件。对于线性假定,两个层面,一是指参数线性,而不是解释变量的线性。这里,某些非参数线性的模型,可以通过对解释变量和被解释变量进行一定的线性变形,可以转换为参数线性模型,比如对数线性模型、半对数线性模型、超对数线性模型等;另一是指有利于推导参数估计量的统计分布以及进行推断分析。第二,满秩性条件,它是为了保证条件期望的唯一性,参数可求解,同时,此项假设在本课程的学习过程,将会在多处(特别是在某些推导过程中)涉及。第三,外生性条件,表示随机扰动项中不包含有解释变量的任何信息。注意,外生性条件的不同表述方式和内涵。外生性条件的违
10、反将影响到参数估计的一致性问题。第四,球形扰动,是指随机扰动项的方差-协方差矩阵为同方差和无自相关同时成立时的情况。违反此假设条件,被称为非球形扰动,将会影响到参数估计的有效性问题。第五,数据生成过程的外生性条件指变量数据的生成过程是独立的,不受其他变量和扰动项的影响。第六,正态性条件,它主要与我们的统计检验和推断有关,但在大样本的条件下,根据中心极限定理这个条件是可以放宽的。在后期的学习过程中,将逐渐放宽这些假设条件,从而对于这些假定的进行深入理解。3、最小二乘法以估计的残差平方和最小的原则确定样本回归函数,称为最小二乘准则。在古典假定下的最小二乘法,也称为普通最小二乘估计(简记为OLS)。
11、对于多元回归模型, 我们的目标是使得回归的残差平方和达到最小,即:则它的一阶条件为:化简得:以上是属于初中级计量中的做法。而在本课程的学习中,我们需要从矩条件对最小二乘进行理解。关于矩将在后面部分中详细提到,这里只是应用该知识点。由外生性条件可得:从而: 用样本矩替代总体矩,则可以得到:。所以有:。1、注意的意义。 若记为参数估计量的方差-协方差矩阵的估计,则有(1)(2)(3)为对称阵,对角线元素是的方差,非对角线元素为相应的协方差;2、应用。可以在多个场合应用。例如,检验某些回归系数是否满足某些约束,如。注意,这种情形是否可以采用Wald检验统计量?通常情形采用t-检验统计量进行检验。其中
12、:分别为中相应位置上的元素。当t-值大于2,拒绝,否则,接受。4、最小二乘估计的一些性质代数性质(1)残差平方和等于0,即;(2)回归线经过均值点,即;(3)回归的预测值的平均值等于实际值的均值,即。但注意这些代数性质只有在回归方程中包含了常数项下才成立。投影及投影定理矩阵的定义与作用;矩阵的定义与作用;两者的区别与联系定理3.1-3.3以及推论3.3.1-3.3.2的理解与把握。5、双残差回归对于双残差回归,首先考察它的由来,然后进一步讨论由它引申出的一些性质。(1)残差的定义由,可以得到:其中,它是一个对称幂等矩阵,存在的性质。因此表示了对回归得到的残差。(2)双残差回归 我们记: 两边同
13、时左乘和,并用矩阵表示可以得到: 利用分块矩阵求逆的公式可以得到:再带回到方程中,并整理可以得到:其中:,对上式进行理解:表示了对回归得到的残差, 表示了对回归得到的残差,即:。它表示的是残差对残差回归的参数估计。进一步理解:残差中扣除了中包含的的信息;残差扣除了中包含的的信息。因此双残差(、)回归仅反应了,在扣除了的影响,对的作用情况,同样说明了系数表示的是变量与的偏相关。同样,的表示与一样,它们是一种对称的关系。(3)经济解释与实际应用双残差回归得到的偏回归系数与统计中的偏相关系数是密切联系的,但不是严格意义上的偏相关系数。所谓偏相关系数,就是扣除了中间变量影响后的相关系数。它与简单相关系
14、数的一个主要区别在于,通常情况下,简单相关系数不仅包含了两个变量之间的直接相关关系,还包括了变量间的间接相关关系(通过中间变量的相关性传导)。一种极端的情况是:变量间的相关关系完全是由间接相关关系引起的。如果是这样,那么在控制了中间变量的影响之后,两个关注变量之间就表现为不相关。又或者说,两个变量之间的简单相关关系是一种负相关的关系,但是在控制了中间变量影响后就可能表现为正相关。举例来说,假设回归方程为,要计算与Z之间的偏相关系数,具体的计算步骤如下:(1)对X进行回归,得到回归残差()(2)对X进行回归,得到残差(3)与Z之间的偏相关系数就是与之间的简单相关系数。可以简单的写成平方形式为:
15、(残差的均值为零,上下N消去,可证明)在计量经济学中有关注变量和控制变量的说法,就是对应了以上的原理。不妨假设在一个典型的线性回归方程中,变量集是我们的关注变量集,相应的就是我们的控制变量集。估计系数表示的就是在控制了变量集后,对的影响。也就是通常说的,在其他变量保持不变的情况下,的变化引起的的变化。很显然,在不同的情况下,我们可以改变我们的控制变量集,来看我们的关注变量系数是否发生显著的变化,这在实证中是很重要步骤和思想。控制变量的t值大小可以不必过于在意。小结:双残差回归思想的理解和具体步骤其中:,假设现在要求的是系数(1)对进行回归,得到回归的残差记为。(2)对进行回归,得到回归的残差记
16、为(3)对回归,得到的参数估计就是的估计值。残差中扣除了中包含的的信息;残差扣除了中包含的的信息。因此双残差(、)回归仅反应了,在扣除了的影响,对的作用情况,同样说明了系数表示的是变量与的偏相关。同样,的表示与一样,它们是一种对称的关系。双残差回归得到的偏回归系数与统计中的偏相关系数是密切联系的,但不是严格意义上的偏相关系数。所谓偏相关系数,就是扣除了中间变量影响后的相关系数。它与简单相关系数的一个主要区别在于,通常情况下,简单相关系数不仅包含了两个变量之间的直接相关关系,额包括了变量间的间接相关关系(通过中间变量的相关性传导)。一种极端的情况是:变量间的相关关系完全是由间接相关关系引起的。如
17、果是这样,那么在控制了中间变量的影响之后,两个关注变量之间就表现为不相关。又或者说,两个变量之间的简单相关关系是一种负相关的关系,但是在控制了中间变量影响后就可能表现为正相关。在计量经济学中有关注变量和控制变量的说法,就是对应了以上的原理。不妨假设在一个典型的线性回归方程中,变量集是我们的关注变量集,相应的就是我们的控制变量集。估计系数表示的就是在控制了变量集后,对的影响。也就是通常说的,在其他变量保持不变的情况下,的变化引起的的变化。很显然,在不同的情况下,我们可以改变我们的控制变量集,来看我们的关注变量系数是否发生显著的变化,这在实证中是很重要步骤和思想。控制变量的t值大小可以不必过于在意
18、。6、方差分解和拟合优度(1)方差分解在初等计量中:考虑一个线性回归方程式:方程两边同取平均值,为两式相减得到: (二倍交叉项为零)也就是:,即: 总离差平方和残差平方和回归平方和。于是可以得到可决系数,它可以用来判别模型的拟合优度。在格林教材中,对于可决系数的计算是用矩阵来表达的。记单位向量,令矩阵,可以证明也是一个对称幂等矩阵。对任意的列向量,有如下结论成立:(a) (b)则定义可决系数。而由前面条件期望部分的方差分解定理:它同样表示了:总离差平方和回归平方和 + 残差平方和因此有:扩展方差分解定理,得到:两边取期望,由迭代期望定理得到:结合式,上式说明在回归式中增加新的变量会使得可决系数
19、增大。(2)两个重要的定理定理:记是对回归的残差平方和,而是对和回归的残差平方和。那么有。其中:c是对和的回归中的参数估计,。这个定理说明的是在一个线性回归模型中增加新的解释变量,总是可以使模型的残差平方和减小,或者至少不增大。由于总离差平方和TSS是不变的,上述结论意味这可决系数的增大。于是得到书上的定理。定理:记是对和回归的可决系数,而是只对回归的可决系数,表示在控制了之后,与的偏相系数。则有:。由该定理也说明了,增加新的解释变量会使得可决系数增大。小结:方差分解定理可以表述为:它表示,在一个二元分布中,y的方差可分解为条件均值函数的方差加上条件均值的期望方差。(1)在方差分解定理的公式中
20、,是的方差,也就是回归式中的总离差平方和TSS。条件均值的方差是回归式中的回归平方和ESS;条件方差的期望是回归的残差平方和RSS。由此,可以构造R2统计量为:(2)对方差分解定理进行简单的扩展,得到如下的表达式:两边取期望,由迭代期望定理得到:由于回归方程的总离差平方和TSS是不变的,因此,上式说明,在回归式中增加新的变量会使得可决系数增大。四、思考题1、阐述双残差回归的步骤和其中体现的统计思想。2、证明在线性回归中增加新的解释变量会使得可决系数增大。即上述定理3、定义,是中的部分解释变量。证明:第三部分 最小二乘(OLS)的有限样本性质一、背景OLS是最基本也是最常用的一个回归估计方法,其
21、思想十分简单,就是使回归的残差平方和达到最小。需要注意的是,应用OLS离不开相应的假设条件,也就是所谓的古典假设。在这些假设条件下,OLS估计具有一系列优良的性质。这个部分主要阐述对古典假设条件和理解并讨论在该条件下OLS所具有的优良性质。二、知识要点1、对古典假设的理解2、自变量的随机和非随机问题3、OLS在古典假设下的无偏性和有效性参考章节Chapter4.14.6、Chapter4.8三、要点细纲1、对古典假设的理解最小二乘有限样本性质的推导是在古典假设下得到的,因此需要注意的是,一旦古典假设不能得到满足,OLS的一系列有限样本的优良性质就不在具备了。计量经济学中的假设很多,从现实角度出
22、发,假设条件应该是越弱要好的。这意味着模型的假设条件在现实中越容易得到满足,但是古典假设是一个很强的假设,虽然有其合理性,但是某些假设需要被放宽或者舍弃。在Greene书中P10的六点假设中,与有限样本性质最密切相关,也是最强的两个假设条件是:A3:自变量的强外生性假定,即A6:随机扰动项服从正态分布,即其中,强外生性条件不仅意味这与X是不相关的,即,也意味着与X的任何函数形式是不相关的。(参见条件期望定理:若,那么对于任意X的函数,有)证明:其次,随机扰动项服从正态分布也是一个过强的,不够实际的假设条件,但是改假设是有限样本性质的核心内容,是进行构造统计量进行假设检验和统计推断的基础。当然,
23、在随机扰动项不服从正态分布的情况下,必须利用渐进理论讨论估计量的大样本性质。这是书中第五章的内容。2、自变量X的随机与非随机问题的讨论一个一般性的回归式为:其中 是一个维的向量,的函数形式可以是线性的,也可以是非线性的。在初等计量的课程中,我们通常把X看作是非随机的变量,也就是说,向量X在回归中是被作为常数处理的,不具备随机变量的性质。扰动项是唯一的随机变量,由于的存在,使得Y成为一个随机数。所有的分析都是在以上的假定下展开的,初看来,这样的假定使得对问题的分析变得相对简单化;但是,仔细推敲,就可以发现这样的设定是不科学的,无论是解释变量X还是被解释变量Y都没有可能是一个非随机的常量,这样的假
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 海归 讲授 博士 高级 计量 经济学
限制150内