概率论与数理统计第15讲.ppt
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_05.gif)
《概率论与数理统计第15讲.ppt》由会员分享,可在线阅读,更多相关《概率论与数理统计第15讲.ppt(60页珍藏版)》请在得力文库 - 分享文档赚钱的网站上搜索。
1、概率论与数理统计概率论与数理统计第第15讲讲本文件可从网址http:/上下载1协方差与相关系数2定性的思考通常人们在研究单个的随机变量的时候,并不关心它们的分布,而是关心它们的数学期望和方差,这也是因为分布携带了太多的信息,很难给人们一个快捷的印象.3而人们在研究两个随机变量的关系的时候,也不关心它们的联合分布,这是携带了更多信息的内容.人们关心的是,这两个随机变量是联系非常紧密呢?还是毫无关系?即相互独立?人们希望用一个数字就能够在相当程度上描述两个随机变量的联系程度.4当然,从数学上看,这是不可能的因为联合分布的信息量为许多个数,甚至无穷多个数,因此一个数不可能反映出无穷多个数携带的信息.
2、5但是我们仍然希望能够找到描述它们之间相互关系的一个数,至少在大多数实际情况下能够描绘两个随机变量联系的紧密程度,例如,如果这个数字越接近于零,说明这两个随机变量的联系越差,越接近于相互独立,反之则联系越紧密,越接近于相互之间有关系.6例如一个人的身高和体重是非常有关系的,但是又并不完全是严格的函数关系,那么关系程度究竟有多大呢?一个人的吸烟量和他的平均寿命是有关系的,这个关系量又有多大呢?7一种化肥的施用量和农作物的产量是有关系的,这个关系的大小又是如何呢?这样一些问题都希望能够用一个数字就表示出来,这就是人们想到要用协方差和相关系数的原因.8对于两个随机变量X和Y当它们是完全相等的时候,联
3、系是最紧密的了.而当它们相互独立的时候,联系是最差的了.我们先研究它们的和X+Y的方差:9D(X+Y)=EX+Y-E(X+Y)2=EX-E(X)+Y-E(Y)2 =EX-E(X)2+Y-E(Y)2+2X-E(X)Y-E(Y)=EX-E(X)2+EY-E(Y)2+2EX-E(X)Y-E(Y)=D(X)+D(Y)+2EX-E(X)Y-E(Y)10D(X+Y)=D(X)+D(Y)+2EX-E(X)Y-E(Y)关键在后一项2EX-E(X)Y-E(Y),我们定义EX-E(X)Y-E(Y)为X和Y的协方差,用cov(X,Y)表示.则D(X+Y)=D(X)+D(Y)+2cov(X,Y)11D(X+Y)=D(
4、X)+D(Y)+2cov(X,Y)当X和Y相互独立时,联系最不紧密,这时候cov(X,Y)=0,因此D(X+Y)=D(X)+D(Y)而当X=Y时,联系最紧密,这时候D(X)=D(Y)=cov(X,Y),因此D(X+Y)=D(2X)=4D(X)12因此,协方差cov(X,Y)的大小可以反映X和Y之间联系紧密程度的大小.当cov(X,Y)=0的时候,X和Y联系最不紧密,而当cov(X,Y)的绝对值较大的时候,X和Y的联系较为紧密,但紧密的程度,却和X与Y的方差D(X)和D(Y)有关.13为去除这个因素,因此定义14现证明|1令X=X-E(X),Y=Y-E(Y),则X,Y都是期望值为0的随机变量.对
5、于任给的实数t,相信E(X+tY)20,即E(X2)+2tE(XY)+t2E(Y2)0,即是说关于t的一元二次方程E(X2)+2tE(XY)+t2E(Y2)=0最多只有单个实根或者没有实根,也就说明判别式b2-4ac015E(X2)+2tE(XY)+t2E(Y2)=0b2-4ac016再考虑当|=1时会是什么情况,这时方程E(X2)+2tE(XY)+t2E(Y2)=0存在着一个单根,假设这单根为t0,则有E(X2)+2t0E(XY)+t02E(Y2)=0即E(X+t0Y)2=017E(X+t0Y)2=0,而当一个总是取非负值的随机变量的期望值为0时,答案只能是此随机变量就是常数0,即存在着实数
6、t0使得X+t0Y=0,即X和Y的离差是正好成比例的,我们将这种情况称作X与Y呈线性关系,因此就有定理(接后页)18定理两个随机变量X和Y呈线性关系的充分必要条件,是它们的相关系数的绝对值为1,即|=1而另一方面,如果X与Y相互独立,则它们的相关系数必为0,即=0.19当然,数学家们会喋喋不休地宣传当=0时未见得X与Y相互独立,并在作业或者例子中经常给出反例.但是,作为经验之谈,当=0时,两个随机变量确实关系不大了.这也是相关系数被广泛使用的原因.20协方差的统计对协方差EX-E(X)Y-E(Y)的统计是这样,先是通过试验获得了X和Y的n对数据(x1,y1),(x2,y2),.,(xn,yn)
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 概率论 数理统计 15
![提示](https://www.deliwenku.com/images/bang_tan.gif)
限制150内