第26讲统计与概率分布.doc
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_05.gif)
《第26讲统计与概率分布.doc》由会员分享,可在线阅读,更多相关《第26讲统计与概率分布.doc(16页珍藏版)》请在得力文库 - 分享文档赚钱的网站上搜索。
1、 第26讲 统计与概率分布 新课标考试大纲对统计与概率分布的考查要求统计(文,理都要求)(1)随机抽样 理解随机抽样的必要性和重要性. 会用简单随机抽样方法从总体中抽取样本;了解分层抽样和系统抽样方法.(2)总体估计 了解分布的意义和作用,会列频率分布表,会画频率分布直方图、频率折线图、茎叶图,理解它们各自的特点. 理解样本数据标准差的意义和作用,会计算数据标准差. 能从样本数据中提取基本的数字特征(如平均数、标准差),并作出合理的解释. 会用样本的频率分布估计总体分布,会用样本的基本数字特征估计总体的基本数字特征,理解用样本估计总体的思想. 会用随机抽样的基本方法和样本估计总体的思想,解决一
2、些简单的实际问题.(3)变量的相关性 会作两个有关联变量数据的散点图,会利用散点图认识变量间的相关关系. 了解最小二乘法的思想,能根据给出的线性回归方程系数公式建立线性回归方程.概率与统计(1)概率(理科要求) 理解取有限个值的离散型随机变量及其分布列的概念,了解分布列对于刻画随机现象的重要性. 理解超几何分布及其导出过程,并能进行简单的应用. 了解条件概率和两个事件相互独立的概念,理解n次独立重复试验的模型及二项分布,并能解决一些简单的实际问题. 理解取有限个值的离散型随机变量均值、方差的概念,能计算简单离散型随机变量的均值、方差,并能解决一些实际问题. 利用实际问题的直方图,了解正态分布曲
3、线的特点及曲线所表示的意义.(2)统计案例(文,理都要求)了解下列一些常见的统计方法,并能应用这些方法解决一些实际问题.(1) 独立检验了解独立性检验(只要求22列联表)的基本思想、方法及其简单应用.(2) 假设检验了解假设检验的基本思想、方法及其简单应用.(3) 聚类分析了解聚类分析的基本思想、方法及其简单应用. (4) 回归分析了解回归的基本思想、方法及其简单应用.主要基础知识1. 离散型随机变量的分布列和数学期望:(1)离散型随机变量:如果对于随机变量可能取的值,可以按一定次序一一列出,这样的随机变量叫做离散型随机变量.若是一个随机变量,是常数.则也是一个随机变量.一般地,若是随机变量,
4、是连续函数或单调函数,则也是随机变量.也就是说,随机变量的某些函数也是随机变量.(2)随机变量的概率分布:设离散型随机变量可能取的值为:取每一个值的概率,则表称为随机变量的概率分布,简称的分布列.有性质; .(3) 随机变量的数学期望:,的数学期望也称作平均数、均值.又简称期望.数学期望反映了离散型随机变量取值的平均水平.注意:若随机变量可以取某一区间内的一切值,这样的变量叫做连续型随机变量.例如:即可以取05之间的一切数,包括整数、小数、无理数.(4) 随机变量的数学期望: 当时,即常数的数学期望就是这个常数本身.当时,即随机变量与常数之和的期望等于的期望与这个常数的和.当时,即常数与随机变
5、量乘积的期望等于这个常数与随机变量期望的乘积.2. 二项分布和数学期望:(1) 二项分布:如果在一次试验中某事件发生的概率是,那么在次独立重复试验中这个事件恰好发生次的概率是:(其中) 于是得到随机变量的概率分布如下:我们称这样的随机变量服从二项分布,记作,并称为成功概率.(2) 二项分布的期望为: (3)二项分布的判断与应用.二项分布,关键是看某一事件是否是进行次独立重复试验,且每次试验只有两种结果,如果不满足此两条件,随机变量就不服从二项分布.当随机变量的总体很大且抽取的样本容量相对于总体来说又比较小,而每次抽取时又只有两种试验结果,此时可以把它看作独立重复试验,利用二项分布求其分布列.4
6、. 几何分布和数学期望:(1)几何分布:“”表示在第次独立重复试验时,事件第一次发生的概率分布.如果把次试验时事件发生记为,事件不发生记为,那么.根据相互独立事件的概率乘法分式:于是得到随机变量的概率分布列.123kP 我们称服从几何分布,并记,其中,其分布列为.(为发生的概率)(2) 几何分布的期望:.5.超几何分布:(1) 超几何分布:一批产品共有件,其中有件次品,任取其中恰有件次品,则事件发生的概率为.其中,(2) 超几何分布的分布列为超几何分布列,其分布为超几何分布6单点分布的期望:其分布列为:. 7两点分布的期望:,其分布列为:(p + q = 1)(1)分布列:(2)期望:8方差、
7、标准差:(1)方差、标准差的定义:当已知随机变量的分布列为时,则称为的方差.显然,故为的根方差或标准差.随机变量的方差与标准差都反映了随机变量取值的稳定与波动,集中与离散的程度.越小,稳定性越高,波动越小.(2)方差的性质.随机变量的方差.(a、b均为常数)单点分布: 两点分布: 二项分布:几何分布: (3) 期望与方差的关系.如果和都存在,则设和是互相独立的两个随机变量,则期望与方差的转化: 9.正态分布与正态曲线:(1) 正态分布与正态曲线:如果随机变量的概率密度为:. 为常数,且),称服从参数为的正态分布,用表示.的表达式可简记为,它的密度曲线简称为正态曲线.(2) 正态分布的期望与方差
8、:若,则的期望与方差分别为:.(3)正态曲线的性质.曲线在x轴上方,与x轴不相交.曲线关于直线对称.当时曲线处于最高点,当x向左、向右远离时,曲线不断地降低,呈现出“中间高、两边低”的钟形曲线.当时,曲线上升;当时,曲线下降,并且当曲线向左、向右两边无限延伸时,以x轴为渐近线,向x轴无限的靠近.当一定时,曲线的形状由确定,越大,曲线越“矮胖”.表示总体的分布越分散;越小,曲线越“瘦高”,表示总体的分布越集中.(4) 标准正态分布:如果随机变量的概率函数为,则称服从标准正态分布. 即有,求出,而的计算则是 .注意:当标准正态分布的的X取0时,有当的X取大于0的数时,有.比如则必然小于0,如图.
9、(5) 正态分布与标准正态分布间的关系:若则的分布函数通常用表示,且有. 10.两个变量的线性相关已知两个具有线性相关的变量的一组数据:,设所求的回归方程是,为使把数据代入方程得到的与实际收集到的数据偏差最小,通过求 的最小值,(这种方法叫做最小二乘法),得到求值的公式 .例题选讲1.随机抽样【例1】(2008广东卷,理)某校共有学生2000名,各年级男、女生人数如表已知在全校学生中随机抽取1名,抽到二年级女生的概率是0.19现用分层抽样的方法在全校抽取64名学生,则应在三年级抽取的学生人数为( )一年级二年级三年级女生373男生377370A24B18C16D12解】C依题意我们知道二年级的
10、女生有380人,那么三年级的学生的人数应该是,即总体中各个年级的人数比例为332,故在分层抽样中应在三年级抽取的学生人数为【例2】(2008湖南卷,文)从某地区15000位老人中随机抽取500人,其生活能否自理的情况如下表所示:性别人数生活能否自理男女能178278不能2321 则该地区生活不能自理的老人中男性比女性约多_人。【解】60 由上表得【例3】(2005湖北卷,理,文)某初级中学有学生270人,其中一年级108人,二、三年级各81人,现要利用抽样方法抽取10人参加某项调查,考虑选用简单随机抽样、分层抽样和系统抽样三种方案,使用简单随机抽样和分层抽样时,将学生按一、二、三年级依次统一编
11、号为1,2,270;使用系统抽样时,将学生统一随机编号1,2,270,并将整个编号依次分为10段。如果抽得号码有下列四种情况:7,34,61,88,115,142,169,196,223,250;5,9,100,107,111,121,180,195,200,265;11,38,65,92,119,146,173,200,227,254;30,57,84,111,138,165,192,219,246,270;关于上述样本的下列结论中,正确的是A、都不能为系统抽样B、都不能为分层抽样C、都可能为系统抽样D、都可能为分层抽样【解】不是系统抽样,可能为分层抽样; 可能为系统抽样,也可能为分层抽样:
12、既非系统抽样也不是分层抽样,综上选(D)2.频率分布直方图,条形图,茎叶图【例1】(2007山东卷,理,文)某班50名学生在一次百米测试中,成绩全部介于13秒与19秒之间,将测试结果按如下方式分成六组:每一组,成绩大于等于13秒且小于14秒;第二组,成绩大于等于14秒且小于15秒;第六组,成绩大于等于18秒且小于等于19秒右图是按上述分组方法得到的频率分布直方图,设成绩小于17秒的学生人数占全班人数的百分比为,成绩大于等于15秒且小于17秒的学生人数为,则从频率分布直方图中可以分析出和分别为( )013141516171819秒频率0.020.040.060.180.340.36ABCD【解】
13、A. P(x17)P(17x 19)1(0.0610.041)0.9,即x0.9y(0.340.36)15035人【例2】(2008广东卷,文)为了调查某厂工人生产某种产品的能力,随机抽查了20位工人某天生产该产品的数量,产品数量的分组区间为45,55),55,65),65,75),75,85),85,95),由此得到频率分布直方图如图3,则这20名工人中一天生产该产品数量在55,75)的人数是 0.0400.0350.0300.0250.0200.0150.0100.0050455565758595产品数量频率组距【解】13.在55,75)的频率为人数为【例3】(2005江西卷,文)为了解某
14、校高三学生的视力情况,随机地抽查了该校100名高三学生的视力情况,得到频率分布直方图,如右,由于不慎将部分数据丢失,但知道前组的频数成等比数列,后6组的频数成等差数列,设最大频率为a,视力在在到之间的学生数为,则a, b的值分别为ABCD【解】由图象可知,前组的公比为,最大频率,设后组公差为,则,解得,后组公差为, 所以,视力在到之间的学生数为(人).选A.29 1 1 5 83 0 2 63 1 0 2 4 7【例4】(2008山东卷,理)右图是根据山东统计年鉴2007中的资料作成的1997年至2006年我省城镇居民百户家庭人口数的茎叶图图中左边的数字从左到右分别表示城镇居民百户家庭人口数的
15、百位数字和十位数字,右边的数字表示城镇居民百户家庭人口数的个位数字从图中可以得到1997年至2006年我省城镇居民百户家庭人口数的平均数为( )A304.6B303.6C302.6D301.6【解】B.【例5】(2008海南,宁夏卷,理,文)从甲、乙两品种的棉花中各抽测了25根棉花的纤维长度(单位:mm),结果如下:甲品种:271273280 285285 287292294295301 303 303307308310314319323 325325 328331334337352乙品种:284292295304306307312313 315 315316318 318320322 322
16、324327329331333336337343356由以上数据设计了如下茎叶图3 1 277 5 5 0 28 45 4 2 29 2 58 7 3 3 1 30 4 6 79 4 0 31 2 3 5 5 6 8 88 5 5 3 32 0 2 2 4 7 97 4 1 33 1 3 6 734 32 35 6甲乙根据以上茎叶图,对甲、乙两品种棉花的纤维长度作比较,写出两个统计结论: ; 【解】(1)乙品种棉花的纤维平均长度大于甲品种棉花的纤维平均长度(或:乙品种棉花的纤维长度普遍大于甲品种棉花的纤维长度)(2)甲品种棉花的纤维长度较乙品种棉花的纤维长度更分散(或:乙品种棉花的纤维长度较甲
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 26 统计 概率 分布
![提示](https://www.deliwenku.com/images/bang_tan.gif)
限制150内