《一抽样方法icav.docx》由会员分享,可在线阅读,更多相关《一抽样方法icav.docx(5页珍藏版)》请在得力文库 - 分享文档赚钱的网站上搜索。
1、一抽样方法:1简单随机抽样:设一个总体的个数为N,如果通过逐个抽样的方法从中抽取一个样本,且每次抽取时各个个体被抽到的概率都相等,就称这样的抽样为简单随机抽样。抽签法和随机数表法是实施简单随机抽样的两种常用的方法。2。分层抽样:当已知总体由差异明显的几部分组成时,常常总体分成几部分,然后按照各部分所占的比例进行抽样,这种抽样叫分层抽样,其中所分成的各个部分叫做层。二、利用样本频率估计总体分布:由于总体分布通常不易知道,我们往往用样本的频率分布估计总体分布。一般地,样本容量越大,这种估计就越精确。1、频率分布条形图:当总体中的个体取不同数值很少时,其频率分布表由所取的样本的不同数值及相应的频率表
2、示,其几何表示就是相应的条形图。2、频率分布直方图:当总体中的个体取不同数值很多时或者可以在实数区内取值时,用频率分布直方图表示相应样本的频率分布。 注:频率分布条形图和频率分布直方图不同。频率分布直方图的纵轴(矩形的高)表示频率,而频率分布直方图的纵轴(矩形的高)表示频率与组距的比值,其相应组距上的频率等于该组距上的矩形的面积。三期望与方差:1期望:的期望:;2方差: 的方差为:3均方差:的均方差:注:对于“已知的期望为多少,求的期望和方差分别是多少?”问题,关键是利用上述公式变形、整理得到所求的结果。平均数、众数和中位数这里说的“三数”是指平均数、众数和中位数要描述一组数据的集中趋势,最重
3、要也是最常见的方法就是用这“三数”来说明学习平均数、众数和中位数应注意以下几个问题:一、正确理解平均数、众数和中位数的概念1平均数平均数是反映一组数据的平均水平的特征数,反映一组数据的集中趋势平均数的大小与一组数据里的每一个数据都有关系,任何一个数据的变化都会引起平均数的变化众数在一组数据中出现次数最多的数据叫做这一组数据的众数一组数据中的众数有时不唯一众数着眼于对各数出现的次数的考察,这就告诉我们在求一组数据的众数时,既不需要排列,又不需要计算,只要能找出样本中出现次数最多的那一个(或几个)数据就可以了当一组数据中有数据多次重复出现时,它的众数也就是我们所要关心的一种集中趋势中位数中位数就是
4、将一组数据按大小顺序排列后,处在最中间的一个数(或处在最中间的两个数的平均数)一组数据中的中位数是唯一的二、注意区别平均数、众数和中位数三者之间的关系平均数、众数和中位数都是描述一组数据的集中趋势的量,但它们描述的角度和适用的范围又不尽相同在具体问题中采用哪种量来描述一组数据的集中趋势,那得看数据的特点和我们要关注的问题三、能正确选用平均数、众数和中位数来解决实际问题由于平均数、众数和中位数都是描述一组数据的集中趋势的量,所以利用平均数、众数和中位数可以来解决现实生活中的问题下面举几例说明例1李大伯承包了一个果园,种植了100棵樱桃树,今年已进入收获期收获时,从中任选并采摘了10棵树的樱桃,分
5、别称得每棵树所产樱桃的质量如下表:序号12345678910质量(千克)14212717182019231922据调查,市场上今年樱桃的批发价格为每千克15元用所学的统计知识估计今年此果园樱桃的总产量与按批发价格销售樱桃所得的总收入分别约为()A200千克,3000元 B1900千克,28500元C2000千克,30000元 D1850千克,27750元简析:依题意此果园平均每棵树所产樱桃的质量是(千克),所以100棵树所产樱桃的的质量是(千克),又批发价格为每千克15元,所以2000千克的樱桃所得的总收入为(元),故应选C例2(陕西省)为了了解某班学生每周做家务劳动的时间,某综合实践活动小组
6、对该班50名学生进行了调查,有关数据如下表:每周做家务的时间(小时)011.522.533.54人数(人)2268121343根据上表中的数据,回答下列问题:(1)该班学生每周做家务劳动的平均时间是多少小时?(2)这组数据的中位数、众数分别是多少?(3)请你根据(1)、(2)的结果,用一句话谈谈自己的感受简析:(1)该班学生每周做家务劳动的平均时间为(小时),即该班学生每周做家务劳动的平均时间为2.44小时(2)由表中的数据我们可以发现这组数据的中位数是2.5(小时),众数是3(小时)(3)只要叙述内容与上述数据有关或与做家务劳动有关,并且态度积极即可极差、方差、标准差极差、方差和标准差都是用
7、来研究一组数据的离散程度的,反映一组数据的波动范围或波动大小的量.一、 极差一组数据中最大值与最小值的差叫做这组数据的极差,即极差=最大值-最小值.极差能够反映数据的变化范围,实际生活中我们经常用到极差.如一支足球队队员中的最大年龄与最小年龄的差,一个公司成员中最高收入与最低收入的差等都是极差的例子.极差是最简单的一种度量数据波动情况的量,它受极端值的影响较大.二、方差方差是反映一组数据的整体波动大小的特征的量.它是指一组数据中各个数据与这组数据的平均数的差的平方的平均数,它反映的是一组数据偏离平均值的情况.方差越大,数据的波动越大;方差越小,数据的波动越小.求一组数据的方差可以简记先求平均,
8、再求差,然后平方,最后求平均数.一组数据x1、x2、x3、xn的平均数为,则该组数据方差的计算公式为:.三、标准差 在计算方差的过程中,可以看出方差的数量单位与原数据的单位不一致,在实际的应用时常常将求出的方差再开平方,此时得到量为这组数据的标准差.即标准差=.四、极差、方差、标准差的关系方差和标准差都是用来描述一组数据波动情况的量,常用来比较两组数据的波动大小.两组数据中极差大的那一组并不一定方差也大.在实际问题中有时用到标准差,是因为标准差的单位和原数据的单位一致,且能缓解方差过大或过小的现象.5典型例析例1 从甲、乙两种玉米苗中各抽10株,分别测得它们的株高如下:(单位:cm)甲: 21
9、 42 39 14 19 22 37 41 40 25乙: 27 16 40 41 16 44 40 40 27 44(1)根据以上数据分别求甲、乙两种玉米的极差、方差和标准差.(2)哪种玉米的苗长得高些;(3)哪种玉米的苗长得齐.分析:本题既是一道和极差、方差和标准差计算有关的问题,又是利用方差解决实际问题的一道题目.要求极差,只要用数据中最大值减去最小值,求到差值即可.利用方差的计算公式可以求到方差,将方差开平方就得标准差. 解: 甲的极差: 42-14=28(cm); 乙的极差:44-16=28(cm).甲的平均值:乙的平均值:甲的方差:,乙的方差:(2)因为甲种玉米的平均高度小于乙种玉
10、米的平均高度,所以一种玉米的苗长的高.(3)因为,所以甲种玉米的苗长得整齐.例2 市体校准备挑选一名跳高运动员参加全市中学生运动会,对跳高运动队的甲、乙两名运动员进行了8次选拔比赛.他们的成绩(单位:m)如下:甲:1.70 1.65 1.68 1.69 1.72 1.73 1.68 1.67乙:1.60 1.73 1.72 1.61 1.62 1.71 1.70 1.75(1)甲、乙两名运动员的跳高平均成绩分别是多少?(2)哪位运动员的成绩更为稳定?(3)若预测,跳过1.65m就很可能获得冠军,该校为了获得冠军,可能选哪位运动员参赛?若预测跳过1.70m才能得冠军呢?解析:本题是一道数据分析有
11、关的实际问题,主要考查数据的平均数、方差的计算方法及处理数据的能力.根据平均数及方差的计算公式可得(1)=1.69(m),=1.68(m). (2)=0.0006(m2),=0.0035(m2),因为,所以甲稳定.(3)可能选甲参加,因为甲8次成绩都跳过1.65m而乙有3次低于1.65m; 可能选乙参加,因为甲仅3次超过1.70m.例3 某公司在过去几年内使用某种型号的灯管1000支,该公司对这些灯管的使用寿命(单位:小时)进行了统计,统计结果如下表所示:分组500,900)900,1100)1100,1300)1300,1500)1500,1700)1700,1900)1900,)频数481
12、2120822319316542频率0.0480.1210.2080.2230.1930.1650.042(I)将各组的频率填入表中;(II)根据上述统计结果,计算灯管使用寿命不足1500小时的频率;(III)该公司某办公室新安装了这种型号的灯管3支,若将上述频率作为概率,试求灯管的使用寿命不足1500小时的概率【解析】(I)因为基本事件总数为1000,所以根据表中给出的频数可以直接写出各组的频率(见表中红字)(II)设“任取1支灯管其使用寿命不足1500小时”的事件为A,则表中的前4列便是关于A的全部数据,故0.048+0.121+0.208+0.223=0.6.(III)设“3支灯管中至少
13、有2支使用寿命不足1500小时”的事件为B,则B有两种情况:(1)3支的使用寿命不足1500小时,其概率为:(2)3支中恰有两支使用寿命不足1500小时,其概率为:.于是P(B)=0.216+0.432=0.648.例4 图l是某县参加2007年高考的学生身高条形统计图,从左到右的各条形表示的学生人数依次记为、(如表示身高(单位:)在150,155)内的学生人数)图2是统计图l中身高在一定范围内学生人数的一个算法流程图现要统计身高在160180(含160,不含180)的学生人数,那么在流程图中的判断框内应填写的条件是,【解析】图1的信息十分明确,我们重点研究图2.这是电脑操作的一种程序.根据题目给出的信息,它的功能是将“身高在160180(含160,不含180)的学生人数”筛选出来.若将该县参加2007年高考的任意1名学生的身高资料输入,不在这个范围的考生将被输出,否则将再次进行操作.第1次操作,从开始,从表中可以看到,A4表示身高在160或160以上的考生,显然符合选择标准,电脑将显示“是”;第2次操作,从开始继续检测.如果该生的身高仅在165以内,他的资料将被输出,检测结束;如果该生的身高达到或超过了165,她将进入的第3次检测.如此继续下去,直到该生的身高超过检测范围为止.由此可以推知,当时将不再检测,于是正确的答案是,选B.
限制150内