SAS软件及统计应用教程3.ppt
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_05.gif)
《SAS软件及统计应用教程3.ppt》由会员分享,可在线阅读,更多相关《SAS软件及统计应用教程3.ppt(90页珍藏版)》请在得力文库 - 分享文档赚钱的网站上搜索。
1、STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程n3.1 3.1 区间估计与假设检验的基本概念区间估计与假设检验的基本概念n3.1.1 区间估计区间估计n3.1.2 假设检验假设检验STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程3.1.1 区间估计区间估计1. 1. 点估计和区间估计点估计和区间估计 参数的估计方法主要有两种:点估计和区间估计。参数的估计方法主要有两种:点估计和区间估计。 点估计是用样本的观测值估计总体未知参数的值。由点估计是用样本的观测值估计总体未知参数的值。由于样本的随机性,不同样本观测值计算得出的参数的估于
2、样本的随机性,不同样本观测值计算得出的参数的估计值间存在着差异,因此常用一个区间估计总体的参数,计值间存在着差异,因此常用一个区间估计总体的参数,并把具有一定可靠性和精度的估计区间称为置信区间。并把具有一定可靠性和精度的估计区间称为置信区间。利用构造的统计量及样本观测值,计算得出参数的置信利用构造的统计量及样本观测值,计算得出参数的置信区间的方法称为参数的区间估计。区间的方法称为参数的区间估计。STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程2. 2. 参数的置信区间参数的置信区间 在区间估计中,对于总体的未知参数在区间估计中,对于总体的未知参数,需要求出两,需
3、要求出两个统计量个统计量1(X1,X2,.,Xn)和和2(X1,X2,.,Xn)来分来分别估计总体参数别估计总体参数的上限和下限,使得总体参数在区间的上限和下限,使得总体参数在区间(1,2)内的概率为)内的概率为P1 2 = 1 其中其中1 称为置信水平,而称为置信水平,而(1,2)称为称为的置信区间,的置信区间,1,2分别称为置信下限和置信上限。置信水平为分别称为置信下限和置信上限。置信水平为1 的的含义是随机区间含义是随机区间(1,2)以以1 的概率包含了参数的概率包含了参数。STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程3. 3. 正态总体均值和方差的置
4、信区间正态总体均值和方差的置信区间 参数的区间估计大多是对正态总体的参数进行估计,参数的区间估计大多是对正态总体的参数进行估计,如对单总体均值、方差的估计、两总体均值差的估计和如对单总体均值、方差的估计、两总体均值差的估计和两总体方差比的估计等。两总体方差比的估计等。 正态总体参数的各种置信区间见表正态总体参数的各种置信区间见表3-1。)1 ,0( NnXZnZXnZX22,) 1(ntnSXt) 1(),) 1(22nSntXnSntX)(2122nXnii)()(,)()(221122212nXnXniinii) 1() 1(212222nXXSnnii) 1()(,) 1()(22112
5、2212nXXnXXniinii被估参数条件枢轴量及其分布参数的置信区间单正态总体2已知2未知2已知未知STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程正态总体参数的各种置信区间见表正态总体参数的各种置信区间见表3-1。)1 ,0()(22212121NnnYXZ2221212nnZYX)2(11)(212121nntnnSYXtw2) 1() 1(21222211nnSnSnSw2121211)2(nnSnntYXw2221) 1, 1(2122212221nnFSSF) 1, 1(1,) 1, 1(121212221212/2221nnFSSnnFSS 其中
6、被估参数条件枢轴量及其分布参数的置信区间两正态总体1 -2两样本独立,12, 22已知两样本独立,12= 22 = 2 未知两样本独立,1, 2未知STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程4. 4. 总体比例与比例差的置信区间总体比例与比例差的置信区间 实际应用中经常需要对总体比例进行估计,如产品的实际应用中经常需要对总体比例进行估计,如产品的合格率、大学生的就业率和手机的普及率等。记合格率、大学生的就业率和手机的普及率等。记和和P分分别表示总体比例和样本比例,则当样本容量别表示总体比例和样本比例,则当样本容量n很大时很大时(一般当(一般当nP和和n(1
7、 P)均大于均大于5时,就可以认为样本容量时,就可以认为样本容量足够大),样本比例足够大),样本比例P的抽样分布可用正态分布近似。的抽样分布可用正态分布近似。总体比例与比例差的置信区间如表总体比例与比例差的置信区间如表3-2所示。所示。),(近似10)1 (NnPPPZnPPZP)1 (2),(近似10)1 ()1 ()()(2221112121NnnPPz222111221)1()1()(nPPnPPZPP待估参数枢轴量及其分布参数的置信区间总体比例两总体比例差1-2其中P1,P2为两个样本比例 STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程3.1.2 假设
8、检验假设检验1. 1. 假设检验的基本原理假设检验的基本原理 对总体参数进行假设检验时,首先要给定一个原假设对总体参数进行假设检验时,首先要给定一个原假设H0,H0是关于总体参数的表述,与此同时存在一个与是关于总体参数的表述,与此同时存在一个与H0相对立的备择假设相对立的备择假设H1,H0与与H1有且仅有一个成立;有且仅有一个成立;经过一次抽样,若发生了小概率事件(通常把概率小于经过一次抽样,若发生了小概率事件(通常把概率小于0.05的事件称为小概率事件),可以依据的事件称为小概率事件),可以依据“小概率事件小概率事件在一次实验中几乎不可能发生在一次实验中几乎不可能发生”的理由,怀疑原假设不的
9、理由,怀疑原假设不真,作出拒绝原假设真,作出拒绝原假设H0,接受,接受H1的决定;反之,若小的决定;反之,若小概率事件没有发生,就没有理由拒绝概率事件没有发生,就没有理由拒绝H0,从而应作出拒,从而应作出拒绝绝H1的决定。的决定。STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程2. 2. 假设检验的步骤假设检验的步骤 1) 根据问题确立原假设根据问题确立原假设H0和备选假设和备选假设H1; 2) 确定一个显著水平确定一个显著水平 ,它是衡量稀有性(小概率事,它是衡量稀有性(小概率事件)的标准,常取为件)的标准,常取为0.05; 3) 选定合适的检验用统计量选定合
10、适的检验用统计量W(通常在原假设中相等(通常在原假设中相等成立时,成立时,W的分布是已知的),根据的分布是已知的),根据W的分布及的分布及 的值,的值,确定确定H0的拒绝域。的拒绝域。 4) 由样本观测值计算出统计量由样本观测值计算出统计量W的观测值的观测值W0,如果,如果W0落入落入H0的拒绝域,则拒绝的拒绝域,则拒绝H0;否则,不能拒绝原假;否则,不能拒绝原假设设H0。STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程 注意:在注意:在SAS系统中,是由样本观测值计算出统计量系统中,是由样本观测值计算出统计量W的观测值的观测值W0和衡量观测结果极端性的和衡量观
11、测结果极端性的p值(值(p值就是当值就是当原假设成立时得到样本观测值和更极端结果的概率),原假设成立时得到样本观测值和更极端结果的概率),然后比较然后比较p和和 作判断:作判断:p ,拒绝原假设,拒绝原假设H0;p ,不,不能拒绝原假设能拒绝原假设H0。STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程 p值通常由下面公式计算而得到。值通常由下面公式计算而得到。 p = P|W| |W0| = 2 P W |W0| (拒绝域为两边对称的区域时)(拒绝域为两边对称的区域时) p = minPW W0,PW W0(拒绝域为两边非对称区域时)(拒绝域为两边非对称区域时)
12、 p = PW W0 (拒绝域为右边区域时)(拒绝域为右边区域时) p = PW W0 (拒绝域为左边区域时)(拒绝域为左边区域时) 只需根据只需根据SAS计算出的计算出的p值,就可以在指定的显著水值,就可以在指定的显著水平下,作出拒绝或不能拒绝原假设的决定。平下,作出拒绝或不能拒绝原假设的决定。STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程3. 3. 正态总体均值和方差的假设检验正态总体均值和方差的假设检验 对正态总体的参数进行假设检验是假设检验的重要内对正态总体的参数进行假设检验是假设检验的重要内容,如对单总体均值、方差的检验、两总体均值之差的容,如对单总
13、体均值、方差的检验、两总体均值之差的检验和两总体方差比的检验等。正态总体参数的各种检检验和两总体方差比的检验等。正态总体参数的各种检验方法见下表验方法见下表3-3至表至表3-5。表3-3 单正态总体N(,2)均值的检验法2nXZ02nSXt0检验名称条件检验类别H0H1检验统计量分布拒绝域Z检验已知双边检验 = 0 0N(0,1)| Z | Z/2左边检验 0 0Z Zt检验未知双边检验 = 0 0t(n 1)| t | t/2(n 1)左边检验 0 0t t(n 1)STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程表3-4 单正态总体N(,2)方差2的检验法2
14、02202niiX1202)(2n)(2212n)(222n202202)(212n202202)(22n202202niiXXSn120 .2022) 1() 1(2n) 1(2212n) 1(222n202202) 1(212n202202) 1(22n或检验名称条件检验类别H0H1检验统计量分布拒绝域2检验已知双边检验左边检验右边检验未知双边检验左边检验右边检验STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程表3-5 两正态总体的均值差与方差比的检验2111nnSYXtw2) 1() 1(21222211nnSnSnSw)2(212nntt)2(21nnt
15、t)2(21nnttnSdtd) 1( nt) 1(2ntt) 1( ntt) 1( ntt1/22211/22212221SSF ) 1, 1(212/1nnFF) 1, 1(212/nnFF1/22211/2221) 1, 1(211nnFF1/22211/2221) 1, 1(21nnFF名称条件类别H0H1检验统计量分布拒绝域Z检验两样本独立,12=22=2未知双边检验1-2=01-20t(n1 + n2 2)左边检验1-201-20t检验成对匹配样本,12,22未知双边检验d=0d0左边检验d0d0F检验两样本独立,1, 2未知双边检验F(n11,n21)左边检验右边检验STATST
16、ATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程4. 4. 总体比例与比例差的检验总体比例与比例差的检验 当样本容量当样本容量n很大时,可根据表很大时,可根据表3-6对总体比例与比例对总体比例与比例差进行假设检验。差进行假设检验。表3-6 总体比例与比例差的检验nPz)1 (00022211121)1 ()1 (nPPnPPPPz检验名称检验类别H0H1 检验统计量分布拒绝域比例检验双边检验 = 0 0N(0,1)| z | z/2左边检验 0 0| z | z两总体比例差检验双边检验1 = 21 2N(0,1)| z | z/2左边检验1 21 2| z | zSTATS
17、TATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程n3.2 3.2 总体均值的区间估计与假设检验的总体均值的区间估计与假设检验的SASSAS实现实现n3.2.1 使用使用INSIGHT模块模块n3.2.2 使用使用“分析家分析家”n3.2.3 使用使用TTEST过程过程STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程3.2.1 使用使用INSIGHT模块模块1. 1. 总体均值的区间估计总体均值的区间估计【例【例3-1】某药材生产商要对其仓库中的】某药材生产商要对其仓库中的1000箱药材的箱药材的平均重量进行估计,药材重量的总体方差未知,随机
18、抽平均重量进行估计,药材重量的总体方差未知,随机抽取取16箱样本称重后结果如表箱样本称重后结果如表3-7所示。所示。表3-7 16箱药材重量(单位:千克) 设药材重量数据存放于数据集设药材重量数据存放于数据集Mylib.yczl中,其中重中,其中重量变量名为量变量名为weight。求该仓库中每箱药材平均重量在。求该仓库中每箱药材平均重量在95%置信水平下的置信区间。置信水平下的置信区间。50505651495347525353495355485055STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程步骤如下:步骤如下: 1) 启动启动INSIGHT模块,并打开数据
19、集模块,并打开数据集Mylib.yczl; 2) 选择菜单选择菜单“Analyze”“Distribution(Y)”; 3) 在打开的在打开的“Distribution(Y)”对话框中进行区间估计对话框中进行区间估计的设置(如图)。的设置(如图)。 STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程 结果包括一个名为结果包括一个名为“95Confidence Intervals(95%置信区间)置信区间)”的列表,表中给出了均值、标准差、方差的列表,表中给出了均值、标准差、方差的估计值(的估计值(Parameter)、置信下限()、置信下限(LCL)和置信上)和
20、置信上限(限(UCL),如图),如图3-2所示。结果表明,根据抽样样本,所示。结果表明,根据抽样样本,该仓库中药材的平均重量以该仓库中药材的平均重量以95%的可能性位于的可能性位于50.08千千克至克至52.92千克之间。千克之间。STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程2. 2. 单样本总体均值的假设检验单样本总体均值的假设检验【例【例3-2】一家食品厂以生产袋装食品为主,每天的产】一家食品厂以生产袋装食品为主,每天的产量大约为量大约为8000袋,每袋重量规定为袋,每袋重量规定为100克。为了分析每克。为了分析每袋重量是否符合要求,质检部门经常进行抽检
21、。现从某袋重量是否符合要求,质检部门经常进行抽检。现从某天生产的一批食品中随机抽取了天生产的一批食品中随机抽取了25袋,测得每袋重量如袋,测得每袋重量如表表3-8所示。所示。表3-8 25袋食品的重量(单位:克)试从抽检的样本数据出发,检验变量试从抽检的样本数据出发,检验变量WEIGHT的均值的均值与与100克是否有显著差异。假定表克是否有显著差异。假定表3-8数据存放在数据集数据存放在数据集Mylib.spzl中,重量变量名为中,重量变量名为WEIGHT。112.5101.0103.0102.0100.5102.6107.595.0108.8115.6100.0123.5102.0101.6
22、102.2116.695.497.8108.6105.0136.8102.8101.598.493.3STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程 设变量设变量WEIGHT的均值为的均值为,问题是希望通过样本数,问题是希望通过样本数据检验变量据检验变量WEIGHT均值的如下假设:均值的如下假设: H0: = 100,H1: 100。使用使用INSIGHT对均值进行检验的步骤如下:对均值进行检验的步骤如下: 1) 首先启动首先启动INSIGHT,并打开数据集,并打开数据集Mylib.spzl; 2) 选择菜单选择菜单“Analyze”“Distribution
23、(Y)”; 3) 在打开的在打开的“Distribution(Y)”对话框中选定分析变量对话框中选定分析变量WEIGHT; 4) 单击单击“OK”按钮,得到变量的描述性统计量;按钮,得到变量的描述性统计量;STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程 5) 选择菜单选择菜单“Tables(表)(表)”“Tests for Location(位置检验)(位置检验)”;在弹出的;在弹出的“Tests for Location”对话框对话框中输入中输入100,单击,单击“OK”按钮得到输出结果如图所示。按钮得到输出结果如图所示。 STATSTATSTATSTATS
24、ASSAS软件与统计应用教程软件与统计应用教程 结果显示,观测值不等于结果显示,观测值不等于100克的观测有克的观测有24个,其中个,其中19个观测值大于个观测值大于100。 图中第一个检验为图中第一个检验为t检验检验(Students t),需要假定变量,需要假定变量服从正态分布,检验的服从正态分布,检验的p值为值为0.0105,这个检验在,这个检验在0.05水水平下是显著的,所以可认为均值与平下是显著的,所以可认为均值与100克有显著差异。克有显著差异。第二个检验第二个检验(Sign)是叫做符号检验的非参数检验,其是叫做符号检验的非参数检验,其p值值为为0.0066,在,在0.05水平下也
25、是显著的,结论不变。第三水平下也是显著的,结论不变。第三个检验个检验(Sgned Rank)是叫做符号秩检验的非参数检验,是叫做符号秩检验的非参数检验,其其p值为值为0.0048,在,在0.05水平下是显著的,结论不变。水平下是显著的,结论不变。STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程3. 3. 两样本总体均值的比较:成对匹配样本两样本总体均值的比较:成对匹配样本 在在INSIGHT中比较成对样本均值是否显著差异,可中比较成对样本均值是否显著差异,可以计算两变量的差值变量,再检验差值变量的均值是否以计算两变量的差值变量,再检验差值变量的均值是否显著为显著
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- SAS 软件 统计 应用 教程
![提示](https://www.deliwenku.com/images/bang_tan.gif)
限制150内