2022年医学统计复习资料.docx
《2022年医学统计复习资料.docx》由会员分享,可在线阅读,更多相关《2022年医学统计复习资料.docx(30页珍藏版)》请在得力文库 - 分享文档赚钱的网站上搜索。
1、精选学习资料 - - - - - - - - - 读书之法 ,在循序而渐进 ,熟读而精思第一至五章统计学是 讨论数据及其存在规律的科学,是关于数据收集、整理、分析、表达和说明的普遍原理和方法;统计学的 总体 是指依据讨论目的确定的、全部同质个体的某个(或某些) 变量值; 这里的 个体又称观看单位(或讨论单位) ,可以是一个社区、一个特定的人群、一个人、一个血样、一个细胞、一个基因、一个蛋白质等;样本: 总体中 有代表性的一部分;依据讨论目的,对讨论对象的某个或某些特点(亦称讨论指标或项目)实施观测,这些特点(指标或项目)称为变量 ;变量的测 得值叫 变量值(也叫观看值或资料)统计工作的步骤 一
2、讨论设计,二收集资料;三整理资料;四 分析资料;计量资料定义 通过度量衡的方法,测量每一个观看单位的某项讨论指标的量的大小,得到的一系列数据资料;如:体重与身高, 特点: 有度量衡单位;多为连续性资料(通过测量得到)计数资料定义:将全体观测单位依据某种性质或特点分组,然后再分别清点各组观看单位的个数;特点 :没有度量衡单位;多为间断性资料(通过枚举或记数得来)等级资料定义:介于计量资料和计数资料之间的一种资料,通过半定量方法测量得到;特点: 每一个观看单位没有准确值;各组之间有性质上的差别或程度上的不同;总体: 依据讨论 目的 确定的 同质的、观看单位 的全体 ;同质与变异 讨论对象具有的相同
3、的状况或属性等共性称 称为 变异;同质 或 同质性 ;对于同质的各观看单位,其某变量值之间的差异,误差: 统计上所说的误差泛指测量值与真值之差,样本指标与总体指标之差;主要有二种:系统误差;随机误差;系统误 差: 指数据搜集和测量过程中由于仪器不精确、标准不规范等缘由,造成观看结果呈倾向性的偏大或偏小;特点:具有累 加性; 随机误差: 由于一些非人为的偶然因素使得结果或大或小,是不确定、不行预知的;特点:随测量次数参与而减小;抽样误差: 由于抽样缘由造成的样本指标与总体指标之间的差别;特点:有抽样发生抽样误差就不行防止;削减抽样误差的方法:(1)增加样本的代表性;样本量n 相等的情形下:整群抽
4、样 单纯随机抽样 系统抽样 分层抽样( 2) 增加样本量n (3)选择变异程度较小的讨论指标;概率: 描述随机大事发生的可能性大小的数值,常用P 来表示; P 的大小在 0 和 1 之间;通常一个大事的发生小于5%,就叫小概率大事;频率: 在实际工作中,当观看单位的例数足够多时,可以用频率来代替概率;频率是概率的估量值;试验设计与调查设计目的:观看不同处理因素的效应;3 个基本要素: 1 处理因素和非处理因素、2 试验对象、 3 试验效应通过试验指标表达选择指标的依据(1 精确性、 2 灵敏性、 3 稳固性) 基本原就: 对比的原就(保证均衡一样的条件 1、对等 2 同步 3 专设)、重复原就
5、(样本量) 、随机化原就;频数: 当汇总大量的原始数据时,把数据按类型分组,其中每组数据个数,称该组的频数;频数表(频数分布) : 将变量值分为不同数量的组段,清点各组段的例数;表示各组及其对应的组频数的表格;意义 概括明白变量值在各组段的分布和规律;两个特点:集中趋势与离散趋势 共性与个性)主要用途:1.揭示分布类型 2. 发觉特大值和特小值 3.运算集中趋势指标与离散趋势指标;资料的统计描述:即用少量几个统计指标刻画出原始数据的特点称为统计描述;计量资料频数表的编制步骤 1.确定全距( R)=最大值 最小值 2.定组数( 8-15 组)和组距:3.写出组段的下限:第 1 组段值小于或等于最
6、小变量值,并以整数(0,5 或 2,4,6, 8)较好; 4.划计并计数:变量(x)归为 L xU(见表 2-1 平均数概念:平均数表示一组同质计量数据集中趋势的位置和平均水平;作用: 是一组计量数据平均水平的代表值;可作为不同组间的比较值;算术均数 mean;简称均数 ,用X表示 . fX第 1 页,共 19 页XnXx 1x 2xnXfn 101 名正常成年女性血清总胆固醇频数表一表 2-1 fX 组段频数( f)组中值 X 2.3- 1 2.45 2.45 2.6- 3 2.75 8.25 2.9- 6 3.05 18.30 3.2- 8 3.35 3.5- 17 3.65 3.8- 2
7、0 3.95 名师归纳总结 - - - - - - -精选学习资料 - - - - - - - - - 读书之法 ,在循序而渐进 ,熟读而精思4.1- 17 4.25 409.7 4.4- 12 4.55 4.7- 9 4.85 5.0- 5 5.15 5.3- 2 5.45 5.6- 5 1 5.75 合计101 加权法公式运算fX f 1 X 1 f 2 X 2 f k X kXf f 1 f 2 f kX fX 1 2 . 45 3 .2 75 1 5 . 75f 1014 . 06 mmol / L 几何均数适用条件 :X 值呈倍数增长或部分数据偏离过大偏态分布(正偏态)资料;运算公式
8、:G lg 1 f lg X i 例 2-4 某地 5 例微丝蚴血症患者治疗 f 7 年后用间接荧光抗体试验测得其抗体滴度分别为 1/10,1/20,1/40,1/80,1/160,求几何均数;G 5 10 20 40 40 160 34.8G lg 1 lg X lg 1 lg10 lg20 lg40 lg40 lg160 34.8n 5结论: 平均抗体滴度为 1:34(几何均数法)中位数 M :定义: 将一组变量值由小到大依次排列,居以中间位次的观看值即为中位数,为这组数据的平均数;适用于描述偏态分布资料的平均水平;如埋伏期、病程资料;中位数的运算MX1 2n1N 为奇数N 为偶数x 百分
9、位数的秩次,其对应的变M1 2Xn2Xn21百分位数是一种位置指标,用P x表示;定义: 将一组变量值由小到大依次排列,为第量值( x)为第 x 百分位数,记 为 Px;例: 8 位患者某病的住院天数:2 2 2 3 3 4 5 6 求 50%位数和 80%位数;解:第 50%位次: nX%=8 0.5=4 中位数 =P50=3(天)第 80%位次: nX%=8 0.8=6.4,用公式 2.7 p 80 x trunc 6.4 1 x 7(天)百分位数运算结果的应用 1.常运算 P25、P50 、P75、和 P95,为临床治疗供应依据;例 2-9:120 名细菌性痢疾治愈的住院天数P5=3.5
10、(天),即只有 5%的人住院低于 3.5 天;P95=15(天)2.确定医学指标的参考值几个常用的变异指标极差;全距( Range):意义: R 值越大,表示该组数据的变异越大;果不稳固;缺点: 数据利用不全,部分信息缺失,在例数少时结四分位数间距:常用QR 表示QR=P75%-P25%作为变异指标比极差稳固;常用于表示偏态分布资料的变异;例: QR= P75% -P25% =67.739.2=28.5 天表示方法: M d( QR )M=51 天,(QR=28.5 天)标准差的简化运算公式:SX2X2/n2/(列数较少)第 2 页,共 19 页n1名师归纳总结 - - - - - - -Sf
11、X2fXff1精选学习资料 - - - - - - - - - 读书之法 ,在循序而渐进 ,熟读而精思(频数表资料)例 2-11 甲组 5 名同龄男孩的身高值(cm)/57 . 91X X290 8100 95 9025 S502505 500 2100 10000 1105 11025 110 12100 S 越小,表示数据的变异程度越小;X500X250250标准差的意义:反映一组变量值变异程度,组间单位相同时,变异系数 CV 1.单位不同时组间变异程度的比较;某地 7 岁年龄组男童身高与体重指标 S CV% 身高 cm 123.10 4.71 3.83 体重 kg 22.29 2.26
12、10.14 结论:7 岁年龄组男童身高与体重值指标比较,体重指标的变异大于身高指标;某地不同年龄组男童身高(cm)年龄组 S CV% 1-2 月 56.3 2.1 3.73 5-6 月 66.5 2.2 3.31 3-3.5 岁 96.1 3.1 3.22 5-5.5 岁 107.8 3.3 3.06 结论:随着年龄增加,身高的变异变小;参数统计 :统计推断方法,通常要求样原来自正态总体,或方差齐等,在这些假设的基础上,对总体参数进行估量和检验,称为参数统计;非参数统计 :有很多资料不符合参数统计的要求,不能用参数统计的方法进行检验,而需要一种不依靠于总体分布类型的假设检验;是通过将样本实际数
13、据排队编秩后,对秩次进行比较,因此也叫秩和检验;抽样误差 :由于抽样引起的样本统计量与总体参数之间的差异;标准误: x Sx 表示抽样误差大小的指标;样本均数的标准差;(均数) 标准误 意义:反映抽样误差的大小;标准误越小,抽样误差越小,用样本均数估量总体均数的牢靠性越大;点估量 是用样本统计量直接估量其总体参数值;如用 估量、S 估量 等;方法虽简洁,但未考虑抽样误差大小区间估量 是按预先给定的概率 1- ,确定一个包含总体参数的范畴;该范畴称为参数的可信区间评判可信区间估量的优劣:正确性:可信度,即区间包含总体参数的理论概率大小,愈接近 1 愈好;精确性:区间的宽度,区间愈窄愈好;当样本含
14、量为定值时,上述两者相互冲突;如只顾提高可信度,就可信区间会变宽可信区间与参考值范畴的区分可信区间用于估量总体参数,总体参数只有一个;参考值范畴用于估量个体值的分布范畴,个体值有很多;95%可信区间中的 95%是可信度,即所求可信区间包含总体参数的可信程度为 95%;95%参考值范畴中的 95%是一个比例,即所求参考值范畴包含了 95%的正常人;个体值的波动样本量越大,参考值的范畴越稳固,总体均数的可信区间:样本量可信区间越小95% 的可信区间的懂得:100 个样本均数和标准差,也可算得100 个均数的可信区间,平均约有95 个可从正态总体中随机抽取100 个样本,可算得信区间包含了总体均数;
15、但在实际工作中,只能依据一次试验结果估量可信区间,我们就认为该区间包含了总体均数正常值范畴与可信区间正常值范畴 概念:绝大多数正常人的某指标范畴;(95%,99%, 指绝大多数正常人)名师归纳总结 - - - - - - -第 3 页,共 19 页精选学习资料 - - - - - - - - - 读书之法 ,在循序而渐进 ,熟读而精思用途 :判定观看对象的某项指标是否正常 . 可信区间概念 :总体均数所在的数值 ,范畴(95%,99% 指可信度) 用途: 估量总体均数正态分布 是描述连续型变量值分布的曲线,医学上很多资料近似听从正态分布;正态分布在统计推断上有重要的 直方图的频数分布与正态分布
16、正态分布曲线理论上的特点1)以 X= 为中心 , X 值呈钟型分布对称性削减;(2 )在 X= 处, f(x)取最大值;(3 )正态分布由 、 打算 正态分布的位置和外形;随 不同,曲线位置不同,称 为位置参数; 越大,曲线外形不同,称 为外形参数;医学参考值 是指包括绝大多数“ 正常人 ” 的各种生理及生化指标常数,也称正常值; 正常值是 指在肯定范畴内波动的值,医学上常用 95%的范畴作为判定正常或反常的参考标准;医学参考值制定时留意问题1.确定诊断指标为“ 定性 ” 或“ 定量 ”2.计量数据要确定其分布 正态或偏态 3.计量资料考虑制定单侧诊断界值仍是双侧诊断界值 4.有足够的样本例数
17、(一般不低于 100 例)二项分布 是指在只会产生两种可能结果如“ 阳性 ”或“ 阴性 ” 之一的 n 次独立重复试验中, 当每次试验的 “阳性 ”概率保持不变时,显现 “阳性 ” 的次数 X=0 ,1, 2,n 的一种概率分布;记为 X B n , , n 为试验次数, 为“ 阳性 ” 概率;适用条件 可能发生的两类错误1,每次试验只会发生两种对立的结果之一,两种互斥结果的概率之和恒等于 1;假设检验的结果2,每次试验产生某种结果(如“阳性 ”)的概率 固定不变;客观实际3,各次试验是相互独立的,即任何一次试验结果的显现不会影响其它试验结果显现的概率;拒绝 H0 不拒绝 H0二项分布的应用
18、总体率的区间估量 样本率与总体率的比较 H0成立 两样本率的比较 I 型错误 讨论非遗传性疾病的家族集聚性 推断正确 群检验I 型错误和 II 型错误 1 1. 当样本量肯定时 II 类错误的概率 值的两个规律:, 愈小 , 就 愈大,反之 ; H0不成立刻 推断正确 II 型错误2.当 肯定时 , 样本量增加 , 削减 . H1成立 1 3.举例说明对合计率标准化的基本思想;答:两人群发病率、死亡率、诞生率、病死率等的比较,常考虑人群性别、年龄等构成的影响,需对率进行标准化;率标准化法的基本思想就是采纳统一的标准人口构成,以排除人口构成不同对人群总率的影响,使算得标准化率具有可比性;举例说明
19、变异系数适用于哪两种形式的资料,作变异程度的比较?答:( 1)度量衡单位不同的多组资料的变异度的比较;例如,欲比较身高和体重何者变异度大,由于度量衡单位不同,不能直接用标准差来比较,而应用变异系数比较;(2)比较均数相差悬殊的多组资料的变异度;例如,t 分布的图形与特点3 岁儿童与 20 岁成年人身高差异的比较;t 分布为一簇单峰分布曲线, 不同,曲线外形不同 ;t 分布以 0 为中心,左右对称;当 靠近 , S X靠近X,t 分t 分布与 有关, 越小,t 值越分散, t 分布的峰部越低,而两侧尾部翘得越高布靠近 u 分布 统计图的概念 用点的位置、线段的升降、直条的长短及面积的大小等几何图
20、形表达事物的统计指标大小、对比关系及变化趋势;统计图的种类 条图 bar chart圆图(pie chart)百分比条图 (percent bar chart)线图(line graph)直方图(histogram)散点图(scatter diagram)统计地图( statistical map)数据分析中应用:箱式图、茎叶图、残差图等;条图 (bar chart)用等宽直条的长短来表示相互独立的各统计;指标的数值大小;分为:名师归纳总结 - - - - - - -第 4 页,共 19 页精选学习资料 - - - - - - - - - 读书之法 ,在循序而渐进 ,熟读而精思单式条图:具有一
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 2022 医学 统计 复习资料
限制150内