医学统计学重点总结

时间:2019-05-13 18:34:45下载本文作者:会员上传
简介:写写帮文库小编为你整理了多篇相关的《医学统计学重点总结》,但愿对你工作学习有帮助,当然你在写写帮文库还可以找到更多《医学统计学重点总结》。

第一篇:医学统计学重点总结

简述标准差与标准误的联系与区别?

标准差和标准误都是变异指标,但它们之间有区别,也有联系。区别: ①概念不同;标准差是描述观察值(个体值)之间的变异程度;标准误是描述样本均数的抽样误差;②用途不同;标准差常用于表示变量值对均数波动的大小,与均数结合估计参考值范围,计算变异系数,计算标准误等。标准误常用于表示样本统计量(样本均数,样本率)对总体参数(总体均数,总体率)的波动情况,用于估计参数的可信区间,进行假设检验等。③它们与样本含量的关系不同: 当样本含量 n 足够大时,标准差趋向稳定;而标准误随n的增大而减小,甚至趋于0。联系: 标准差,标准误均为变异指标,如果把样本均数看作一个变量值,则样本均数的标准误可称为样本均数的标准差;当样本含量不变时,标准误与标准差成正比;两者均可与均数结合运用,但描述的内容各不相同。

试述正态分布的特征?

服从正态分布的变量的频数分布由υ、σ 完全决定。

(1)υ 是正态分布的位置参数,描述正态分布的集中趋势位置。正态分布以 x =υ为对

称轴,左右完全对称。正态分布的均数、中位数、众数相同,均等于υ。

(2)σ描述正态分布资料数据分布的离散程度,σ越大,数据分布越分散,σ越小,数

据分布越集中。σ也称为是正态分布的形状参数,σ越大,曲线越扁平,反之,σ越小,曲

线越瘦高。

简述直线相关与直线回归的联系与区别?

答:

1、区别: ①在资料要求上,回归要求因变量y 服从正态分布,自变量x是可以精确测量和严格控制的变量,一般称为Ⅰ型回归;相关要求两个变量x、y服从双变量正态分布。这种资料若进行回归分析称为Ⅱ型回归。②在应用上,说明两变量间依存变化的数量关系用回归,说明变量间的相关关系用相关。

2、联系: ①对一组数据若同时计算r与b,则它们的正负号是一致的;②r与b的假设检验是等价的,即对同一样本,二者的t值相等。③可用回归解释相关。

.简述假设检验的基本步骤及其两类错误

① 建立假设:包括: H0,称无效假设;H1: 称备择假设;② 确定检验水准:检验水准用α表示,α一般取0.05;③ 计算检验统计量:根据不同的检验方法,使用特定的公式计算;④确定P值:通过统计量及相应的界值表来确定P值;⑤推断结论:如P>α,则接受H0,差别无统计学意义;如P≤α,则拒绝H0,差别有统计学意义。Ⅰ型错误又称第一类错误(type Ⅰ error):拒绝了实际上成立的的错误,其概率通常用,为“弃真”,表示。Ⅱ型错误又称第二类错误(type Ⅱ error):不拒绝实际上不成立的表示。为“存伪”的错误,其概率通常用

3.简述标准差的意义和用途?

标准差是描述变量值离散程度常用的指标,主要用途如下: ①描述变量值的离散程度。两组同类资料(总体或样本)均数相近,标准差大,说明变量值的变异度较大,即各变量值较分散,因而均数代表性较差;反之,标准差较小,说明变量异度较小,各变量值较集中在均数周围,因而均数的代表性较好。②结合均数描述正态分布特征;③结合均数计算变异系数CV;④结合样本含量计算标准误。

抽样误差:由于总体中存在个体变异,随机抽样所得样本仅仅是总体的一部分,从而造成样本统计量与总体参数之间的差异,称抽样误差。

第一类错误:拒绝了实际上是成立的H0所产生的错误,即“弃真”,其概率大小为α。

第二类错误:接受了实际上不成立的H0所产生的错误,即“存伪”,其概率大小用β表示,一般β是未知的,其大小与α有关。

构成比: 又称构成指标。它说明一事物内部各组成部分所占的比重或分布。

构成比=(某一组成部分的观察单位数/同一事物各组成的观察单位总数)×100%。

率:又称频率指标。它说明某现象发生的频率或强度。

率=(发生某现象的观察单位数/可能发生该现象的观察单位总数)×K。

率的标准化法: 采用一个共同的内部构成标准,把两个或多个样本的不同内部构成调整为共同的内部构成标准, 以消除因内部构成不同对总率产生的影响,使算得的标准化率具有可比性

计量资料: 用定量方法对每个观察对象测定某项指标量的大小,所得的资料称为计量资料。

计数资料: 先将观察单位按某种属性或类别分组,然后清点各组的观察单位数所得资料,称为计数资料。等级资料: 将观察单位按某种属性的不同程度分组,所得各组的观察单位数,称为等级资料。

小概率事件:我们把概率很接近于0(即在大量重复试验中出现的频率非常低)的事件称为小概率事件。P值:P 值即概率,反映某一事件发生的可能性大小。统计学根据显著性检验方法所得到的P 值反应结果真实程度,一般以P ≤ 0.05 认为有统计学意义,P ≤0.01 认为有高度统计学意义,其含义是样本间的差异由抽样误差所致的概率等于或小于0.05 或0.01。

描述数据分布集中趋势的指标 算术均数、几何均数、中位数。

描述数据分布离散程度的指标 极差、四分位数间距、方差、标准差、变异系数。

同质:影响研究指标的主要因素易控制的因素基本上相同。

可信区间:在参数估计时,按一定可信度估计所得的总体参数所在的范围。

率:又称频率指标。它说明某现象发生的频率或强度。

非参数检验:在统计推断中,不依赖于总体的分布形式, 直接对总体分布位置是否相同进行检验的方法相关系数: 说明两变量间相关关系的密切程度与相关方向的指标,用r表示。

回归系数b: 即回归直线的斜率,它表示当X变动一个单位时,Y平均改变b个单位。

偏回归系数bi: 在其它自变量保持恒定时,Xi每增(减)一个单位时y平均改变bi个单位。

决定系数: 相关系数或复相关系数的平方,即r或R。它表明由于引入有显著性相关的自变量,使总平方和减少的部分,r或R越接近1, 说明引入相关变量的效果越好

医学参考值范围:指绝大多数正常人的解剖、生理、生化、免疫及组织代谢产物的含量等各种波动范围。2222

第二篇:医学统计学_总结_重点_笔记_复习资料

第一章

2选1 总体:总体(population)是根据研究目的确定的同质观察单位(研究对象)的全体,实际上是某一变量值的集合。可分为有限总体和无限总体。总体中的所有单位都能够标识者为有限总体,反之为无限总体。

总体population根据研究目的而确定的同质观察单位的全体。

样本:从总体中随机抽取部分观察单位,其测量结果的集合称为样本(sample)。样本应具有代表性。所谓有代表性的样本,是指用随机抽样方法获得的样本。

样本sample从总体中随机抽得的部分观察单位,其实测值的集合。

3选1 小概率事件:我们把概率很接近于0(即在大量重复试验中出现的频率非常低)的事件称为小概率事件。

P值:P 值即概率,反映某一事件发生的可能性大小。统计学根据显著性检验方法所得到的P 值反应结果真实程度,一般以P ≤ 0.05 认为有统计学意义,P ≤0.01 认为有高度统计学意义,其含义是样本间的差异由抽样误差所致的概率等于或小于0.05 或0.01。P值是:

1)一种概率,一种在原假设为真的前提下出现观察样本以及更极端情况的概率。2)拒绝原假设的最小显著性水平。3)观察到的(实例的)显著性水平。

4)表示对原假设的支持程度,是用于确定是否应该拒绝原假设的另一种方法。

小概率原理:一个事件如果发生的概率很小的话,那么可认为它在一次实际实验中是不会发生的,数学上称之小概率原理,也称为小概率的实际不可能性原理。统计学中,一般认为等于或小于0.05或0.01的概率为小概率。

资料的类型(3选1)

(1)计量资料:对每个观察单位用定量的方法测定某项指标量的大小,所得的资料称为计量资料(measurement data)。计量资料亦称定量资料、测量资料。.其变量值是定量的,表现为数值大小,一般有度量衡单位。如某一患者的身高(cm)、体重(kg)、红细胞计数(10/L)、脉搏(次/分)、血压(KPa)等。

计量资料measurement data定量资料quantitative data数值变量资料numerical variable 为观测每个观察单位某项指标的大小,而获得的资料。

(2)计数资料:将观察单位按某种属性或类别分组,所得的观察单位数称为计数资料(count data)。计数资料亦称定性资料或分类资料。其观察值是定性的,表现为互不相容的类别或属性。如调查某地某时的男、女性人口数;治疗一批患者,其治疗效果为有效、无效的人数;调查一批少数民族居民的A、B、AB、O 四种血型的人数等。

计量资料enumeration data定性资料qualitative data无序分类变量资料unordered categorical variable 名义变量资料nominal variable 为将观察单位按某种属性或类别分组计数,分组汇总各组观察单位数后而得到的资料。

(3)等级资料:将观察单位按测量结果的某种属性的不同程度分组,所得各组的观察单位数,称为等级资料(ordinal data)。等级资料又称有序变量。如患者的治疗结果可分为治愈、好转、有效、无效或死亡,各种结果既是分类结果,又有顺序和等级差别,但这种差别却不能准确测量;一批肾病患者尿蛋白含量的测定结果分为 +、++、+++等。12等级资料ranked data半定量资料semi-quantitative data有序分类变量ordinal categorical variable资料

为将观察单位按某种属性的不同程度分成等级后分组计数,分类汇总各组观察单位后而得到的资料。

等级资料与计数资料不同:属性分组有程度差别,各组按大小顺序排列。

等级资料与计量资料不同:每个观察单位未确切定量,故亦称为半计量资料。两种误差(2选1)

抽样误差(sampling error)由于抽样而引起的总体指标(参数)与样本指标(统计数)之间的差异。抽样误差是由个体变异或其它随机因素造成的,是不可避免的,但误差分布有规律可循,可进行估计和分析。

系统误差(systematic error):由于测量仪器结构本身的问题、刻度不准确或测量环境改变等原因,在多次测量时所产生的,总是偏大或总是偏小的误差,称为系统误差。它带有规律性,经过校正和处理,通常可以减少或消除。

统计的步骤(考填空题,四个空)

统计工作的步骤

1.设计:设计内容包括资料收集、整理和分析全过程总的设想和安排。设计是整个研究中最关键的一环,是今后工作应遵循的依据。

2.收集资料:应采取措施使能取得准确可靠的原始数据。

3.整理资料:简化数据,使其系统化、条理化,便于进一步分析计算。

4.分析资料:计算有关指标,反映事物的综合特征,阐明事物的内在联系和规律。分析资料包括统计描述和统计推断。

实验设计的基本原则(考填空题,三个空)随机化原则、对照的原则、重复的原则。2选1 参数:参数(paramater)是指总体的统计指标,如总体均数、总体率等。总体参数

是固定的常数。多数情况下,总体参数是不易知道的,但可通过随机抽样抽取有代表性的样

本,用算得的样本统计量估计未知的总体参数。

统计量:统计量(statistic)是指样本的统计指标,如样本均数、样本率等。样本

统计量可用来估计总体参数。总体参数是固定的常数,统计量是在总体参数附近波动的随机

变量。

第二章

频数表的制作步骤以及频数分布表的用途(问答题)频数分布表的编制步骤:

例:某市1982年50名7岁男童的身高(cm)资料如下,试编制频数表。

114.4 117.2 122.7 124.0 114.0 110.8 118.2 116.7 118.9 118.1 123.5 118.3 120.3 116.2 114.7 119.7 114.8 119.6 113.2 120.0 119.8 116.8 119.8 122.5 119.7 120.7 114.3 122.0 117.0 122.5 119.7 124.9 126.1 120.0 124.6 120.0 121.5 114.3 124.1 117.2 120.2 120.8 126.6 121.5 126.1 117.7 124.1 128.3 121.8 118.7

1、找出观察值中的最大值(largest value)、最小值(smallest value),求极差(range)。

极差等于最大值减最小值。本例最大值=128.3,最小值=110.8,则极差=128.3-110.8=17.5(cm)

2、确定分组数和组距(class interval)。

组数的多少是根据例数的多少来确定的,以能够反映出频数分布的特征为原则,一般分10—15组。组距为相邻两组的间隔,组距=极差/组数。本例拟分10组,则组距=17.5/10=1.75≈2,为划记方便,可取稍大或稍小的数(当然本例组距也可取1.5)。

3、确定组段。

第一组段包括要最小值,取较最小值稍小且划分方便的数,本例取“110~”。最后组段包括最大值并写出其上限值。

4、划记。

将各观察值以划“正”字的方法,一笔代表一例,划在相应组段中。例如第一个数l14.4应在组段“114~”处划,第二个数117.2应在“116~”处划,以此类推。

5、统计各组段的频数。全部数据划记完后,清点各组段的人数。

根据编制出的频数表即可了解该数值变量资料的频数分布特征。频数分布表的用途

1、描述资料的分布特征和分布类型。

频数分布有两个重要特征:集中趋势和离散趋势。大部分观察值向某一数值集中的趋势称为集中趋势,常用平均数指标来表示,各观察值之间大小参差不齐。频数由中央位置向两侧逐渐减少,称离散趋势,是个体差异所致,可用一系列的变异指标来反映。

2、便于进一步计算有关指标或进行统计分析。当数据较多且需手工计算时,常先编制频数表,再进行统计计算。

3、发现特大、特小的可疑值。

如果频数表的一端或两端出现连续几个组段的频数为零后,又出现少数几个特大值或特小值,使人怀疑其是否准确,需进一步检查和核对并做相应处理。

4、据此绘制频数分布图。

描述数据分布集中趋势的指标和描述数据分布离散程度的指标(考选择或者填空)

2. 描述数据分布集中趋势的指标

算术均数、几何均数、中位数。

3. 描述数据分布离散程度的指标

极差、四分位数间距、方差、标准差、变异系数。正态分布的特征(考选择题 υ、σ对图形的影响)

服从正态分布的变量的频数分布由υ、σ 完全决定。

(1)υ 是正态分布的位置参数,描述正态分布的集中趋势位置。正态分布以 x =υ为对

称轴,左右完全对称。正态分布的均数、中位数、众数相同,均等于υ。(2)σ描述正态分布资料数据分布的离散程度,σ越大,数据分布越分散,σ越小,数 据分布越集中。σ也称为是正态分布的形状参数,σ越大,曲线越扁平,反之,σ越小,曲

线越瘦高。

标准正态分布(填空)

1.标准正态分布是一种特殊的正态分布,标准正态分布的υ 常用u(或Z)表示服从标准正态分布的变量,记为υ~N(0,1)。

正态分布的应用(简答)

某些医学现象,如同质群体的身高、红细胞数、血红蛋白量,以及实验中的随机误差,呈现为正态或近似正态分布;有些指标(变量)虽服从偏态分布,但经数据转换后的新变量可服从正态或近似正态分布,可按正态分布规律处理。其中经对数转换后服从正态分布的指标,被称为服从对数正态分布。

1.估计频数分布 一个服从正态分布的变量只要知道其均数与标准差就可根据公式即可估计任意取值范围内频数比例。

2.制定参考值范围

(1)正态分布法 适用于服从正态(或近似正态)分布指标以及可以通过转换后服从正态分布的指标。

(2)百分位数法 常用于偏态分布的指标。表3-1中两种方法的单双侧界值都应熟练掌握。

3.质量控制:为了控制实验中的测量(或实验)误差,常以 作为上、下警戒值,以 作为上、下控制值。这样做的依据是:正常情况下测量(或实验)误差服从正态分布。4.正态分布是许多统计方法的理论基础。检验、方差分析、相关和回归分析等多种统计方法均要求分析的指标服从正态分布。许多统计方法虽然不要求分析指标服从正态分布,但相应的统计量在大样本时近似正态分布,因而大样本时这些统计推断方法也是以正态分布为理论基础的。

医学参考值范围的制定(计算题)

确定参考值范围的单双侧:一般生理物质指标多为双侧、毒物指标则多为单侧。确定百分位点:一般取95%或99%。

20,σ2 1,通

例题

某市 20 岁男学生 160 人的脉搏数(次/分钟),经正态性检验服从正态分布。求得76.10,S =9.32。试估计脉搏数的95%、99%参考值范围。

解:脉搏数的95%正常值范围为:脉搏数的99%正常值范围为:

±1.96 S=76.10 ± 1.96(9.32)=57.83~94.37 ±2.58 S =76.10 ± 2.58(9.32)=52.05~100.37

第三章

= 标准误的概念,计算公式。标准误:抽样研究中,样本统计量与总体参数间的差别称为抽样误差(sampling error)。统计上用标准误(standard error,SE)来衡量抽样误差的大小,即样本均数的标准差,是描述均数抽样分布的离散程度及衡量均数抽样误差大小的尺度。

t分布的图形特征及其与正态分布的区别(简答)t分布的图形特征

1.以0为中心,左右对称的单峰分布;

2.t分布是一簇曲线,其形态变化与n(确切地说与自由度ν)大小有关。自由度ν越小,t分布曲线越低平;自由度ν越大,t分布曲线越接近标准正态分布(u分布)曲线。

t分布

对应于每一个自由度ν,就有一条t分布曲线,每条曲线都有其曲线下统计量t的分布规律,计算较复杂。

t 分布与正态分布比较的区别 t 分布与标准正态分布相比有以下特点:①都是单峰、对称分布;②t 分布峰值较低,而尾部较高;③随自由度增大,t 分布趋近与标准正态分布;当ν趋向∞,t 分布的极限分布是标准正态分布。

置信区间和参数估计(名解2选1)

置信区间:在统计学中,一个概率样本的置信区间(Confidence interval)是对这个样本的某个总体参数的区间估计。置信区间展现的是这个参数的真实值有一定概率落在测量结果的周围的程度。给出的是被测量参数的测量值的可信程度。

1、对于具有特定的发生概率的随机变量,其特定的价值区间------一个确定的数值范围(“一个区间”)。

2、在一定置信水平时,以测量结果为中心,包括总体均值在内的可信范围。

3、该区间包含了参数θ真值的可信程度。

4、参数的置信区间可以通过点估计量构造,也可以通过假设检验构造。

参数估计:指用样本指标值(统计量)估计总体指标值(参数)。参数估计有两种方法:点估计和区间估计。

可信区间与参考值范围的不同点(简答)

应注意:可信区间与参考值范围的意义、计算公式和用途均不同。

1.从意义和用途来看

95%参考值范围是指同质总体内包括95%个体值的估计范围,而总体均数95%可信区间是指按95%可信度估计的总体均数的所在范围。可信区间用于估计总体参数,总体参数只有一个。参考值范围用于估计变量值的分布范围,变量值可能很多甚至无限。2.从计算公式看

若指标服从正态分布,95%参考值范围的公式是:

±1.96s。

总体均数95%可信区间的公式是:。

前者用标准差,后者用标准误。前者用1.96,后者用α为0.05,自由度为v的t界值。t检验的应用条件和类型(填空)

t检验的应用条件:要求各样本来自相互独立的正态总体且各总体方差齐。t检验的类型:单样本t检验,独立t检验,配对t检验

配对设计和完全随机设计(名解2选1)

完全随机设计(completely random design):完全随机设计仅涉及一个处理因素(但可为多水平),故又称单因素(one-way)设计。它是将受试对象按随机化的方法分配到各个处理组中,观察实验效应,临床试验中的随机对照试验也属于此类设计。

配对设计(paired design):是将受试对象按一定条件匹配成对,再随机分配每对中的两个受试对象到不同处理组。配对的因素是影响实验效应的主要非处理凶素。

假设检验的基本求解步骤或者注意事项。(简答2选1)

假设检验的基本步骤

1.建立假设,确定检验水准α

假设有零假设(H0)和备择假设(H1)两个,零假设又叫作无效假设或检验假设。H0和H1的关系是互相对立的,如果拒绝H0,就要接受H1.根据备择假设不同,假设检验有单、双侧检验两种。检验水准用α表示,通常取0.05或0.10.检验水准说明了该检验犯第一类错误的概率。2.根据研究目的和设计类型选择适合的检验方法

这里的检验方法,是指参数检验方法,有u检验、t检验和方差分析三种,对应于不同的检验公式。对双样本资料,要注意区分成组设计和配对设计的资料类型。如果资料里有“配成对子”字样,或者是对同一对象用两种方法来处理,一般就可以判定是配对设计资料。3.确定P值并作出统计结论

u检验得到的是u统计量或称u值,t检验得到的是t统计量或称t值。方差分析得到的是F统计量或称F值。将求得的统计量绝对值与界值相比,可以确定P值。当α=0.05时,u值要和u界值1.96相比较,确定P值。如果u<1.96,则P>0.05.反之,如u>1.96,则P<0.05.t值 要和某自由度的t界值相比较,确定P值。如果t值<t界值,故P>0.05.反之,如t>t界值,则P<0.05.相同自由度的情况下,单侧检验的t界值 要小于双侧检验的t界值,因此有可能出现算得的t值大于单侧t界值,而小于双侧t界值的情况,即单侧检验显著,双侧检验未必就显著,反之,双侧检验显著,单侧检验必然会显著。即单侧检验更容易出现阳性结论。

当P>0.05时,接受零假设,认为差异无统计学意义,或者说二者不存在质的区别。当P<0.05时,拒绝零假设,接受备择假设,认为差异有统 计学意义,也可以理解为二者存在质的区别。但即使检验结果是P<0.01甚至P<0.001,都不说明差异相差很大,只表示更有把握认为二者存在差异。

假设检验时应注意的事项

(一)要有严密的抽样研究设计;样本必须是从同质总体中随机抽取的;要保证组间的均衡性和资料的可比性。

(二)根据现有的资料的性质、设计类型、样本含量大小正确选用检验方法。

(三)对差别有无统计学意义的判断不能绝对化,因检验水准只是人为规定的界限,是相对的。差别有统计学意义时,是指无效假设h0被接受的可能性只有5%或不到5%,甚至不到1%,根据小概率事件一次不可能拒h0,但尚不能排除有5%或1%出现的可能,所以可能产生第一类错误;同样,若不拒绝h0,可能产生第二类错误。

(四)统计学上差别显著与否,与实际意义是有区别的。如应用某药治疗高血压,平均降低舒张压0.5kpa,并得出差别有高度统计学意义的结论。从统计学角度,说明该药有降压作用,但实际上,降低0.5kpa是无临床意义。因此要结合专业作出恰如其分的结论。

第一类错误与第二类错误(名解 2选1)

Ⅰ型错误又称第一类错误(type Ⅰ error):拒绝了实际上成立的,为“弃真”的错误,其概率通常用表示。可取单尾也可取双尾,假设检验时研究者可以根据需要确定值大小,一般规定=0.05或=0.01,其意义为:假设检验中如果拒绝Ⅰ型错误的概率为5%或1%,即100次拒绝

时,发生的结论中,平均有5次或1次是错误的。,为“存伪”Ⅱ型错误又称第二类错误(type Ⅱ error):不拒绝实际上不成立的的错误,其概率通常用

表示。

只取单尾,假设检验时

值一般不知道,在一定情况下可以测算出,如已知两总体的差值(如)、样本含量和检验水准。以下图说明两类错误:

第四章

为什么等级资料不可用方差分析?资料不相互独立

方差分析的基本思想 应用条件(简答)

方差分析(analysis of variance,ANOVA)的基本思想就是根据资料的设计类型,即变异的不同来源将全部观察值总的离均差平方和(sum of squares of deviations from mean,SS)和自由度分解为两个或多个部分,除随机误差外,其余每个部分的变异可由某个因素的作用(或某几个因素的交互作用)加以解释,如各组均数的变异SS 组间可由处理因素的作用加以解释。通过各变异来源的均方与误差均方比值的大小,借助F 分布作出统计推断,判断各因素对各组均数有无影响。

方差分析的应用条件

(1)各样本是相互独立的随机样本,且来自正态分布总体。

(2)各样本的总体方差相等,即方差齐性(homoscedasticity)。

第五章 分类资料的统计描述(几个常用相对数指标 填空题)率(强度相对数,频率相对数)、构成比、相对比 应用相对数时应注意的问题(简答题 六条)⑴ 计算相对数的分母一般不宜过小。⑵ 分析时不能以构成比代替率。

⑶ 不能用构成比的动态分析代替率的动态分析。

⑷ 对观察单位数不等的几个率,不能直接相加求其总率。⑸ 在比较相对数时应注意可比性。

⑹ 对样本率(或构成比)的比较应随机抽样,并做假设检验。率的标准化的基本思想,应注意的问题(分析题)

率的标准化的基本思想 :

要比较两个总率时,发现两组资料的内部构成(如年龄、性别构成等)存在明显不同,而且影响到了总率的结果,这时就不宜再直接比较总率,而应考虑采用标准化法。

标准化法的基本思想,就是采用统一的标准(统一的内部构成)计算出消除内部构成不同影响后的标准化率(调整率),然后再进行比较。

二、直接标准化法的计算方法

当已知所比较资料各组率Pi,可选用直接法计算标化率。

三、间接标准化死亡比的计算方法

当所比较的资料已知各自某现象总发生数r及各分组观察单位数时,宜采用间接法计算标化率。

第六章

二项分布,Piosson分布 在什么条件下接近正态分布(选择或填空)

第七章(考计算题)

配对与完全随机设计下的四格表的计算 列四格表

公式选择

给个例题把

为研究静脉曲张是否与肥胖有关,观察 122 对同胞兄弟,每对同胞兄弟中有一个属肥胖,另一个属正常体重,记录得静脉曲张发生情况见表8-2,试分析之。

[评析]这是一个配对设计的资料,因此用配对

检验公式计算。

第八章

参数统计与非参数统计(名解 2选1)1. 参数统计

样本所来自的总体分布具有某个已知的函数形式,而其中有的参数是未知的,统计分析的目的就是对这些未知的参数进行估计或检验。此类方法称为参数统计。

2. 非参数统计

样本所来自的总体分布难以用某种函数式来表达,还有一些资料的总体分布的函数式是未知的,只知道总体分布是连续型的或离散型的,解决这类问题的一种不依赖总体分布的具体形式的统计方法。由于这类方法不受总体参数的限制,故称非参数统计法(non-parametric statistics),或称为不拘分布(distribution-free statistics)的统计分析方法,又称为无分布型式假定(assumption free statistics)的统计分析方法。它检验的是分布,而不是参数。非参数统计不需对总体分布(总体参数)作出特殊假设。

非参数统计的特点和适用范围(简答)1.特点

(1)样本所来自的总体的分布形式为任何形式,甚至是未知的,都能适用。(2)收集资料方便,可用“等级”或“符号”来评定观察结果。

(3)多数非参数方法比较简便,易于理解和掌握。

(4)缺点是损失信息量,适用于参数统计法的资料用非参数统计方法进行检验将降低检验效能。

2.适用范围

(1)等级资料。

(2)偏态分布资料。当观察资料呈偏态或极度偏态分布而又未作变量变换,或虽经变量变换仍未达到正态或近似正态分布时,宜用非参数检验。

(3)各组离散程度相差悬殊,即方差明显不齐,且不能变换达到齐性。(4)个别数据偏离过大,或资料为单侧或双侧没有上限或下限值。(5)分布类型不明。(6)初步分析。有些医学资料由于统计工作量大,可采用非参数统计方法进行初步分析,挑选其中有意义者再进一步分析(包括参数统计内容)。

(7)对于一些特殊情况,如从几个总体所获得的数据,往往难以对其原有总体分布作出估计,在这种情况下可用非参数统计方法。

非参数检验的优缺点:(简答)

非参数统计与传统的参数统计相比,有以下优点:

1、非参数统计方法要求的假定条件比较少,因而它的适用范围比较广泛。

2、多数非参数统计方法要求的运算比较简单,可以迅速完成计算取得结果,因而比较节约时间。

3、大多数非参数统计方法在直观上比较容易理解,不需要太多的数学基础知识和统计学知识。

4、大多数非参数统计方法可用来分析如象由等级构成的数据资料,而对计量水准较低的数据资料,参数统计方法却不适用。

5、当推论多达3个以上时,非参数统计方法尤具优越性。

但非参数统计方法也有以下缺点:

1、由于方法简单,用的计量水准较低,因此,如果能与参数统计方法同时使用时,就不如参数统计方法敏感。若为追求简单而使用非参数统计方法,其检验功效就要差些。这就是说,在给定的显著性水平下进行检验时,非参数统计方法与参数统计方法相比,第Ⅱ类错误的概率β要大些。

2、对于大样本,如不采用适当的近似,计算可能变得十分复杂。注 意: 凡符合或经过变换后符合参数检验条件的资料,最好用参数检验。当资料不具备参数检验的条件时,非参数检验是一种有效的分析方法。

配对设计的符号秩和检验方法(简答)(1)假设:H0:差值总体中位数Md=0 H1:Md≠0 α =0.05(2)求差值

(3)编秩次:依差值的绝对值从小到大编秩次。编秩次时遇差数等于 0,舍去不计,同时样本例数减1;遇绝对值相等差数,符号相同顺次编秩次,符号相反取平均秩次,且符号相反。

(4)求秩和并确定检验统计量:分别求出正负秩次之和,正秩和以 T+表示,负秩和的绝对值以T-表示。T+及T-之和应等于 n(n+1)/2,任取T+(或 T-)作检验统计量T。

(5)确定 P 值和作出推断结论:当 n≤50 时,查 T 界值表,得出 P值。若检验统计量T值在上、下界值范围内,其 P值大于表上方相应概率水平;若 T值在上、下界值上若范围外,其 P值小于表上方相应概率水平。

第九章

线性相关系数(名解)

线性相关系数:表示两个变数线性相关方向及程度的统计数或参数。又叫直线相关系数,简称相关系数。,|R|的极值为1,|R|越大(接近1),则直线关系越好。

线性相关系数取值范围(填空)

-1≤r≤1 样本相关系数 r的假设检验(填空题)(1)r 界值表法;(2)t检验法。

线性相关或回归应用应注意的问题(简答)

⑴作回归分析和相关分析时要有实际意义,不能把毫无关联的两种现象作回归、相关分析,必须对两种现象间的内在联系有所认识。

⑵在进行回归分析和相关分析之前,应绘制散点图。但观察点的分布有直线趋势时,才适宜作回归、相关分析。如果散点图呈明显曲线趋势,应使之直线化再行分析。散点图还能提示资料有无可疑异常点。

⑶直线回归方程的应用范围一般以自变量的取值范围为限。若无充分理由证明超过自变量取值范围外还是直线,应避免外延。

⑷双变量的小样本经 t 检验只能推断两变量间有无直线关系,而不能推断相关的紧密程度,要推断相关的紧密程度,样本含量必须很大。

⑸相关或回归关系不一定是因果关系,也可能是伴随关系,有相关或回归关系不能证明事物间确有内在联系。

秩相关的应用适用范围(简答)

秩相关,又称等级相关(rank correlation),是用双变量等级数据作直线相关分析,适用于下列资料:

⒈ 不服从双变量正态分布而不宜作积差相关分析; ⒉ 总体分布型未知;

⒊ 用等级表示的原始数据。相关与回归的区别与联系(简答)区别:

1.意义 :相关反映两变量的相互关系,即在两个变量中,任何一个的变化都会引起另一个的变化,是一种双向变化的关系。回归是反映两个变量的依存关系,一个变量的改变会引起另一个变量的变化,是一种单向的关系。

2.应用:研究两个变量的相互关系用相关分析。研究两个变量的依存关系用回归分析。3.研究性质:相关是对两个变量之间的关系进行描述,看两个变量是否有关,关系是否密切,关系的性质是什么,是正相关还是负相关。回归是对两个变量做定量描述,研究两个变量的数量关系,已知一个变量值可以预测出另一个变量值,可以得到定量结果。

4.相关系数r与回归系数b :r与b的绝对值反映的意义不同。r的绝对值越大,散点图中的点越趋向于一条直线,表明两变量的关系越密切,相关程度越高。b的绝对值越大,回归直线越陡,说明当X变化一个单位时,Y的平均变化就越大。反之也是一样。

联系:

1.r与b值可相互换算; 2.r与b正负号一致;

3.r与b的假设检验等价;

4.回归可解释相关。相关系数的平方r2(又称决定系数)是回归平方和与总的离均差平方和之比,故回归平方和是引入相关变量后总平方和减少的部分。

回归系数的估计原则:最小二乘(least squares)原则(填空)应用直线回归时的注意事项(简答)

应用直线回归时的注意事项:

1.作回归分析要有实际意义,不能把毫无关联的两种现象作回归分析,必须对两种现象间的内在联系有所认识。2.在进行直线回归分析之前,应绘制散点图,当观察点的分布有直线趋势时,才适宜作直线回归分析,散点图还能提示资料有无异常点。异常点的存在往往对方程中的系数(a、b)的估计产生较大影响。因此,需对异常点进行复查。

3.建立直线回归方程后,要对系数进行假设检验,以确定回归方程有无意义。

4.直线回归方程的适用范围一般以自变量的取值范围为限,避免外延。获得自变量值的手段也应与建立方程时相同。否则会产生较大偏差。

第三篇:医学统计学总结

1、同一资料的标准差是否一定小于均数?

答:均数是描述定量资料集中趋势的指标,而标准差是描述定量资料离散程度的指标,二者反映的是资料分布特征的两个不同方面。

2、极差、四分位间距、标准差、变异系数的适用范围有何异同?

答:这四个指标的相同点在于均用于描述计量资料的离散程度。不同点为:极差可用于各种分布的资料,一般常用于描述单峰对称分布小样本资料的变异程度,或用于初步了解资料的变异程度。若样本含量相差较大,则不宜用极差来比较资料的离散程度。四分位间距:适用于描述偏态分布资料、两端无确切值或分布不明确资料的离散程度。标准差常用于描述对称分布,特别是正态分布或近似分布资料的离散程度。变异系数适用于比较计量单位不同或均数相差悬殊的几组资料的离散程度。

3、x2检验用于什么?

答:x检验用于:推断两个及两个以上总体率或构成比是否有差别,两个分类变量间有无相关关系,多个率的趋势检验,以及两个率的等效检验等。此外,也用于频数分布的拟合优度检验。

4、四格表的U检验和x2检验有何联系?

答:(1)相同点:四格表的u检验的根据是正态近似原理(n足够大,∏和1-∏均不太小)。能用四格表的u检验进行两个率比较检验的资料,都可以用x检验。四格表的双侧u检验与x检验是完全等价的,两个统计量的关系为u= x,u20.05/2= u20.05/1.u检验和卡方检验都存在连续性矫正问题(2)不同点:①正态分布可以确定单、双侧检验界值,满足正态近似条件时,可以使用四格表的单侧u检验。②满足四格表u检验的资料,计算两率之间的95%可信区间,尚可分析两率之差有无实际意义。③x2检验还可以用于配对设计四格表,但这时推断∏1,∏2是否有差别的x2公式不同。5.参数检验和非参数检验的区别何在?各有何优缺点? 答:区别:参数检验,其应用条件是已知总体的分布类型,对总体参数进行估计或检验。非参数检验,不依赖总体分布的具体形式,目的在于检验总体分布是否不同。(2)参数检验优点是符合应用条件时,检验效能较高。缺点是对资料要求严格,不能用于等级数据、一端或两端有不确切数据,此外,还要求资料的分布类型已知和总体方差齐等条件。非参数检验优点是应用范围广,计算简便,对资料的要求不高;缺点是若对符合参数检验条件的资料用非参数检验,则会降低检验效能。如需检验出同样大小的差异,非参数检验往往需要更大的样本含量。

6.对同一资料,又出自同一研究目的,用参数检验和非参数检验所得不一致时,宜以何者为准?答:两者各有使用条件,究竟取哪种结论,要根据资料是否满足该种检验方法的应用条件进行选择。在符合参数检验的条件时,可接受参数检验的结论,而资料不符合参数检验的条件时,应以非参数检验的结论为佳。如总体分布为极度偏态或其他非正态分布,或者两总体方差不齐时,此时宜采用秩和检验的结果。7.非参数检验适用于哪些情况?

答:①等级资料②偏态资料。当观察资料成偏态或极度偏态而又未经任何变量变换,或虽经变量变换但仍未达到正态或近似正态分布时③总体分布类型未知的资料④要比较的各组资料方差不齐⑤一端或两端有不确定数据。

8.两样本比较的秩和检验,当n1>n2>10时采用u检验,这时检验是属于参数检验还是非参数检验?为什么?答:两组比较的秩和检验,当n很大时,可利用秩和T的分布随n增大渐进正态分布的性质,进行u检验,此时利用的并非原始数据,而是经秩变换后的数据,故仍属非参数检验。9.直线回归分析中应注意哪些问题?

答:做回归分析一定要有专业意义,不能将毫无联系的两个变量作直线回归分析;回归分析之前首先应绘制散点图,考查x与y之间有无直线趋势以及是否存在异常点;考虑是否满足建立线性回归模型的基本假定;直线回归方程的应用与图示一般以自变量x的取值范围为限;两变量的直线关系不一定是因果关系,也可能是伴随关系。

10.简述直线回归与直线相关的区别与联系。

答:区别:①资料要求不同:直线回归中因变量y是来自正态总体的随机变量,而r既可以是来自正态总体中的随机变量,也可以是严密控制、精确测量的变量;相关分析则要求x,y是来自双变量正态分布总体的随机变量,②分析目的不同:直线回归用于说明两变量间依存变化的数量关系;直线相关用于说明变量间的直线相关关系。联系:①方向一致:对一组数据计算,r与b,它们的正负号是一致的。②假设检验等价:对同一样本r和b的假设检验得到的t值相等。③用回归解释相关:由r2=SS回/SS总可知,若回归平方和越接近总平方和,则r越接近于1。

11.简述直线相关、秩相关的区别与联系。

答:区别:①资料要求不同:直线相关要求x、y是来自双变量正态总体的随机变量;秩相关适用于不服从双变量正态分布或总体分布类型未知以及用等级表示的原始数据。②相关意义不同:直线相关表示两变量的直线相关关系存在,秩相关表示两变量的相关关系。联系:相关系数的取值范围相同;秩相关是将原始数据进行秩变换,以秩次计算直线相关系数。

12.均数的可信区间和参考值范围有何不同?

222

22答:均数的可信区间:按一定的概率100(1-α)%(即可信度)估计总体均数所在的范围,得到的范围亦称可信区间。参考值范围:医学参考值范围指包括绝大多数正常人的人体形态、功能和代谢产物等各种生理及生化指标常数,也称正常值。由于存在着个体差异,生物医学数据并非常数,而是一定范围内波动,故采用医学参考值范围作为判定正常和异常的参考标准。

13秩和检验的优缺点是什么? 答:①不受总体分布限制,适用面广②适用于等级资料及两端无确定值的资料③易于理解,易于计算。缺点:是对分布类型的广泛适应性,使其很难充分利用资料提供的信息,有时会导致检验效能降低。14在t检验和u检验时,何种情况下采用单侧检验?

答:单侧检验的备择假设带有方向性,如:m>m0,实际中只可能出现一种情况。双侧检验的备择假设中包含不等号(如:m≠m0),实际上包括两种情况:m>m0或m<m0,无方向性。15.均数、几何均数和中位数的适用范围是什么?

答:均数适用于描述单峰对称分布,特别是正态分布或近似正态分布资料的集中趋势。(由于均数易受到极端值的影响,故不适用于描述偏态分布资料的集中趋势,只是需采用几何均数或中位数。)几何均数对于原始观察值呈偏态分布,但经过对数变换后呈正态分布或近似正态分布的资料,易用几何均数描述其集中趋势。常用于等比级资料或对数正态分布资料。中位数可用于各种分布的资料。对于正态分布资料,中位数等于均数;对于对数正态分布资料,中位数等于几何均数。由于中位数不受极端值的影响,主要用于偏态分布资料,两端无确切值或分布不明确的资料。16.标准差和标准误有何区别与联系,他们的用途是什么?

答:标准差:是描述对称分布,特别是正态分布或近似正态分布资料离散趋势(变异程度)的常用指标。总体标准差用δ表示,样本标准差用s表示。标准误:样本均数的标准差称为标准误。样本均数⊙的总体均数为H,各⊙围绕H的离散程度,可以用样本均数的标准差来描述。用途:标准差用途:①表示变量分布的离散程度②结合均数计算变异系数③结合样本含量计算标准误④结合均数描述分布特征。标准误用途:表示每个样本均数间的变异程度,描述样本均数的抽样误差,即样本均数与总体均数的接近程度,也可称为样本均数的标准差。17.统计图制作的一般原则?

答:首先,根据资料性质和分析目的正确选用适当的统计图。其次,除圆图外,一般用直角坐标系的第一象限的位置表示。最后,绘制图形应注意准确、美观,给人以清晰的印象。18.各种统计图适合于何种资料? 答:描述某连续变量的频数分布宜选用直方图;分析、比较独立的或不连续的多个组或多个类别的统计量宜选用条图,分析某指标随时间或其它连续变量变化而变化的趋势宜选用线图,描述或比较不同事物内部构成时用圆图或百分比条图等。

19.为什么要做r和b的假设检验?

答:b:即使从总体回归系数β等于零的总体中作随机抽样,由于抽样误差的存在,其样本回归系数b也不一定全为零。因此,求得一个样本回归系数时,首先,需考虑线性方程是否成立?并进行回归系数β是否为零的检验。以推断自变量x与应变量y见是否有直线关系存在。

r:假定从总体相关系数þ=0的总体中随机抽样,由于存在抽样误差,所得样本相关系数r不一定全为零。故此,求得一个样本相关系数r值后,仍需进行总体相关系数þ是否为零的假设检验。

20.服从二项分布的条件是什么?

答:凡具有贝努力试验序列3个特点的变量,一般可认为服从二项分布①每次试验的结果只能是两种互斥的结果中的一种(A或者非A)②各次试验的结果互不影响,即各次试验独立③在相同试验条件下,各次试验中出现某一结果A具有相同的概率∏(非A的概率1-∏)。

21.相关系数和回归系数有什么区别和联系?

答:直线的斜率称为回归系数,直线相关系数也称积距相关系数,说明具有直线关系的两变量间的相关方向与密切程度。它们的联系——方向一致即r与b正负一致,假设检验等价。区别:资料要求不同,回归系数方程要求服从正态分布,x精确测量严格控制Ⅰ型回归,相关方程要求x,y双重复正态Ⅱ型回归。22多个样本均数间的比较为什么不能用t检验?

答:多个样本均数的两两比较又称多重比较,其目的是推断究竟哪些总体均数之间存在差别,由于涉及的对比组数大于2,若仍用前述的t检验对两个对比组做比较,会使犯第Ⅰ类错误的概率增大,即可能吧本来无差别的两个总体均数判为有差别,因此,多重比较不宜用t检验分别作两两比较。

23对同一资料,有出自同一研究目的,用参数检验和非参数检验所得结果不一致时,宜以何者为准?答:参数检验要求其总体分布为正态分布,总体方差齐性,非参数检验常用解决那些总体分布未知的统计问题,对于同一资料,又出自同一研究目的,采用参数研究还是非参数检验取决于资料的类型。24.为什么要进行抽样研究?抽样时为什么会产生抽样误差?

答:计量资料的总体中所含的样本数量巨大,要获取资料的总体均数、标准差等数据十分困难,因此医学科学研究中通常采用的抽样研究方法,是指从总体中随机抽取一个样本,用样本信息推断总体特征,这种分析方法称为统计推断。但通常情况下,样本均数(x拔)不可能与总体均数μ正好相等,这种由个体变异产生的,随机抽样引起的样本统计量与总体参数间的差异称为抽样误差。25.相关系数的意义?

答:相关系数r没有单位,取值范围为-1≤r≤1。两变量相关的方向用r的正负号表示,即r>0表示正相关;r<0表示负相关。相关系数r的大小表示密切程度,r绝对值越接近1,表示两变量间相关关系密切程度越高。∣r∣=1表示完全相关,∣r∣=0表示无直线相关。26.方差分析的应用条件?

答:①各样本是相互独立的随机样本②各样本来自正态分布③各样本方差相等,即方差齐。

27.χ2检验要注意的问题(注意事项)?

答:① 计算χ2 值时必须用绝对数。而不能用相对数,因为χ2 值的大小与频数大小有关。②χ2 检验要求理论频数不宜太小,一般认为不宜有1/5以上格子理论频数小于5,或一个格子的理论频数小于1。对理论频数太小有三种处理方法:A 增大样本例数 B 删除理论数太小的行或列 C 合并③当多个样本率(或构成比)比较的χ2 检验结论为拒绝检验假设,只能认为各总体率(或总体构成比)之间总的说来有差别,但不能说它们彼此间都有差别。或某两者间有差别。

28.非参数检验适用哪些情况?

答:①等级顺序资料。②偏态资料。当观察资料成偏态或极度偏态分布而又未经变量变换未达到正态或近似正态分布时,宜用非参数检验。③未知分布类型资料④要比较的各组资料变异度相差较大,方差不齐,且不能变换达到齐性。⑤初步分析。有些医学资料由于统计工作量过大,可采用非参数统计方法进行初步分析,挑选其中有意义者再进一步分析⑥对于一些特殊情况,如从几个总体所获得的数据,往往难以对其原有总体分布作出估计,在这种情况下可用非参数统计方法。

29.为什么秩和检验的编秩在不同对比组间出现相同数据要给予“平均秩次”,而同一组的相同数据不必计算“平均秩次”?

答:因为在不同对比组,不取平均秩次会加大或减小某一组的秩和;而在同一组内,出现相同数据不编平均秩次,该组秩和不受影响。

30.怎样正确使用单侧检验和双侧检验?

答:根据专业知识推断两个总体是否有差别时,是甲高于乙,还是以高于甲,当两种可能都存在时,一般选双侧;若根据专业知识,如果甲不会低于乙,或研究者仅关心其中一种可能时,可选用单侧。一般来讲,双侧检验较稳妥故较多用,在预实验有探索性质时,对结果的考虑以思路较宽为好,也用双侧检验。单侧检验,应以专业知识为依据,他充分利用了另一侧的不可能性,故检出效率高,但应慎用。

31.回归系数:直线的斜率b,也称回归系数。统计学意义是自变量x改变一个单位时,应变量y平均变化b个单位。32.相关系数:也称pearson积距相关系数,说明具有直线相关的两变量间相关方向与密切程度。33.直线回归分析中应注意的问题?

答:①做直线回归一定要有实际意义②回归分析之前首先应绘制散点图。③考虑建立线性模型的基本假定④取值范围,避免外延。⑤两变量间有直线关系不一定是因果关系。34.相关分析应用中应注意的问题?

答:①资料要求x、y都应来自双变量正态总体的随机变量。②进行相关分析前,应先绘制散点图,有线性趋势时,才可进行相关分析。③满足应用条件的同一份双变量资料,回归系数b与相关系数r的正负号一致,假设检验等价。④相关分析时,小样本资料经t检验只能推断两变量间有无直线关系,而不能推断其相关的密切程度。要推断两样本间相关的程度,样本含量必须足够大,当r有统计学意义时,但r2较小时,下结论要慎重。35.方差分析的应用条件? 答:①各样本是相互独立的随机样本②各样本来自正态分布③各样本方差相等,即方差齐。

36.二项分布:贝努力试验序列中结果A出现次数的概率分布就是~。

37.率的标准化法:为解决因内部构成不同而导致分组率比较的结果与和纪律比较结果的矛盾,选定一个共同的标准人口或标准人口构成,分别计算两组的标准化率,这种方法称~。

38.抽样误差:由个体变异产生的,随机抽样引起的样本统计量与总体参考数间的差异称~

第四篇:医学统计学总结

医学统计学总结

一、两组或多组计量资料的比较1.两组资料: 1)大样本资料或服从正态分布的小样本资料(1)若方差齐性,则作成组t检验(2)若方差不齐,则作t’检验或用成组的Wilcoxon秩和检验 2)小样本偏态分布资料,则用成组的Wilcoxon秩和检验 2.多组资料: 1)若大样本资料或服从正态分布,并且方差齐性,则作完全随机的方差分析。如果方差分析的统计检验为有统计学意义,则进一步作统计分析:选择合适的方法(如:LSD检验,Bonferroni检验等)进行两两比较。2)如果小样本的偏态分布资料或方差不齐,则作Kruskal Wallis的统计检验。如果Kruskal Wallis的统计检验为有统计学意义,则进一步作统计分析:选择合适的方法(如:用成组的Wilcoxon秩和检验,但用Bonferroni方法校正P值等)进行两两比较。

二、分类资料的统计分析1.单样本资料与总体比较 1)二分类资料:(1)小样本时:用二项分布进行确切概率法检验;(2)大样本时:用U检验。2)多分类资料:用Pearson c2检验(又称拟合优度检验)。2.四格表资料 1)n>40并且所以理论数大于5,则用Pearson c2 2)n>40并且所以理论数大于1并且至少存在一个理论数<5,则用校正c2或用Fisher’s 确切概率法检验 3)n£40或存在理论数<1,则用Fisher’s 检验 3.2×C表资料的统计分析 1)列变量为效应指标,并且为有序多分类变量,行变量为分组变量,则行评分的CMH c2或成组的Wilcoxon秩和检验 2)列变量为效应指标并且为二分类,列变量为有序多分类变量,则用趋势c2检验 3)行变量和列变量均为无序分类变量(1)n>40并且理论数小于5的格子数<行列表中格子总数的25%,则用Pearson c2(2)n£40或理论数小于5的格子数>行列表中格子总数的25%,则用Fisher’s 确切概率法检验 4.R×C表资料的统计分析 1)列变量为效应指标,并且为有序多分类变量,行变量为分组变量,则CMH c2或Kruskal Wallis的秩和检验 2)列变量为效应指标,并且为无序多分类变量,行变

量为有序多分类变量,作none zero correlation analysis的CMH c

23)列变量和行变量均为有序多分类变量,可以作Spearman相关分析 4)列变量和行变量均为无序多分类变量,(1)n>40并且理论数小于5的格子数<行列表中格子总数的25%,则用Pearson c2(2)n£40或理论数小于5的格子数>行列表中格子总数的25%,则用Fisher’s 确切概率法检验

三、Poisson分布资料1.单样本资料与总体比较: 1)观察值较小时:用确切概率法进行检验。2)观察值较大时:用正态近似的U检验。2.两个样本比较:用正态近似的U检验。配对设计或随机区组设计

四、两组或多组计量资料的比较 1.两组资料: 1)大样本资料或配对差值服从正态分布的小样本资料,作配对t检验 2)小样本并且差值呈偏态分布资料,则用Wilcoxon的符号配对秩检验 2.多组资料: 1)若大样本资料或残差服从正态分布,并且方差齐性,则作随机区组的方差分析。如果方差分析的统计检验为有统计学意义,则进一步作统计分析:选择合适的方法(如:LSD检验,Bonferroni检验等)进行两两比较。2)如果小样本时,差值呈偏态分布资料或方差不齐,则作Fredman的统计检验。如果Fredman的统计检验为有统计学意义,则进一步作统计分析:选择合适的方法(如:用Wilcoxon的符号配对秩检验,但用Bonferroni方法校正P值等)进行两两比较。

五、分类资料的统计分析1.四格表资料 1)b+c>40,则用McNemar配对c2检验或配对边际c2检验 2)b+c<40,则用二项分布确切概率法检验 2.C×C表资料: 1)配对比较:用McNemar配对c2检验或配对边际c2检验 2)一致性问题(Agreement):用Kap检验 变量之间的关联性分析

六、两个变量之间的关联性分析 1.两个变量均为连续型变量 1)小样本并且两个变量服从双正态分布,则用Pearson相关系数做统计分析 2)大样本或两个变量不服

第五篇:医学统计学

A.总体中任意的一部分B.总体中的典型部分

C.总体中有意义的一部分

1、measurement date2、coefficient of variation(变异系数)

3、sampling error(抽样误差)

4、linear correlation coefficient(直线相关系数)

5、population(总体)

D.总体中有价值的一部分E.总体中有代表性的一部分

5、以下检验方法属非参数法的是。

A.T检验B.t检验C.u 检验D.F检验E.以上都是

6、样本含量的确定下面哪种说法合理。

A.样本越大越好B.样本越小越好C.保证一定检验效能条件下尽量增大样本含量D.保证一定检验效能条件下尽量减少样本含量E.越易于组织实施的样本含量越好

7、对计数资料进行统计描述的主要指标是。

A.平均数B.相对数C.标准差D.变异系数E.中位数

1、用样本推论总体,具有代表性的样本指的是

A.总体中最容易获得的部分个体B.在总体中随意抽取任意个体 C.挑选总体中的有代表性的部分个体D.用配对方法抽取的部分个体 E.依照随机原则抽取总体中的有代表性部分个体

2、计量资料,计数资料和等级分组资料的关系是。A.计量资料兼有计数资料和等级分组资料的一些性质B.计数资料兼有计量资料和等级分组资料的一些性质

8、由两样本均数的差别推断两总体均数的差别,得到此差别具有统计意义的结论是指

A.两样本均数差别有显著性B.两总体均数差别有显著性

C.两样本均数和两总体均数的差别都有显著性

D.其中一个样本均数和它的总体均数差别有显著性

9、说明某现象发生强度的指标为。A.构成比B.相对比C.定基比D.环比E.率

10、配对设计的秩和检验中,其H0假设为。A.差值的总体均数为0B.差值的总体中位数为0C.μd≠0D.Md≠0

C.等级分组资料兼有计量资料和计数资料的一些性质 D.计数资料有计量资料的一些性质E.等级分组资料又称半计数资料

3、总体率95%可信区间的意义是。

A.95%的正常值在此范围B.95%的样本率在此范围

C.95%的总体率在此范围D.总体率在此范围内的可能性为95%E.样本率在此范围内的可能性为95%

4、为了由样本推断总体,样本应该是。

命题组组长签字:第页(本试卷共4页)

E.μ1≠μ211、单因素方差分析中,不正确的计算公式是。A.SS组内=SS总-SS组间B.v总=v组间-v组内C.MS组间=SS组间/v组间D.MS组内=SS组内/v组内E.F=MS组内/MS组间

12、方差分析中,组内变异反映的是。A.测量误差B.个体差异

C.随机误差,包括个体差异及测量误差D.抽样误差E.系统误差

13、对统计图中的的坐标有如下规定。

A.所有统计图的纵坐标都必须从零点开始B.所有统计图坐标中都不能有折断线

C.条图、线图、直方图的纵坐标必须从零开始D.线图、直方图的纵坐标必须从零开始E.条图、直方图的纵坐标必须从零开始

14、制统计图时要求。

A.标题应说明图的主要内容,一般在图的上方B.纵横两轴应有标目,一般不注单位C.纵轴尺度必须从零开始

D.直条图和线图,其长宽比例一般取5:7E.以上都不对

15、下列关于医学参考值范围描述中,不正确的是

A.排除了有关疾病等因素对所研究指标有影响的正常人的解剖、生理、生化 等数据的波动范围

B.没有任何疾病的人的解剖、生理、生化等数据的波动范围C.习惯确定只包含95%或99%的人的界值来源:D.根据专业知识确定取单侧界限或双侧界限E.资料为正态分布时,可用正态近似法计算

16、各观察值均加(或减)同一数后A.均数改变,标准差不变B.均数不变,标准差改变

C.两者均不变D.两者均改变

E.根据实际资料而定

17、统计工作的步骤为

A.统计研究调查、搜集资料、整理资料、分析资料B.统计资料收集、整理资料、统计描述、统计推断C.统计研究设计、搜集资料、整理资料、分析资料D.统计研究调查、统计描述、统计推断、统计图表E.统计研究设计、统计描述、统计推断、统计图表

18、两个样本率判别的假设检验,其目的是。A.推断两个样本率有无差别B.推断两个总体率有无差别

C.推断两个样本率和两个总体率有无差别

D.推断两个样本率和两个总体率的差别有无统计意义E.推断两个总体分布是否相同

19、假设检验过程中,下列哪一项不可以由研究者事先设定。A.所比较的总体参数B.单侧或双侧检验C.检验水准D.P值E.以上都不对 20、统计资料的类型包括。

A.频数分布资料和等级分类资料B.多项分类资料和二项分类资料C.正态分布资料和频数分布资料

D.数值变量资料和等级资料E.数值变量资料和分类变量资料

21、有关离散度指标意义中,描述不正确的是。A.数值越大,说明个体差异越大B.数值越大,说明观察值的变异度越大C.数值越小,说明平均数的代表性越好D.数值越小,说明平均数的代表性越差E.应与平均数结合起来进行分析

22、秩和检验和t检验相比,其优点是。

A.计算简便,不受分布限制B.公式更为合理C.检验效能高D.抽样误差小E.第二类错误概率小

23、总体标准差描述的是。

A.所有个体值对总体均数的离散程度B.某样本均数对总体均数的离散程度C.所有样本均数对总体均数的离散程度D.某些样本均数对总体均数的离散程度

E.所有某个含量相同的样本均数对总体均数的离散程度

24、比较身高和体重两组数据变异度大小宜采用。A.变异系数B.方差

C.极差D.标准差E.四分位数间距

25、当样本例数相同时,两组计量资料的成组t检验与配对t检验相比,一般情况下为

A.成组t检验效率高一些B.配对t检验效率高一些C.两者效率相等

D.大样本时两者效率一致E.与两组样本均数的大小有关

26、样本的两变量(X,Y)的相关系数r=0时,说明。(B)A.两变量不存在任何关系

B.两变量间不存在直线关系,但不排除存在某种曲线关系

C.两变量间存在相互关系的可能性很小D.两变量必然存在某种曲线关系E.两变量间的关系不能确定

27、在标准差与标准误的关系中。A.二者均反映抽样误差大小

B.总体标准差增大时,总体标准误也增大

C.样本例数增大时,样本标准差和标准误都减小

D.可信区间大小与标准差有关,而参考值范围与标准误有关E.总体标准差一定时,增大样本例数会减小标准误

28、说明两个有关联的同类指标之比为。

A.率B.构成比C.频率D.相对比E.频数

29、下列观测结果属于等级资料的是(D)

A.收缩压测量值B.脉搏数 C.住院天数D.病情程度 E.四种血型

30、收集资料不可避免的误差是

A.随机误差B.系统误差 C.过失误差D.记录误差 E.仪器故障误差

31、算术均数与中位数相比,其特点是

A.不易受极端值的影响B.能充分利用数据的信息C.抽样误差较大D.更适用于偏态分布资料E.更适用于分布不明确资料

32、描述一组对称(或正态)分布资料的变异程度,用(A)较好

A标准差B 方差C 离均差平方和D 变异系数E以上都可以

33、变异系数主要用于

A.比较不同计量指标的变异程度B.衡量正态分布的变异程度

C.衡量测量的准确度D.衡量偏态分布的变异程度

E.衡量样本抽样误差的大小

34、正态曲线下,从均数μ到μ+1.0σ的面积

A、45%B、90%C、95.00%D、47.5%E、34.14%

35、方差分析的基本思想和要点是

A.组间均方大于组内均方B.组内均方大于组间均方 C.不同来源的方差必须相等D.两方差之比服从F分布 E.总变异及其自由度可按不同来源分解

36、多组均数比较的方差分析,如果P0.05,则应该进一步做的是 A.两均数的t检验B.区组方差分析C.方差齐性检验D.q检验 E.确定单独效应

37、两样本均数比较,检验结果P>0.05说明(D)

A.两总体均数的差别较小B.两总体均数的差别较大C.支持两总体无差别的结论D.不支持两总体有差别的结论E.可以确认两总体无差别

38、计算标准化死亡率的目的是(D)

A.减少死亡率估计的偏倚B.减少死亡率估计的抽样误差 C.便于进行不同地区死亡率的比较D.消除各地区内部构成不同的影响 E.便于进行不同时间死亡率的比较

39、标准化后的总死亡率:

A、仅仅作为比较的基础,它反映了一种相对水平B、它反映了实际水平

C、它不随标准的选择变化而变化 D、它反映了事物实际发生的强度 E、它反映了实际率的水平

240、利用检验公式不适合解决的实际问题是(C)

A.比较两种药物的有效率B.检验某种疾病与基因多态性的关系 C.两组有序试验结果的药物疗效D.药物三种不同剂量显效率有无差别 E.两组病情“轻、中、重”的构成比例

41、对医学计量资料成组比较, 相对参数检验来说,非参数秩和检验的优点是(A)A.适用范围广B.检验效能高 C.检验结果更准确D.充分利用资料信息 E.不易出现假阴性错误

42、对于计量资料的比较,在满足参数法条件下用非参方法分析,可能产生的结果是(B)

A.增加Ⅰ类错误B.增加Ⅱ类错误C.减少Ⅰ类错误D.减少Ⅱ类错误 E.两类错误都增加

43、对于两组资料的比较,方差分析与t检验的关系是(E)A.t检验结果更准确B.方差分析结果更准确 C.t检验对数据的要求更为严格D.近似等价 E.完全等价

44、四格表如有一个实际数为0(C)A、就不能作χ2检验

B、就必须用校正χ2检验

C、还不能决定是否可作χ2检验 D、肯定可作校正χ2检验 E、肯定不可作校正χ2检验

45、行×列表的χ2检验中,P<0.05说明(D)A、被比较的几个样本率之间的差异均有显著性 B、样本率间的差异没有显著性

C、任意两个率之间的差异均有显著性 D、至少某两个样本率间的差异有显著性 E、只有两个样本率间的差异有显著性

46、两数值变量相关关系越强,表示(B)

A.相关系数越大B.相关系数的绝对值越大 B.回归系数越大C.回归系数的绝对值越大 E.相关系数检验统计量的t值越大

47、t分布比标准正态分布(D)

A、中心位置左移,但分布曲线相同 B、中心位置右移,但分布曲线相同 C、中心位置不变,但分布曲线峰高

D、中心位置不变,但分布曲线峰低,两侧较伸展 E、中心位置右移,但分布曲线峰高

三、判断题(10分)

1、相关系数r=0.98,说明两变量密切正相关(对)

2、构成比资料可以选用圆图和条图(错)

3、标准差和标准误都是反映变异程度大小的指标(错)

4、多个样本均数的两两比较可以用成组的t检验(错)

5、正常值范围属于统计描述,可信区间的估计属于统计推断(对)

6、、数值变量资料的标准差一定比均数小(错)

7、等级资料比较宜用秩和检验。(对)

8、两变量的相关分析中,若散点图的散点完全在一条直线上,则r=1(错)

9、对统计图中的的坐标所有统计图的纵坐标都必须从零点开始(错)

10、非参数统计进行假设检验要求的条件是总体是正态分布(错)

四、简答题(25分)

1、医学参考值范围和可信区间的区别(5)

2、非参数检验的适用条件(5)

3、标准正态分布曲线下的面积规律(5)

4、标准差与标准误有何区别?(5分)

5、描述数值变量集中趋势的指标有哪些?适用条件分别是什么?(5分)

五、作图(10分)

某药治疗老年慢性气管炎的近期疗效结果如下:

1、单纯型共221例,其中按病情分为重、中、轻,分别观察了136例、54例、31例;疗效:治愈60人、显效98人、好转51人、无效12人,有效率94.6%。

2、喘息型共182例,其中按病情分为重、中、轻,分别观察了93例,56例、33例;疗效:治愈23人、显效83人、好转65人、无效11人,有效率94.0%。请根据题目要求做出合适的统计图。

下载医学统计学重点总结word格式文档
下载医学统计学重点总结.doc
将本文档下载到自己电脑,方便修改和收藏,请勿使用迅雷等下载。
点此处下载文档

文档为doc格式


声明:本文内容由互联网用户自发贡献自行上传,本网站不拥有所有权,未作人工编辑处理,也不承担相关法律责任。如果您发现有涉嫌版权的内容,欢迎发送邮件至:645879355@qq.com 进行举报,并提供相关证据,工作人员会在5个工作日内联系你,一经查实,本站将立刻删除涉嫌侵权内容。

相关范文推荐

    医学统计学

    单词: Actual frequency 实际频数 Alternative hypothesis 备择假设 Average平均数 Bar chart 直条图 Cause fatality 病死率 Coefficient of correlation 相关系数 Confide......

    医学统计学知识点总结

    知识点 1. 统计学是应用概率论和数理统计的基本原理和方法,研究数据的搜集、整理、分析、表达和解释的一门学科。 2. 医学统计学是应用统计学的基本原理和方法,研究医学及其有......

    医学统计学书籍总结

    医学统计学书籍总结 第三章:总体均数的估计与假设检验 异常值监测 1.boxplot.stats intersect 交集 2.lofactor 数值数据 T检验 要求:n0.05,服从正态分布 方差齐性检验......

    医学统计学知识点总结

    知识点 1. 统计学是应用概率论和数理统计的基本原理和方法,研究数据的搜集、整理、分析、表 达和解释的一门学科。 2. 医学统计学是应用统计学的基本原理和方法,研究医学及其......

    医学统计学大题总结

    医学统计学 简答题 1.随机区组方差分析的填表(需要自己画表)。 2.两样本均数比较时,为何要做统计检验。 3.什么是率的标准化?如何选取标准构成比? 4.在比较样本均数与总体均数,......

    统计学重点

    1. 数据收集和整理的意义和步骤。意义:为一项调查或者研究提供必要的输入;用与评估某项正数据进行分析,因此做好数据收集工作很重要。步骤:首先要明确收集目的和收集方向,制在进......

    医学统计学考试

    医学统计学是运用概率论和数理统计原理、方法结合医药卫生工作的实际情况,阐述医学科研设计的基本原理,研究医学资料(信息)的搜集、整理和分析的方法学总称,他是认识医学现象数量......

    《医学统计学》教学大纲

    《医学统计学》教学大纲(60学时) 课程编码:10272003 课程名称:医学统计学 英文名称:Medical Statistics 开课学期: 学时/学分:60 / 4 (其中实习学时:20 ) 课程类型:专业课 开课专业:临......