第一篇:医学统计学_总结_重点_笔记_复习资料[精选]
第一章
2选1 总体:总体(population)是根据研究目的确定的同质观察单位(研究对象)的全体,实际上是某一变量值的集合。可分为有限总体和无限总体。总体中的所有单位都能够标识者为有限总体,反之为无限总体。
总体population根据研究目的而确定的同质观察单位的全体。
样本:从总体中随机抽取部分观察单位,其测量结果的集合称为样本(sample)。样本应具有代表性。所谓有代表性的样本,是指用随机抽样方法获得的样本。
样本sample从总体中随机抽得的部分观察单位,其实测值的集合。
3选1 小概率事件:我们把概率很接近于0(即在大量重复试验中出现的频率非常低)的事件称为小概率事件。
P值:P 值即概率,反映某一事件发生的可能性大小。统计学根据显著性检验方法所得到的P 值反应结果真实程度,一般以P ≤ 0.05 认为有统计学意义,P ≤0.01 认为有高度统计学意义,其含义是样本间的差异由抽样误差所致的概率等于或小于0.05 或0.01。P值是:
1)一种概率,一种在原假设为真的前提下出现观察样本以及更极端情况的概率。2)拒绝原假设的最小显著性水平。3)观察到的(实例的)显著性水平。
4)表示对原假设的支持程度,是用于确定是否应该拒绝原假设的另一种方法。
小概率原理:一个事件如果发生的概率很小的话,那么可认为它在一次实际实验中是不会发生的,数学上称之小概率原理,也称为小概率的实际不可能性原理。统计学中,一般认为等于或小于0.05或0.01的概率为小概率。
资料的类型(3选1)
(1)计量资料:对每个观察单位用定量的方法测定某项指标量的大小,所得的资料称为计量资料(measurement data)。计量资料亦称定量资料、测量资料。.其变量值是定量的,表现为数值大小,一般有度量衡单位。如某一患者的身高(cm)、体重(kg)、红细胞计数(10/L)、脉搏(次/分)、血压(KPa)等。
计量资料measurement data定量资料quantitative data数值变量资料numerical variable 为观测每个观察单位某项指标的大小,而获得的资料。
(2)计数资料:将观察单位按某种属性或类别分组,所得的观察单位数称为计数资料(count data)。计数资料亦称定性资料或分类资料。其观察值是定性的,表现为互不相容的类别或属性。如调查某地某时的男、女性人口数;治疗一批患者,其治疗效果为有效、无效的人数;调查一批少数民族居民的A、B、AB、O 四种血型的人数等。
计量资料enumeration data定性资料qualitative data无序分类变量资料unordered categorical variable 名义变量资料nominal variable 为将观察单位按某种属性或类别分组计数,分组汇总各组观察单位数后而得到的资料。
(3)等级资料:将观察单位按测量结果的某种属性的不同程度分组,所得各组的观察单位数,称为等级资料(ordinal data)。等级资料又称有序变量。如患者的治疗结果可分为治愈、好转、有效、无效或死亡,各种结果既是分类结果,又有顺序和等级差别,但这种差别却不能准确测量;一批肾病患者尿蛋白含量的测定结果分为 +、++、+++等。12等级资料ranked data半定量资料semi-quantitative data有序分类变量ordinal categorical variable资料
为将观察单位按某种属性的不同程度分成等级后分组计数,分类汇总各组观察单位后而得到的资料。
等级资料与计数资料不同:属性分组有程度差别,各组按大小顺序排列。
等级资料与计量资料不同:每个观察单位未确切定量,故亦称为半计量资料。两种误差(2选1)
抽样误差(sampling error)由于抽样而引起的总体指标(参数)与样本指标(统计数)之间的差异。抽样误差是由个体变异或其它随机因素造成的,是不可避免的,但误差分布有规律可循,可进行估计和分析。
系统误差(systematic error):由于测量仪器结构本身的问题、刻度不准确或测量环境改变等原因,在多次测量时所产生的,总是偏大或总是偏小的误差,称为系统误差。它带有规律性,经过校正和处理,通常可以减少或消除。
统计的步骤(考填空题,四个空)
统计工作的步骤
1.设计:设计内容包括资料收集、整理和分析全过程总的设想和安排。设计是整个研究中最关键的一环,是今后工作应遵循的依据。
2.收集资料:应采取措施使能取得准确可靠的原始数据。
3.整理资料:简化数据,使其系统化、条理化,便于进一步分析计算。
4.分析资料:计算有关指标,反映事物的综合特征,阐明事物的内在联系和规律。分析资料包括统计描述和统计推断。
实验设计的基本原则(考填空题,三个空)随机化原则、对照的原则、重复的原则。2选1 参数:参数(paramater)是指总体的统计指标,如总体均数、总体率等。总体参数
是固定的常数。多数情况下,总体参数是不易知道的,但可通过随机抽样抽取有代表性的样
本,用算得的样本统计量估计未知的总体参数。
统计量:统计量(statistic)是指样本的统计指标,如样本均数、样本率等。样本
统计量可用来估计总体参数。总体参数是固定的常数,统计量是在总体参数附近波动的随机
变量。
第二章
频数表的制作步骤以及频数分布表的用途(问答题)频数分布表的编制步骤:
例:某市1982年50名7岁男童的身高(cm)资料如下,试编制频数表。
114.4 117.2 122.7 124.0 114.0 110.8 118.2 116.7 118.9 118.1 123.5 118.3 120.3 116.2 114.7 119.7 114.8 119.6 113.2 120.0 119.8 116.8 119.8 122.5 119.7 120.7 114.3 122.0 117.0 122.5 119.7 124.9 126.1 120.0 124.6 120.0 121.5 114.3 124.1 117.2 120.2 120.8 126.6 121.5 126.1 117.7 124.1 128.3 121.8 118.7
1、找出观察值中的最大值(largest value)、最小值(smallest value),求极差(range)。
极差等于最大值减最小值。本例最大值=128.3,最小值=110.8,则极差=128.3-110.8=17.5(cm)
2、确定分组数和组距(class interval)。
组数的多少是根据例数的多少来确定的,以能够反映出频数分布的特征为原则,一般分10—15组。组距为相邻两组的间隔,组距=极差/组数。本例拟分10组,则组距=17.5/10=1.75≈2,为划记方便,可取稍大或稍小的数(当然本例组距也可取1.5)。
3、确定组段。
第一组段包括要最小值,取较最小值稍小且划分方便的数,本例取“110~”。最后组段包括最大值并写出其上限值。
4、划记。
将各观察值以划“正”字的方法,一笔代表一例,划在相应组段中。例如第一个数l14.4应在组段“114~”处划,第二个数117.2应在“116~”处划,以此类推。
5、统计各组段的频数。全部数据划记完后,清点各组段的人数。
根据编制出的频数表即可了解该数值变量资料的频数分布特征。频数分布表的用途
1、描述资料的分布特征和分布类型。
频数分布有两个重要特征:集中趋势和离散趋势。大部分观察值向某一数值集中的趋势称为集中趋势,常用平均数指标来表示,各观察值之间大小参差不齐。频数由中央位置向两侧逐渐减少,称离散趋势,是个体差异所致,可用一系列的变异指标来反映。
2、便于进一步计算有关指标或进行统计分析。当数据较多且需手工计算时,常先编制频数表,再进行统计计算。
3、发现特大、特小的可疑值。
如果频数表的一端或两端出现连续几个组段的频数为零后,又出现少数几个特大值或特小值,使人怀疑其是否准确,需进一步检查和核对并做相应处理。
4、据此绘制频数分布图。
描述数据分布集中趋势的指标和描述数据分布离散程度的指标(考选择或者填空)
2. 描述数据分布集中趋势的指标
算术均数、几何均数、中位数。
3. 描述数据分布离散程度的指标
极差、四分位数间距、方差、标准差、变异系数。正态分布的特征(考选择题 υ、σ对图形的影响)
服从正态分布的变量的频数分布由υ、σ 完全决定。
(1)υ 是正态分布的位置参数,描述正态分布的集中趋势位置。正态分布以 x =υ为对
称轴,左右完全对称。正态分布的均数、中位数、众数相同,均等于υ。(2)σ描述正态分布资料数据分布的离散程度,σ越大,数据分布越分散,σ越小,数 据分布越集中。σ也称为是正态分布的形状参数,σ越大,曲线越扁平,反之,σ越小,曲
线越瘦高。
标准正态分布(填空)
1.标准正态分布是一种特殊的正态分布,标准正态分布的υ 常用u(或Z)表示服从标准正态分布的变量,记为υ~N(0,1)。
正态分布的应用(简答)
某些医学现象,如同质群体的身高、红细胞数、血红蛋白量,以及实验中的随机误差,呈现为正态或近似正态分布;有些指标(变量)虽服从偏态分布,但经数据转换后的新变量可服从正态或近似正态分布,可按正态分布规律处理。其中经对数转换后服从正态分布的指标,被称为服从对数正态分布。
1.估计频数分布 一个服从正态分布的变量只要知道其均数与标准差就可根据公式即可估计任意取值范围内频数比例。
2.制定参考值范围
(1)正态分布法 适用于服从正态(或近似正态)分布指标以及可以通过转换后服从正态分布的指标。
(2)百分位数法 常用于偏态分布的指标。表3-1中两种方法的单双侧界值都应熟练掌握。
3.质量控制:为了控制实验中的测量(或实验)误差,常以 作为上、下警戒值,以 作为上、下控制值。这样做的依据是:正常情况下测量(或实验)误差服从正态分布。4.正态分布是许多统计方法的理论基础。检验、方差分析、相关和回归分析等多种统计方法均要求分析的指标服从正态分布。许多统计方法虽然不要求分析指标服从正态分布,但相应的统计量在大样本时近似正态分布,因而大样本时这些统计推断方法也是以正态分布为理论基础的。
医学参考值范围的制定(计算题)
确定参考值范围的单双侧:一般生理物质指标多为双侧、毒物指标则多为单侧。确定百分位点:一般取95%或99%。
20,σ2 1,通
例题
某市 20 岁男学生 160 人的脉搏数(次/分钟),经正态性检验服从正态分布。求得76.10,S =9.32。试估计脉搏数的95%、99%参考值范围。
解:脉搏数的95%正常值范围为:脉搏数的99%正常值范围为:
±1.96 S=76.10 ± 1.96(9.32)=57.83~94.37 ±2.58 S =76.10 ± 2.58(9.32)=52.05~100.37
第三章
= 标准误的概念,计算公式。标准误:抽样研究中,样本统计量与总体参数间的差别称为抽样误差(sampling error)。统计上用标准误(standard error,SE)来衡量抽样误差的大小,即样本均数的标准差,是描述均数抽样分布的离散程度及衡量均数抽样误差大小的尺度。
t分布的图形特征及其与正态分布的区别(简答)t分布的图形特征
1.以0为中心,左右对称的单峰分布;
2.t分布是一簇曲线,其形态变化与n(确切地说与自由度ν)大小有关。自由度ν越小,t分布曲线越低平;自由度ν越大,t分布曲线越接近标准正态分布(u分布)曲线。
t分布
对应于每一个自由度ν,就有一条t分布曲线,每条曲线都有其曲线下统计量t的分布规律,计算较复杂。
t 分布与正态分布比较的区别 t 分布与标准正态分布相比有以下特点:①都是单峰、对称分布;②t 分布峰值较低,而尾部较高;③随自由度增大,t 分布趋近与标准正态分布;当ν趋向∞,t 分布的极限分布是标准正态分布。
置信区间和参数估计(名解2选1)
置信区间:在统计学中,一个概率样本的置信区间(Confidence interval)是对这个样本的某个总体参数的区间估计。置信区间展现的是这个参数的真实值有一定概率落在测量结果的周围的程度。给出的是被测量参数的测量值的可信程度。
1、对于具有特定的发生概率的随机变量,其特定的价值区间------一个确定的数值范围(“一个区间”)。
2、在一定置信水平时,以测量结果为中心,包括总体均值在内的可信范围。
3、该区间包含了参数θ真值的可信程度。
4、参数的置信区间可以通过点估计量构造,也可以通过假设检验构造。
参数估计:指用样本指标值(统计量)估计总体指标值(参数)。参数估计有两种方法:点估计和区间估计。
可信区间与参考值范围的不同点(简答)
应注意:可信区间与参考值范围的意义、计算公式和用途均不同。
1.从意义和用途来看
95%参考值范围是指同质总体内包括95%个体值的估计范围,而总体均数95%可信区间是指按95%可信度估计的总体均数的所在范围。可信区间用于估计总体参数,总体参数只有一个。参考值范围用于估计变量值的分布范围,变量值可能很多甚至无限。2.从计算公式看
若指标服从正态分布,95%参考值范围的公式是:
±1.96s。
总体均数95%可信区间的公式是:。
前者用标准差,后者用标准误。前者用1.96,后者用α为0.05,自由度为v的t界值。t检验的应用条件和类型(填空)
t检验的应用条件:要求各样本来自相互独立的正态总体且各总体方差齐。t检验的类型:单样本t检验,独立t检验,配对t检验
配对设计和完全随机设计(名解2选1)
完全随机设计(completely random design):完全随机设计仅涉及一个处理因素(但可为多水平),故又称单因素(one-way)设计。它是将受试对象按随机化的方法分配到各个处理组中,观察实验效应,临床试验中的随机对照试验也属于此类设计。
配对设计(paired design):是将受试对象按一定条件匹配成对,再随机分配每对中的两个受试对象到不同处理组。配对的因素是影响实验效应的主要非处理凶素。
假设检验的基本求解步骤或者注意事项。(简答2选1)
假设检验的基本步骤
1.建立假设,确定检验水准α
假设有零假设(H0)和备择假设(H1)两个,零假设又叫作无效假设或检验假设。H0和H1的关系是互相对立的,如果拒绝H0,就要接受H1.根据备择假设不同,假设检验有单、双侧检验两种。检验水准用α表示,通常取0.05或0.10.检验水准说明了该检验犯第一类错误的概率。2.根据研究目的和设计类型选择适合的检验方法
这里的检验方法,是指参数检验方法,有u检验、t检验和方差分析三种,对应于不同的检验公式。对双样本资料,要注意区分成组设计和配对设计的资料类型。如果资料里有“配成对子”字样,或者是对同一对象用两种方法来处理,一般就可以判定是配对设计资料。3.确定P值并作出统计结论
u检验得到的是u统计量或称u值,t检验得到的是t统计量或称t值。方差分析得到的是F统计量或称F值。将求得的统计量绝对值与界值相比,可以确定P值。当α=0.05时,u值要和u界值1.96相比较,确定P值。如果u<1.96,则P>0.05.反之,如u>1.96,则P<0.05.t值 要和某自由度的t界值相比较,确定P值。如果t值<t界值,故P>0.05.反之,如t>t界值,则P<0.05.相同自由度的情况下,单侧检验的t界值 要小于双侧检验的t界值,因此有可能出现算得的t值大于单侧t界值,而小于双侧t界值的情况,即单侧检验显著,双侧检验未必就显著,反之,双侧检验显著,单侧检验必然会显著。即单侧检验更容易出现阳性结论。
当P>0.05时,接受零假设,认为差异无统计学意义,或者说二者不存在质的区别。当P<0.05时,拒绝零假设,接受备择假设,认为差异有统 计学意义,也可以理解为二者存在质的区别。但即使检验结果是P<0.01甚至P<0.001,都不说明差异相差很大,只表示更有把握认为二者存在差异。
假设检验时应注意的事项
(一)要有严密的抽样研究设计;样本必须是从同质总体中随机抽取的;要保证组间的均衡性和资料的可比性。
(二)根据现有的资料的性质、设计类型、样本含量大小正确选用检验方法。
(三)对差别有无统计学意义的判断不能绝对化,因检验水准只是人为规定的界限,是相对的。差别有统计学意义时,是指无效假设h0被接受的可能性只有5%或不到5%,甚至不到1%,根据小概率事件一次不可能拒h0,但尚不能排除有5%或1%出现的可能,所以可能产生第一类错误;同样,若不拒绝h0,可能产生第二类错误。
(四)统计学上差别显著与否,与实际意义是有区别的。如应用某药治疗高血压,平均降低舒张压0.5kpa,并得出差别有高度统计学意义的结论。从统计学角度,说明该药有降压作用,但实际上,降低0.5kpa是无临床意义。因此要结合专业作出恰如其分的结论。
第一类错误与第二类错误(名解 2选1)
Ⅰ型错误又称第一类错误(type Ⅰ error):拒绝了实际上成立的,为“弃真”的错误,其概率通常用表示。可取单尾也可取双尾,假设检验时研究者可以根据需要确定值大小,一般规定=0.05或=0.01,其意义为:假设检验中如果拒绝Ⅰ型错误的概率为5%或1%,即100次拒绝
时,发生的结论中,平均有5次或1次是错误的。,为“存伪”Ⅱ型错误又称第二类错误(type Ⅱ error):不拒绝实际上不成立的的错误,其概率通常用
表示。
只取单尾,假设检验时
值一般不知道,在一定情况下可以测算出,如已知两总体的差值(如)、样本含量和检验水准。以下图说明两类错误:
第四章
为什么等级资料不可用方差分析?资料不相互独立
方差分析的基本思想 应用条件(简答)
方差分析(analysis of variance,ANOVA)的基本思想就是根据资料的设计类型,即变异的不同来源将全部观察值总的离均差平方和(sum of squares of deviations from mean,SS)和自由度分解为两个或多个部分,除随机误差外,其余每个部分的变异可由某个因素的作用(或某几个因素的交互作用)加以解释,如各组均数的变异SS 组间可由处理因素的作用加以解释。通过各变异来源的均方与误差均方比值的大小,借助F 分布作出统计推断,判断各因素对各组均数有无影响。
方差分析的应用条件
(1)各样本是相互独立的随机样本,且来自正态分布总体。
(2)各样本的总体方差相等,即方差齐性(homoscedasticity)。
第五章 分类资料的统计描述(几个常用相对数指标 填空题)率(强度相对数,频率相对数)、构成比、相对比 应用相对数时应注意的问题(简答题 六条)⑴ 计算相对数的分母一般不宜过小。⑵ 分析时不能以构成比代替率。
⑶ 不能用构成比的动态分析代替率的动态分析。
⑷ 对观察单位数不等的几个率,不能直接相加求其总率。⑸ 在比较相对数时应注意可比性。
⑹ 对样本率(或构成比)的比较应随机抽样,并做假设检验。率的标准化的基本思想,应注意的问题(分析题)
率的标准化的基本思想 :
要比较两个总率时,发现两组资料的内部构成(如年龄、性别构成等)存在明显不同,而且影响到了总率的结果,这时就不宜再直接比较总率,而应考虑采用标准化法。
标准化法的基本思想,就是采用统一的标准(统一的内部构成)计算出消除内部构成不同影响后的标准化率(调整率),然后再进行比较。
二、直接标准化法的计算方法
当已知所比较资料各组率Pi,可选用直接法计算标化率。
三、间接标准化死亡比的计算方法
当所比较的资料已知各自某现象总发生数r及各分组观察单位数时,宜采用间接法计算标化率。
第六章
二项分布,Piosson分布 在什么条件下接近正态分布(选择或填空)
第七章(考计算题)
配对与完全随机设计下的四格表的计算 列四格表
公式选择
给个例题把
为研究静脉曲张是否与肥胖有关,观察 122 对同胞兄弟,每对同胞兄弟中有一个属肥胖,另一个属正常体重,记录得静脉曲张发生情况见表8-2,试分析之。
[评析]这是一个配对设计的资料,因此用配对
检验公式计算。
第八章
参数统计与非参数统计(名解 2选1)1. 参数统计
样本所来自的总体分布具有某个已知的函数形式,而其中有的参数是未知的,统计分析的目的就是对这些未知的参数进行估计或检验。此类方法称为参数统计。
2. 非参数统计
样本所来自的总体分布难以用某种函数式来表达,还有一些资料的总体分布的函数式是未知的,只知道总体分布是连续型的或离散型的,解决这类问题的一种不依赖总体分布的具体形式的统计方法。由于这类方法不受总体参数的限制,故称非参数统计法(non-parametric statistics),或称为不拘分布(distribution-free statistics)的统计分析方法,又称为无分布型式假定(assumption free statistics)的统计分析方法。它检验的是分布,而不是参数。非参数统计不需对总体分布(总体参数)作出特殊假设。
非参数统计的特点和适用范围(简答)1.特点
(1)样本所来自的总体的分布形式为任何形式,甚至是未知的,都能适用。(2)收集资料方便,可用“等级”或“符号”来评定观察结果。
(3)多数非参数方法比较简便,易于理解和掌握。
(4)缺点是损失信息量,适用于参数统计法的资料用非参数统计方法进行检验将降低检验效能。
2.适用范围
(1)等级资料。
(2)偏态分布资料。当观察资料呈偏态或极度偏态分布而又未作变量变换,或虽经变量变换仍未达到正态或近似正态分布时,宜用非参数检验。
(3)各组离散程度相差悬殊,即方差明显不齐,且不能变换达到齐性。(4)个别数据偏离过大,或资料为单侧或双侧没有上限或下限值。(5)分布类型不明。(6)初步分析。有些医学资料由于统计工作量大,可采用非参数统计方法进行初步分析,挑选其中有意义者再进一步分析(包括参数统计内容)。
(7)对于一些特殊情况,如从几个总体所获得的数据,往往难以对其原有总体分布作出估计,在这种情况下可用非参数统计方法。
非参数检验的优缺点:(简答)
非参数统计与传统的参数统计相比,有以下优点:
1、非参数统计方法要求的假定条件比较少,因而它的适用范围比较广泛。
2、多数非参数统计方法要求的运算比较简单,可以迅速完成计算取得结果,因而比较节约时间。
3、大多数非参数统计方法在直观上比较容易理解,不需要太多的数学基础知识和统计学知识。
4、大多数非参数统计方法可用来分析如象由等级构成的数据资料,而对计量水准较低的数据资料,参数统计方法却不适用。
5、当推论多达3个以上时,非参数统计方法尤具优越性。
但非参数统计方法也有以下缺点:
1、由于方法简单,用的计量水准较低,因此,如果能与参数统计方法同时使用时,就不如参数统计方法敏感。若为追求简单而使用非参数统计方法,其检验功效就要差些。这就是说,在给定的显著性水平下进行检验时,非参数统计方法与参数统计方法相比,第Ⅱ类错误的概率β要大些。
2、对于大样本,如不采用适当的近似,计算可能变得十分复杂。注 意: 凡符合或经过变换后符合参数检验条件的资料,最好用参数检验。当资料不具备参数检验的条件时,非参数检验是一种有效的分析方法。
配对设计的符号秩和检验方法(简答)(1)假设:H0:差值总体中位数Md=0 H1:Md≠0 α =0.05(2)求差值
(3)编秩次:依差值的绝对值从小到大编秩次。编秩次时遇差数等于 0,舍去不计,同时样本例数减1;遇绝对值相等差数,符号相同顺次编秩次,符号相反取平均秩次,且符号相反。
(4)求秩和并确定检验统计量:分别求出正负秩次之和,正秩和以 T+表示,负秩和的绝对值以T-表示。T+及T-之和应等于 n(n+1)/2,任取T+(或 T-)作检验统计量T。
(5)确定 P 值和作出推断结论:当 n≤50 时,查 T 界值表,得出 P值。若检验统计量T值在上、下界值范围内,其 P值大于表上方相应概率水平;若 T值在上、下界值上若范围外,其 P值小于表上方相应概率水平。
第九章
线性相关系数(名解)
线性相关系数:表示两个变数线性相关方向及程度的统计数或参数。又叫直线相关系数,简称相关系数。,|R|的极值为1,|R|越大(接近1),则直线关系越好。
线性相关系数取值范围(填空)
-1≤r≤1 样本相关系数 r的假设检验(填空题)(1)r 界值表法;(2)t检验法。
线性相关或回归应用应注意的问题(简答)
⑴作回归分析和相关分析时要有实际意义,不能把毫无关联的两种现象作回归、相关分析,必须对两种现象间的内在联系有所认识。
⑵在进行回归分析和相关分析之前,应绘制散点图。但观察点的分布有直线趋势时,才适宜作回归、相关分析。如果散点图呈明显曲线趋势,应使之直线化再行分析。散点图还能提示资料有无可疑异常点。
⑶直线回归方程的应用范围一般以自变量的取值范围为限。若无充分理由证明超过自变量取值范围外还是直线,应避免外延。
⑷双变量的小样本经 t 检验只能推断两变量间有无直线关系,而不能推断相关的紧密程度,要推断相关的紧密程度,样本含量必须很大。
⑸相关或回归关系不一定是因果关系,也可能是伴随关系,有相关或回归关系不能证明事物间确有内在联系。
秩相关的应用适用范围(简答)
秩相关,又称等级相关(rank correlation),是用双变量等级数据作直线相关分析,适用于下列资料:
⒈ 不服从双变量正态分布而不宜作积差相关分析; ⒉ 总体分布型未知;
⒊ 用等级表示的原始数据。相关与回归的区别与联系(简答)区别:
1.意义 :相关反映两变量的相互关系,即在两个变量中,任何一个的变化都会引起另一个的变化,是一种双向变化的关系。回归是反映两个变量的依存关系,一个变量的改变会引起另一个变量的变化,是一种单向的关系。
2.应用:研究两个变量的相互关系用相关分析。研究两个变量的依存关系用回归分析。3.研究性质:相关是对两个变量之间的关系进行描述,看两个变量是否有关,关系是否密切,关系的性质是什么,是正相关还是负相关。回归是对两个变量做定量描述,研究两个变量的数量关系,已知一个变量值可以预测出另一个变量值,可以得到定量结果。
4.相关系数r与回归系数b :r与b的绝对值反映的意义不同。r的绝对值越大,散点图中的点越趋向于一条直线,表明两变量的关系越密切,相关程度越高。b的绝对值越大,回归直线越陡,说明当X变化一个单位时,Y的平均变化就越大。反之也是一样。
联系:
1.r与b值可相互换算; 2.r与b正负号一致;
3.r与b的假设检验等价;
4.回归可解释相关。相关系数的平方r2(又称决定系数)是回归平方和与总的离均差平方和之比,故回归平方和是引入相关变量后总平方和减少的部分。
回归系数的估计原则:最小二乘(least squares)原则(填空)应用直线回归时的注意事项(简答)
应用直线回归时的注意事项:
1.作回归分析要有实际意义,不能把毫无关联的两种现象作回归分析,必须对两种现象间的内在联系有所认识。2.在进行直线回归分析之前,应绘制散点图,当观察点的分布有直线趋势时,才适宜作直线回归分析,散点图还能提示资料有无异常点。异常点的存在往往对方程中的系数(a、b)的估计产生较大影响。因此,需对异常点进行复查。
3.建立直线回归方程后,要对系数进行假设检验,以确定回归方程有无意义。
4.直线回归方程的适用范围一般以自变量的取值范围为限,避免外延。获得自变量值的手段也应与建立方程时相同。否则会产生较大偏差。
第二篇:医学统计学重点总结
简述标准差与标准误的联系与区别?
标准差和标准误都是变异指标,但它们之间有区别,也有联系。区别: ①概念不同;标准差是描述观察值(个体值)之间的变异程度;标准误是描述样本均数的抽样误差;②用途不同;标准差常用于表示变量值对均数波动的大小,与均数结合估计参考值范围,计算变异系数,计算标准误等。标准误常用于表示样本统计量(样本均数,样本率)对总体参数(总体均数,总体率)的波动情况,用于估计参数的可信区间,进行假设检验等。③它们与样本含量的关系不同: 当样本含量 n 足够大时,标准差趋向稳定;而标准误随n的增大而减小,甚至趋于0。联系: 标准差,标准误均为变异指标,如果把样本均数看作一个变量值,则样本均数的标准误可称为样本均数的标准差;当样本含量不变时,标准误与标准差成正比;两者均可与均数结合运用,但描述的内容各不相同。
试述正态分布的特征?
服从正态分布的变量的频数分布由υ、σ 完全决定。
(1)υ 是正态分布的位置参数,描述正态分布的集中趋势位置。正态分布以 x =υ为对
称轴,左右完全对称。正态分布的均数、中位数、众数相同,均等于υ。
(2)σ描述正态分布资料数据分布的离散程度,σ越大,数据分布越分散,σ越小,数
据分布越集中。σ也称为是正态分布的形状参数,σ越大,曲线越扁平,反之,σ越小,曲
线越瘦高。
简述直线相关与直线回归的联系与区别?
答:
1、区别: ①在资料要求上,回归要求因变量y 服从正态分布,自变量x是可以精确测量和严格控制的变量,一般称为Ⅰ型回归;相关要求两个变量x、y服从双变量正态分布。这种资料若进行回归分析称为Ⅱ型回归。②在应用上,说明两变量间依存变化的数量关系用回归,说明变量间的相关关系用相关。
2、联系: ①对一组数据若同时计算r与b,则它们的正负号是一致的;②r与b的假设检验是等价的,即对同一样本,二者的t值相等。③可用回归解释相关。
.简述假设检验的基本步骤及其两类错误
① 建立假设:包括: H0,称无效假设;H1: 称备择假设;② 确定检验水准:检验水准用α表示,α一般取0.05;③ 计算检验统计量:根据不同的检验方法,使用特定的公式计算;④确定P值:通过统计量及相应的界值表来确定P值;⑤推断结论:如P>α,则接受H0,差别无统计学意义;如P≤α,则拒绝H0,差别有统计学意义。Ⅰ型错误又称第一类错误(type Ⅰ error):拒绝了实际上成立的的错误,其概率通常用,为“弃真”,表示。Ⅱ型错误又称第二类错误(type Ⅱ error):不拒绝实际上不成立的表示。为“存伪”的错误,其概率通常用
3.简述标准差的意义和用途?
标准差是描述变量值离散程度常用的指标,主要用途如下: ①描述变量值的离散程度。两组同类资料(总体或样本)均数相近,标准差大,说明变量值的变异度较大,即各变量值较分散,因而均数代表性较差;反之,标准差较小,说明变量异度较小,各变量值较集中在均数周围,因而均数的代表性较好。②结合均数描述正态分布特征;③结合均数计算变异系数CV;④结合样本含量计算标准误。
抽样误差:由于总体中存在个体变异,随机抽样所得样本仅仅是总体的一部分,从而造成样本统计量与总体参数之间的差异,称抽样误差。
第一类错误:拒绝了实际上是成立的H0所产生的错误,即“弃真”,其概率大小为α。
第二类错误:接受了实际上不成立的H0所产生的错误,即“存伪”,其概率大小用β表示,一般β是未知的,其大小与α有关。
构成比: 又称构成指标。它说明一事物内部各组成部分所占的比重或分布。
构成比=(某一组成部分的观察单位数/同一事物各组成的观察单位总数)×100%。
率:又称频率指标。它说明某现象发生的频率或强度。
率=(发生某现象的观察单位数/可能发生该现象的观察单位总数)×K。
率的标准化法: 采用一个共同的内部构成标准,把两个或多个样本的不同内部构成调整为共同的内部构成标准, 以消除因内部构成不同对总率产生的影响,使算得的标准化率具有可比性
计量资料: 用定量方法对每个观察对象测定某项指标量的大小,所得的资料称为计量资料。
计数资料: 先将观察单位按某种属性或类别分组,然后清点各组的观察单位数所得资料,称为计数资料。等级资料: 将观察单位按某种属性的不同程度分组,所得各组的观察单位数,称为等级资料。
小概率事件:我们把概率很接近于0(即在大量重复试验中出现的频率非常低)的事件称为小概率事件。P值:P 值即概率,反映某一事件发生的可能性大小。统计学根据显著性检验方法所得到的P 值反应结果真实程度,一般以P ≤ 0.05 认为有统计学意义,P ≤0.01 认为有高度统计学意义,其含义是样本间的差异由抽样误差所致的概率等于或小于0.05 或0.01。
描述数据分布集中趋势的指标 算术均数、几何均数、中位数。
描述数据分布离散程度的指标 极差、四分位数间距、方差、标准差、变异系数。
同质:影响研究指标的主要因素易控制的因素基本上相同。
可信区间:在参数估计时,按一定可信度估计所得的总体参数所在的范围。
率:又称频率指标。它说明某现象发生的频率或强度。
非参数检验:在统计推断中,不依赖于总体的分布形式, 直接对总体分布位置是否相同进行检验的方法相关系数: 说明两变量间相关关系的密切程度与相关方向的指标,用r表示。
回归系数b: 即回归直线的斜率,它表示当X变动一个单位时,Y平均改变b个单位。
偏回归系数bi: 在其它自变量保持恒定时,Xi每增(减)一个单位时y平均改变bi个单位。
决定系数: 相关系数或复相关系数的平方,即r或R。它表明由于引入有显著性相关的自变量,使总平方和减少的部分,r或R越接近1, 说明引入相关变量的效果越好
医学参考值范围:指绝大多数正常人的解剖、生理、生化、免疫及组织代谢产物的含量等各种波动范围。2222
第三篇:急诊医学 急救医学 复习资料 总结 重点 笔记
急诊医疗服务体系
院前急救 医院急诊 危重病监护 急诊医学专业的特点及观念 急诊 救人治病 的 原则
逻辑反应因果关系,急诊发展过程理念要求强调 救人治病,即把抢救生命作为第一目标,和“治病救人”不同,治病救人意味着首先要明确诊断,在采取相应的治疗措施,而急诊工作中患者最突出的表现就是急性症状,因为病情多变复杂,往往一时间难以诊断明确,如病情危急时重点应放在抢救生命、稳定病情上。急症抢救有很强的时限性,要尽可能减少院前或医院救治的时间延误。黄金时间更要强调从致伤发病起计算时间,缩小时间窗。只有生命体征稳定才能赢取确定诊断和针对病因治疗的时机,要在医疗制度和抢救流程上规定救命优先的原则,可以说急诊救治真正反映一个医院的综合医疗水平,也折射出一个社会对生命的尊重的文明程度。
特点 综合分析 注重功能 逆向思维 时限紧迫 心肺复苏的机制
脑 心脏等很容易受缺血损害,4~6分钟大脑不可逆性损害,骤停前期、骤停期、复苏期(心泵理论和胸泵理论)及复苏后期
新的急救指南的与旧的的急救指南的不同点(1)顺序为C A B D
(2)生命链增加了第五环——综合的心脏骤停后治疗(3)按压每分钟至少100次,成人胸骨按下至少5cm(4)不推荐常规使用阿托品
(5)建议在围停搏期为插管患者持续使用二氧化碳波形图进行定量分析。应用包括确认气管插管位置以及根据呼气末二氧化碳(PETCO2)值监护心肺复苏质量和检测是否恢复自主循环
电除颤的电压用多少焦耳
单相360J,双相150J或200J 心肺复苏的药物、盐水 静脉、气管和骨髓给药
①血管加压药 肾上腺素 1MG,每隔3~5分钟可重复一次,还有血管加压素 ②阿托品
③抗心律失常药
胺碘酮 无反应型VF.T;利多卡因 代替胺碘酮;镁剂 尖端扭转型室性心动过速 ④碳酸氢钠
心脏猝死的概念
未能预料的于突发心脏症状1小时内发生的心脏原因死亡。心脏骤停不治是心脏猝死最常见的死因。休克的概念 各种致病因素引起的有效循环血量急剧减少导致器官和组织微循环灌注不足致使组织缺氧、细胞代谢紊乱和器官功能受损的综合症。
辅助检查如CVP、PAWP、CO.4~8L/min <2提示心功不全,CI2.5~4.1L/minm²<1.3伴周围循环血量不足提示为心源性休克。
休克的治疗原则稳定生命体征,保持重要器官的微循环灌注和改善细胞代谢,并在此前提下进行病因治疗。药物 血管活性药 多巴胺多巴酚丁胺和异丙肾上腺素、去甲肾上腺素及肾上腺素(过敏性休克首选)、间羟胺;其他糖皮质激素、纳洛酮
各型休克的特点及急救 低血容量 补液 ;心源性 抗心失和强心药 血管活性药糖皮质激素 心肌保护药 限制补液量; 感染性 液体疗法和控制感染 糖皮质激素 纠正酸碱和水电解质失衡 改善细胞代谢和防治并发症;过敏性 肾上腺素和糖皮质激素 升压药和脱敏药 吸氧 补液等 有效循环血量的概念
单位时间内通过心血管系统进行循环的血量 SIRS的临床特点及诊断 体温 >38或<36 心率 >90次/分
呼吸>20次/分或PACO2<32mmhg 白细胞计数大于12或<4X10九次方每升 MODS的概念
原发性MODS 是指严重创伤和大量多次输血等明确的生理打击直接作用的结果,器官功能障碍由打击本身造成,损伤早期出现多个器官功能障碍,发病过程SIRS未起主导作用。休克 复苏 高代谢状态和器官功能衰竭
二次打击的机制
机体受严重损害因素打击,激发防御反应,若反应过度释放大量细胞因子和炎性介质损伤细胞组织导致器官功能障碍启动了MODS。缺血再灌注和SIRS,两次打击所致的炎症反应失控时最重要的病理生理基础。脓毒症的概念
感染因素引起的全身炎症反应,严重时可导致器官功能障碍和或循环衰竭。
低钠血症 <135 大量胃肠液丢失,大量饮水输液稀释和心肾功能不好,药物及抗利尿激素过多疾病等原因
补钠量 142 –患者血钠 X体重 X0.6 低钾血症 <3.5 摄入不足及排出过多,分布异常及缺镁 心电图致T波低平,ST段下降和QT延长和特征性U波 补钾 口服 见尿补钾 速度<40 禁忌静脉快速推注 高血钾 肾功不足及代谢性酸中毒 对称 T波高峰 心室颤动或停止
大于6就透析葡萄糖酸钙和胰岛素β2受体激动剂碳酸氢钠及血液净化 急性中毒吸收、代谢、排出,中毒机制。胃肠 呼吸道 皮肤 等途径吸收,肝脏代谢和肾脏排出
中毒机制 局部腐蚀和刺激,缺氧和麻醉、抑制酶活力和干扰细胞代谢及受体竞争 有机磷中毒
急诊处理原则 ①清除毒物 立即脱离中毒现场和清洗污染皮肤毛发;洗胃 敌百虫禁忌碳酸氢钠,对硫磷禁忌高锰酸钾;导泻 硫酸镁;血液净化治疗 ②特效解毒药 原则 早期足量联合重复 胆碱酯酶复活剂 氯或碘解磷定
抗胆碱药 阿托品 阻断乙酰胆碱对副交感神经和中枢神经系统的M受体的作用,改善M样症状和中枢呼吸抑制
长托宁 对M2受体不明显作用,优势 较强的抗M作用改善平滑肌痉挛和腺体分泌过多,抗N作用解除肌纤维纤颤症状,中枢和外周双重抗胆碱效应,不引起心动过速和半衰期长及每次用量小不易中毒
治疗措施(血液净化治疗的适应症 血液透析 小于500D水溶性强;血液灌流500~40000D,水溶脂溶均可;血浆置换 溶血性毒物)反跳
中间型综合征
氨基甲酸酯类中毒的治疗要点 应用阿托品但忌用胆碱酯酶复活剂 了解各种老鼠药的中毒机制及治疗药物 溴鼠隆 广泛出血 用VK1 毒鼠强 癫痫痉挛 抗惊厥治疗 地西泮等 氟乙酰胺 昏迷 乙酰胺 磷化锌 蒜臭味 硫酸铜 多发伤
遭受一个致病因素,同时造成两个或以上解剖部位的损伤 多发伤的救治原则
①生命支持 呼吸道的管理 心肺复苏 抗休克治疗
②急救 颅脑损伤降颅压 失血为主快速补液 各部位损伤视为整体处理 ③进一步处理 颅脑损伤防治脑疝 胸腹部损伤和四肢骨盆脊柱损伤的处理 ④多发伤手术处理顺及一期手术治疗(胸腹颅脑四肢泌尿系统)⑤营养支持
⑥预防感染 彻底清除和预防院内感染 复合伤
同时或相继遭受两种或以上致伤因素作用于人体造成的损伤,病情更复杂更严重。了解灾害流程 现场急救、分检与运送 和院内急救 损伤控制原则 意识障碍的临床表现(嗜睡、昏睡、昏迷)
昏迷的急诊处理 呼吸道通畅和吸氧 维持有效循环血量 急诊查常规血气肝肾功能 降颅压 控制高血压和过高体温 预防感染和控制癫痫发作 纠正水电解质紊乱 给予脑代谢促进剂及促醒药物 稳定病情后送入ICU病房确诊和治疗 格拉斯昏迷量表
睁眼反应4分 语言5分 动作 6分
我国脑死亡 脑干反射消失 深昏迷和自主呼吸停止,脑电图和观察12小时无变化
WHO的脑死亡标准 对外界刺激无反应,无反射活动,无自主活动,必须依靠持续的人工机械维持呼吸,脑电图长时间静息
了解脑出血 基底节 豆纹动脉
脑梗死 缺血性卒中 动脉粥样硬化 中老年
呼吸困难的表现 吸气性和呼气性、混合性 和潮式呼吸间停呼吸
治疗原则 保持呼吸道通畅,纠正缺氧和CO2潴留,纠正酸碱平衡失调,为基础疾病及诱发因素的治疗争取时间 哮喘诊断
反复发作的病史,突发喘息、咳嗽、胸闷和呼吸困难,双肺弥漫哮鸣音 排除气胸和急性左心衰,重度 治疗无效,缺氧加重心率变快烦躁不安等
治疗原则 ①迅速控制哮喘 给氧 控制哮喘症状 沙丁胺醇和抗胆碱药② 药物治疗 糖皮质激素吸入 抗胆碱能药物 和胃肠道外使用β能肾上腺素 茶碱类 心衰的急诊处理 体位 坐位,改善氧供减轻心肌缺血,建立静脉通道和注射吗啡,利尿剂,血管扩张药(硝酸甘油和硝普钠),氨茶碱,正性肌力药,血流动力学监测和其他主动脉内球囊反博 吗啡 颅内出血,神志障碍和慢性肺部疾病忌用,纳洛酮解除呼吸抑制
洋地黄 房颤伴室率增快,重度二尖瓣狭窄伴窦性心律忌用,不可先强心后利尿 肺栓塞病因:血栓或其他如空气、羊水和脂肪、寄生虫等。临床特点 ①猝死型 肺动脉主干
②急性肺源性心脏病 两个肺叶以上肺血管 ③急性心源性休克型 血管堵塞50%以上 ④肺梗死型 外周肺血管堵塞
⑤不可解释的呼吸困难型 常见,梗死面积较小
诊断要点 危险因素 临表 突发呼困、胸痛和咯血、晕厥,D二聚体,<500ug/L基本排除急性肺栓塞,肺动脉造影最准确
处理原则 绝对卧床休息和吗啡镇静,抗休克及纠正心律失常等 溶栓和抗凝治疗
溶栓的适应证 两个以上肺叶大面积肺梗死;PE伴休克;原有肺心病次大块PE致循环衰竭;血流动力学稳定和无右心室运动障碍和循环血流障碍者不主张溶栓,主要并发症 颅内出血。ARDS与ALI诊断标准有什么不同,了解治疗 氧合指数PAO2/FIO2≤200为ARDS,≤300就是ALI;治疗用呼气末正压通气PEEP 可能的名词解释 心脏猝死的概念
是指未能预料的发生于突发心脏症状1小时内的心脏原因死亡。心跳骤停未治是主要死因。有效循环血量的概念
单位时间内通过心血管系统进行循环的血量。MODS的概念,原发性MODS 多种疾病导致机体内环境的失衡,器官不能维持自身正常功能而出现一系列病理生理改变和临床表现,包括早期的多器官功能障碍到晚期的MOF。脓毒症的概念
感染因素引起的全身炎症反应,严重时可导致器官功能障碍和或循环衰竭。复合伤的概念
两种或以上致伤因素导致的同时或相继作用与人体所造成的损伤。反跳
急性有机磷中毒口服者经抢救临床症状好转后达稳定期几天到一周左右病情突然恶化,再次出现胆碱能危象甚至昏迷肺水肿猝死。中间型综合征
急性有机磷中毒引起的,介于胆碱能危象和迟发型多发性神经病之间发生的一组以肌无力为突出表现的综合症
迟发性多发性神经病
少数危重中毒症状者症状消失后2~3周发生感觉和运动型多发性神经病变,表现为肢体末梢烧灼感、麻木感和下肢肌无力肌萎缩等,多是由于毒物的重吸收和停药过快等。老师确认了的大题
1、有机磷中毒
胆碱酯酶抑制导致乙酰胆碱的蓄积,轻 M样50~70%,中M、N样30~50%,重M、N样和脑水肿和肺水肿、呼衰等 <30%。
清除毒物 脱离现场和洗胃、导泻、硫酸镁;特效解毒药早期足量联合重复 ①清除毒物 立即脱离中毒现场和清洗污染皮肤毛发;洗胃 敌百虫禁忌碳酸氢钠,对硫磷禁忌高锰酸钾;导泻 硫酸镁;血液净化治疗 ②特效解毒药 原则 早期足量联合重复 胆碱酯酶复活剂 氯或碘解磷定
抗胆碱药 阿托品 阻断乙酰胆碱对副交感神经和中枢神经系统的M受体的作用,改善M样症状和中枢呼吸抑制
长托宁 对M2受体不明显作用,优势 较强的抗M作用改善平滑肌痉挛和腺体分泌过多,抗N作用解除肌纤维纤颤症状,中枢和外周双重抗胆碱效应,不引起心动过速和半衰期长及每次用量小不易中毒——6点 治疗措施(血液净化治疗的适应症 血液透析 小于500D水溶性强;血液灌流500~40000D,水溶脂溶均可;血浆置换 溶血性毒物)
2、肺栓塞
各种栓子阻塞肺动脉
临床特点 猝死型 主干阻塞;急性肺源性心脏病型 两个肺叶以上;急性心源性休克 50%以上肺血管阻塞;肺梗死型外周肺血管阻塞;不可解释的呼吸困难 诊断 危险因素 临表 血浆D二聚体 肺动脉造影
3、新的急救指南的与旧的的急救指南的不同点
顺序CABD;增加心跳骤停后治疗为第五环;不推荐常规使用阿托品;成人心肺复苏频率至少达到100次/分,按压深度至少5cm;建议在围停搏期为插管患者持续使用CO2波形图进行定量分析,可检查插管深度和根据呼气末CO2值观察心肺复苏效果和检测是否有自主呼吸
4、论述题第一张绪论出
救人治病 逻辑决定因果关系,救人治病强调把抢救生命当做第一目标,而治病救人要求医生必须先明确诊断再采取救治措施,但是急诊患者最突出的表现是急性症状,病情重且多变,往往难以立即明确诊断,故应先采取救治措施稳定病人生命体征,才能赢得更多确定诊断和针对病因治疗的时间,因此要在医疗制度和救治过程上规定生命优先的原则,急诊救治反应一个医院的综合治疗水平,也反映了社会对生命尊重的文明程度。可能的大题
5、多发伤概念 一种致伤因素导致的两处以上解剖部位的损伤。
多发伤的救治原则 生命支持 管理呼吸道的通畅 心肺复苏 休克液体复苏,急救,进一步治疗,手术顺序和一期手术,营养支持和防治感染
6、休克
7、钠、钾异常的病因、治疗
8、心衰的急诊处理
体位 坐位,吸氧,建立静脉通道,吗啡 呼吸抑制,利尿剂,强心剂 洋地黄,血管扩张药,氨茶碱和主动脉球囊反博器,血流动力学检测等
9、脑死亡标准 对外界刺激无反应 无反射性活动 无自主活动 脑电图长时间静息 必须继续的人工机械通气维持呼吸
第四篇:医学统计学总结
1、同一资料的标准差是否一定小于均数?
答:均数是描述定量资料集中趋势的指标,而标准差是描述定量资料离散程度的指标,二者反映的是资料分布特征的两个不同方面。
2、极差、四分位间距、标准差、变异系数的适用范围有何异同?
答:这四个指标的相同点在于均用于描述计量资料的离散程度。不同点为:极差可用于各种分布的资料,一般常用于描述单峰对称分布小样本资料的变异程度,或用于初步了解资料的变异程度。若样本含量相差较大,则不宜用极差来比较资料的离散程度。四分位间距:适用于描述偏态分布资料、两端无确切值或分布不明确资料的离散程度。标准差常用于描述对称分布,特别是正态分布或近似分布资料的离散程度。变异系数适用于比较计量单位不同或均数相差悬殊的几组资料的离散程度。
3、x2检验用于什么?
答:x检验用于:推断两个及两个以上总体率或构成比是否有差别,两个分类变量间有无相关关系,多个率的趋势检验,以及两个率的等效检验等。此外,也用于频数分布的拟合优度检验。
4、四格表的U检验和x2检验有何联系?
答:(1)相同点:四格表的u检验的根据是正态近似原理(n足够大,∏和1-∏均不太小)。能用四格表的u检验进行两个率比较检验的资料,都可以用x检验。四格表的双侧u检验与x检验是完全等价的,两个统计量的关系为u= x,u20.05/2= u20.05/1.u检验和卡方检验都存在连续性矫正问题(2)不同点:①正态分布可以确定单、双侧检验界值,满足正态近似条件时,可以使用四格表的单侧u检验。②满足四格表u检验的资料,计算两率之间的95%可信区间,尚可分析两率之差有无实际意义。③x2检验还可以用于配对设计四格表,但这时推断∏1,∏2是否有差别的x2公式不同。5.参数检验和非参数检验的区别何在?各有何优缺点? 答:区别:参数检验,其应用条件是已知总体的分布类型,对总体参数进行估计或检验。非参数检验,不依赖总体分布的具体形式,目的在于检验总体分布是否不同。(2)参数检验优点是符合应用条件时,检验效能较高。缺点是对资料要求严格,不能用于等级数据、一端或两端有不确切数据,此外,还要求资料的分布类型已知和总体方差齐等条件。非参数检验优点是应用范围广,计算简便,对资料的要求不高;缺点是若对符合参数检验条件的资料用非参数检验,则会降低检验效能。如需检验出同样大小的差异,非参数检验往往需要更大的样本含量。
6.对同一资料,又出自同一研究目的,用参数检验和非参数检验所得不一致时,宜以何者为准?答:两者各有使用条件,究竟取哪种结论,要根据资料是否满足该种检验方法的应用条件进行选择。在符合参数检验的条件时,可接受参数检验的结论,而资料不符合参数检验的条件时,应以非参数检验的结论为佳。如总体分布为极度偏态或其他非正态分布,或者两总体方差不齐时,此时宜采用秩和检验的结果。7.非参数检验适用于哪些情况?
答:①等级资料②偏态资料。当观察资料成偏态或极度偏态而又未经任何变量变换,或虽经变量变换但仍未达到正态或近似正态分布时③总体分布类型未知的资料④要比较的各组资料方差不齐⑤一端或两端有不确定数据。
8.两样本比较的秩和检验,当n1>n2>10时采用u检验,这时检验是属于参数检验还是非参数检验?为什么?答:两组比较的秩和检验,当n很大时,可利用秩和T的分布随n增大渐进正态分布的性质,进行u检验,此时利用的并非原始数据,而是经秩变换后的数据,故仍属非参数检验。9.直线回归分析中应注意哪些问题?
答:做回归分析一定要有专业意义,不能将毫无联系的两个变量作直线回归分析;回归分析之前首先应绘制散点图,考查x与y之间有无直线趋势以及是否存在异常点;考虑是否满足建立线性回归模型的基本假定;直线回归方程的应用与图示一般以自变量x的取值范围为限;两变量的直线关系不一定是因果关系,也可能是伴随关系。
10.简述直线回归与直线相关的区别与联系。
答:区别:①资料要求不同:直线回归中因变量y是来自正态总体的随机变量,而r既可以是来自正态总体中的随机变量,也可以是严密控制、精确测量的变量;相关分析则要求x,y是来自双变量正态分布总体的随机变量,②分析目的不同:直线回归用于说明两变量间依存变化的数量关系;直线相关用于说明变量间的直线相关关系。联系:①方向一致:对一组数据计算,r与b,它们的正负号是一致的。②假设检验等价:对同一样本r和b的假设检验得到的t值相等。③用回归解释相关:由r2=SS回/SS总可知,若回归平方和越接近总平方和,则r越接近于1。
11.简述直线相关、秩相关的区别与联系。
答:区别:①资料要求不同:直线相关要求x、y是来自双变量正态总体的随机变量;秩相关适用于不服从双变量正态分布或总体分布类型未知以及用等级表示的原始数据。②相关意义不同:直线相关表示两变量的直线相关关系存在,秩相关表示两变量的相关关系。联系:相关系数的取值范围相同;秩相关是将原始数据进行秩变换,以秩次计算直线相关系数。
12.均数的可信区间和参考值范围有何不同?
222
22答:均数的可信区间:按一定的概率100(1-α)%(即可信度)估计总体均数所在的范围,得到的范围亦称可信区间。参考值范围:医学参考值范围指包括绝大多数正常人的人体形态、功能和代谢产物等各种生理及生化指标常数,也称正常值。由于存在着个体差异,生物医学数据并非常数,而是一定范围内波动,故采用医学参考值范围作为判定正常和异常的参考标准。
13秩和检验的优缺点是什么? 答:①不受总体分布限制,适用面广②适用于等级资料及两端无确定值的资料③易于理解,易于计算。缺点:是对分布类型的广泛适应性,使其很难充分利用资料提供的信息,有时会导致检验效能降低。14在t检验和u检验时,何种情况下采用单侧检验?
答:单侧检验的备择假设带有方向性,如:m>m0,实际中只可能出现一种情况。双侧检验的备择假设中包含不等号(如:m≠m0),实际上包括两种情况:m>m0或m<m0,无方向性。15.均数、几何均数和中位数的适用范围是什么?
答:均数适用于描述单峰对称分布,特别是正态分布或近似正态分布资料的集中趋势。(由于均数易受到极端值的影响,故不适用于描述偏态分布资料的集中趋势,只是需采用几何均数或中位数。)几何均数对于原始观察值呈偏态分布,但经过对数变换后呈正态分布或近似正态分布的资料,易用几何均数描述其集中趋势。常用于等比级资料或对数正态分布资料。中位数可用于各种分布的资料。对于正态分布资料,中位数等于均数;对于对数正态分布资料,中位数等于几何均数。由于中位数不受极端值的影响,主要用于偏态分布资料,两端无确切值或分布不明确的资料。16.标准差和标准误有何区别与联系,他们的用途是什么?
答:标准差:是描述对称分布,特别是正态分布或近似正态分布资料离散趋势(变异程度)的常用指标。总体标准差用δ表示,样本标准差用s表示。标准误:样本均数的标准差称为标准误。样本均数⊙的总体均数为H,各⊙围绕H的离散程度,可以用样本均数的标准差来描述。用途:标准差用途:①表示变量分布的离散程度②结合均数计算变异系数③结合样本含量计算标准误④结合均数描述分布特征。标准误用途:表示每个样本均数间的变异程度,描述样本均数的抽样误差,即样本均数与总体均数的接近程度,也可称为样本均数的标准差。17.统计图制作的一般原则?
答:首先,根据资料性质和分析目的正确选用适当的统计图。其次,除圆图外,一般用直角坐标系的第一象限的位置表示。最后,绘制图形应注意准确、美观,给人以清晰的印象。18.各种统计图适合于何种资料? 答:描述某连续变量的频数分布宜选用直方图;分析、比较独立的或不连续的多个组或多个类别的统计量宜选用条图,分析某指标随时间或其它连续变量变化而变化的趋势宜选用线图,描述或比较不同事物内部构成时用圆图或百分比条图等。
19.为什么要做r和b的假设检验?
答:b:即使从总体回归系数β等于零的总体中作随机抽样,由于抽样误差的存在,其样本回归系数b也不一定全为零。因此,求得一个样本回归系数时,首先,需考虑线性方程是否成立?并进行回归系数β是否为零的检验。以推断自变量x与应变量y见是否有直线关系存在。
r:假定从总体相关系数þ=0的总体中随机抽样,由于存在抽样误差,所得样本相关系数r不一定全为零。故此,求得一个样本相关系数r值后,仍需进行总体相关系数þ是否为零的假设检验。
20.服从二项分布的条件是什么?
答:凡具有贝努力试验序列3个特点的变量,一般可认为服从二项分布①每次试验的结果只能是两种互斥的结果中的一种(A或者非A)②各次试验的结果互不影响,即各次试验独立③在相同试验条件下,各次试验中出现某一结果A具有相同的概率∏(非A的概率1-∏)。
21.相关系数和回归系数有什么区别和联系?
答:直线的斜率称为回归系数,直线相关系数也称积距相关系数,说明具有直线关系的两变量间的相关方向与密切程度。它们的联系——方向一致即r与b正负一致,假设检验等价。区别:资料要求不同,回归系数方程要求服从正态分布,x精确测量严格控制Ⅰ型回归,相关方程要求x,y双重复正态Ⅱ型回归。22多个样本均数间的比较为什么不能用t检验?
答:多个样本均数的两两比较又称多重比较,其目的是推断究竟哪些总体均数之间存在差别,由于涉及的对比组数大于2,若仍用前述的t检验对两个对比组做比较,会使犯第Ⅰ类错误的概率增大,即可能吧本来无差别的两个总体均数判为有差别,因此,多重比较不宜用t检验分别作两两比较。
23对同一资料,有出自同一研究目的,用参数检验和非参数检验所得结果不一致时,宜以何者为准?答:参数检验要求其总体分布为正态分布,总体方差齐性,非参数检验常用解决那些总体分布未知的统计问题,对于同一资料,又出自同一研究目的,采用参数研究还是非参数检验取决于资料的类型。24.为什么要进行抽样研究?抽样时为什么会产生抽样误差?
答:计量资料的总体中所含的样本数量巨大,要获取资料的总体均数、标准差等数据十分困难,因此医学科学研究中通常采用的抽样研究方法,是指从总体中随机抽取一个样本,用样本信息推断总体特征,这种分析方法称为统计推断。但通常情况下,样本均数(x拔)不可能与总体均数μ正好相等,这种由个体变异产生的,随机抽样引起的样本统计量与总体参数间的差异称为抽样误差。25.相关系数的意义?
答:相关系数r没有单位,取值范围为-1≤r≤1。两变量相关的方向用r的正负号表示,即r>0表示正相关;r<0表示负相关。相关系数r的大小表示密切程度,r绝对值越接近1,表示两变量间相关关系密切程度越高。∣r∣=1表示完全相关,∣r∣=0表示无直线相关。26.方差分析的应用条件?
答:①各样本是相互独立的随机样本②各样本来自正态分布③各样本方差相等,即方差齐。
27.χ2检验要注意的问题(注意事项)?
答:① 计算χ2 值时必须用绝对数。而不能用相对数,因为χ2 值的大小与频数大小有关。②χ2 检验要求理论频数不宜太小,一般认为不宜有1/5以上格子理论频数小于5,或一个格子的理论频数小于1。对理论频数太小有三种处理方法:A 增大样本例数 B 删除理论数太小的行或列 C 合并③当多个样本率(或构成比)比较的χ2 检验结论为拒绝检验假设,只能认为各总体率(或总体构成比)之间总的说来有差别,但不能说它们彼此间都有差别。或某两者间有差别。
28.非参数检验适用哪些情况?
答:①等级顺序资料。②偏态资料。当观察资料成偏态或极度偏态分布而又未经变量变换未达到正态或近似正态分布时,宜用非参数检验。③未知分布类型资料④要比较的各组资料变异度相差较大,方差不齐,且不能变换达到齐性。⑤初步分析。有些医学资料由于统计工作量过大,可采用非参数统计方法进行初步分析,挑选其中有意义者再进一步分析⑥对于一些特殊情况,如从几个总体所获得的数据,往往难以对其原有总体分布作出估计,在这种情况下可用非参数统计方法。
29.为什么秩和检验的编秩在不同对比组间出现相同数据要给予“平均秩次”,而同一组的相同数据不必计算“平均秩次”?
答:因为在不同对比组,不取平均秩次会加大或减小某一组的秩和;而在同一组内,出现相同数据不编平均秩次,该组秩和不受影响。
30.怎样正确使用单侧检验和双侧检验?
答:根据专业知识推断两个总体是否有差别时,是甲高于乙,还是以高于甲,当两种可能都存在时,一般选双侧;若根据专业知识,如果甲不会低于乙,或研究者仅关心其中一种可能时,可选用单侧。一般来讲,双侧检验较稳妥故较多用,在预实验有探索性质时,对结果的考虑以思路较宽为好,也用双侧检验。单侧检验,应以专业知识为依据,他充分利用了另一侧的不可能性,故检出效率高,但应慎用。
31.回归系数:直线的斜率b,也称回归系数。统计学意义是自变量x改变一个单位时,应变量y平均变化b个单位。32.相关系数:也称pearson积距相关系数,说明具有直线相关的两变量间相关方向与密切程度。33.直线回归分析中应注意的问题?
答:①做直线回归一定要有实际意义②回归分析之前首先应绘制散点图。③考虑建立线性模型的基本假定④取值范围,避免外延。⑤两变量间有直线关系不一定是因果关系。34.相关分析应用中应注意的问题?
答:①资料要求x、y都应来自双变量正态总体的随机变量。②进行相关分析前,应先绘制散点图,有线性趋势时,才可进行相关分析。③满足应用条件的同一份双变量资料,回归系数b与相关系数r的正负号一致,假设检验等价。④相关分析时,小样本资料经t检验只能推断两变量间有无直线关系,而不能推断其相关的密切程度。要推断两样本间相关的程度,样本含量必须足够大,当r有统计学意义时,但r2较小时,下结论要慎重。35.方差分析的应用条件? 答:①各样本是相互独立的随机样本②各样本来自正态分布③各样本方差相等,即方差齐。
36.二项分布:贝努力试验序列中结果A出现次数的概率分布就是~。
37.率的标准化法:为解决因内部构成不同而导致分组率比较的结果与和纪律比较结果的矛盾,选定一个共同的标准人口或标准人口构成,分别计算两组的标准化率,这种方法称~。
38.抽样误差:由个体变异产生的,随机抽样引起的样本统计量与总体参考数间的差异称~
第五篇:医学统计学总结
医学统计学总结
一、两组或多组计量资料的比较1.两组资料: 1)大样本资料或服从正态分布的小样本资料(1)若方差齐性,则作成组t检验(2)若方差不齐,则作t’检验或用成组的Wilcoxon秩和检验 2)小样本偏态分布资料,则用成组的Wilcoxon秩和检验 2.多组资料: 1)若大样本资料或服从正态分布,并且方差齐性,则作完全随机的方差分析。如果方差分析的统计检验为有统计学意义,则进一步作统计分析:选择合适的方法(如:LSD检验,Bonferroni检验等)进行两两比较。2)如果小样本的偏态分布资料或方差不齐,则作Kruskal Wallis的统计检验。如果Kruskal Wallis的统计检验为有统计学意义,则进一步作统计分析:选择合适的方法(如:用成组的Wilcoxon秩和检验,但用Bonferroni方法校正P值等)进行两两比较。
二、分类资料的统计分析1.单样本资料与总体比较 1)二分类资料:(1)小样本时:用二项分布进行确切概率法检验;(2)大样本时:用U检验。2)多分类资料:用Pearson c2检验(又称拟合优度检验)。2.四格表资料 1)n>40并且所以理论数大于5,则用Pearson c2 2)n>40并且所以理论数大于1并且至少存在一个理论数<5,则用校正c2或用Fisher’s 确切概率法检验 3)n£40或存在理论数<1,则用Fisher’s 检验 3.2×C表资料的统计分析 1)列变量为效应指标,并且为有序多分类变量,行变量为分组变量,则行评分的CMH c2或成组的Wilcoxon秩和检验 2)列变量为效应指标并且为二分类,列变量为有序多分类变量,则用趋势c2检验 3)行变量和列变量均为无序分类变量(1)n>40并且理论数小于5的格子数<行列表中格子总数的25%,则用Pearson c2(2)n£40或理论数小于5的格子数>行列表中格子总数的25%,则用Fisher’s 确切概率法检验 4.R×C表资料的统计分析 1)列变量为效应指标,并且为有序多分类变量,行变量为分组变量,则CMH c2或Kruskal Wallis的秩和检验 2)列变量为效应指标,并且为无序多分类变量,行变
量为有序多分类变量,作none zero correlation analysis的CMH c
23)列变量和行变量均为有序多分类变量,可以作Spearman相关分析 4)列变量和行变量均为无序多分类变量,(1)n>40并且理论数小于5的格子数<行列表中格子总数的25%,则用Pearson c2(2)n£40或理论数小于5的格子数>行列表中格子总数的25%,则用Fisher’s 确切概率法检验
三、Poisson分布资料1.单样本资料与总体比较: 1)观察值较小时:用确切概率法进行检验。2)观察值较大时:用正态近似的U检验。2.两个样本比较:用正态近似的U检验。配对设计或随机区组设计
四、两组或多组计量资料的比较 1.两组资料: 1)大样本资料或配对差值服从正态分布的小样本资料,作配对t检验 2)小样本并且差值呈偏态分布资料,则用Wilcoxon的符号配对秩检验 2.多组资料: 1)若大样本资料或残差服从正态分布,并且方差齐性,则作随机区组的方差分析。如果方差分析的统计检验为有统计学意义,则进一步作统计分析:选择合适的方法(如:LSD检验,Bonferroni检验等)进行两两比较。2)如果小样本时,差值呈偏态分布资料或方差不齐,则作Fredman的统计检验。如果Fredman的统计检验为有统计学意义,则进一步作统计分析:选择合适的方法(如:用Wilcoxon的符号配对秩检验,但用Bonferroni方法校正P值等)进行两两比较。
五、分类资料的统计分析1.四格表资料 1)b+c>40,则用McNemar配对c2检验或配对边际c2检验 2)b+c<40,则用二项分布确切概率法检验 2.C×C表资料: 1)配对比较:用McNemar配对c2检验或配对边际c2检验 2)一致性问题(Agreement):用Kap检验 变量之间的关联性分析
六、两个变量之间的关联性分析 1.两个变量均为连续型变量 1)小样本并且两个变量服从双正态分布,则用Pearson相关系数做统计分析 2)大样本或两个变量不服