第一篇:医学统计学统计方法总结
计量资料:
一、描述性分析
集中趋势:对称——算术均数偏态——中位数等比——几何均数 离散趋势:对称——方差、标准差偏态——四分位数间距
均数悬殊或单位不同的资料比较——变异系数
二、统计推断(根据样本推断总体)1.参数(均数)估计总体方差未知——总体方差已知——
参考值范围:单双侧正态分布——
XuS
(xt/2v
snsn,xt/2v
s
sn))
(xu/2,xu/2
n
XuSXuS
偏态分布——百分位数法
二者的含义、用途 2.假设检验
(1)均数的比较(正态)
单个样本、配对(与两独立样本的区别)两样本(方差齐——t检验
方差不齐——校正t检验或秩和检验或变量转换)多样本:方差齐完全随机设计方差分析随机区组设计方差分析
方差不齐——秩和检验或变量转换
非正态:秩和检验或变量转换
F—+—>t
两两比较:SNK任两个对比
LSD一对或几对比较
Dunnet 实验与对照组比较
t——>FF=t
2(2)方差比较
两个方差:F检验(正态)
多个方差:Bartlett(正态)
Levene检验
假设检验注意事项
计数资料
一、描述性分析
频率或严重程度——率
比重或构成——构成比
一指标为另一指标的若干倍或百分比——相对比
应用注意:不能以比代率、可比性、样本率不能直接对比
率或构成比比较:
1.若某因素内部构成不同并且影响比较,进行标化
二、统计推断
1.参数估计
二项分布率的估计:查表或正态法
泊松分布均数估计:查表或正态法
2.假设检验
单个样本率:直接法或二项分布U检验泊松分布U检验(率很小)两样本率的比较:四格表2检验(校正)
二项分布U检验(n大、np>5,n(1-p)>5)
泊松分布U检验((率很小)
精确概率法
多个率或构成比比较:2检验(理论数不能小于1或小于的理论数
不能多于5分1)
两两比较:
任两个对比、实验与对照组比较
等级资料:-----效应比较
秩和检验
两变量关系:
1.定量(计量资料)正态pearson相关 回归
非正态秩相关
2.无序分类定性
3.有序分类定性2检验和列联相关系数
(1)单向有序分组有序、指标无序卡方检验分组无序、指标有序秩和检验
(2)双向有序
属性相同属性不同Kappa检验 线性趋势秩相关
第二篇:医学统计学总结
1、同一资料的标准差是否一定小于均数?
答:均数是描述定量资料集中趋势的指标,而标准差是描述定量资料离散程度的指标,二者反映的是资料分布特征的两个不同方面。
2、极差、四分位间距、标准差、变异系数的适用范围有何异同?
答:这四个指标的相同点在于均用于描述计量资料的离散程度。不同点为:极差可用于各种分布的资料,一般常用于描述单峰对称分布小样本资料的变异程度,或用于初步了解资料的变异程度。若样本含量相差较大,则不宜用极差来比较资料的离散程度。四分位间距:适用于描述偏态分布资料、两端无确切值或分布不明确资料的离散程度。标准差常用于描述对称分布,特别是正态分布或近似分布资料的离散程度。变异系数适用于比较计量单位不同或均数相差悬殊的几组资料的离散程度。
3、x2检验用于什么?
答:x检验用于:推断两个及两个以上总体率或构成比是否有差别,两个分类变量间有无相关关系,多个率的趋势检验,以及两个率的等效检验等。此外,也用于频数分布的拟合优度检验。
4、四格表的U检验和x2检验有何联系?
答:(1)相同点:四格表的u检验的根据是正态近似原理(n足够大,∏和1-∏均不太小)。能用四格表的u检验进行两个率比较检验的资料,都可以用x检验。四格表的双侧u检验与x检验是完全等价的,两个统计量的关系为u= x,u20.05/2= u20.05/1.u检验和卡方检验都存在连续性矫正问题(2)不同点:①正态分布可以确定单、双侧检验界值,满足正态近似条件时,可以使用四格表的单侧u检验。②满足四格表u检验的资料,计算两率之间的95%可信区间,尚可分析两率之差有无实际意义。③x2检验还可以用于配对设计四格表,但这时推断∏1,∏2是否有差别的x2公式不同。5.参数检验和非参数检验的区别何在?各有何优缺点? 答:区别:参数检验,其应用条件是已知总体的分布类型,对总体参数进行估计或检验。非参数检验,不依赖总体分布的具体形式,目的在于检验总体分布是否不同。(2)参数检验优点是符合应用条件时,检验效能较高。缺点是对资料要求严格,不能用于等级数据、一端或两端有不确切数据,此外,还要求资料的分布类型已知和总体方差齐等条件。非参数检验优点是应用范围广,计算简便,对资料的要求不高;缺点是若对符合参数检验条件的资料用非参数检验,则会降低检验效能。如需检验出同样大小的差异,非参数检验往往需要更大的样本含量。
6.对同一资料,又出自同一研究目的,用参数检验和非参数检验所得不一致时,宜以何者为准?答:两者各有使用条件,究竟取哪种结论,要根据资料是否满足该种检验方法的应用条件进行选择。在符合参数检验的条件时,可接受参数检验的结论,而资料不符合参数检验的条件时,应以非参数检验的结论为佳。如总体分布为极度偏态或其他非正态分布,或者两总体方差不齐时,此时宜采用秩和检验的结果。7.非参数检验适用于哪些情况?
答:①等级资料②偏态资料。当观察资料成偏态或极度偏态而又未经任何变量变换,或虽经变量变换但仍未达到正态或近似正态分布时③总体分布类型未知的资料④要比较的各组资料方差不齐⑤一端或两端有不确定数据。
8.两样本比较的秩和检验,当n1>n2>10时采用u检验,这时检验是属于参数检验还是非参数检验?为什么?答:两组比较的秩和检验,当n很大时,可利用秩和T的分布随n增大渐进正态分布的性质,进行u检验,此时利用的并非原始数据,而是经秩变换后的数据,故仍属非参数检验。9.直线回归分析中应注意哪些问题?
答:做回归分析一定要有专业意义,不能将毫无联系的两个变量作直线回归分析;回归分析之前首先应绘制散点图,考查x与y之间有无直线趋势以及是否存在异常点;考虑是否满足建立线性回归模型的基本假定;直线回归方程的应用与图示一般以自变量x的取值范围为限;两变量的直线关系不一定是因果关系,也可能是伴随关系。
10.简述直线回归与直线相关的区别与联系。
答:区别:①资料要求不同:直线回归中因变量y是来自正态总体的随机变量,而r既可以是来自正态总体中的随机变量,也可以是严密控制、精确测量的变量;相关分析则要求x,y是来自双变量正态分布总体的随机变量,②分析目的不同:直线回归用于说明两变量间依存变化的数量关系;直线相关用于说明变量间的直线相关关系。联系:①方向一致:对一组数据计算,r与b,它们的正负号是一致的。②假设检验等价:对同一样本r和b的假设检验得到的t值相等。③用回归解释相关:由r2=SS回/SS总可知,若回归平方和越接近总平方和,则r越接近于1。
11.简述直线相关、秩相关的区别与联系。
答:区别:①资料要求不同:直线相关要求x、y是来自双变量正态总体的随机变量;秩相关适用于不服从双变量正态分布或总体分布类型未知以及用等级表示的原始数据。②相关意义不同:直线相关表示两变量的直线相关关系存在,秩相关表示两变量的相关关系。联系:相关系数的取值范围相同;秩相关是将原始数据进行秩变换,以秩次计算直线相关系数。
12.均数的可信区间和参考值范围有何不同?
222
22答:均数的可信区间:按一定的概率100(1-α)%(即可信度)估计总体均数所在的范围,得到的范围亦称可信区间。参考值范围:医学参考值范围指包括绝大多数正常人的人体形态、功能和代谢产物等各种生理及生化指标常数,也称正常值。由于存在着个体差异,生物医学数据并非常数,而是一定范围内波动,故采用医学参考值范围作为判定正常和异常的参考标准。
13秩和检验的优缺点是什么? 答:①不受总体分布限制,适用面广②适用于等级资料及两端无确定值的资料③易于理解,易于计算。缺点:是对分布类型的广泛适应性,使其很难充分利用资料提供的信息,有时会导致检验效能降低。14在t检验和u检验时,何种情况下采用单侧检验?
答:单侧检验的备择假设带有方向性,如:m>m0,实际中只可能出现一种情况。双侧检验的备择假设中包含不等号(如:m≠m0),实际上包括两种情况:m>m0或m<m0,无方向性。15.均数、几何均数和中位数的适用范围是什么?
答:均数适用于描述单峰对称分布,特别是正态分布或近似正态分布资料的集中趋势。(由于均数易受到极端值的影响,故不适用于描述偏态分布资料的集中趋势,只是需采用几何均数或中位数。)几何均数对于原始观察值呈偏态分布,但经过对数变换后呈正态分布或近似正态分布的资料,易用几何均数描述其集中趋势。常用于等比级资料或对数正态分布资料。中位数可用于各种分布的资料。对于正态分布资料,中位数等于均数;对于对数正态分布资料,中位数等于几何均数。由于中位数不受极端值的影响,主要用于偏态分布资料,两端无确切值或分布不明确的资料。16.标准差和标准误有何区别与联系,他们的用途是什么?
答:标准差:是描述对称分布,特别是正态分布或近似正态分布资料离散趋势(变异程度)的常用指标。总体标准差用δ表示,样本标准差用s表示。标准误:样本均数的标准差称为标准误。样本均数⊙的总体均数为H,各⊙围绕H的离散程度,可以用样本均数的标准差来描述。用途:标准差用途:①表示变量分布的离散程度②结合均数计算变异系数③结合样本含量计算标准误④结合均数描述分布特征。标准误用途:表示每个样本均数间的变异程度,描述样本均数的抽样误差,即样本均数与总体均数的接近程度,也可称为样本均数的标准差。17.统计图制作的一般原则?
答:首先,根据资料性质和分析目的正确选用适当的统计图。其次,除圆图外,一般用直角坐标系的第一象限的位置表示。最后,绘制图形应注意准确、美观,给人以清晰的印象。18.各种统计图适合于何种资料? 答:描述某连续变量的频数分布宜选用直方图;分析、比较独立的或不连续的多个组或多个类别的统计量宜选用条图,分析某指标随时间或其它连续变量变化而变化的趋势宜选用线图,描述或比较不同事物内部构成时用圆图或百分比条图等。
19.为什么要做r和b的假设检验?
答:b:即使从总体回归系数β等于零的总体中作随机抽样,由于抽样误差的存在,其样本回归系数b也不一定全为零。因此,求得一个样本回归系数时,首先,需考虑线性方程是否成立?并进行回归系数β是否为零的检验。以推断自变量x与应变量y见是否有直线关系存在。
r:假定从总体相关系数þ=0的总体中随机抽样,由于存在抽样误差,所得样本相关系数r不一定全为零。故此,求得一个样本相关系数r值后,仍需进行总体相关系数þ是否为零的假设检验。
20.服从二项分布的条件是什么?
答:凡具有贝努力试验序列3个特点的变量,一般可认为服从二项分布①每次试验的结果只能是两种互斥的结果中的一种(A或者非A)②各次试验的结果互不影响,即各次试验独立③在相同试验条件下,各次试验中出现某一结果A具有相同的概率∏(非A的概率1-∏)。
21.相关系数和回归系数有什么区别和联系?
答:直线的斜率称为回归系数,直线相关系数也称积距相关系数,说明具有直线关系的两变量间的相关方向与密切程度。它们的联系——方向一致即r与b正负一致,假设检验等价。区别:资料要求不同,回归系数方程要求服从正态分布,x精确测量严格控制Ⅰ型回归,相关方程要求x,y双重复正态Ⅱ型回归。22多个样本均数间的比较为什么不能用t检验?
答:多个样本均数的两两比较又称多重比较,其目的是推断究竟哪些总体均数之间存在差别,由于涉及的对比组数大于2,若仍用前述的t检验对两个对比组做比较,会使犯第Ⅰ类错误的概率增大,即可能吧本来无差别的两个总体均数判为有差别,因此,多重比较不宜用t检验分别作两两比较。
23对同一资料,有出自同一研究目的,用参数检验和非参数检验所得结果不一致时,宜以何者为准?答:参数检验要求其总体分布为正态分布,总体方差齐性,非参数检验常用解决那些总体分布未知的统计问题,对于同一资料,又出自同一研究目的,采用参数研究还是非参数检验取决于资料的类型。24.为什么要进行抽样研究?抽样时为什么会产生抽样误差?
答:计量资料的总体中所含的样本数量巨大,要获取资料的总体均数、标准差等数据十分困难,因此医学科学研究中通常采用的抽样研究方法,是指从总体中随机抽取一个样本,用样本信息推断总体特征,这种分析方法称为统计推断。但通常情况下,样本均数(x拔)不可能与总体均数μ正好相等,这种由个体变异产生的,随机抽样引起的样本统计量与总体参数间的差异称为抽样误差。25.相关系数的意义?
答:相关系数r没有单位,取值范围为-1≤r≤1。两变量相关的方向用r的正负号表示,即r>0表示正相关;r<0表示负相关。相关系数r的大小表示密切程度,r绝对值越接近1,表示两变量间相关关系密切程度越高。∣r∣=1表示完全相关,∣r∣=0表示无直线相关。26.方差分析的应用条件?
答:①各样本是相互独立的随机样本②各样本来自正态分布③各样本方差相等,即方差齐。
27.χ2检验要注意的问题(注意事项)?
答:① 计算χ2 值时必须用绝对数。而不能用相对数,因为χ2 值的大小与频数大小有关。②χ2 检验要求理论频数不宜太小,一般认为不宜有1/5以上格子理论频数小于5,或一个格子的理论频数小于1。对理论频数太小有三种处理方法:A 增大样本例数 B 删除理论数太小的行或列 C 合并③当多个样本率(或构成比)比较的χ2 检验结论为拒绝检验假设,只能认为各总体率(或总体构成比)之间总的说来有差别,但不能说它们彼此间都有差别。或某两者间有差别。
28.非参数检验适用哪些情况?
答:①等级顺序资料。②偏态资料。当观察资料成偏态或极度偏态分布而又未经变量变换未达到正态或近似正态分布时,宜用非参数检验。③未知分布类型资料④要比较的各组资料变异度相差较大,方差不齐,且不能变换达到齐性。⑤初步分析。有些医学资料由于统计工作量过大,可采用非参数统计方法进行初步分析,挑选其中有意义者再进一步分析⑥对于一些特殊情况,如从几个总体所获得的数据,往往难以对其原有总体分布作出估计,在这种情况下可用非参数统计方法。
29.为什么秩和检验的编秩在不同对比组间出现相同数据要给予“平均秩次”,而同一组的相同数据不必计算“平均秩次”?
答:因为在不同对比组,不取平均秩次会加大或减小某一组的秩和;而在同一组内,出现相同数据不编平均秩次,该组秩和不受影响。
30.怎样正确使用单侧检验和双侧检验?
答:根据专业知识推断两个总体是否有差别时,是甲高于乙,还是以高于甲,当两种可能都存在时,一般选双侧;若根据专业知识,如果甲不会低于乙,或研究者仅关心其中一种可能时,可选用单侧。一般来讲,双侧检验较稳妥故较多用,在预实验有探索性质时,对结果的考虑以思路较宽为好,也用双侧检验。单侧检验,应以专业知识为依据,他充分利用了另一侧的不可能性,故检出效率高,但应慎用。
31.回归系数:直线的斜率b,也称回归系数。统计学意义是自变量x改变一个单位时,应变量y平均变化b个单位。32.相关系数:也称pearson积距相关系数,说明具有直线相关的两变量间相关方向与密切程度。33.直线回归分析中应注意的问题?
答:①做直线回归一定要有实际意义②回归分析之前首先应绘制散点图。③考虑建立线性模型的基本假定④取值范围,避免外延。⑤两变量间有直线关系不一定是因果关系。34.相关分析应用中应注意的问题?
答:①资料要求x、y都应来自双变量正态总体的随机变量。②进行相关分析前,应先绘制散点图,有线性趋势时,才可进行相关分析。③满足应用条件的同一份双变量资料,回归系数b与相关系数r的正负号一致,假设检验等价。④相关分析时,小样本资料经t检验只能推断两变量间有无直线关系,而不能推断其相关的密切程度。要推断两样本间相关的程度,样本含量必须足够大,当r有统计学意义时,但r2较小时,下结论要慎重。35.方差分析的应用条件? 答:①各样本是相互独立的随机样本②各样本来自正态分布③各样本方差相等,即方差齐。
36.二项分布:贝努力试验序列中结果A出现次数的概率分布就是~。
37.率的标准化法:为解决因内部构成不同而导致分组率比较的结果与和纪律比较结果的矛盾,选定一个共同的标准人口或标准人口构成,分别计算两组的标准化率,这种方法称~。
38.抽样误差:由个体变异产生的,随机抽样引起的样本统计量与总体参考数间的差异称~
第三篇:医学统计学总结
医学统计学总结
一、两组或多组计量资料的比较1.两组资料: 1)大样本资料或服从正态分布的小样本资料(1)若方差齐性,则作成组t检验(2)若方差不齐,则作t’检验或用成组的Wilcoxon秩和检验 2)小样本偏态分布资料,则用成组的Wilcoxon秩和检验 2.多组资料: 1)若大样本资料或服从正态分布,并且方差齐性,则作完全随机的方差分析。如果方差分析的统计检验为有统计学意义,则进一步作统计分析:选择合适的方法(如:LSD检验,Bonferroni检验等)进行两两比较。2)如果小样本的偏态分布资料或方差不齐,则作Kruskal Wallis的统计检验。如果Kruskal Wallis的统计检验为有统计学意义,则进一步作统计分析:选择合适的方法(如:用成组的Wilcoxon秩和检验,但用Bonferroni方法校正P值等)进行两两比较。
二、分类资料的统计分析1.单样本资料与总体比较 1)二分类资料:(1)小样本时:用二项分布进行确切概率法检验;(2)大样本时:用U检验。2)多分类资料:用Pearson c2检验(又称拟合优度检验)。2.四格表资料 1)n>40并且所以理论数大于5,则用Pearson c2 2)n>40并且所以理论数大于1并且至少存在一个理论数<5,则用校正c2或用Fisher’s 确切概率法检验 3)n£40或存在理论数<1,则用Fisher’s 检验 3.2×C表资料的统计分析 1)列变量为效应指标,并且为有序多分类变量,行变量为分组变量,则行评分的CMH c2或成组的Wilcoxon秩和检验 2)列变量为效应指标并且为二分类,列变量为有序多分类变量,则用趋势c2检验 3)行变量和列变量均为无序分类变量(1)n>40并且理论数小于5的格子数<行列表中格子总数的25%,则用Pearson c2(2)n£40或理论数小于5的格子数>行列表中格子总数的25%,则用Fisher’s 确切概率法检验 4.R×C表资料的统计分析 1)列变量为效应指标,并且为有序多分类变量,行变量为分组变量,则CMH c2或Kruskal Wallis的秩和检验 2)列变量为效应指标,并且为无序多分类变量,行变
量为有序多分类变量,作none zero correlation analysis的CMH c
23)列变量和行变量均为有序多分类变量,可以作Spearman相关分析 4)列变量和行变量均为无序多分类变量,(1)n>40并且理论数小于5的格子数<行列表中格子总数的25%,则用Pearson c2(2)n£40或理论数小于5的格子数>行列表中格子总数的25%,则用Fisher’s 确切概率法检验
三、Poisson分布资料1.单样本资料与总体比较: 1)观察值较小时:用确切概率法进行检验。2)观察值较大时:用正态近似的U检验。2.两个样本比较:用正态近似的U检验。配对设计或随机区组设计
四、两组或多组计量资料的比较 1.两组资料: 1)大样本资料或配对差值服从正态分布的小样本资料,作配对t检验 2)小样本并且差值呈偏态分布资料,则用Wilcoxon的符号配对秩检验 2.多组资料: 1)若大样本资料或残差服从正态分布,并且方差齐性,则作随机区组的方差分析。如果方差分析的统计检验为有统计学意义,则进一步作统计分析:选择合适的方法(如:LSD检验,Bonferroni检验等)进行两两比较。2)如果小样本时,差值呈偏态分布资料或方差不齐,则作Fredman的统计检验。如果Fredman的统计检验为有统计学意义,则进一步作统计分析:选择合适的方法(如:用Wilcoxon的符号配对秩检验,但用Bonferroni方法校正P值等)进行两两比较。
五、分类资料的统计分析1.四格表资料 1)b+c>40,则用McNemar配对c2检验或配对边际c2检验 2)b+c<40,则用二项分布确切概率法检验 2.C×C表资料: 1)配对比较:用McNemar配对c2检验或配对边际c2检验 2)一致性问题(Agreement):用Kap检验 变量之间的关联性分析
六、两个变量之间的关联性分析 1.两个变量均为连续型变量 1)小样本并且两个变量服从双正态分布,则用Pearson相关系数做统计分析 2)大样本或两个变量不服
第四篇:常用医学统计学方法的选择
常用医学统计学方法的选择
1.多组率的比较用卡方检验(χ2检验,chi-square test)直接用几个率的数值比较,与直接用原始数据录入比较,结果会有什么不同?卡方值会受样本量的影响,样本越多,卡方值越大。
2.多组计量资料比较采用方差分析(F检验),不能用t检验。当方差分析结果为P<0.05时,只能说明k组总体均数之间不完全相同。若想进一步了解哪两组的差别有统计学意义,需进行多个均数间的多重比较,即SNK-q检验(多个均数两两之间的全面比较)、LSD-t检验(适用于一对或几对在专业上有特殊意义的均数间差别的比较)和Dunnett检验(适用于k-1个实验组与一个对比组均数差别的多重比较)。
3.非正态分布多组数据之间比较选用非参数检验、单样本中位数检验(符号检验和 Wilcoxon 检验)、双样本中位数检验(Mann-Whitney 检验)、方差分析(Kruskal-Wallis、Mood 中位数和 Friedman 检验)
4.按血糖水平从低到高分成多组,进行多组之间死亡率的比较,由于死亡率同样受年龄、性别、病史、您身边的论文好秘书:您的原始资料与构思,我按您的意思整理成优秀论文论著,并安排出版发表,扣1550116010、766085044自信我会是您人生路上不可或缺的论文好秘书血脂等因素的影响,所以需选取合适统计方法实现“调整年龄、性别等危险因素后,按血糖分组进行死亡率的比较(由血糖从低到高分成的4组)”。①年龄是定量变量(是数值),调整年龄的方法可在Logistic回归中运用,连续性变量年龄加入covariate中,当成协变量,就可以调整年龄,age-adjusted odds ratio就能得到了。②性别性别是二分类变量,不是定量变量,不可在LOGISTIC回归里比较。调整性别可在卡方检验中采取分层的方法比较。
如果为多分类LOGISTIC回归,在选择用multinomianl LOGISTIC回归中,可选入年龄等进入covariate,观察年龄的配比情况。可把性别选入factors(自变量)。这样可以实现调整年龄、性别等危险因素。
5.回顾性研究(1)临床妊娠率和女性年龄的关系+(2)男性影响临床妊娠的精子参数比较: 数据类型及变量的说明:y:计量 拟采用的分析方法:卡方检验 拟采用的分析软件:spss 原始数据附件及格式:word表
能否用其他方法统计分析:可用卡方分割,调整检验水准(根据比较的次数N,校正后的检验水准为0.05/N)。
6.重复t检验:多个样本均数间的两两比较(又称多重比较)不宜用t检验,因为重复数次,t检验将增加第一类错误的概率,使检验效率降低。此时宜用方差分析,并在此基础上用两两比较方法(如.SNK、LSD、Duncan法等)。
对于同一对均数间的差异,用t检验无显著性,而两两比较可能有显著性,可见错误选用统计方法将推出错误结论。
统计方法的选择: 分计量、计数、等级资料三
第五篇:医学统计学 常用方法小结
一、两组或多组计量资料的比较 1.两组资料:
1)大样本资料或服从正态分布的小样本资料(1)若方差齐性,则作成组t检验
(2)若方差不齐,则作t’检验或用成组的Wilcoxon秩和检验 2)小样本偏态分布资料,则用成组的Wilcoxon秩和检验 2.多组资料:
1)若大样本资料或服从正态分布,并且方差齐性,则作完全随机的方差分析。如果方差分析的统计检验为有统计学意义,则进一步作统计分析:选择合适的方法(如:LSD检验,Bonferroni检验等)进行两两比较。
2)如果小样本的偏态分布资料或方差不齐,则作Kruskal Wallis的统计检验。如果Kruskal Wallis的统计检验为有统计学意义,则进一步作统计分析:选择合适的方法(如:用成组的Wilcoxon秩和检验,但用Bonferroni方法校正P值等)进行两两比较。
二、分类资料的统计分析 1.单样本资料与总体比较 1)二分类资料:
(1)小样本时:用二项分布进行确切概率法检验;(2)大样本时:用U检验。
2)多分类资料:用Pearson c2检验(又称拟合优度检验)。2.四格表资料
1)n>40并且所以理论数大于5,则用Pearson c2 2)n>40并且所以理论数大于1并且至少存在一个理论数<5,则用校正c2或用Fisher’s 确切概率法检验
3)n£40或存在理论数<1,则用Fisher’s 检验 3.2×C表资料的统计分析
1)列变量为效应指标,并且为有序多分类变量,行变量为分组变量,则行评分的CMH c2或成组的Wilcoxon秩和检验
2)列变量为效应指标并且为二分类,列变量为有序多分类变量,则用趋势c2检验 3)行变量和列变量均为无序分类变量
(1)n>40并且理论数小于5的格子数<行列表中格子总数的25%,则用Pearson c2(2)n£40或理论数小于5的格子数>行列表中格子总数的25%,则用Fisher’s 确切概率法检验
4.R×C表资料的统计分析
1)列变量为效应指标,并且为有序多分类变量,行变量为分组变量,则CMH c2或Kruskal Wallis的秩和检验
2)列变量为效应指标,并且为无序多分类变量,行变量为有序多分类变量,作none zero correlation analysis的CMH c2 3)列变量和行变量均为有序多分类变量,可以作Spearman相关分析 4)列变量和行变量均为无序多分类变量,(1)n>40并且理论数小于5的格子数<行列表中格子总数的25%,则用Pearson c2(2)n£40或理论数小于5的格子数>行列表中格子总数的25%,则用Fisher’s 确切概率法检验
三、Poisson分布资料 1.单样本资料与总体比较: 1)观察值较小时:用确切概率法进行检验。2)观察值较大时:用正态近似的U检验。2.两个样本比较:用正态近似的U检验。
配对设计或随机区组设计
四、两组或多组计量资料的比较 1.两组资料:
1)大样本资料或配对差值服从正态分布的小样本资料,作配对t检验 2)小样本并且差值呈偏态分布资料,则用Wilcoxon的符号配对秩检验 2.多组资料:
1)若大样本资料或残差服从正态分布,并且方差齐性,则作随机区组的方差分析。如果方差分析的统计检验为有统计学意义,则进一步作统计分析:选择合适的方法(如:LSD检验,Bonferroni检验等)进行两两比较。
2)如果小样本时,差值呈偏态分布资料或方差不齐,则作Fredman的统计检验。如果Fredman的统计检验为有统计学意义,则进一步作统计分析:选择合适的方法(如:用Wilcoxon的符号配对秩检验,但用Bonferroni方法校正P值等)进行两两比较。
五、分类资料的统计分析 1.四格表资料
1)b+c>40,则用McNemar配对c2检验或配对边际c2检验 2)b+c£40,则用二项分布确切概率法检验 2.C×C表资料:
1)配对比较:用McNemar配对c2检验或配对边际c2检验 2)一致性问题(Agreement):用Kap检验
变量之间的关联性分析
六、两个变量之间的关联性分析 1.两个变量均为连续型变量
1)小样本并且两个变量服从双正态分布,则用Pearson相关系数做统计分析 2)大样本或两个变量不服