第一篇:医学统计学
单词:
Actual frequency 实际频数
Alternative hypothesis 备择假设
Average平均数
Bar chart 直条图
Cause fatality 病死率
Coefficient of correlation 相关系数
Confidence interval 可信区间(置信区间)
Constituent ratio 构成比
Cure rate 治愈率
Death rate 死亡率
Incidence rate 发病率
Interval estimation 区间估计
Line chart 线图
Mean 均数(算术均数)
Nonparametric test 非参数检验
Normal range 正常值范围
Null hypothesis 无效假设
Parameter estimation 参数估计
Parametric test 参数检验方法
Percentage chart 百分条图
Probability 概率
Reference value range 医学参考值范围
Regression coefficient 回归系数
Relative number 相对数
Relative ratio 相对比
Sample 样本
Sampling error 抽样误差
Type Ⅰ error Ⅰ型错误
Type Ⅱ error Ⅱ型错误
参数S标准差Reference value range医学参考值范围Ratio比r
2统计量CV变异系数X值X均数rate率
名词:
1样本:从总体中随机抽取部分的观察单位构成的集合。
2总体:根据研究目的确定的同质的个体所构成的全体。
3抽样误差:由抽样造成的样本均数与总体均数的差异。
4标准误:样本均数的标准差。
5相对数:原始的两个资料(绝对数)之比所得指标的统称。
6率:表示某种现象发生的频率和强度。
7构成比:表示事物内部各个组成部分所占整体的比重。
8相对比:两个有关联指标之比,用以描述两者对比水平.9概率:描写某一事件发生的可能性大小的一个量度。
10变异系数:相对于均数而言标准差的大小。
11中位数:将一组观察值从小到大按顺序排列,居中心位置的数值。
12四分位数间距:把所有的观察值排序后,分成四个数目相等的段落,每个段落的观察值数目各占总例数的25%,去掉两端的25%,取中间50%观察值的数据范围。
13百分位数:在一组数据中找到这样一个值,全部观察值的x%小于Px,而其余(100-x)%大于Px。
14参数:描述总体的统计指标。
15统计量:描述样本的统计指标。
16相关系数:说明具有直线关系的两个量间相关密切程度和相关方向的统计量。
17回归系数:线性回归方程ý=a+bx 中的b叫做回归系数,它表明x每变化1单位ý变化b单位。
18医学参考值范围:传统称正常值范围,指正常人的解剖、生理、生化、免疫及组织代谢产物的含量等各种数据的波动范围。
填空或选择:
1配对设计的原则:对子之间差异大、对子内个体之间差异小,其优点为:减少实验的误差和个体差异,提高统计处理的效率。
2描述正态分布集中趋势的是均数,离散趋势的是标准差。
3描述偏态分布集中趋势的是中位数,离散趋势的是四分位数间距。
4统计分析包括统计描述、统计推断(参数估计、假设检验)。
5要比较甲乙两地某病发(患)病率时注意标准化(对年龄、性别构成等进行标准化)。6估计医学参考值范围常用正态分布、百分位数法。
27四格表x检验校正的条件: N≥40,且1≤T<5。
28四格表x检验不校正的条件: N≥40,且T≥5。
9统计表编制的主要原则:重点突出,简单明了、主谓分明,层次清楚。
10标准误反映了样本均数间的离散程度,也反映了样本均数与总体均数的差异,它衡量了抽样误差的大小。
问答题:
1医学统计学工作的基本步骤(简述医学统计学工作的主要内容):实验设计、收集资料、整理资料、分析资料。
2简述描述定量资料(数值)集中趋势的统计指标及其适用条件。⑴平均数:包括①算术均数:主要适用于对称分布或偏斜度不大的资料②几何均数:多用于血清学和微生物学中⑵中位数和百分位数:①中位数:适用于所有计数资料,尤其是用于偏态分布资料②百分位数可用于任何频数分布的资料。
3简述描述定量资料(数值)离散趋势的统计指标及其适用条件。⑴极差和四分位数间距:①极差:仅用于粗略地说明变量的变动范围②四分位数间距(所有分布类型资料)⑵离均差平方和、方差(正态或接近正态分布的资料)、标准差(正态分布资料)和变异系数
4标准差和标准误区别和联系:联系:都是反映变异的统计指标,标准误是由标准差推导而来的.区别:1定义不同.2计算公式不同.3应用不同.标准差s的应用:1描述个体观察值变异.2S结合均数X计算变异系数CV=S/X.3S结合X计算医学参考值范围.4S结合n计算标准误Sx=S/√n.标准误应用:1度量抽样误差.2参数估计.3假设检验
5简述统计表的主要结构:标题、标目、线条、数字、文字。
6编制统计表的基本原则:①重点突出,简单明了②主谓分明,层次清楚③数据准确、可靠。7常用的统计图有哪些,它们分别适用于哪些情况?①直条图:主要适用于分类变量、计数资料或计量资料的非连续资料②构成图:常用于描述构成比的资料③趋势图:适用于分组标志为连续性变量的资料④直方图:适用于表示连续变量频数分布情况⑤箱图:用于比较两组或多组资料的平均指标和变异指标⑥散点图:适用于连续性定量资料
8什么是抽样误差?如何度量抽样误差?
由抽样造成的样本均数与总体均数的差异称为抽样误差。标准误可以衡量抽样误差的大小。9什么叫相对数?常用的相对数有哪些?
为了使计数资料具有可比性取原始的两个资料(绝对数)之比所得指标统称为相对数,常用的种类有率、构成比与相对比。
10相对数应用时注意事项:①不要把构成比与率相混淆②使用相对数时,分母不宜过小③要注意资料的可比性④要注意使用率的标准化⑤要考虑存在抽样误差。
11应用直线回归分析时的注意事项:①只有将两个内在有联系的变量放在一起进行回归分析才有意义②在回归分析中,因变量是随机变量,自变量既可以是随机变量,也可以是给定的量③回归方程建立后必须做假设检验,只有经假设检验拒绝了无效假设,回归方程才有意义④使用回归方程计算估计值时,不可把估计的范围扩大到建立方程时的自变量的取值范围之外。
12实验设计的三要素:受试对象、处理因素和实验效应;必须遵循的基本统计原则:对照原则、随机原则、重复原则和均衡原则。
13什么叫非参数检验,优缺点有哪些?
非参数检验是指不考虑总体的参数和总体的分布类型,而对总体的分布或分布位置进行检验。优点:适应性强,应用范围较广。缺点:若符合参数检验方法而用非参数检验,会损失信息,增加Ⅱ型错误。
分析题
1构成比只能说明某事物内部各组成部分的比重和分布,不能说明该事物某一部分发生的强度和频率,只有率才能描述某事物某部分发生的强度与频率,根据提供的信息只能计算构成比,把率和构成比混淆了.2统计表的缺点:①标题不够明确,而且未注明时间地点②发病季节、年龄、职业三项指标机械地放在一起,内容繁杂,不简明突出③标目设计不合理“人数”、“%”多次重复,不便比较分析④表内文字和线条过多.计算题
1配对t检验;(同一受试对象分别接受两种不同处理, 同一受试对象接受某种处理的前后;配对的两个个体分别接受两种不同处理).1建立假设检验,确立检验水准.H0: μd=0
H1: μd≠0
α=0.05
2计算检验统计量.分别计算配对样本的差值d,然后求出均数d,标准差Sdd
代入公式t=自由度ν=n-1
Sd/√n
3确定P值得出推断结论.t>t0.05(ν)或t>t0.01(ν)
P<0.05或P<0.01差别有统计学意义,拒绝H0,接受H1,可以认为两种方法反应结果有统计学意义.2独立样本t检验: 1建立假设检验,确立检验水准.H0:μ1=μ2
H1:μ1≠μ2
α=0.05
2计算检验统计量.分别计算n1、x1、s1、n2、x2、s2
(n1-1)s12+(n2-1)s22x1-x2
代入公式sc2=t=ν=n1+n2-2 2n1+n2-2√sc(1/n1+1/n2)
3确定P值得出推断结论
t>t0.05(ν)或t>t0.01(ν).P<0.05或P<0.01差别有统计学意义,拒绝H0,接受H1,可以认为两种方法反应结果有统计学意义.3四格表X2检验:首先通过两率或相对比编制规范四格表
1建立假设检验,确立检验水准.H0:π1=π2aba+bH1: π1≠π2cdc+dα=0.05a+cb+dn=a+b+c+d2计算检验统计量.通过标准判断是否需要校正即计算Ta=(a+b)(a+c)/n,n≥40,T≥5,应用公式 22X=(ad-bc)n/(a+c)(b+d)(a+b)(c+d)n≥40,1≤T<5,应用公式
22X=(︴ad-bc︴-n/2)n/(a+c)(b+d)(a+b)(c+d)
3确定P值得出推断结论.2222X>X0.05(1)或X>X0.01(1)
P<0.05或P<0.01在α=0.05或α=0.01的检验水准下,拒绝H0, ,可以认为两种方法反应有差别,差别具有统计学意义。
第二篇:医学统计学
A.总体中任意的一部分B.总体中的典型部分
C.总体中有意义的一部分
1、measurement date2、coefficient of variation(变异系数)
3、sampling error(抽样误差)
4、linear correlation coefficient(直线相关系数)
5、population(总体)
D.总体中有价值的一部分E.总体中有代表性的一部分
5、以下检验方法属非参数法的是。
A.T检验B.t检验C.u 检验D.F检验E.以上都是
6、样本含量的确定下面哪种说法合理。
A.样本越大越好B.样本越小越好C.保证一定检验效能条件下尽量增大样本含量D.保证一定检验效能条件下尽量减少样本含量E.越易于组织实施的样本含量越好
7、对计数资料进行统计描述的主要指标是。
A.平均数B.相对数C.标准差D.变异系数E.中位数
1、用样本推论总体,具有代表性的样本指的是
A.总体中最容易获得的部分个体B.在总体中随意抽取任意个体 C.挑选总体中的有代表性的部分个体D.用配对方法抽取的部分个体 E.依照随机原则抽取总体中的有代表性部分个体
2、计量资料,计数资料和等级分组资料的关系是。A.计量资料兼有计数资料和等级分组资料的一些性质B.计数资料兼有计量资料和等级分组资料的一些性质
8、由两样本均数的差别推断两总体均数的差别,得到此差别具有统计意义的结论是指
A.两样本均数差别有显著性B.两总体均数差别有显著性
C.两样本均数和两总体均数的差别都有显著性
D.其中一个样本均数和它的总体均数差别有显著性
9、说明某现象发生强度的指标为。A.构成比B.相对比C.定基比D.环比E.率
10、配对设计的秩和检验中,其H0假设为。A.差值的总体均数为0B.差值的总体中位数为0C.μd≠0D.Md≠0
C.等级分组资料兼有计量资料和计数资料的一些性质 D.计数资料有计量资料的一些性质E.等级分组资料又称半计数资料
3、总体率95%可信区间的意义是。
A.95%的正常值在此范围B.95%的样本率在此范围
C.95%的总体率在此范围D.总体率在此范围内的可能性为95%E.样本率在此范围内的可能性为95%
4、为了由样本推断总体,样本应该是。
命题组组长签字:第页(本试卷共4页)
E.μ1≠μ211、单因素方差分析中,不正确的计算公式是。A.SS组内=SS总-SS组间B.v总=v组间-v组内C.MS组间=SS组间/v组间D.MS组内=SS组内/v组内E.F=MS组内/MS组间
12、方差分析中,组内变异反映的是。A.测量误差B.个体差异
C.随机误差,包括个体差异及测量误差D.抽样误差E.系统误差
13、对统计图中的的坐标有如下规定。
A.所有统计图的纵坐标都必须从零点开始B.所有统计图坐标中都不能有折断线
C.条图、线图、直方图的纵坐标必须从零开始D.线图、直方图的纵坐标必须从零开始E.条图、直方图的纵坐标必须从零开始
14、制统计图时要求。
A.标题应说明图的主要内容,一般在图的上方B.纵横两轴应有标目,一般不注单位C.纵轴尺度必须从零开始
D.直条图和线图,其长宽比例一般取5:7E.以上都不对
15、下列关于医学参考值范围描述中,不正确的是
A.排除了有关疾病等因素对所研究指标有影响的正常人的解剖、生理、生化 等数据的波动范围
B.没有任何疾病的人的解剖、生理、生化等数据的波动范围C.习惯确定只包含95%或99%的人的界值来源:D.根据专业知识确定取单侧界限或双侧界限E.资料为正态分布时,可用正态近似法计算
16、各观察值均加(或减)同一数后A.均数改变,标准差不变B.均数不变,标准差改变
C.两者均不变D.两者均改变
E.根据实际资料而定
17、统计工作的步骤为
A.统计研究调查、搜集资料、整理资料、分析资料B.统计资料收集、整理资料、统计描述、统计推断C.统计研究设计、搜集资料、整理资料、分析资料D.统计研究调查、统计描述、统计推断、统计图表E.统计研究设计、统计描述、统计推断、统计图表
18、两个样本率判别的假设检验,其目的是。A.推断两个样本率有无差别B.推断两个总体率有无差别
C.推断两个样本率和两个总体率有无差别
D.推断两个样本率和两个总体率的差别有无统计意义E.推断两个总体分布是否相同
19、假设检验过程中,下列哪一项不可以由研究者事先设定。A.所比较的总体参数B.单侧或双侧检验C.检验水准D.P值E.以上都不对 20、统计资料的类型包括。
A.频数分布资料和等级分类资料B.多项分类资料和二项分类资料C.正态分布资料和频数分布资料
D.数值变量资料和等级资料E.数值变量资料和分类变量资料
21、有关离散度指标意义中,描述不正确的是。A.数值越大,说明个体差异越大B.数值越大,说明观察值的变异度越大C.数值越小,说明平均数的代表性越好D.数值越小,说明平均数的代表性越差E.应与平均数结合起来进行分析
22、秩和检验和t检验相比,其优点是。
A.计算简便,不受分布限制B.公式更为合理C.检验效能高D.抽样误差小E.第二类错误概率小
23、总体标准差描述的是。
A.所有个体值对总体均数的离散程度B.某样本均数对总体均数的离散程度C.所有样本均数对总体均数的离散程度D.某些样本均数对总体均数的离散程度
E.所有某个含量相同的样本均数对总体均数的离散程度
24、比较身高和体重两组数据变异度大小宜采用。A.变异系数B.方差
C.极差D.标准差E.四分位数间距
25、当样本例数相同时,两组计量资料的成组t检验与配对t检验相比,一般情况下为
A.成组t检验效率高一些B.配对t检验效率高一些C.两者效率相等
D.大样本时两者效率一致E.与两组样本均数的大小有关
26、样本的两变量(X,Y)的相关系数r=0时,说明。(B)A.两变量不存在任何关系
B.两变量间不存在直线关系,但不排除存在某种曲线关系
C.两变量间存在相互关系的可能性很小D.两变量必然存在某种曲线关系E.两变量间的关系不能确定
27、在标准差与标准误的关系中。A.二者均反映抽样误差大小
B.总体标准差增大时,总体标准误也增大
C.样本例数增大时,样本标准差和标准误都减小
D.可信区间大小与标准差有关,而参考值范围与标准误有关E.总体标准差一定时,增大样本例数会减小标准误
28、说明两个有关联的同类指标之比为。
A.率B.构成比C.频率D.相对比E.频数
29、下列观测结果属于等级资料的是(D)
A.收缩压测量值B.脉搏数 C.住院天数D.病情程度 E.四种血型
30、收集资料不可避免的误差是
A.随机误差B.系统误差 C.过失误差D.记录误差 E.仪器故障误差
31、算术均数与中位数相比,其特点是
A.不易受极端值的影响B.能充分利用数据的信息C.抽样误差较大D.更适用于偏态分布资料E.更适用于分布不明确资料
32、描述一组对称(或正态)分布资料的变异程度,用(A)较好
A标准差B 方差C 离均差平方和D 变异系数E以上都可以
33、变异系数主要用于
A.比较不同计量指标的变异程度B.衡量正态分布的变异程度
C.衡量测量的准确度D.衡量偏态分布的变异程度
E.衡量样本抽样误差的大小
34、正态曲线下,从均数μ到μ+1.0σ的面积
A、45%B、90%C、95.00%D、47.5%E、34.14%
35、方差分析的基本思想和要点是
A.组间均方大于组内均方B.组内均方大于组间均方 C.不同来源的方差必须相等D.两方差之比服从F分布 E.总变异及其自由度可按不同来源分解
36、多组均数比较的方差分析,如果P0.05,则应该进一步做的是 A.两均数的t检验B.区组方差分析C.方差齐性检验D.q检验 E.确定单独效应
37、两样本均数比较,检验结果P>0.05说明(D)
A.两总体均数的差别较小B.两总体均数的差别较大C.支持两总体无差别的结论D.不支持两总体有差别的结论E.可以确认两总体无差别
38、计算标准化死亡率的目的是(D)
A.减少死亡率估计的偏倚B.减少死亡率估计的抽样误差 C.便于进行不同地区死亡率的比较D.消除各地区内部构成不同的影响 E.便于进行不同时间死亡率的比较
39、标准化后的总死亡率:
A、仅仅作为比较的基础,它反映了一种相对水平B、它反映了实际水平
C、它不随标准的选择变化而变化 D、它反映了事物实际发生的强度 E、它反映了实际率的水平
240、利用检验公式不适合解决的实际问题是(C)
A.比较两种药物的有效率B.检验某种疾病与基因多态性的关系 C.两组有序试验结果的药物疗效D.药物三种不同剂量显效率有无差别 E.两组病情“轻、中、重”的构成比例
41、对医学计量资料成组比较, 相对参数检验来说,非参数秩和检验的优点是(A)A.适用范围广B.检验效能高 C.检验结果更准确D.充分利用资料信息 E.不易出现假阴性错误
42、对于计量资料的比较,在满足参数法条件下用非参方法分析,可能产生的结果是(B)
A.增加Ⅰ类错误B.增加Ⅱ类错误C.减少Ⅰ类错误D.减少Ⅱ类错误 E.两类错误都增加
43、对于两组资料的比较,方差分析与t检验的关系是(E)A.t检验结果更准确B.方差分析结果更准确 C.t检验对数据的要求更为严格D.近似等价 E.完全等价
44、四格表如有一个实际数为0(C)A、就不能作χ2检验
B、就必须用校正χ2检验
C、还不能决定是否可作χ2检验 D、肯定可作校正χ2检验 E、肯定不可作校正χ2检验
45、行×列表的χ2检验中,P<0.05说明(D)A、被比较的几个样本率之间的差异均有显著性 B、样本率间的差异没有显著性
C、任意两个率之间的差异均有显著性 D、至少某两个样本率间的差异有显著性 E、只有两个样本率间的差异有显著性
46、两数值变量相关关系越强,表示(B)
A.相关系数越大B.相关系数的绝对值越大 B.回归系数越大C.回归系数的绝对值越大 E.相关系数检验统计量的t值越大
47、t分布比标准正态分布(D)
A、中心位置左移,但分布曲线相同 B、中心位置右移,但分布曲线相同 C、中心位置不变,但分布曲线峰高
D、中心位置不变,但分布曲线峰低,两侧较伸展 E、中心位置右移,但分布曲线峰高
三、判断题(10分)
1、相关系数r=0.98,说明两变量密切正相关(对)
2、构成比资料可以选用圆图和条图(错)
3、标准差和标准误都是反映变异程度大小的指标(错)
4、多个样本均数的两两比较可以用成组的t检验(错)
5、正常值范围属于统计描述,可信区间的估计属于统计推断(对)
6、、数值变量资料的标准差一定比均数小(错)
7、等级资料比较宜用秩和检验。(对)
8、两变量的相关分析中,若散点图的散点完全在一条直线上,则r=1(错)
9、对统计图中的的坐标所有统计图的纵坐标都必须从零点开始(错)
10、非参数统计进行假设检验要求的条件是总体是正态分布(错)
四、简答题(25分)
1、医学参考值范围和可信区间的区别(5)
2、非参数检验的适用条件(5)
3、标准正态分布曲线下的面积规律(5)
4、标准差与标准误有何区别?(5分)
5、描述数值变量集中趋势的指标有哪些?适用条件分别是什么?(5分)
五、作图(10分)
某药治疗老年慢性气管炎的近期疗效结果如下:
1、单纯型共221例,其中按病情分为重、中、轻,分别观察了136例、54例、31例;疗效:治愈60人、显效98人、好转51人、无效12人,有效率94.6%。
2、喘息型共182例,其中按病情分为重、中、轻,分别观察了93例,56例、33例;疗效:治愈23人、显效83人、好转65人、无效11人,有效率94.0%。请根据题目要求做出合适的统计图。
第三篇:医学统计学考试
医学统计学是运用概率论和数理统计原理、方法结合医药卫生工作的实际情况,阐述医学科研设计的基本原理,研究医学资料(信息)的搜集、整理和分析的方法学总称,他是认识医学现象数量特征的重要工具。医学统计工作基本步骤包括4步:设计、搜集资料、整理和分析资料。这四个步骤是相互联系的,科学、周密、严谨的设计是搜集准确可靠资料的保证,准确、完整、及时地搜集资料、恰当地整理资料是统计分析的基础,在此基础上选择正确的方法分析资料才能得出科学的结论。下面就《血压管理对脑出血患者预后的影响》进行一下分析,表述下我自己通过学习医学统计学这门课程对医学统计学的理解和掌握。
设计:对医学研究来说,设计实际上是指制定周密的医学研究计划,通常包括调查设计和实验设计。
1、调查设计一般包括专业设计和统计设计。统计设计包括资料搜集、整理和分析资料的计划。搜集资料的计划在整个设计中占主要地位,一般包括:(1、明确调查目的和确定研究指标;(2、确定研究对象和观察单位;(3、选择调查方法;
(4、决定采取的调查方式;(5、设计调查项目和调查表;(6、样本含量估计。本文章实验的目的是研究探讨血压管理对脑出血预后的的影响。研究指标为两组患者入院时及入院1周、2周、3个月时神经功能缺损程度评分(ccss)及斯堪的那维亚卒中量表(sss)神经功能评分。研究对象为2011年1月--2012年12月收治的脑出血患者210例,男132例,女78例,年龄(60.3±4.2)岁,所有患者诊断均符合全国脑血管病会议制定的卒中诊断标准。并经CT、MRI明确诊断,入院
时平均出血量(14.78±4.78),排除既往有卒中史且有明显后遗症者$有其他颅内病变及并发其他影响肢体运动、共济功能及言语功能的疾病,影响日常生活自理能力患者也除外。样本含量适当是抽样调查应遵循的基本原则。应根据a等计算允许误差的最小样本量,从而确定n所需样本量而不是随机指定。
2、实验设计要严格尊循3个原则,即对照、随机和重复原则。本实验研究组(105例)给予规范化血压控制治疗;对照组(105例)给予传统血压治疗。但实验称随机选取2011年1月-2012 年12月收治的脑出血患者,随机平均分为两组。此处不够谨慎,因为研究对象是患者,首先患者疾病比较复杂,可能并发多种疾病,如糖尿病、脑动脉瘤等,对脑出血的复发及预后均有影响,可重复性差,应绝对控制这些因素。且在临床试验中无论是研究人员或是受试者,都可能为某种原因有意无意的给试验结果带来偏倚,应采用盲法尽量减少此种偏倚。
搜集资料:即选择得到资料的最佳途径和获取完整、准确、可靠资料的过程,但此试验按照神经功能缺损程度评分(ccss)及斯堪的那维亚卒中量表(sss)神经功能评分,具有主观性,给试验结果带来偏倚。
整理资料:其目的是将搜集到的原始资料系统化、条理化,便于进一步计算统计指标和深入分析。资料整理前在次审查,无误后设计分组。
分析资料:根据研究设计的目的、要求、资料的类型和分布特征选择正确的统计方法进行分析。常常从两个方面分析,一是进行统计描
述,即计算统计指标,如平均值等;二是进行统计推断包括参数估计和假设检验部分。此实验处只给出了整体的对比,未给出具体单项对比数据可能不够呢详细。且此表格尚需要进一步完善应给出具体的卡方值,表达可能会更清楚详细。
以上仅是我自己对医学统计学的初步理解与掌握,思想仍不够完善与成熟,在以后的学习与应用中会继续努力的。
第四篇:医学统计学总结
1、同一资料的标准差是否一定小于均数?
答:均数是描述定量资料集中趋势的指标,而标准差是描述定量资料离散程度的指标,二者反映的是资料分布特征的两个不同方面。
2、极差、四分位间距、标准差、变异系数的适用范围有何异同?
答:这四个指标的相同点在于均用于描述计量资料的离散程度。不同点为:极差可用于各种分布的资料,一般常用于描述单峰对称分布小样本资料的变异程度,或用于初步了解资料的变异程度。若样本含量相差较大,则不宜用极差来比较资料的离散程度。四分位间距:适用于描述偏态分布资料、两端无确切值或分布不明确资料的离散程度。标准差常用于描述对称分布,特别是正态分布或近似分布资料的离散程度。变异系数适用于比较计量单位不同或均数相差悬殊的几组资料的离散程度。
3、x2检验用于什么?
答:x检验用于:推断两个及两个以上总体率或构成比是否有差别,两个分类变量间有无相关关系,多个率的趋势检验,以及两个率的等效检验等。此外,也用于频数分布的拟合优度检验。
4、四格表的U检验和x2检验有何联系?
答:(1)相同点:四格表的u检验的根据是正态近似原理(n足够大,∏和1-∏均不太小)。能用四格表的u检验进行两个率比较检验的资料,都可以用x检验。四格表的双侧u检验与x检验是完全等价的,两个统计量的关系为u= x,u20.05/2= u20.05/1.u检验和卡方检验都存在连续性矫正问题(2)不同点:①正态分布可以确定单、双侧检验界值,满足正态近似条件时,可以使用四格表的单侧u检验。②满足四格表u检验的资料,计算两率之间的95%可信区间,尚可分析两率之差有无实际意义。③x2检验还可以用于配对设计四格表,但这时推断∏1,∏2是否有差别的x2公式不同。5.参数检验和非参数检验的区别何在?各有何优缺点? 答:区别:参数检验,其应用条件是已知总体的分布类型,对总体参数进行估计或检验。非参数检验,不依赖总体分布的具体形式,目的在于检验总体分布是否不同。(2)参数检验优点是符合应用条件时,检验效能较高。缺点是对资料要求严格,不能用于等级数据、一端或两端有不确切数据,此外,还要求资料的分布类型已知和总体方差齐等条件。非参数检验优点是应用范围广,计算简便,对资料的要求不高;缺点是若对符合参数检验条件的资料用非参数检验,则会降低检验效能。如需检验出同样大小的差异,非参数检验往往需要更大的样本含量。
6.对同一资料,又出自同一研究目的,用参数检验和非参数检验所得不一致时,宜以何者为准?答:两者各有使用条件,究竟取哪种结论,要根据资料是否满足该种检验方法的应用条件进行选择。在符合参数检验的条件时,可接受参数检验的结论,而资料不符合参数检验的条件时,应以非参数检验的结论为佳。如总体分布为极度偏态或其他非正态分布,或者两总体方差不齐时,此时宜采用秩和检验的结果。7.非参数检验适用于哪些情况?
答:①等级资料②偏态资料。当观察资料成偏态或极度偏态而又未经任何变量变换,或虽经变量变换但仍未达到正态或近似正态分布时③总体分布类型未知的资料④要比较的各组资料方差不齐⑤一端或两端有不确定数据。
8.两样本比较的秩和检验,当n1>n2>10时采用u检验,这时检验是属于参数检验还是非参数检验?为什么?答:两组比较的秩和检验,当n很大时,可利用秩和T的分布随n增大渐进正态分布的性质,进行u检验,此时利用的并非原始数据,而是经秩变换后的数据,故仍属非参数检验。9.直线回归分析中应注意哪些问题?
答:做回归分析一定要有专业意义,不能将毫无联系的两个变量作直线回归分析;回归分析之前首先应绘制散点图,考查x与y之间有无直线趋势以及是否存在异常点;考虑是否满足建立线性回归模型的基本假定;直线回归方程的应用与图示一般以自变量x的取值范围为限;两变量的直线关系不一定是因果关系,也可能是伴随关系。
10.简述直线回归与直线相关的区别与联系。
答:区别:①资料要求不同:直线回归中因变量y是来自正态总体的随机变量,而r既可以是来自正态总体中的随机变量,也可以是严密控制、精确测量的变量;相关分析则要求x,y是来自双变量正态分布总体的随机变量,②分析目的不同:直线回归用于说明两变量间依存变化的数量关系;直线相关用于说明变量间的直线相关关系。联系:①方向一致:对一组数据计算,r与b,它们的正负号是一致的。②假设检验等价:对同一样本r和b的假设检验得到的t值相等。③用回归解释相关:由r2=SS回/SS总可知,若回归平方和越接近总平方和,则r越接近于1。
11.简述直线相关、秩相关的区别与联系。
答:区别:①资料要求不同:直线相关要求x、y是来自双变量正态总体的随机变量;秩相关适用于不服从双变量正态分布或总体分布类型未知以及用等级表示的原始数据。②相关意义不同:直线相关表示两变量的直线相关关系存在,秩相关表示两变量的相关关系。联系:相关系数的取值范围相同;秩相关是将原始数据进行秩变换,以秩次计算直线相关系数。
12.均数的可信区间和参考值范围有何不同?
222
22答:均数的可信区间:按一定的概率100(1-α)%(即可信度)估计总体均数所在的范围,得到的范围亦称可信区间。参考值范围:医学参考值范围指包括绝大多数正常人的人体形态、功能和代谢产物等各种生理及生化指标常数,也称正常值。由于存在着个体差异,生物医学数据并非常数,而是一定范围内波动,故采用医学参考值范围作为判定正常和异常的参考标准。
13秩和检验的优缺点是什么? 答:①不受总体分布限制,适用面广②适用于等级资料及两端无确定值的资料③易于理解,易于计算。缺点:是对分布类型的广泛适应性,使其很难充分利用资料提供的信息,有时会导致检验效能降低。14在t检验和u检验时,何种情况下采用单侧检验?
答:单侧检验的备择假设带有方向性,如:m>m0,实际中只可能出现一种情况。双侧检验的备择假设中包含不等号(如:m≠m0),实际上包括两种情况:m>m0或m<m0,无方向性。15.均数、几何均数和中位数的适用范围是什么?
答:均数适用于描述单峰对称分布,特别是正态分布或近似正态分布资料的集中趋势。(由于均数易受到极端值的影响,故不适用于描述偏态分布资料的集中趋势,只是需采用几何均数或中位数。)几何均数对于原始观察值呈偏态分布,但经过对数变换后呈正态分布或近似正态分布的资料,易用几何均数描述其集中趋势。常用于等比级资料或对数正态分布资料。中位数可用于各种分布的资料。对于正态分布资料,中位数等于均数;对于对数正态分布资料,中位数等于几何均数。由于中位数不受极端值的影响,主要用于偏态分布资料,两端无确切值或分布不明确的资料。16.标准差和标准误有何区别与联系,他们的用途是什么?
答:标准差:是描述对称分布,特别是正态分布或近似正态分布资料离散趋势(变异程度)的常用指标。总体标准差用δ表示,样本标准差用s表示。标准误:样本均数的标准差称为标准误。样本均数⊙的总体均数为H,各⊙围绕H的离散程度,可以用样本均数的标准差来描述。用途:标准差用途:①表示变量分布的离散程度②结合均数计算变异系数③结合样本含量计算标准误④结合均数描述分布特征。标准误用途:表示每个样本均数间的变异程度,描述样本均数的抽样误差,即样本均数与总体均数的接近程度,也可称为样本均数的标准差。17.统计图制作的一般原则?
答:首先,根据资料性质和分析目的正确选用适当的统计图。其次,除圆图外,一般用直角坐标系的第一象限的位置表示。最后,绘制图形应注意准确、美观,给人以清晰的印象。18.各种统计图适合于何种资料? 答:描述某连续变量的频数分布宜选用直方图;分析、比较独立的或不连续的多个组或多个类别的统计量宜选用条图,分析某指标随时间或其它连续变量变化而变化的趋势宜选用线图,描述或比较不同事物内部构成时用圆图或百分比条图等。
19.为什么要做r和b的假设检验?
答:b:即使从总体回归系数β等于零的总体中作随机抽样,由于抽样误差的存在,其样本回归系数b也不一定全为零。因此,求得一个样本回归系数时,首先,需考虑线性方程是否成立?并进行回归系数β是否为零的检验。以推断自变量x与应变量y见是否有直线关系存在。
r:假定从总体相关系数þ=0的总体中随机抽样,由于存在抽样误差,所得样本相关系数r不一定全为零。故此,求得一个样本相关系数r值后,仍需进行总体相关系数þ是否为零的假设检验。
20.服从二项分布的条件是什么?
答:凡具有贝努力试验序列3个特点的变量,一般可认为服从二项分布①每次试验的结果只能是两种互斥的结果中的一种(A或者非A)②各次试验的结果互不影响,即各次试验独立③在相同试验条件下,各次试验中出现某一结果A具有相同的概率∏(非A的概率1-∏)。
21.相关系数和回归系数有什么区别和联系?
答:直线的斜率称为回归系数,直线相关系数也称积距相关系数,说明具有直线关系的两变量间的相关方向与密切程度。它们的联系——方向一致即r与b正负一致,假设检验等价。区别:资料要求不同,回归系数方程要求服从正态分布,x精确测量严格控制Ⅰ型回归,相关方程要求x,y双重复正态Ⅱ型回归。22多个样本均数间的比较为什么不能用t检验?
答:多个样本均数的两两比较又称多重比较,其目的是推断究竟哪些总体均数之间存在差别,由于涉及的对比组数大于2,若仍用前述的t检验对两个对比组做比较,会使犯第Ⅰ类错误的概率增大,即可能吧本来无差别的两个总体均数判为有差别,因此,多重比较不宜用t检验分别作两两比较。
23对同一资料,有出自同一研究目的,用参数检验和非参数检验所得结果不一致时,宜以何者为准?答:参数检验要求其总体分布为正态分布,总体方差齐性,非参数检验常用解决那些总体分布未知的统计问题,对于同一资料,又出自同一研究目的,采用参数研究还是非参数检验取决于资料的类型。24.为什么要进行抽样研究?抽样时为什么会产生抽样误差?
答:计量资料的总体中所含的样本数量巨大,要获取资料的总体均数、标准差等数据十分困难,因此医学科学研究中通常采用的抽样研究方法,是指从总体中随机抽取一个样本,用样本信息推断总体特征,这种分析方法称为统计推断。但通常情况下,样本均数(x拔)不可能与总体均数μ正好相等,这种由个体变异产生的,随机抽样引起的样本统计量与总体参数间的差异称为抽样误差。25.相关系数的意义?
答:相关系数r没有单位,取值范围为-1≤r≤1。两变量相关的方向用r的正负号表示,即r>0表示正相关;r<0表示负相关。相关系数r的大小表示密切程度,r绝对值越接近1,表示两变量间相关关系密切程度越高。∣r∣=1表示完全相关,∣r∣=0表示无直线相关。26.方差分析的应用条件?
答:①各样本是相互独立的随机样本②各样本来自正态分布③各样本方差相等,即方差齐。
27.χ2检验要注意的问题(注意事项)?
答:① 计算χ2 值时必须用绝对数。而不能用相对数,因为χ2 值的大小与频数大小有关。②χ2 检验要求理论频数不宜太小,一般认为不宜有1/5以上格子理论频数小于5,或一个格子的理论频数小于1。对理论频数太小有三种处理方法:A 增大样本例数 B 删除理论数太小的行或列 C 合并③当多个样本率(或构成比)比较的χ2 检验结论为拒绝检验假设,只能认为各总体率(或总体构成比)之间总的说来有差别,但不能说它们彼此间都有差别。或某两者间有差别。
28.非参数检验适用哪些情况?
答:①等级顺序资料。②偏态资料。当观察资料成偏态或极度偏态分布而又未经变量变换未达到正态或近似正态分布时,宜用非参数检验。③未知分布类型资料④要比较的各组资料变异度相差较大,方差不齐,且不能变换达到齐性。⑤初步分析。有些医学资料由于统计工作量过大,可采用非参数统计方法进行初步分析,挑选其中有意义者再进一步分析⑥对于一些特殊情况,如从几个总体所获得的数据,往往难以对其原有总体分布作出估计,在这种情况下可用非参数统计方法。
29.为什么秩和检验的编秩在不同对比组间出现相同数据要给予“平均秩次”,而同一组的相同数据不必计算“平均秩次”?
答:因为在不同对比组,不取平均秩次会加大或减小某一组的秩和;而在同一组内,出现相同数据不编平均秩次,该组秩和不受影响。
30.怎样正确使用单侧检验和双侧检验?
答:根据专业知识推断两个总体是否有差别时,是甲高于乙,还是以高于甲,当两种可能都存在时,一般选双侧;若根据专业知识,如果甲不会低于乙,或研究者仅关心其中一种可能时,可选用单侧。一般来讲,双侧检验较稳妥故较多用,在预实验有探索性质时,对结果的考虑以思路较宽为好,也用双侧检验。单侧检验,应以专业知识为依据,他充分利用了另一侧的不可能性,故检出效率高,但应慎用。
31.回归系数:直线的斜率b,也称回归系数。统计学意义是自变量x改变一个单位时,应变量y平均变化b个单位。32.相关系数:也称pearson积距相关系数,说明具有直线相关的两变量间相关方向与密切程度。33.直线回归分析中应注意的问题?
答:①做直线回归一定要有实际意义②回归分析之前首先应绘制散点图。③考虑建立线性模型的基本假定④取值范围,避免外延。⑤两变量间有直线关系不一定是因果关系。34.相关分析应用中应注意的问题?
答:①资料要求x、y都应来自双变量正态总体的随机变量。②进行相关分析前,应先绘制散点图,有线性趋势时,才可进行相关分析。③满足应用条件的同一份双变量资料,回归系数b与相关系数r的正负号一致,假设检验等价。④相关分析时,小样本资料经t检验只能推断两变量间有无直线关系,而不能推断其相关的密切程度。要推断两样本间相关的程度,样本含量必须足够大,当r有统计学意义时,但r2较小时,下结论要慎重。35.方差分析的应用条件? 答:①各样本是相互独立的随机样本②各样本来自正态分布③各样本方差相等,即方差齐。
36.二项分布:贝努力试验序列中结果A出现次数的概率分布就是~。
37.率的标准化法:为解决因内部构成不同而导致分组率比较的结果与和纪律比较结果的矛盾,选定一个共同的标准人口或标准人口构成,分别计算两组的标准化率,这种方法称~。
38.抽样误差:由个体变异产生的,随机抽样引起的样本统计量与总体参考数间的差异称~
第五篇:医学统计学总结
医学统计学总结
一、两组或多组计量资料的比较1.两组资料: 1)大样本资料或服从正态分布的小样本资料(1)若方差齐性,则作成组t检验(2)若方差不齐,则作t’检验或用成组的Wilcoxon秩和检验 2)小样本偏态分布资料,则用成组的Wilcoxon秩和检验 2.多组资料: 1)若大样本资料或服从正态分布,并且方差齐性,则作完全随机的方差分析。如果方差分析的统计检验为有统计学意义,则进一步作统计分析:选择合适的方法(如:LSD检验,Bonferroni检验等)进行两两比较。2)如果小样本的偏态分布资料或方差不齐,则作Kruskal Wallis的统计检验。如果Kruskal Wallis的统计检验为有统计学意义,则进一步作统计分析:选择合适的方法(如:用成组的Wilcoxon秩和检验,但用Bonferroni方法校正P值等)进行两两比较。
二、分类资料的统计分析1.单样本资料与总体比较 1)二分类资料:(1)小样本时:用二项分布进行确切概率法检验;(2)大样本时:用U检验。2)多分类资料:用Pearson c2检验(又称拟合优度检验)。2.四格表资料 1)n>40并且所以理论数大于5,则用Pearson c2 2)n>40并且所以理论数大于1并且至少存在一个理论数<5,则用校正c2或用Fisher’s 确切概率法检验 3)n£40或存在理论数<1,则用Fisher’s 检验 3.2×C表资料的统计分析 1)列变量为效应指标,并且为有序多分类变量,行变量为分组变量,则行评分的CMH c2或成组的Wilcoxon秩和检验 2)列变量为效应指标并且为二分类,列变量为有序多分类变量,则用趋势c2检验 3)行变量和列变量均为无序分类变量(1)n>40并且理论数小于5的格子数<行列表中格子总数的25%,则用Pearson c2(2)n£40或理论数小于5的格子数>行列表中格子总数的25%,则用Fisher’s 确切概率法检验 4.R×C表资料的统计分析 1)列变量为效应指标,并且为有序多分类变量,行变量为分组变量,则CMH c2或Kruskal Wallis的秩和检验 2)列变量为效应指标,并且为无序多分类变量,行变
量为有序多分类变量,作none zero correlation analysis的CMH c
23)列变量和行变量均为有序多分类变量,可以作Spearman相关分析 4)列变量和行变量均为无序多分类变量,(1)n>40并且理论数小于5的格子数<行列表中格子总数的25%,则用Pearson c2(2)n£40或理论数小于5的格子数>行列表中格子总数的25%,则用Fisher’s 确切概率法检验
三、Poisson分布资料1.单样本资料与总体比较: 1)观察值较小时:用确切概率法进行检验。2)观察值较大时:用正态近似的U检验。2.两个样本比较:用正态近似的U检验。配对设计或随机区组设计
四、两组或多组计量资料的比较 1.两组资料: 1)大样本资料或配对差值服从正态分布的小样本资料,作配对t检验 2)小样本并且差值呈偏态分布资料,则用Wilcoxon的符号配对秩检验 2.多组资料: 1)若大样本资料或残差服从正态分布,并且方差齐性,则作随机区组的方差分析。如果方差分析的统计检验为有统计学意义,则进一步作统计分析:选择合适的方法(如:LSD检验,Bonferroni检验等)进行两两比较。2)如果小样本时,差值呈偏态分布资料或方差不齐,则作Fredman的统计检验。如果Fredman的统计检验为有统计学意义,则进一步作统计分析:选择合适的方法(如:用Wilcoxon的符号配对秩检验,但用Bonferroni方法校正P值等)进行两两比较。
五、分类资料的统计分析1.四格表资料 1)b+c>40,则用McNemar配对c2检验或配对边际c2检验 2)b+c<40,则用二项分布确切概率法检验 2.C×C表资料: 1)配对比较:用McNemar配对c2检验或配对边际c2检验 2)一致性问题(Agreement):用Kap检验 变量之间的关联性分析
六、两个变量之间的关联性分析 1.两个变量均为连续型变量 1)小样本并且两个变量服从双正态分布,则用Pearson相关系数做统计分析 2)大样本或两个变量不服