第一篇:卫生统计学学习总结
1.连续性资料
1.1 两组独立样本比较
1.1.1 资料符合正态分布,且两组方差齐性,直接采用t检验。
1.1.2 资料不符合正态分布,(1)可进行数据转换,如对数转换等,使之服从正态分布,然后对转换后的数据
采用t检验;(2)采用非参数检验,如Wilcoxon检验。
1.1.3 资料方差不齐,(1)采用Satterthwate 的t’检验;(2)采用非参数检验,如Wilcoxon检验。
1.2 两组配对样本的比较
1.2.1 两组差值服从正态分布,采用配对t检验。
1.2.2 两组差值不服从正态分布,采用wilcoxon的符号配对秩和检验。
1.3 多组完全随机样本比较
1.3.1资料符合正态分布,且各组方差齐性,直接采用完全随机的方差分析。如果检验结果为有统计学意义,则进一步作两两比较,两两比较的方法有LSD检验,Bonferroni法,tukey法,Scheffe法,SNK法等。
1.3.2资料不符合正态分布,或各组方差不齐,则采用非参数检验的Kruscal-Wallis法。如果检验结果为有
统计学意义,则进一步作两两比较,一般采用Bonferroni法校正P值,然后用成组的Wilcoxon检验。
1.4 多组随机区组样本比较
1.4.1资料符合正态分布,且各组方差齐性,直接采用随机区组的方差分析。如果检验结果为有统计学意义,则进一步作两两比较,两两比较的方法有LSD检验,Bonferroni法,tukey法,Scheffe法,SNK法等。
1.4.2资料不符合正态分布,或各组方差不齐,则采用非参数检验的Fridman检验法。如果检验结果为有统
计学意义,则进一步作两两比较,一般采用Bonferroni法校正P值,然后用符号配对的Wilcoxon检验。
****需要注意的问题:
(1)一般来说,如果是大样本,比如各组例数大于50,可以不作正态性检验,直接采用t检验或方差
分析。因为统计学上有中心极限定理,假定大样本是服从正态分布的。
(2)当进行多组比较时,最容易犯的错误是仅比较其中的两组,而不顾其他组,这样作容易增大犯假
阳性错误的概率。正确的做法应该是,先作总的各组间的比较,如果总的来说差别有统计学意义,然后才能作其中任意两组的比较,这些两两比较有特定的统计方法,如上面提到的LSD检验,Bonferroni法,tukey法,Scheffe法,SNK法等。**绝不能对其中的两组直接采用t检验,这样即使得出结果也未必正确**
(3)关于常用的设计方法:多组资料尽管最终分析都是采用方差分析,但不同设计会有差别。常用的设计如完全随即设计,随机区组设计,析因设计,裂区设计,嵌套设计等。
2.分类资料
2.1 四格表资料
2.1.1 例数大于40,且所有理论数大于5,则用普通的Pearson 检验。
检验或Fisher’s确切概2.1.2 例数大于40,所有理论数大于1,且至少一个理论数小于5,则用校正的率法检验。
2.1.3 例数小于40,或有理论数小于2,则用Fisher’s确切概率法检验。
2.22×C表或R×2表资料的统计分析
2.2.1 列变量&行变量均为无序分类变量,则(1)例数大于40,且理论数小于5的格子数目<总格子数目的25%,则用普通的Pearson 检验。(2)例数小于40,或理论数小于5的格子数目>总格子数目
检验只说明组
检验的25%,则用Fisher’s确切概率法检验。2.2.2列变量为效应指标,且为有序多分类变量,行变量为分组变量,用普通的Pearson 间构成比不同,如要说明疗效,则可用行平均分差检验或成组的Wilcoxon秩和检验。2.2.3 列变量为效应指标,且为二分类变量,行变量为有序多分类变量,则可采用普通的Pearson
比较各组之间有无差别,如果总的来说有差别,还可进一步作两两比较,以说明是否任意两组之间的差别都有统计学意义。
2.3R×C表资料的统计分析
2.2.1 列变量&行变量均为无序分类变量,则(1)例数大于40,且理论数小于5的格子数目<总格子数目的25%,则用普通的Pearson 检验。(2)例数小于40,或理论数小于5的格子数目>总格子数目
检验只说明组的25%,则用Fisher’s确切概率法检验。(3)如果要作相关性分析,可采用Pearson相关系数。2.2.2列变量为效应指标,且为有序多分类变量,行变量为分组变量,用普通的Pearson
间构成比不同,如要说明疗效或强弱程度的不同,则可用行平均分差检验或成组的Wilcoxon秩和检验或Ridit分析。
2.2.3 列变量为效应指标,且为无序多分类变量,行变量为有序多分类变量,则可采用普通的Pearson
检验比较各组之间有无差别,如果有差别,还可进一步作两两比较,以说明是否任意两组之间的差别都有统计学意义。
2.2.4 列变量&行变量均为有序多分类变量,(1)如要做组间差别分析,则可用行平均分差检验或成组的Wilcoxon秩和检验或Ridit分析。如果总的来说有差别,还可进一步作两两比较,以说明是否任意两组之间的差别都有统计学意义。(2)如果要做两变量之间的相关性,可采用Spearson相关分析。
2.4配对分类资料的统计分析
2.4.1 四格表配对资料,(1)b+c>40,则用McNemar配对
检验。
2.4.1 C×C资料,(1)配对比较:用McNemar配对检验。(2)b+c<40,则用校正的配对检验。(2)一致性检验,用Kappa检验。
第二篇:卫生统计学学习总结
1.连续性资料
1.1 两组独立样本比较
1.1.1 资料符合正态分布,且两组方差齐性,直接采用t检验。
1.1.2 资料不符合正态分布,(1)可进行数据转换,如对数转换等,使之服从正态分布,然后对转换后的数据采用t检验;(2)采用非参数检验,如Wilcoxon检验。
1.1.3 资料方差不齐,(1)采用Satterthwate 的t’检验;(2)采用非参数检验,如Wilcoxon检验。1.2 两组配对样本的比较
1.2.1 两组差值服从正态分布,采用配对t检验。
1.2.2 两组差值不服从正态分布,采用wilcoxon的符号配对秩和检验。1.3 多组完全随机样本比较
1.3.1资料符合正态分布,且各组方差齐性,直接采用完全随机的方差分析。如果检验结果为有统计学意义,则进一步作两两比较,两两比较的方法有LSD检验,Bonferroni法,tukey法,Scheffe法,SNK法等。
1.3.2资料不符合正态分布,或各组方差不齐,则采用非参数检验的Kruscal-Wallis法。如果检验结果为有统计学意义,则进一步作两两比较,一般采用Bonferroni法校正P值,然后用成组的Wilcoxon检验。1.4 多组随机区组样本比较
1.4.1资料符合正态分布,且各组方差齐性,直接采用随机区组的方差分析。如果检验结果为有统计学意义,则进一步作两两比较,两两比较的方法有LSD检验,Bonferroni法,tukey法,Scheffe法,SNK法等。1.4.2资料不符合正态分布,或各组方差不齐,则采用非参数检验的Fridman检验法。如果检验结果为有统计学意义,则进一步作两两比较,一般采用Bonferroni法校正P值,然后用符号配对的Wilcoxon检验。
****需要注意的问题:
(1)一般来说,如果是大样本,比如各组例数大于50,可以不作正态性检验,直接采用t检验或方差分析。因为统计学上有中心极限定理,假定大样本是服从正态分布的。
(2)当进行多组比较时,最容易犯的错误是仅比较其中的两组,而不顾其他组,这样作容易增大犯假阳性错误的概率。正确的做法应该是,先作总的各组间的比较,如果总的来说差别有统计学意义,然后才能作其中任意两组的比较,这些两两比较有特定的统计方法,如上面提到的LSD检验,Bonferroni法,tukey法,Scheffe法,SNK法等。**绝不能对其中的两组直接采用t检验,这样即使得出结果也未必正确**
(3)关于常用的设计方法:多组资料尽管最终分析都是采用方差分析,但不同设计会有差别。常用的设计如完全随即设计,随机区组设计,析因设计,裂区设计,嵌套设计等。
2.分类资料 2.1 四格表资料
2.1.1 例数大于40,且所有理论数大于5,则用普通的Pearson
检验。
检验或Fisher’s确切概2.1.2 例数大于40,所有理论数大于1,且至少一个理论数小于5,则用校正的率法检验。
2.1.3 例数小于40,或有理论数小于2,则用Fisher’s确切概率法检验。2.2
2×C表或R×2表资料的统计分析
2.2.1 列变量&行变量均为无序分类变量,则(1)例数大于40,且理论数小于5的格子数目<总格子数目的25%,则用普通的Pearson
检验。(2)例数小于40,或理论数小于5的格子数目>总格子数目
检验只说明组
检验的25%,则用Fisher’s确切概率法检验。
2.2.2列变量为效应指标,且为有序多分类变量,行变量为分组变量,用普通的Pearson 间构成比不同,如要说明疗效,则可用行平均分差检验或成组的Wilcoxon秩和检验。2.2.3 列变量为效应指标,且为二分类变量,行变量为有序多分类变量,则可采用普通的Pearson 比较各组之间有无差别,如果总的来说有差别,还可进一步作两两比较,以说明是否任意两组之间的差别都有统计学意义。2.3
R×C表资料的统计分析
2.2.1 列变量&行变量均为无序分类变量,则(1)例数大于40,且理论数小于5的格子数目<总格子数目的25%,则用普通的Pearson
检验。(2)例数小于40,或理论数小于5的格子数目>总格子数目
检验只说明组的25%,则用Fisher’s确切概率法检验。(3)如果要作相关性分析,可采用Pearson相关系数。2.2.2列变量为效应指标,且为有序多分类变量,行变量为分组变量,用普通的Pearson 间构成比不同,如要说明疗效或强弱程度的不同,则可用行平均分差检验或成组的Wilcoxon秩和检验或Ridit分析。2.2.3 列变量为效应指标,且为无序多分类变量,行变量为有序多分类变量,则可采用普通的Pearson 检验比较各组之间有无差别,如果有差别,还可进一步作两两比较,以说明是否任意两组之间的差别都有统计学意义。
2.2.4 列变量&行变量均为有序多分类变量,(1)如要做组间差别分析,则可用行平均分差检验或成组的Wilcoxon秩和检验或Ridit分析。如果总的来说有差别,还可进一步作两两比较,以说明是否任意两组之间的差别都有统计学意义。(2)如果要做两变量之间的相关性,可采用Spearson相关分析。2.4 配对分类资料的统计分析
2.4.1 四格表配对资料,(1)b+c>40,则用McNemar配对检验。
2.4.1 C×C资料,(1)配对比较:用McNemar配对
检验。(2)b+c<40,则用校正的配对
检验。(2)一致性检验,用Kappa检验。
第三篇:卫生统计学总结
卫生统计学总结
王玉林 石河子大学医学院预防医学系
(一)简答题
一.方差分析的基本思想是什么?
方差分析的基本思想就是把全部观察值间的变异(总变异)按设计和需要分解成两个或多个组成部分,然后将各部分的变异与随机误差进行比较,以判断各部分的变异是否具有统计学意义,总自由度也分解成相应的几个部分,再做分析。分解的每一部分代表不同的含义,其中至少有一部分代表各均数间的变异情况,另一部分代表误差。
二.标准差和标准误的区别与联系?
标准差和标准误都是变异指标,但它们之间有区别,也有联系。
1.区别:①概念不同:标准差是描述观察值(个体值)之间的变异程度;标准误是描述样本均
数的抽样误差;
②用途不同:标准差与均数结合估计参考值范围,计算变异系数,计算标准误等。
标准误用于估计参数的可信区间,进行假设检验等。
③它们与样本含量的关系不同:当样本含量 n 足够大时,标准差趋向稳定;而标
准误随n的增大而减小,甚至趋于0。
2.联系:标准差,标准误均为变异指标,当样本含量不变时,标准误与标准差成正比。
三.假设检验的原理是什么?
假设检验:统计学中的一种推论过程,通过样本统计量得出的差异作为一般性结论,判断总体参数之间是否存在差异。
假设检验的实质是对可置信性的评价,是对一个不确定问题的决策过程,其结果在一定概率上正确的,而不是全部。
1.两类假设
对于任何一种研究而言,其结果无外乎有两种可能,即是否符合我们预期。一般来说证伪一件事情比证实一件事容易,在行为科学的研究中,由于我们无法了解总体中除样本以外的个体情况,因此尝试拒绝虚无假设的方法优于证明备择假设。备则假设:因变量的变化、差异确实是由于自变量的作用
往往是我们对研究结果的预期,用H1表示。
虚无假设:实际上什么也没有发生,我们所预计的改变、差异、处理效果都不存在 观察到的差异只是随机误差在起作用,用H0表示。2.小概率原理
小概率原理:小概率事件在一次试验中几乎是不可能发生的
至于什么就算小概率事件,那就是我们在计算前明确的决策标准,也就是显著性水平α。在检验过程中,我们假设虚无假设是真实的,同时计算出观测到的差异完全是由于随机误差所致的概率。之后将其与我们实现界定好的显著性水平比较,从而考虑是否依据小概率原理来拒绝虚无假设。
3.两类错误 第Ⅰ类错误:当虚无假设正确时,我们拒绝了它所犯的错误,也叫α错误 研究者得出了处理有效果的结论,而实际上并没有效果,即所谓“无中生有” 第Ⅱ类错误:当虚无假设是错误的时候,我们没有拒绝所犯的错误,也叫β错误 假设检验未能侦查到实际存在的处理效应,即所谓“失之交臂” 两类检验的关系 ①α+β不一定等于1 ②在其他条件不变的情况下,α与β不可能同时减小或增大 4.检验的方向性
单侧检验:强调某一方向的检验,显著性的百分等级为α
双侧检验:只强调差异不强调方向性的检验,显著性百分等级为α/2 对于同样的显著性标准,在某一方向上,单侧检验的临界区域要大于双侧检验,因此如果差异发生在该方向,单侧检验犯β错误的概率较小,我们也说它的检验效力更高。5.假设检验的步骤
①根据问题要求,提出虚无假设和备择假设 ②选择适当的检验统计量 ③确定检验的方向性并规定显著性水平④计算检验统计量的值 ⑤将统计量的值与临界值对比做出决策
附:假设检验基本推断原理:小概率事件在一次随机试验中不(大)可能发生。
假设检验基本逻辑:在零假设成立的情形下计算统计量和P值,把“不太可能出现的 假阳性”当做“不可能出现假阳性”,从而拒绝零假设。
四.直线相关与直线回归的区别与联系?
1.区别:①相关分析资料双变量正态分布,回归资料只要求Y为正态分布,X可是正态分布
资料,也可为一般变量。
②意义上,相关说明互相关系,回归反应依存关系。2.联系:①同一资料,r与b的正负号相同
②r与b的假设检验等价,同一资料tb=tr
③用回归解释相关R2=SS回/SS总
五.应用相对数时的注意事项?
1.理解相对数的含义不可望文生义 2.频率型指标的解释要紧扣总体与属性 3.计算相对数时分母应有足够数量 4.正确计算合计率 5.注意资料的可比性 6.样本相对数的统计推断
六.非参数检验的特点和适用范围
1.特点:①对样本所来自的总体分布形式没有要求。
②收集资料方便,可用“等级”或“符号”来记录观察结果。
③多数非参数检验方法比较简便,易于理解和掌握。
④缺点是损失信息量,适用于参数检验的资料用非参数检验会降低检验效能。2.适用范围:①等级资料。②偏态分布资料。③方差不齐,且不能通过变量变换达到齐性。
④个体数据偏离过大,或一端或两端无界的资料。⑤分布类型不明。⑥初步分析。七.卡方检验的用途?
1.单样本分布的拟合优度;
2.比较两个或多个独立样本频率或独立样本频率分布; 3.比较配对设计两样本和两频率分布。
八.均数比较的方法有哪些?
1.t检验
①单样本资料的t检验:样本均数与总体均属比较的t检验,推断样本是否来自已知总体。
应用条件:计量资料,具有独立性、正态性、方差齐性。
②两独立样本资料的t检验:推断两样本总体均数是否相等(或两样本是否来自同一总体)。
应用条件:计量资料,具有独立性、正态性、方差齐性。
③配对设计资料的t检验:配对计量资料比较的t检验,差值均数的比较,包括异体配对和
自身配对。
应用条件:计量资料,具有独立性、正态性、方差齐性。2.方差分析
①完全随机设计资料的方差分析:多个样本均数的比较。
应用条件:计量资料,具有独立性、正态性、方差齐性。②随机区组设计资料的方差分析:多个样本均数的比较。
应用条件:计量资料,具有独立性、正态性、方差齐性。
③析因设计资料的方差分析:分析个实验因素的单独效应、主效应和因素间的交互效应。
应用条件:计量资料,具有独立性、正态性、方差齐性。
3.非参数检验
①单样本资料的秩和检验:用于不满足t检验条件的单样本定量变量资料的比较,推断样本中位数与已知总体中位数是否相等。
应用条件:计量资料,不具有独立性、正态性、方差齐性。
②配对设计资料的秩和检验:当差值d不满足正态分布时使用,推断两个总体中位数是否相等,即两种处理效应是否相同。
应用条件:计量资料,差值具有正态性。③两独立样本比较的秩和检验:推断连续型变量资料或有序变量资料的两个独立样本代表的两个总体分布是否有差别。
应用条件:两样本来自非正态总体或方差不齐。
④多组独立样本比较的秩和检验:推断定量变量或有序分类变量的多个总体分布有无差别。
应用条件:多个独立样本对应总体不满足正态性或方差齐性。⑤随机区组设计的秩和检验:多个样本均数的比较。
应用条件:多个独立样本对应总体不满足正态性或方差齐性。
九.参考值范围和可信区间的区别与联系
1.从意义来看
95%参考值范围是指同质总体内包括95%个体值的估计范围,而总体均数95%可信区间是指按95%可信度估计的总体均数的所在范围。2.从计算公式看
若指标服从正态分布,95%参考值范围的公式是:
±1.96s。总体均数95%可信区间的公式是:。
前者用标准差,后者用标准误。前者用1.96,后者用α为0.05,自由度为v的t界值。
十.频率分布表(图)的用途是什么?
1.揭示资料的分布类型
2.描述分布的集中趋势和离散趋势 3.便于发现某些特大和特小的可疑值 4.便于进一步计算指标和统计分析
(二)名词解释
1.医学统计学(medical statistics)应用概率论和数理统计学原理结合医学实际解决医学科研中设计,资料收集、整理、分析的科学。
2.总体(population)是根据研究目的确定的同质研究对象的全体。3.样本(sample)是指从研究总体中抽取的一部分有代表性的个体。
4.同质(homogeneity)是指同一总体中个体的性质、影响条件或背景相同或非常相近。5.变异(variation)是指同质的个体之间存在的差异。6.参数(parameter)是指反映总体特征的统计指标。
7.样本统计量(statistic)由样本观察资料计算出来的反映样本特征的两称为样本统计量。8.频率分布表(frequency distribution table)当变量值个数较多时,对各变量值出现的频率列表即为频率分布表,简称频率表。
9.二项分布(binomial distribution)是指在只会产生两种可能结果的n次独立重复试验中,当每次试验的“阳性”概率保持不变时,出现“阳性”的次数X=0,1,2,3...,n的一种概率分布。
10.医学参考值范围(reference range)是指特定的“正常”人群的解剖、生理、生化指标及组织代谢产物含量等数据中大多数个体的取值所在的范围。
11.抽样误差(sampling error)由于生物固有的个体变异的存在,从某一总体中随机抽取一个样本,所得样本统计量与相应的总体参数往往是不同的,这种差异称为抽样误差。
12.置信区间(confidence interval,CI)区间估计是将样本统计量与标准误结合起来,确定一个具有较大置信度的包含总体参数的范围,该范围称为总体参数的置信区间。
13.统计推断(statistical inference)由样本信息对相应总体的特征进行推断称为统计推断。14.假设检验(hypothesis testing)若对所估计的总体首先提出一个假设,然后通过样本数据去推断是否拒绝这一假设,称为假设检验。
15.析因设计(factorial design)是将两个或多个实验因素的个水平进行全面组合的实验,能够分析个实验因素的单独效应、主效应和因素间的交互效应。
16.单独效应(simple effect)是指其他因素水平固定时,同一因素不同水平的效应之差。17.主效应(main effect)是指某一因素单独效应的平均值。
18.交互效应(interaction)是指两个或多个因素间的效应互不独立的情形。
19.参数检验(parametric test)凡是以特定的总体分布为前提,对未知的总体参数做推断的假设检验方法统称为参数检验。
20.非参数检验(nonparametric test)不以特定的总体分布为前提,也不针对决定总体分布的几个参数做推断,故又称任意分布检验(distribution-free test)。
21.线性相关系数(linear correlation coefficient)是表示两个随机变量之间线性相关强度和方向的统计量。
22.回归系数(regression coefficient)回归分析中度量依变量对自变量的相依程度的指标,它反映当自变量每变化一个单位时,依变量所期望的变化量。(回归系数βj表示在控制其他自变量时,自变量Xj变化一个单位所引起logit(π)的改变量)
23.决定系数(coefficient of determination)回归平方和与总离均差平方和之比称为决定系数。它反映了回归贡献的相对程度,即在因变量Y的总变异中回归关系所能解释的比例。24.生存分析(survival analysis)就是将终点事件的出现与否和达到终点所经历的时间结合起来分析的一类统计分析方法。
第四篇:《卫生统计学》课程教学大纲汇总
吉林大学公共卫生学院MPH课程教学大纲
《卫生统计学》课程教学大纲
课程名称: 卫生统计学 课程编码:MD264001 英文名称: Health Statistics 课程类别:必修 课程学时: 60 课程学分:3 授课科室: 卫生统计学教研室 授课地点:三楼多媒体教室 授课对象: 公共卫生硕士 授课时间: 执笔人: 陶育纯 编写日期:
一、课程简介
卫生统计学是把概率论和数理统计原理和方法应用于医学研究、人民健康和卫生事业管理的一门科学,是公共卫生硕士(MPH)的专业学位课程。它主要研究数据的搜集、整理、分析和推断,反映事物特征,揭示事物间的客观规律。
本课程的内容包括卫生统计学的基本概念,不同类型资料的统计描述方法,常用统计图表,常用的统计分布,不同类型资料的常用统计推断方法,线性回归和相关分析,常用非参数统计方法,生存分析等。
本课程通过课堂讲授、实习等形式进行,注重基本技能训练,培养严密的统计逻辑思维能力,训练独立进行统计分析的能力。课程采用提问、考试等方式评价教学效果。
通过本课程学习,要求学生能够:
1.掌握常用的和重要的统计分析方法,为学习流行病学等学科、阅读专业书刊和从事公共卫生领域工作打下一必要的统计学基础。
2.学会运用直观的统计图表反映居民健康状况的各项指标。
3.熟练掌握函数型计算器统计功能的使用方法,了解统计软件的功能和基本使用方法。
4.养成统计逻辑思维的习惯,具有严肃认真、实事求是,对人民负责的科学态度。
二、课程学时分配
课 时 分 配 表
授 课 内 容 理论教学时数 实习教学时数 合计教学时数 第一章 绪言 2 2 第二章 统计描述 6 4 10 第三章 三个常用分布 2 1 3
吉林大学公共卫生学院MPH课程教学大纲
第四章 总体均数的估计和总体率的估计 2 1 3 第五章 正态总体均数的假设检验 8 4 12 第六章 Poisson分布总体均数的假设检验 1 1 2 第七章 总体率的假设检验 1 1 2 第八章 行列表资料的统计分析 6 4 10 第九章 线性回归和相关分析 4 2 6 第十章 非参数统计分析 4 2 6 第十一章 生存分析 2 2 考试 2 2 学时合计 40 20 60
三、课程内容及教学要求
第一章 绪言
[教学目的和要求] 掌握统计学的基本概念。2 掌握统计资料的类型。3 熟悉统计工作的基本步骤。[讲授内容] 统计学的基本概念:总体和样本;参数和统计量;概率。2 统计资料的类型:计量资料;计数资料;等级资料。统计工作的基本步骤:设计;搜集资料;整理资料;分析资料。[授课时数] 2学时
[外文专业术语] statistics, health statistics, population, sample, parameter, statistic, probability
[教学方法和手段] 课堂讲授
第二章
统计描述 [教学目的和要求] 熟悉频数分布表的编制过程。2 掌握计量资料的统计描述方法。3 掌握计数资料的统计描述方法。了解率的标准化法的意义和计算方法。了解制作统计图表的基本要求,熟悉常用统计图表的制作。[讲授内容] 频数分布表的编制方法。计量资料的平均水平指标:均数;几何均数;中位数和百分位数。计量资料的变异程度指标:极差;四分位数间距;方差和标准差;变异系数。4 常用相对数:率;构成比;相对比;应用相对数的注意事项。5 率的标准化方法。动态数列及其分析指标。7 常用统计图表。[授课时数]
6学时
[外文专业术语] frequency, frequency distribution table, mean, geometric mean, median, percentile, range, variance, standard deviation, coefficient of variation, rate, proportion, ratio, standardized rate
吉林大学公共卫生学院MPH课程教学大纲
[教学方法和手段] 课堂讲授和实习(课堂习题),多媒体演示。
第三章
三个常用分布 [教学目的和要求] 熟悉正态分布的特征和正态曲线下面积分布规律,掌握参考值范围的估计。2 了解二项分布的特征和正态近似性。了解Poisson分布的特征和二项分布的近似性。[讲授内容] 正态分布的特征和正态曲线下面积分布规律,参考值范围的估计。2 二项分布的特征和正态近似性。Poisson分布的特征和二项分布的近似性。[授课时数]
2学时
[外文专业术语] normal distribution, reference ranges, binomial distribution, Poisson distribution [教学方法和手段] 课堂讲授和实习(课堂习题),多媒体演示。
第四章
总体均数的估计和总体率的估计 [教学目的和要求] 熟悉抽样误差的含义,掌握均数的标准误的计算方法。2 掌握t分布的特征和t界值的使用。3 掌握总体均数的可信区间计算方法。4 掌握率的标准误的计算方法。5 掌握总体率的可信区间计算方法。[讲授内容] 均数的抽样误差,均数的标准误。
2t分布的特征和t分布曲线下面积分布规律。总体均数的区间估计:总体均数95%(99%)可信区间的计算。4 率的抽样误差与标准误。总体率的区间估计:总体率95%(99%)可信区间的计算。[授课时数] 2学时
[外文专业术语] sampling error, standard error, t-distribution, interval estimate, confidence interval [教学方法和手段] 课堂讲授和实习(课堂习题),多媒体演示。
第五章
正态总体均数的假设检验 [教学目的和要求] 1 掌握假设检验的基本思想和基本概念。2 掌握假设检验的基本步骤。3 掌握t检验和u检验。熟悉方差分析的基本思想和应用条件。掌握完全随机设计和配伍组设计资料的方差分析方法。6 熟悉多个均数间的两两比较方法。[讲授内容]
吉林大学公共卫生学院MPH课程教学大纲
假设检验的基本思想和基本概念。两类错误和单双侧检验。假设检验的基本步骤。
样本均数与总体均数比较的t检验;配对资料的t检验;两样本均数比较的t检验;两大样本均数比较的u检验。5 方差分析的基本思想和应用条件。完全随机设计资料的方差分析;配伍组设计资料的方差分析。7 均数间的两两比较方法。[授课时数] 8学时
[外文专业术语] hypothesis test, size of a test, statistic, statistical significance, t-test, u-test, type I error, type II error, analysis of variance(ANOVA), one-way ANOVA, homogeneity of variance, LSD-t test, Dunnett-t test, SNK-q test [教学方法和手段] 课堂讲授和实习(课堂习题),多媒体演示。
第六章
Poisson分布总体均数的假设检验 [教学目的和要求] 了解Poisson分布的正态近似条件。了解Poisson分布的两样本均数比较的u检验。[讲授内容] Poisson分布的直接计算概率法和正态近似法。2 Poisson分布的两样本均数比较的u检验。[授课时数] 1学时
[教学方法和手段] 课堂讲授。
第七章
总体率的假设检验 [教学目的和要求] 了解二项分布的正态近似条件。熟悉二项分布的两样本均数比较的u检验。[讲授内容] 二项分布的直接计算概率法和正态近似法。2 二项分布的两样本均数比较的u检验。[授课时数] 1学时
[教学方法和手段] 课堂讲授。
第八章
行列表资料的统计分析 [教学目的和要求] 熟悉χ2检验的基本思想。掌握四格表资料χ2检验和适用条件。3 掌握配对四格表资料χ2检验。4 掌握行×列表资料χ2检验。5 了解行×列表χ2检验注意事项。[讲授内容] χ2检验的基本思想。1 2 3 4
吉林大学公共卫生学院MPH课程教学大纲 四格表资料χ2检验,四格表χ2检验专用公式和校正公式。3 配对四格表资料χ2检验。4 行×列表资料χ2检验。多个四格表资料的统计分析。[授课时数] 6学时
[外文专业术语] chi-square test, Fisher exact test [教学方法和手段] 课堂讲授和实习(课堂习题),多媒体演示。
第九章
线性回归和相关分析 [教学目的和要求] 掌握直线回归的概念,直线回归方程的求法,回归系数的假设检验。2 了解直线回归方程的应用。掌握直线相关的概念,直线相关系数的求法,相关系数的假设检验。4 了解线性回归模型的分析方法。[讲授内容] 直线相关的概念,直线相关系数的求法,相关系数的假设检验。2 直线回归的概念,直线回归方程的求法,回归系数的假设检验。3 直线回归的区间估计。4 直线回归方程的应用。线性回归模型的概念,线性回归模型的计算。[授课时数] 4学时
[外文专业术语] correlation, regression, linear regression, linear regression equation, intercept, regression coefficient, linear correlation, correlation coefficient [教学方法和手段] 课堂讲授和实习(课堂习题),多媒体演示。
第十章
非参数统计分析 [教学目的和要求] 1 了解非参数统计的概念和应用条件及与参数统计的区别。2 掌握常用的秩和检验方法。3 熟悉等级相关的分析方法。[讲授内容] 非参数统计的概念和应用条件,非参数统计与参数统计的区别。配对设计资料差别的符号秩和检验,两独立样本资料差别的秩和检验,完全随机
设计多组资料差别的秩和检验,配伍组设计的多组秩和检验。3 等级相关。[授课时数] 4学时
[外文专业术语] nonparametric statistics, rank sum test, Wilcoxon signed rank test [教学方法和手段] 课堂讲授和实习(课堂习题),多媒体演示。
第十一章
生存分析 [教学目的和要求] 1 了解生存分析的概念和生存率的计算。2 了解生存曲线的意义。
吉林大学公共卫生学院MPH课程教学大纲
[讲授内容] 生存分析的概念,生存时间,截尾值,生存概率,生存率,生存曲线。2 生存率的计算及其标准误。3 Kaplan-Meier法。4 生存曲线的比较。[授课时数] 2学时
[外文专业术语] survival analysis, survival probability, survival rate, censored value [教学方法和手段] 课堂讲授和多媒体演示。
四、习题、作业、讨论
习课以教材每章附带的思考与练习题为主,适当补充课外材料。作业从上述习题范围内选取,采取课堂集中讲解方式批改。实习课中适当采用讨论的形式进行。
五、考试形式与方法
笔试(闭卷)。
六、本课程与其它课程的联系
是流行病学,社会医学,卫生事业管理学的主要分析工具。
七、教材及主要参考书
教材:
卫生统计学方法
曹素华主编 复旦大学出版社 2003年
主要参考书:
1、卫生统计学 第5版
方积乾主编 人民卫生出版社 2003年
2、流行病学
第5版
李立明主编 人民卫生出版社 2003年
3、卫生统计学 第四版
倪宗瓒主编 人民卫生出版社 2000年
4、医用SAS统计分析
金丕焕等主编
复旦大学出版社
2002年
5、Excel在统计分析中的应用
刘钢主编
人民卫生出版社
2002年
第五篇:实用卫生统计学复习资料(汇总)
《实用卫生统计学》
一、名词解释
1.变异:同一性质的事物,其观察值(变量值)之间的差异,统计上称为变异。
2.抽样研究:从所研究的总体中随机抽取一部分有代表性的样本进行研究,抽样研究的目的是通过用样本资料计算的指标去推论总体。
3.统计描述:用统计图表或计算统计指标的方法表达一个特定群体(这个群体可以是总体也可以是样本)的某种现象或特征,称统计描述。
4.统计推断:根据样本资料的特性对总体的特性作估计或推论的方法称统计推断,常用方法是参数估计和假设检验。
5.均数:是反映计量资料全部观察值平均水平的统计指标,适用于对称分布尤其是正态分布资料,公式如下:
6.标准差:是反映计量资料全部观察值离散程度的统计指标,用于描述对称分布资料,尤其正态分布资料的离散趋势,公式如下:
7.标准正态变换:将服从正态分布的原始变量x~n(μ,σ)进行变量变换,这种变换叫标准正态变换(或M变换)。
8.构成比:又称构成指标,它表示事物内部各组成部分所占的比重或分布。
9.动态数列:是一系列按时间顺序排列起来的统计指标,包括绝对数、相对数或平均数,用以说明事物在时间上的变化和发展趋势。计指标,它是对资料进行统计描述时的一种常用手段。(如点、线、面或立体)显示数据的大小、升降、分布以及关系等,它也是对资料进行统计描述时的一种常用手段。
12.抽样误差:在同一总体中随机抽取样本含量相同的若干样本时,样本指标之间的差异以及样本指标与总体指标的差异,称为抽样误差。
13.均数的抽样误差:在同一总体中随机抽取样本含量相同的若干样本时,样本指标之间的差异以及样本指标与总体指标的差异,称为抽样误差。统计学上,对于抽样过程中产生的同一总体中均数之间的差异称为均数的抽样误差。
14.率的抽样误差:在同一总体中随机抽取样本含量相同的若干样本时,样本指标之间的差异以及样本指标与总体指标的差异,称为抽样误差。统计学上,对于抽样过程中产生的同一总体中率之间的差异称为率的抽样误差。
15.检验水准:也称为显著性水准,符号为α。α是预先规定的概率值,通常取0.05,它是“是否拒绝H。的界限”。16.可比性:是指除了处理因素外,其他可能影响结果的非处理因素在各组间应该尽可能相同或相近,即“齐同”。17.检验效能:检验效能又称为把握度(1一β)。它的含义是:当两总体确实有差别时,按规定的检验水准α,能够发现两总体间差别的能力。
18.四格表资料:两个样本率的资料又称为四格表资料,在四格表资料中两个样本的实际发生频数和实际未发生频数
为基本数据,其他数据均可由这四个基本数据推算出来。
19.列联表资料:对同一样本资料按其两个无序分类变量(行变量和列变量)归纳成双向交叉排列的统计表,其行变量可分为R类,列变量可分为C类,这种表称为R×C列联表。
20.参数检验:参数检验是一种要求样本来自总体分布型是已知的(如正态分布),在这种假设的基础上,对总体参数(如总体均数)进行统计推断的假设检验。
21.非参数检验:非参数检验是一种不依赖总体分布类型,也不对总体参数(如总体均数)进行统计推断的假设检验。
22.秩次:秩次即通常意义上的序号。实际上就是将观察值按顺序由小到大排列,并用序号代替了变量值本身。
23.直线相关系数:它是说明具有直线关系的两个变量间,相关关系的密切程度与相关方向的统计指标。相关系数没有
单位,取值范围是-1≤r≤1,r的绝对值越大表明两变量的关系越密切。
24.直线回归系数:它是直线回归方程的重要参数之一,即回归直线的斜率。当b>0时,表示直线由左下方走向右上方,y随x增大而增大。回归系数b的统计学意义是x每增加(或减少)一个单位时,y平均改变b个单位。
25.正相关:它是说明具有直线关系的两个变量间,存在有正的相关方向,即当x增大时,y有相应增大的趋势,所算得的相关系数r为正值。
26.完全负相关:这是一种极为特殊的负相关关系,从散点图上可以看出,由X与y构成的散点完全分布在一条直线上,x增加,y相应减少,算得的相关系数r=-1。
27.等级相关:是对等级数据作相关分析,它又称为秩相关,是一种非参数统计方法。
28.评价:所谓评价,是通过对照某些标准来判断观测结果,并赋予这种结果以一定的意义和价值的过程。
29:所谓的综合评价,是指人们根据不同的评价目的,选择相应的评价形式,据此选择多个因素或指标,并通过一定的数学模型,将多个评价因素或指标转化为能反映评价对象总体特征的信息。
30.综合评分法:综合评分法是在以专家评分法作为权重估计的基础上而建立的一种综合评价方法。
31.为了比较某几个事物或方案的优劣,在选定各项评价指标后,将待评价的对象或方案就各项评价指标的测量值大小分别排序,并分别对各序号(等级)以相应的评分值即优序数,然后综合诸评价指标,分别计算评价对象的总赋优序数,并按总赋优序数大小评定其优劣顺序的方法即优序法。
32.Topsis Topsis法常用于系统工程中有限方案多目标决策分析,此外,也可用于效益评价、卫生决策和卫生事业管理等多领域。
33.层次分析法:用层次分析法作系统分析,首先需要把问题层次化,根据问题的性质和评价目的,将问题分解为不同的组成因素,得到各层的评价指标,并以最下层的评价目标作为衡量目标达到程度的评价指标。然后依据这些指标计算出综合评分指数,对评价对象的总评价目标进行评价,最后依其大小来确定评价对象的优劣等级。
34.发病率:发病率是指一定时期(年、季、月)内,可能发生某病的人群中实际发生某病新病例的频率。
35.时点患病率:时点患病率:指在某时点检查时,接受检查的人群中现患病例所占的比例,分子为新老病人数,又称现患率或流行率。
36.某病病死率:某病病死率:表示在规定的观察期间内,某病患者中因该病而死亡的频率。
37某病死亡率是一定时期内某人群因某病而死亡的频率。
38.卫生服务调查统计:1.卫生服务调查统计是卫生统计的主要内容之一,卫生服务调查统计是从卫生服务资料的设计、收集,整理、分析的角度,来阐述卫生服务研究的特点、研究方法和注意事
项,以便使卫生服务研究工作更具有科学性。
39.卫生服务调查:卫生服务调查是指对卫生服务状况、人群健康的危险因素、人群卫生服务的需求和利用、卫生服务资源的分配和利用所进行的一种社会调查。
40.调查表:把调查项目按调查时提问的逻辑顺序列成表格就是调查表,调查表又称调查问卷。
41.卫生服务需要:卫生服务需要是指人们因疾病影响健康,引起人体正常活动的障碍,实际应当接受各种卫生服务的需要(如预防保健、治疗、康复)。
42.两周患病率 :两周患病率指在每千名被调查者的居民中,在调查日之前两周之内患病的人数。
43.两周就诊率:两周就诊率指每千名被调查的居民中,在调查之日前两周内因病、伤去医疗机构就诊的人(次)数。
44.住院分娩率 :住院分娩率某年某地每百名活产中在县级或县级以上医院接受住院分娩的产妇数。45.卫生资源:卫生资源是指卫生人力,卫生费用、卫生设施和设备、卫生技术和卫生信息。
二、简答题
1.卫生事业管理专业与卫生统计学的关系是什么。卫生事业管理的研究对象也存在许多不确定性,因此,要利用卫生统计这个有效工具,充分发挥卫生统计的信息、咨询、监督的整体功能,为满足决策管理和卫生服务研究的需要。
2样本是从总体中随机抽取的一部分有代表性的个体组成,除了数量比总体少,其他构成均与总体一样,是总体具体而微的缩影。
3.收集资料时,对统计资料的要求是什么? 要做到①资料必须完整、正确和及时;②要有足够的数量;③注意资料的代表性和可比性。
4.标准正态曲线下横轴上下侧尾部面积为O.5 %、2.5%、5%时所对应的u值?标准正态曲线下横轴上下侧尾部面
积的0.5%、2.5%、5%时所对应的u值分别为-2.58、-1.96、-1.64。
5.了解正态曲线下面积分布规律有何用处?根据正态曲线下面积的分布规律,可以估计观察值的频数分布情况,通常用于估计95%的观察值所在范围和99%的观察值所在范围,临床医学常用以估计医学参考值范围。
6.正态分布有哪些参数?为什么说正态分布是很重要的连续性分布?总体均数卢和总体标准差a被称为正态分布参数。卢为位置参数,它描述了正态分布集中趋势的位置;a为变异度参数,反映正态分布的离散程度。若已知某数值变量服从正态分布或近似正态分布,如同年龄、同性别儿童及同性别健康成人身高、体重等,可按正态分布的规律估计其个体变量值所在范围,如95%的医学参考值的估计。同时正态分布是很多统计分析方法的基础。
7.应用相对数时有哪些注意事项?(1)构成比与率是意义不同的两个统计指标,应用时不能相互混淆。构成比说明事物内部各组成部分所占的比重,而率则说明某事物或现象的发生频率或强度,不能以构成比代替率来说明问题。(2)样本含量太小时,不宜计算相对数,最好用绝对数来表示。(3)对各组观察例数不等的几个率,不能直接相加求其总率。(4)在比较相对数时应注意资料的可比性。
8.率的标准化法的基本思想?直接标化法需要的条件是什么?当不同人群的总率进行比较时,若其人群的内部构成(如年龄、性别、病情轻重等)存在差异,而年龄、性别等因素对率有影响。为消除构成的影响,要按照统一标准构成对两个人群进行校正,使两个人群构成一致。这种选择统一构成,然后计算标准化率的方法称为率的标准化法。直接法计算标化率需下面2个条件:(1)资料条件:已知实际人群的年龄别(组)率,且各年龄组率无明显交叉。(2)选择标准:可选择标准人群的年龄组人口数或构成比。
10.统计表和统计图在表达资料中有何特殊作用?统计表和统计图是我们分
析、对比事物的重要工具,统计图表的合理采用可以使资料得以准确表达,使人印象深刻和一目了然,便于资料的计算、分析和对比。
11.绘制统计表的基本原则是什么?绘制统计表有两个基本原则是:1)一张表只能有一个中心,要说明什么问题,应该十分明确;2)横纵标目的排列要合理,主谓分明。
12.绘制统计表的基本要求是什么?①标题不可缺少,要求用一句简明扼要的话来说明表的内容,写在表的上方;②横纵标目的设计要符合逻辑,主谓分明,标目的文字应简明,有单位的要注明;③线条同样应力求简 洁,除基本线条外,应尽量减少其他不必要的线条;④数字应准确无误,要求一律采用阿拉伯数字表示,同一指标的数字的小数位数应一致,位次对齐,表中不宜留空项;⑤备注一般不列入表 内,而写在表的下方。
13.绘制统计图有哪些总要求?①要根据资料的性质以及分析目的,选择合适的图形;②统计图要有标题,要求能简明扼要的说明图的内容,一般写在图体下方的中央位置;③对于有横纵坐标轴的图形,要说明横纵轴分别代表的事物的名称,并标注单位。横纵轴的长度比例通常为7:5;④在同一张图内比较不同事物时,要用不同颜色或线条区别它们,并附图例说明,图例的摆放位置要与图体协调。
15.普通线图与半对数线图在绘制方法上的主要区别是什么?普通线图与半对数线图都是有横纵坐标轴的图形,在绘制普通线图时,横纵轴均采用普通算术尺度,而绘制半对数线图时,横轴为算术尺度,纵轴为对数尺度。17.t分布与u分布有何联系? t分布曲线是一簇曲线,随自由度υ不同,曲线的形状不同。当自由度υ很大,即n很大时,t分布近似u分布。
18.t分布的特征是什么?t分布的特征:①以0为中心,左右对称的单峰分布。②自由度υ=n一1越小,曲线变得越低平,尾部翘得越高;③随着自由度υ逐渐增大时,t分布逐渐逼近标准正态分布;
当υ趋于∞时,t分布就完全成为标准正态分布。
19.如何理解可信区间的意义?用 x±1.96s x、x±2.58s x及p±1.96S、p±2.58s计算的结果各说明什么问题?总体参数的所在范围通常称为参数的可信区间或置信区间,即该区间以一定的概率(如95%或99%)包含总体参数。x±1.96s x与x±2.58s x适用于σ未知但n足够大时(n>50)总体均数的区间估计,x±1.96s x表示总体均数有95%的概率落在此范围内;x±2.58s x表示总体均数有99%的概率落在此范围内。p±1.96sp郎与p±2.58sp,适用于n足够大,且np与n(1一p)均大于5时总体率的区间估计,p±1.96sp表示总体率有95%的概率落在此范围内;p±2.58sp表示总体率有99%的概率落在此范围内。
21.为什么要做假设检验?假设检验可以回答什么问题?假设检验的目的是通过样本推断总体,即通过两个样本均数的比较来判断
两个总体均数是否相等(以完全随机设计类型为例)。通过假设检验,可以回答两个样本均数的差异是由于抽样误差造成,还是由于两个总体均数不相等造成。
22.t检验和甜检验有何区别与联系? t检验与“检验的适用条件不同。t检验的适用条件:当总体标准差σ未知,样本含量n较小(n≤50)时,理论上要求样本来自正态分布的总体。完全随机设计的两个小样本均数比较时还要求两总体方差相等。甜检验的适用条件:当总体标准差一未知,但样本含量咒较大(一般n>50)或总体标准差口已知时,选用“检验。
23.t检验,P<0.001,是否能说明两总体均数之间差别很大,为什么? t检验,P<0.001,说明差别有统计学意义,可以认为两个总体均数不同;但是假设检验的结论不能直接回答差异的大小,“差别有统计学意义”并不意味着两个总体均数相差很大。差别的大小及差别有无实际意义只能进一步根据专业知识来确定。例
如:当样本量足够大时,即使两个样本均数间相差很小也可能得出P≤0.05,此时差别虽有统计学意义,但不一定有实际意义。
24.怎样正确使用单侧检验与双侧检验?应该根据专业知识来确定选择单侧检验或双侧检验。如果从专业知识的角度,判断一种方法的结果不可能低于或高于另一种方法的结果,则可以采用单侧检验。在不能根据专业知识判断两种结果谁高谁低时,则用双侧检验。
25.假设检验的结论为什么不能绝对化?假设检验的结论不能绝对化,因为无论拒绝H。或不拒绝H。,假设检验的结论都有犯错误的可能。假设检验通常可能发生下面两类错误。I型错误:拒绝了实际上成立的H。.犯I型错误的概率是α,α通常为0.05。Ⅱ型错误:接受了实际上是不成立的H。.犯Ⅱ型错误的概率是β,一般情况下β的大小是未知的。
26.完全随机设计的两样本均数比较的t检验与方差分析之间的关系如何?两个样本均数比较可以看作为多个样本均数比较的特例,因此完全随机设计的两个样本均数比较的t检验,可以用完全随机设计的方差分析代替。两者的计算结果有如下关系:。反之,则不成立,即多个样本均数比较的方法,应该用方差分析,而不能用两个样本均数比较的t检验代替,否则会增大犯工型错误的概率。
27.(体标准差σ未知),可以考虑用哪几种方法?可以考虑三种方法:完全随机设计的t检验和“检验以及完全随机设计的单因素方差分析。
28.请简述方差分析的基本思想。方差分析的基本思想就是将总变异分解成两个或多个部分。除随机误差外,其余每个部分的变异可以由某因素的作用来解释,通过比较可能由某因素所致的变异与随机误差的均方,由F检验作出统计推断,从而了解该因素有无作用。
29、率的u检验和x2检验应用有何异同?率的u检验主要用于:(1)一个样本率和一个总体率的比较。(2)两个样本率的比较。应用条件见相应的章节。x2检验应用更为广泛,可用于:(1)两个样本
率的比较。(2)多个样本率或构成比的比较。(3)列联表资料两个变量间关系的独立性检验。(4)配对计数资料差别的检验。(5)频数分布拟合优度的检验(参见有关统计学专著)。对于两个样本率的比较,样本量较大时,用 x2检验和u检验所得的统计结论一致,且u2= x2。
30、四格表资料x2检验的适用条件?四格表资料x2检验的适用条件:(1)当n>40,且所有T≥5时,用x2检验的基本公式或四格表专用公式。(2)当n>40,但有1 31、行×列表资料二般包括哪些资料,它们的检验目的有何不同?行×列表资料一般包括多个样本率、多个构成比资料,其基本数据可整理成尺行C列,称为R×C表,又称行×列表。多个样本率或构成比x2检验目的是推断其总体率或构成比是否不同。对同一样本资料按其两个无序分类变量(行变量和列变量)归纳成双向交叉排列的统计表,其行变量可分为 R类,列变量可分为C类,这种表称为R×C列联表。列联表资料x2检验的目的是推断两变量(行变量、列变量)之间分布是否相互独立,用列联表的独立性x2检验。尽管这两种行×列表检验目的和检验假设方面有所不同,但计算x2值和自由度的公式完全相同。 32、作多个样本率或多组构成比资料比较的x2检验,下结论时应注意什么?作多个样本率或多组构成比资料比较的x2检验,其结论若是拒绝H。(P≤0.05),只能认为各总体率之间(各总体构成比)总的说来有差别,但不能说明各两组率(或各两组构成比)之间均有差别。 33.非参数检验与参数检验的区别何在?各有何优缺点?区别在于:①参数检验要求样本来自正态总体,而非参数检验则不对总体分布有任何要求;②参数检验是对总体参数(如总体均数)进行的检验,而非参数检验考察的是总体的分布情况。参数检验的优点是能充分利用所提供的信息,检验效率较高。缺点是对样本所对应的总体分布有比较严格的要求,因此适用 资料有限。非参数检验的优点是不受总体分布类型的限制,适用于任何分布的资料。其缺点是不直接对原始数据作检验,从而有可能会损失信息并降低其检验效率。 34.秩和检验适用哪些情况?⑴秩和检验不受总体分布类型的限制,适用于偏态分布或分布类型不清的资料。⑵秩和检验是将原始数据转化为秩次来研究的,适用于不能准确测量,只能以严重程度、优劣等级、次序先后表示的等级资料;或者末端无确定值,如“>50mg”等资料。⑶它对样本例数没有要求,适用于小样本资料。 35.假如对同一批资料。用参数检验和非参数检验所得结果不一致时,宜以何者为准。对同一批资料,在资料满足参数检验条件的前提下,参数检验的检验效率高于非参数检验。因此当两者所得结果不一致时,宜以参数检验结果为准。若资料是严重偏态分布,则非参数检验的检验效率不一定比参数检验低,此时需要结合资料的实际情况,综合予以考虑。36.直线相关与回归分析对资料的要求是什么?直线相关与回归分析要求所处理的资料为双变量资料,即对同一名研究对象要求同时测量x、y两个数值变量,并且x、y还应服从双变量正态分布。 37.直线相关分析中散点图与相关系数r的关系如何?由散点图可以知道相关系数r的正负,此外根据散点排列的疏密程度能够粗略地对两变量的相关密切程度做出判断。 38.比较直线相关分析与直线回归分析的研究目的有何不同?直线相关分析的分析目的是:(1)首先研究两变量间有无直线相关关系,即x变化时y是否有相应改变;(2)如果有相关,则进一步回答相关的方向,即当x增大,y的变化趋势是增加还是减小,以及两者的相关密切程度有多大的问题。直线回归分析的研究目的则是通过建立直线回归方程,定量地描述并分析两变量间的线性依存关系,即用x估计y。 39.为什么计算得到的相关系数r和回归系数6都要做显著性检验?由于r 与b都是根据样本资料求得的,而在由变量x与y组成的总体中作随机抽样,获取样本的过程中,不可避免地会存在有抽样误差。因此当算得的r或b不为零时,有可能实际情况是x与y之问是不相关或不存在直线回归关系的,只是由于抽样误差,r与b才会不为零。作显著性检验的目的正是对这种情况作出判断,看r或b是否确实由总体相关系数ρ或总体回归系数β不为零的总体中抽得。 40.统计中的回归关系与数学上的函数关系有何区别?数学上的函数关系式y=a+bx,是表示变量x与y是严格意义上的一一对应关系。每一个x值,都会有一个确定并且唯一的y值与之相对应。在坐标系中,所有的点(x,y)形成一条直线。而统计中的回归式,其因变量是y的估计值,它的数值大小与实际的y值是存在一定差距的。从散点图来看,所有的点(x,y)不会全部落在回归直线上,而只能是围绕其较均匀地分布。 41.直线回归分析时怎样确定自变量和应变量?通常我们都是选取一个容易测 量的变量值作为自变量x,来估计另一个难测量的变量值(y)。与直线相关分析不同,自变量和应变量的如何确定是非常关键的,因为它将会影响到最终怎样解释直线回归方程的意义。 42.请总结直线相关系数 r与直线回归系数b的意义及特点?直线相关系数r是说明具有直线关系的两个变量间,相关关系的密切程度与相关方向的统计指标。总体相关系数用ID表示,样本相关系数用r表示,r是ID的估计值。相关系数没有单位,取值范围是-1≤r≤1。r值为正,表示两变量呈正相关,X与y变化趋势是正向的。r值为负,表示两变量呈负相关,X与y呈反向变化,通常r的绝对值越大,表示两变量相关关系越密切。直线回归系数b即回归直线的斜率,b>0表示直线从左下方走向右上方,y随x增大而增大;b<0表示直线从左上方走向右下方,y随x增大而减小;b=0则直线与x轴平行,x与y无直线关系。b的统计学意义是x每增加(减)一个单位,y平均改变x个单位。 43.直线相关与直线回归分析有何联系与区别? ⑴区别:如果作直线相关分析,是要看两变量之间的相关关系如何,当X值增大,Y值随之增大还是减小。而若想了解两变量之间的依存关系,即由自变量X来估计因变量Y,则要进行直线回归分析。相关分析时,无论是将哪个作为自变量X或Y,算得的相关系数的数值相等。但是回归分析时,则必须要求利用自身的专业知识事先将自变量X和因变量Y确定好,再建立直线回归方程,否则将很难参回归系数b值作出正确解释。⑵联系:对同一批资料,相关系数r为正(或负)则b为正(或负),均表示X与Y呈同向(或反向)变化。对同一批资料,相关系数r与回归系数b显著性检验结果是等价的,有tr=tb的关系。 44.应用直线相关与回归分析时应注意哪些问题? ⑴作相关与回归分析要有实际意义。⑵在医学中,许多现象之间都存在相互联系,为此我们引入相关与回归的统计分析方法。⑶作相关分析时还应注意以下两点:⑴在求出相关系数r的值的同时,应作假设检验。⑵两变量相关的密切程度,是根据相关系数的大小来判定的。⑷概率P值的理解。⑸直线回归的适用范围一般以自变量取值范围为限,其分析的结果不能随意外推,即不能随意地将超过自变量取值范围的变量值X代入回归方程求Y值。 45.为什么要做综合评价?所谓评价,是通过对照某些标准来判断观测结果,并赋予这种结果以一定的意义和价值的过程。单一因素的评价较易于实现。只要分别依据该因素给研究对象一个评价等级或分数,依等级或分数高低,便可排出优劣顺序;但是,在现实生活中和医疗卫生实际工作中,由于复杂的条件和状况的影响,必须综合考察多个有关因素,依据多个有关指标进行评价,排出优劣顺序,这就是综合评价过程。 46.为什么要对评价指标进行权重估计?在利用挑选出来的评价指标建立评估模型时,还应当考虑各指标对评价结果的影响大小,即各个评价指标在评价模型中的权重问题,就是说各指标的重要程度,因此要对评价指标进行权重估计。 47.层次分析法与其他三种方法在资料形式上有何不同?在社会、经济以及科学管理领域,人们常面临由相互关联、相互制约的众多因素构成的复杂系统,对于这类由多层因素组成的复杂的资料,用一般的综合分析方法显得无能为力。20世纪70年代出现的层次分析法为分析这类复杂的问题提供了一种新的、简洁并且实用方法。 48.请对四种综合评价方法进行比较它们的各自特点是什么?综合评分法是在专家进行指标权重估计的基础上对所有待评方案在每一个评价指标计算其得分,然后累加总分后进行分析和评价的方法。本法对样本数据无特殊要求。优序法的特点是把所有待评价方案按照相同评价指标进行单指标排序,并按特定赋值原则给予优序数,最后综合所有评价指标,并分别计算各方案的总优序数,然后再进行分析评价的方法。本法对样本数据无特殊要求。Topiis法是基于归一化的数据矩阵,计算待评方案中的最优和最劣方案的最优值向量和最劣值向量,通过计算待评价方案与最优和最劣方案的距离,获得各评价方案与最优方案的接近程度,最终达到评价的目的。本法对数据无特殊要求。层次分析法的特点是把评价目标分解为不同层次的目标,对原始资料按不同层次建立目标树图,并根据经验对各层子目标的重要程度做两两对比打分,用计算得到的各层子目标的权重系数计算组合权重,最后用累加法等方法计算加权总分并进行综合评价。 50.某病病死率和某病死亡率的区别。某病病死率表示在规定的观察期间内,某病患者中因该病而死亡的频率;某病死亡率表示一定时期内某人群因某病而死亡的频率。病死率常用来说明某疾病对病人生命的威胁程度,它常受疾病的严重程度及医疗水平的影响,一般用百分率表示。某病死亡率反映了某种疾病对居民生命的危害程度,一般用10万分率表示。 51.疾病的统计对象有哪些?疾病的统计对象有①门诊疾病的统计对象:指患 者去医疗机构就诊,并经医师诊断为患病者。②住院疾病的统计对象:诊断为有病的住院病人。③疾病调查的研究对象:与门诊和住院疾病的统计对象不同,疾病调查常以特定人群(包括健康人和病人)作为研究对象,探讨疾病在人群中的分布。应根据调查目的确定观察对象。并根据研究目的确定研究的疾病及诊断方法和诊断标准。 52.疾病的统计单位有哪些?什么是新发病例和现患病例?有“病人”和“病例”的不同统计单位。新发(生)病例:指在观察期间(通常为一年内)新发生的疾病,以第一次诊断为准。一些急性病,在观察期间内发病,在此期间内治愈,愈后又发生同一种病,则算作2个新病例。现患病例:疾病调查或健康检查时的现患病例,是指在调查时点或调查期间(一般很短的期间)内的检查出的疾病,包括在此之前发生而未愈的病例及本次现的病例调查新发。 53.什么是国际疾病分类?有什么用途?国际疾病分类(International Classification of Diseases,ICD)是将有关疾病与其他健康问题的医学描述与诊断,转化为由字母数字所组成的编码,该编码已成为国际公认的疾病统计标准分类。主要用途①使用国际疾病分类便于信息贮存、统计分析。②不同国家、不同地区或相同国家、地区的不同医院之间按照这一国际标准,对疾病、损伤中毒和死亡原因等健康问题进行编码与分类,获得的疾病与死因统计资料可以相互比较。 54.什么是根本死因?为什么死因统计要选择根本死因?WHO规定,根本死因是指:“(a)引起直接导致死亡的一系列病态事件的那些疾病或损伤,或者(b)造成致命损伤的事故或暴力的情况”。制定根本死因的想法是从预防死亡的角度出发,去寻找带有根本性的、引起一系列疾病并最终导致死亡的那个原因,不管它发生在死前多长时间都应给予记录。根本死因可以是一个明确的疾病诊断,可以是一个无明确诊断的医学情况(如:症状、体征、临床表现),也可以是一个意外的损伤和中毒。 56.卫生服务调查资料的来源有哪些?卫生服务调查资料的来源同一般的统计资料来源相同,主要来自常规报表、卡、册和专题调查,从卫生服务供需的两方面考虑,卫生服务调查资料的来源主要包括卫生机构调查和家庭卫生询问调查。 57.描述性调查和分析性调查需要的资料有何不同?描述性卫生服务调查旨在掌握卫生服务的现状与历史,并用文字、数字描述疾病、健康的基本情况。通过对健康的现状和历史的描述,还可对近期、远期的卫生服务状况及其变动趋势进行预测。分析性卫生服务调查是对卫生服务状况的原因进行探讨。描述性调查回答了某问题是什么样的,即它的状态;分析性调查则回答了该问题为什么是这样的,即它的原因。分析性调查主要探讨事物及其现象间的内在联系,通过对大量现象的观察,从总趋势中分析出事物之间的系及其联系程度。 59.家庭卫生服务调查中常用抽样方法有哪些?常用的抽样方法有单纯随机抽样、整群抽样、系统抽样和分层抽样。 发展中国家大多数采用整群抽样和系统抽样,发达国家多采用分层随机抽样方法或多阶段随机抽样方法。 60.在调查表的内容设计上应注意哪些?在调查表的内容设计上必须注意以下几点:(1)符合研究目的的需要,指标不宜设置得太多或太少。(2)针对所研究事物的性质选择合适的问卷,以免收集的资料不完整或存在偏倚。(3)应避免项目含糊不清。(4)不要涉及社会禁忌与爱好,如正面提问敏感的道德问题或个人隐私等,这样就无法得到准确的回答。(5)不应有暗示作用,暗示会诱导被调查者趋向于某种答案。(6)不要超出被调查者的知识和能力,概念不要太抽象、太笼统。62.静态人口统计都有哪些指标,分别用来说明什么问题?静态人El统计的常用指标有人口总数、性别比、年龄中位数、老年人口系数、少年儿童人口系数、老少化、负担系数、人口金字塔。其中人口总数用来说明一个国家或地区的人口规模;性别比说明人口的性别特征,计算不同年龄段的性别比较有意义;年龄构成指标说明人口所占比例,用于反映人口类型。人口金字塔将人口的性别和年龄资料结合起来,形象直观地反映现有男女性别人口的年龄构成,而且也可以分析过去人El的出生死亡情况以及今后人口的发展趋势。 64.总和生育率是如何计算的?为什么是测量生育水平较理想的指标?年龄分组为5岁一组时,则年龄别生育率之和再乘5,即得总和生育率。表示每1000名妇女一生平均生多少个孩子,或每个妇女一生平均生多少个孩子。总和生育率是用某年横断面的年龄别生育率资料计算的,因此消除了人口的年龄性别构成对生育水平的影响,不同时间、不同地区的总和生育率可以直接进行比较。 66.什么是寿命表,其最大优点是什么?寿命表是根据某一人群的年龄组死亡率编制出来的,说明人群生命过程及死亡过程的 一种统计表。其优点是寿命表中的各项统计指标不受人口年龄结构的影响,不同地区或时期 的寿命表指标可以直接比较。 67.寿命表的基本思想是什么?其基本思想是假定有同时出生的一代人,按照某个时期当地人口实际年龄组死亡率而陆续死亡,用寿命表方法计算出一系列统计指标,其中尚存人数(lx)、死亡人数(ndx)、死亡概率(nqx)及平均预期寿命(ex)是主要寿命表指标。 68.现时寿命表和定群寿命表的主要区别是什么?主要区别为现实寿命表是用某一时间的横断面资料进行编制。按五岁或十岁一组计算出来的寿命表称简略寿命表。定群寿命表是用纵向随访资料进行编制。 69.编制简略寿命表必须具备哪些原始资料?原始资料中的哪些问题可能影响寿命表指标的准确性?编制简略寿命表必须有分性别、年龄组的平均人口数和死亡数,或分性别、年龄组死亡率资料,这些都是来自某时某地人口及死亡统计的实际资料。在此基础上再用假定的10万人去计算一系列的寿命表指标。我国在收集人口出生、死亡资料过程中,很多地方存在的问题是新生儿出生与死亡数字的漏 报,对计算婴儿死亡率的影响较大,进而影响到寿命表指标的准确性。 70.哪两个指标在寿命表编制中起到重要和关键的作用?为什么? nmx和nqx,因为简略寿命表中的年龄组死亡率是根据原始资料中某年龄组的死亡人数和该年龄组的平均人口数计算的,是编制寿命表的基础,而死亡概率又是计算其他寿命表指标的关键。 71.去死因寿命表的基本原理是什么?其用途是什么?其基本原理是:先编制消除某病死亡后的寿命表,计算其平均预期寿命。然后,和全死因的平均预期寿命,即用简略寿命表计算的未消除该死因的平均预期寿命相比,通过两表的寿命(以)差数来说明该病对居民生命的危害程度。其作用是求得消除某种死因后的平均预期寿命的增量,综合说明某种死因对人类寿命的影响。