统计学考试知识点总结[小编整理]

时间:2019-05-11 23:02:17下载本文作者:会员上传
简介:写写帮文库小编为你整理了多篇相关的《统计学考试知识点总结》,但愿对你工作学习有帮助,当然你在写写帮文库还可以找到更多《统计学考试知识点总结》。

第一篇:统计学考试知识点总结

第一章

统计这个概念,其实包括三种不同而又密切相关的涵义:即统计资料、统计工作和统计学 统计资料:是反映被调查研究的客观事物及其过程的数字资料以及与之相关的文字资料、图表资料等

统计工作 即统计实践活动,是人们利用各种科学的统计方法,搜集、整理、分析和提供统计资料工作的总称。

统计学 统计学是研究如何测定、收集、整理、归纳和分析反映客观现象总体数量的数据,以便给出正确认识结论的方法论科学。

统计学的研究对象

1.广义:社会经济、自然领域总体的数量方面

2.狭义:研究大量社会经济现象的总体数量方面,即社会经济现象的数量特征、数量关系、数量界限。

统计的研究对象是社会经济现象总体的数量特征和数量关系,其根本特征是在质与量的辨证统一中研究大量社会经济现象总体的数量方面,反映社会现象发展变化的规律性在具体时间地点和条件下的数量表现,揭示事物的本质、相互联系、变动规律和发展趋势。

统计学研究的基本方法:

1、大量观察法:对要研究事物的全部或足够数量进行观察的方法。

2、统计分组法:是根据一定的研究目的和现象的总体特征,将调查得到的大量资料,按照一定的标志划分为不同性质或类型的组别,使组内的单位具有相对的同质性,组间的单位具有明显的差异性。

适用于统计工作的全过程。

3、综合指标法 即用统计指标去概括和分析现象总体的数量特征和数量关系的方法。

总体的前提条件:总体的同质性。

4统计模型法

5、抽样推断法

6、指数法

7、时间数列分析法

8、相关分析法、图表法

对比分析法

描述统计学 指对采集的数据进行登记、审核、整理、归类.在此基础上进一步计算出各种能反映总体数量特征的综合指标,并用图表的形式表示经过归纳分析而得到的各种有用的统计信息。

内容 :搜集数据、整理数据、展示数据

目的:描述数据特征、找出数据的基本规律 推断统计学是在对样本数据进行描述的基础上,利用一定的方法根据样本数据去估计或检验总体的数量特征。

内容:抽样推断、假设检验 目的:对总体特征作出推断

总体:它是由客观存在的、具有某种共同性质的许多个别事物构成的整体。

总体的特征:同质性、大量性、差异性

总体单位:(简称单位)是组成总体的各个个体。总体和总体单位的关系:两者是相对而言的,随着研究目的和总体范围的不同而相互转化。同一个研究对象,在—种情况下为总体,但在另一种情况下又可能变成总体单位。

例如,研究全国各省的人口情况时,全国为总体,各省为总体单位;而当要研究某省各县人口状况时,则该省就变成了总体,各县又成了总体单位

抽取样本时应注意的问题

1、样本的单位必须取自同一总体

2、样本个数的多少和样本所包含的单位数量与抽样方法有关。

3、样本的抽取必须排除主观因素的影响

4、样本去推断总体的特征总是存在一定的误差。

样本容量:样本所包含的总体单位数 标志:说明总体单位特征的概念或名称

数量标志: 表明总体单位数量方面的特征,可以用数值来表现

品质标志:表明总体单位属性方面的特征,只能用文字、语言来描述

不变标志: 一个总体中各单位有关标志的具体表现都相同

可变标志:—个标志在总体各单位的具体表现不同

统计指标是反映统计总体数量特征的概念和数值

统计指标六要素:指标名称、指标数值、指标计量单位、计算方法、指标所属的时间和空间(时间限制、空间限制)

统计指标的特点(性质):数量性、综合性、具体性

指标的分类:按表现形式:总量指标、相对指标、平巨额指标

按其说明的总体现象的内容:数量指标、质量指标

按反应现象的时间状况:静态指标、动态指标

按数据取值的依据:客观指标、主管指标

变异:是指标志的不同表现。标志变异可分为属性变异和数量变异。

变量:在统计中,说明现象的某一数量特征的概念被称为变量。包括可变的数量标志和统计指标

变量值是指变量的具体数值表现 按变量值是否连续可分为:

①连续型变量:指其数值连续不断,在相邻的两个值之间可以无穷分割,可以用小数表示,也可以用整数表示。如:工业总产值、身高等。

②离散型变量:可按一定顺序一一列举其数值的变量。变量值只能表现为整数。

如工厂数、工人数等。

按变量值取值是否确定可分为:

①确定性变量:是指变量值的变化受某种或某几种确定性因素的影响,其变化是沿着一定的方向呈上升或下降的变动。例,人口的预期寿命。

②随机性变量:是指变量值的变化受某种或某几种不确定性因素的影响,其变化不是沿着一定的方向发展,而是带有很大的偶然性。例零件的尺寸误差。

第二章

统计调查:是按照预定的统计研究的目的和任务,运用科学的调查方法与手段,有计划有组织地从客观实际采集数据的过程。

统计调查的主要是原始资料,同时也包括对次级资料的搜集。

原始资料是指说明总体单位特征的资料;次级资料是指已经经过加工整理,由个体过渡到总体,能够在一定程度上说明所研究总体的统计资料。对统计调查的要求

1.准确性—搜集的资料要符合客观实际情况。

2.及时性—时效性。及时上报各项统计资料以满足各种需要。

3.完整性—全面性。即在规定时间内对调查资料毫无遗漏地搜集起来。统计计量尺度通常可以分为四类:定类尺度、定序尺度、定距尺度、定比尺度

1、定类尺度是最粗略、计量层次最低的计量尺度,它是按照客观现象的某

种属性对其进行分类。

2、定序尺度是对客观现象各类之间的等级差或顺序差的一种测度

3、定距尺度是对现象类别或次序之间间距的测度。不但可以用数字表示现象各类别的不同和顺序大小的差异,而且可以用确切的数值反映现象之间在量方面的差异。

4、定比尺度是在定距尺度的基础上,确定相应的比较基数.然后将两种相关的数加

以对比而形成的相对数(或平均数)统计调查的各种形式

按调查单位的范围大小分为:全面调查、非全面调查

按调查时间是否连续分为:经常性(连续)调查、不连续调查(一次性调查)按调查的组织方式不同分为:一般调查{定期调查}、专门调查—普查、重点调查、典型调查、抽样调查

统计调查的方法:直接观察法、采访法、报告法、问卷法、遥感技术法、实验法 统计调查方案 用来指导整个调查工作的纲领性文件,是统计设计在统计调查阶段的具体化

基本内容: ⒈确定调查目的和任务;

⒉确定调查对象与调查单位; ⒊确定调查项目 ;

4.调查表格和问卷设计;5.确定调查时间、调查期限、调查空间、调查方法;

6.调查的组织工作。

统计报表是按照国家有关法律的规定,自上而下的统一布置,自下而上地逐级定期提供基本统计资料的一种方式。

统计报表的种类

按填报单位:基本报表、综合报表

按调查范围:全面报表、非全面报表

按报送的周期长短:日报、旬报、月报、季报、半年报和年报

按报送方式:电讯报送报表、书面邮寄报表

按内容和实施范围:国家报表、部门报表和地方报表

普查: 专门组织的一次性全面调查。

普查应遵循的原则:

1、规定普查的标准时点

2、普查的期限要尽可能缩短

3、普查项目要统一规定

4、选择普查的时期要适当

重点调查

为了解总体基本情况,在调查对象中只选择一部分重点单位 进行调查的一种非全面调查组织方式

重点单位 通常是指那些标志值总量在全部单位标志总量中占据最大比重的单位。这些单位数目不多,但其标志值在总体标志总量中占有较大比重,能反映总体的基本情况

选择典型单位的注意事项:

1、要根据不同的调查目的和要求选择不同的典型

2、根据调查对象的不同特点来选择调查类型

关键:要保证所选的典型单位有充分的代表性

抽样调查

按照随机原则从总体中抽取一部分样本单位进行调查,再用样本资料

推断把握总体的数量特征的一种非全面调查组织方式

抽样调查特点:按随机原则抽取样本单位

目的是推断总体的数量特征(根据部分调查资料对总体的数量特征做出估计)

抽样误差可以事先计算并控制

优点:能用较少的人力、物力和时间达到全面调查的目的

调查资料的准确性较高、受人为干扰的可能性较小

第三章

统计分组

是指根据事物的特点和统计研究的目的,选择一定的分组标志将统计总体区分为若干性质不同的组成部分的统计研究方法。统计分组的原则

穷尽原则:就是使总体中的每一个单位都应有可归,或者说各分组的空间足以容纳总体中所有单位。

互斥原则:就是在特定的分组标志下,总体中的任何一个单位只能归

属于某一组,而不能同时或可能归属于几个组。

统计分组的作用:1·区分事物的类型:类型分组

2·反映总体内部结构:结构分组

3·研究现象之间的依存关系:分析分组 统计分组的种类:

1、按品质标志分组和按数量标志分组

2、简单分组和复合分组

分组标志的选择:

1、根据统计研究的目的选择分组标志

2、根据现象的本质特征选择分组标志

3、根据现象所处的历史条件选择分组标志

次数分布

在统计分组基础上,将总体所有单位按组归并排列,形成总体中各个在各组间的分布,称为次数分布。次数分布也称为次数分布数列。

变量数列的种类:单项式数列 指每个组值只用一个具体的变量值表现的数列

组距式数列 指每个组的变量值用一个区间来表现的变量数列 从表式上看,统计表是由纵横交叉的线条组成的一种表格,表格包括总标题、横行标题、纵栏标题和指标数值四个部分。

第四章

总量指标是反映现象在一定时间、地点条件下的总规模或总水平的统计指标,也称为绝对数指标,绝对量指标。

总量指标有两种表现形式:一是现象总体的总量。二是两个总量指标的差。总量指标的种类 一)、按总量指标反映现象总体内容不同分:

单位总量:指总体单位总数。

标志总量:指总体单位某一数量标志值的总和。

注意:对某一确定的总体而言,单位总量只有唯一的一个,但标志总量可以有多个。

单位总量和标志总量都是相对的,随着研究的目的而发生变化。

(二)按反映的时间状况不同,总量指标可分为

时期指标: 反映总体现象在某一段时期内所达到的总量。如:商品销售额、原煤产量…

时点指标:反映总体现象在某一时刻所达到的总量。如年末人口数,商品库

存量…

(三)、按计量单位不同,可分为

实物量指标

采用实物单位计量的绝对数指标 价值量指标

用货币单位计量的的绝对数指标

相对指标是两个有联系的统计指标进行对比计算的比值。也称为相对数。它从数量上反映事物在时间、空间、事物本身内部以及不同事物之间的联系程度和对比关系。

相对指标的类型:计划完成相对数、结构相对数、比例相对数、比较相对数、强度相对数、动态相对数

第五章

平均指标反映同质总体内各单位某一数量标志值一般水平的综合指标,即反映现象某一数量标志值的集中趋势值,称为平均指标,或均值。平均指标的特点

1.只有同质总体才可计算平均指标。

2.平均指标是质量指标。

3.平均指标是总体一般水平的代表值。平均数的分类

平均数根据其具体的代表意义和计算方式不同,可分为:

1、数值平均数:是以统计数列的所有各项数据来计算的平均数。其特点是统计数列中任何一项数据的变动,都会在一定程度上影响数值平均数的计算结果

包括:算数平均数、调和平均数、几何平均数

2、位置平均数:根据标志值某一特点位置来确定的平均数。它不是对统计数列中所有各项数据进行计算所得的结果,而是根据数列中处于特殊位置上的个别单位或部分单位的标志值来确定的。包括:众数、中位数

从按考核内容分: 静态平均数、动态平均数 算术平均数基本计算公式是:

总体标志总量/总体单位总量。算术平均数与强度相对指标的区别

1、概念不同。强度相对数是两个有联系而性质不同的总量指标对比而形成相对数指标。算术平均数是反映同质总体单位标志值一般水平的指标。

2、主要作用不同。强度相对数反映两不同总体现象形成的密度、强度、普遍程度。算术平均数反映同一现象在同一总体中的一般水平。

3、计算公式及内容不同。算术平均数分子、分母分别是同一总体的标志总量和总体单位数,分子、分母的元素具有一 一对应的关系,即分母每一个总体单位都在分子可找到与之对应的标志值,反之,分子每一个标志值都可以在分母中找到与之对应的总体单位。而强度相对数是两个总体现象之比,分子分母没有一 一对应关系。

(1)简单算术平均数 适用于未分组资料,用总体各单位标志值加总得到标志

总量除以总体单位总量而得。

计算公式为:

(2)加权算术平均数

①根据单项数列计算加权算术平均数

计算公式

X代表分组变量,f代表每组的次数

应用条件:单项式分组,各组次数不同。

权数 对平均数的大小起着权衡轻重的作用。平均数总是趋向于出现次数最多的哪个标志值

由比重权数计算加权算术平均数

应用条件:已知的是比重权数(频率)公式:

众数的含义: 总体中出现次数最多、频率最高的标志值。

用以代表现象的一般水平。

中位数的含义:将总体各单位按其标志值大小顺序排列起来居于中间位置的那个数就是中位数。

众数、中位数、和算术平均数和的关系

众数、中位数和算术平均数数量关系的经验公式为:算术平均数和众数的距离约等于算术平均数与中位数距离的三倍:

根据上述关系,可以从已知的两个平均指标推算另一个平均指标。

变异指标是用来反映总体分布的离散程度或变异状况的指标。

变异指标越大,表明总体各单位标志值的变异程度越大。它是反映总体各标志值间差异程度的,且能衡量总体平均数的代表性。

常见的变异指标有:极差、平均差、标准差、方差和变异系数。变异指标的作用

1、用于衡量平均指标的代表性

2、研究总体标志值分布偏离正态的情况。

3、可以反映社会生产和其它经济活动的均衡性和稳定性。

4、标志变异指标是科学地确定必要抽样单位数应考虑的因素。

第六章

时间数列

把反映现象发展水平的统计指标数值,按照时间先后顺序排列起来所形成的统计数列,又称时间序列,动态数列。

时间数列法是描绘社会经济现象发展变化过程的特有方法。

构成要素:现象所属的时间

反映现象发展水平的指标数值

时间数列的种类

按数列中所排列指标的表现形式不同分为:绝对数数列(包括时期数列、时点数

列)、相对数数列、平均数数列

时期数列 由反映一段时期内社会经济现象发展的总量或总和的绝对数所组成的时间数列。

时点数列

由反映一时点上社会经济现象所处的水平的绝对数所组成的时间数列

二者的区别:

1、各指标数值是否具有可加性

2、各指标数值大小是否与其时间长短直接相关。

3、各指标的数值的取得方式。是连续登记还是一次性登记。

编制时间数列的基本原则:

1、各期指标数值所属时间长短要统一

2、各期指标数值的总体范围要统一

3、各期指标数值的计算口径要统一(包括计算方法、计算价格、计量单位)

4、各期指标数值的经济内容要统一平均发展水平又叫序时平均数,是把时间数列中各期指标数值加以平均而求得的平均数

长期趋势指现象在较长时期内受某种根本性因素影响而形成的总的变动趋势。

是由现象内在的根本性的、本质因素决定的,支配着现象沿着一个方向持续上升、下降或在原有水平上起伏波动。

按月(季)平均法

1、根据原时间数列通过简单平均计算季节指数

2、假定时间数列没有明显的长期趋势和循环波动

3、计算季节指数的步骤

(1)计算若干年同月(或同季)的平均数 (2)计算全部数据的总月(总季)平均数 (3)计算季节指数(S) 月(或季)的指数之和等于1200%(或400%)

第七章

统计指数

统计指数

广义指数:凡用来反映社会经济现象数量变动的相对数,都可称为指数。狭义指数:指数是表明复杂经济现象总体数量综合变动的相对数。(不能直接相加的现象)指数的作用

1.综合地反映复杂经济现象总体的变动方向和程度

2.分析在复杂经济现象总体的变动中,各构成因素影响的大小。3.分析复杂经济现象总体的变化趋势和规律。

平均数指数是个体指数的平均数,它是先计算个体指数,然后将个体指数平均而计算的总指数,也称为平均指数。

特点:先对比,后平均。

第八章

抽样推断

抽样调查 是按照随机原则从全部研究对象中抽取一部分单位进行观察,并依据获得的样本数据对全部研究对象的数量特征做出具有一定可靠性的估计和判断,以达到对现象总体认识的一种方法。

抽样误差

在抽样调查中,误差是指调查所得结果与总体真实数值之间的差异。影响抽样误差的因素有:

1、总体各单位标志值的差异程度;

2、样本的容量;

3、抽样的方法

4、抽样调查的组织形式。

抽样平均误差

是所有可能组成的样本的样本指标总体指标的平均离差,即所有样本指标的标准差。

估计量优劣的标准

1、无偏性

是指样本估计量的均值应等于被估计总体参数的真值,2、一致性 也称相合性,是指随着样本容量的增大,估计量越来越接近被估计的总体参数

3、有效性

是指作为优良的估计量,除了满足无偏性外,其方差应比较小。

4.充分性

第九章

相关与回归分析

相关关系

指现象之间客观存在的不严格、不确定的数量上的相互依存关系。相关关系的种类:

1.按相关形式划分可以分为线性相关和非线性相关。2.按相关程度划分完全相关、不完全相关、不相关 3.按相关的方向划分可分为正相关和负相关

4.按相关关系涉及的变量多少划分分为单相关、复相关和偏相关。

相关分析

是用来研究变量之间相关密切程度与相关方向的一种统计分析方法。回归分析

是指对具有相关关系的现象,根据其相关关系的具体形态,选择一个合适的数学模型(称为回归方程式),用来近似地表达变量间的平均变化关系的一种统计分析方法。

相关分析与回归分析的区别

1.在相关分析中,不必确定自变量和因变量;而在回归分析中,必须事先确定哪个为自变量,哪个为因变量,而且只能从自变量去推测因变量,而不能从因变量去推断自变量。

2.相关分析不能指出变量间相互关系的具体形式;而回归分析能确切的指出变量之间相互关系的具体形式,它可根据回归模型从已知量估计和预测未知量。3.相关分析所涉及的变量一般都是随机变量,而回归分析中因变量是随机的,自变量则作为研究时给定的非随机变量。相关分析与回归分析的联系

相关分析和回归分析有着密切的联系,它们不仅具有共同的研究对象,而且在具体应用时,常常必须互相补充。相关分析需要依靠回归分析来表明现象数量相关的具体形式,而回归分析则需要依靠相关分析来表明现象数量变化的相关程度。只有当变量之间存在着高度相关时,进行回归分析寻求其相关的具体形式才有意义。

总结:

1、相关分析是回归分析的基础和前提;

2、回归分析是相关分析的深入和继续。

统计重点

名词解释:

统计学 :统计学是一门搜集,整理和分析数据方法的科学,其目的是探索数据的内在数量规律性,以达到对客观事物的科学认识。

描述统计学:是研究如何取得反应客观现象的数据,并通过图表形式对所搜集的数据进行加工处理和显示,进而通过综合、概括与分析得出反应客观现象的规律性的数量特征。推断统计学:是研究如何根据样本数据去推断总体数量特征的方法,它是在对样本数据进行

描述的基础上,对统计总体的未知数量特征作出概率形式的推断。统计设计:是根据统计研究对象的性质和研究的目的,对统计工作的各个方面和各个环节通盘考虑和安排,制定各种设计方案的过程。

统计报表:是按照国家有关法律规定,自上而下地统一布置,至上而下地逐级定期提供基本统计资料的一种统计报告制度,通常称作统计报表制度。

重点单位: 统计分组:是根据统计研究的目的和社会经济现象的特点,按照一个或几个标志把统计总体区分为性质不同的若干个组成部分的一种统计方法。

总量指标:是反应现象在一定时间、地点和条件下的总规模、总水平和工作总量的一种统计指标,又称为绝对数指标。

平均指标:是同质总体中,运用一定的方法将总体个单位在某一标志下的数量差异抽象化,以反映总体在一定时间、地点和条件下所达到的一般水平的统计综合指标,称之为统计均值,也成为平均数。

标志变异指标:是反应总体单位指标值分布特征的另一个重要的综合指标,它反映着总体各单位标志值的差异程度,即反应分配数列中以平均数为中心各指标值变动范围和离差程度。时间序列:同一空间,不同时间某一现象的统计指标数值,按时间先后顺序排列,就形成了时间序列,又称为时间数列或动态数列。

长期趋势:是指客观现象由于受某种基本因素的影响,在一段相当长时间内,持续向上或向下发展的趋势。

抽样调查:是按随机原则,从总体中抽取部分单位进行统计调查,计算有关样本指标,并据以推断总体的数量特征,达到认识总体的一种统计方法。

抽样误差:是指由于抽样的随机性而造成的估计值与总体真实值之间的离差。

相关关系:指现象之间确实存在着数量关系,但这种关系不是严格确定的,当一种现象的数量发生变化时,另一种现象的数量可能在一定范围内发生变化,出现不同的数值。区分点:可能会是简答题。

1)指标与标志的区别与联系(重点)

(1)指标与标志的区别:指标说明总体数量特征,标志说明总体单位特征。指标表现为具体的量,无论是数量指标还是质量指标。标志中数量指标用数值表示,但品质指标只能用文字来表述。(总体都对应指标,总体单位对应标志)

二者的联系:指标建立在标志的基础之上,是各个总体单位标志表现的加总,没有总体单位的标志表现,也就不可能有总体的指标值。

2)时期指标与时点指标的区别与联系;时期序列与时点序列的区别与联系(两者的区别与联系时一样的)(重点)

时期指标:是反应现象在一段时期内达到的规模或水平的绝对数指标。特点:(1)时期指标的个其实质可以直接相(2)时期指标值的大小与计算期的长短有直接关系(3)时期指标值的取得往往是通过连续登记取得的。

时点指标:是反应总体在某一时点(瞬间)上存在状况的总量指标。特点:(1)时点指标在格时点上的数值一般不能直接相加。(2)时点指标值的大小与计算时刻的间隔长短没有直接关系(3)时点指标往往是通过一次性登记获得的。3)调查单位与填报单位(选择题)调查时间与调查期限(选择题)

调查单位:构成调查现象的总体单位(实际上就是被调查的某一个单位)填报单位:负责向上级报告调查内容,提交统计资料的单位; 调查时间:调查资料所属的时间 调查期限:进行调查工作的时限;

4)平均指标与强度相对指标的区别平均指标与强度相对指标的区别:平均指标是总体标志值总量与总体单位总量之比,反映的是总体各单位标志值的一般水平,不涉及不同的总体。而强度相对指标则是两个不同总体的指标值对比的结果,作为分子的总量标志,并不随着作为分母的总量标志变动而变动,二者在数量上没有依存关系,更不存在标志总量与单位总量相适应的问题。5)平均数指数与综合指数的区别与联系 6)相关关系与回归分析 区别:

1.在相关分析中,不必确定自变量和因变量;而在回归分析中,必须事先确定哪个为自变量,哪个为因变量,而且只能从自变量去推测因变量,而不能从因变量去推断自变量。2.相关分析不能指出变量间相互关系的具体形式;而回归分析能确切的指出变量之间相互关系的具体形式,它可根据回归模型从已知量估计和预测未知量。

3.相关分析所涉及的变量一般都是随机变量,而回归分析中因变量是随机的,自变量则作为研究时给定的非随机变量。联系:

相关分析和回归分析有着密切的联系,它们不仅具有共同的研究对象,而且在具体应用时,常常必须互相补充。相关分析需要依靠回归分析来表明现象数量相关的具体形式,而回归分析则需要依靠相关分析来表明现象数量变化的相关程度。只有当变量之间存在着高度相关时,进行回归分析寻求其相关的具体形式才有意义。要注意的几个原则

1)统计分组的原则P38 穷尽性原则;互斥性原则 2)时间序列的编制原则P101 时间长短要统一;总体范围要一致;指标的经济内容要统一;各指标值的计算方法、计算价格和计算单位都应统一。计算题的范围

1)计划完成程度指标(长期指标不考计算题)P60(重点)2)加权算术平均数(P70)、加权调和平均数(75)3)标准差(重点看加权的公式)(P88);标准差系数;(89)(重点)4)长期趋势的测定(最小平方法)P116(重点)5)按季(或月)平均法P122 6)因素分析P145(重点)7)区间估计P185(重点)

8)随机抽样的容量确定P190(重点)9)简单线性回归方程P219(重点)

大题计算就考这么多,我没有提到的都不考。

第二篇:医学统计学知识点总结

知识点

1.统计学是应用概率论和数理统计的基本原理和方法,研究数据的搜集、整理、分析、表达和解释的一门学科。

2.医学统计学是应用统计学的基本原理和方法,研究医学及其有关领域数据信息的搜集、整理、分析、表达和解释的一门学科。

3.统计软件包是对资料进行各种统计处理分析的一系列程序的组合。4.统计工作的基本步骤:研究设计、搜集资料、整理资料和分析资料。

5.科研结果的好坏取决于研究设计的好坏,研究设计是统计工作中的基础和关键,决定着整个统计工作的成败。

6.统计分析包括统计描述和统计推断。统计描述是对已知的样本(或总体)的分布情况或特征值进行分析表述;统计推断是根据已知的样本信息来推断未知的总体。7.医学原始资料的类型有:计量资料、计数资料、等级资料。

8.计量资料是用定量的方法对每一个观察单位的某项指标进行测定所得的资料。

9.计数资料是把观察单位按某种属性(性质)或类别进行分组,清点各组观察单位数所得资料。

10.等级资料是把观察单位按属性程度或等级顺序分组,清点各组观察单位数所得资料。各属性之间有程度的差别。等级资料的等级顺序不能任意颠倒。11.同质:是指所研究的观察对象具有某些相同的性质或特征。

12.变异:是同质个体的某项指标之间的差异,即个体变异或个体差异性。13.总体是根据研究目的确定的同质研究对象的总体。样本是总体中具有代表性的一部分个体。

14.抽样研究是通过从总体中随机抽取样本,对样本信息进行分析,从而推断总体的研究方法。抽样误差是由随机抽样造成的样本指标与总体指标之间、样本指标与样本指标之间的差异,其根源在于总体中的个体存在变异性,只要是抽样研究,就一定存在抽样误差,不能用样本的指标直接下结论。

15.统计学的主要任务是进行统计推断,包括参数估计和假设检验。16.概率是某随机事件发生可能性大小(或机会大小)的数值度量。概率的取值为0≤P≤1。小概率事件是指P≤0.05的随机事件。

17.频数表和频数分布图的用途:(1)揭示计量资料的分布类型。(2)揭示计量资料分布的重要特征—集中趋势与离散趋势。(3)便于发现特大或特小的可疑值。(4)作为陈述资料的形式。例数大时,可以频率估计概率。(5)便于资料的进一步统计分析。18.均数应用于计量资料的正态分布或近似正态分布资料。19.当资料呈正态分布时,均数位于分布的中心。

20.每个观察值都加一个常数a,则均数为原均数加常数a;每个观察值都乘以一个常数b,则均数为原均数的b倍。

21.几何均数应用于对数正态分布或近似正态分布资料,也可用于呈倍数关系的等比资料。在医院中主要用于抗原(体)滴度资料。

22.计算几何均数的资料一般不能有观察值为0,也不能同时包含正负观察值。

23.中位数可用于描述任何分布类型计量资料的集中趋势,但对于正态分布或近似正态分布的资料,中位数不利于进一步的统计分析,故对正态分布或近似正态分布资料应首选均数描述其集中趋势。

24.中位数适用于描述偏态分布资料、一端或两端无确定数据的资料和分布不明资料的集中趋势。

25.极差与四分位数间距可用于描述计量资料的离散程度,但都比较粗略,而四分位数间距较极差稳定,他们用于描述偏态分布资料。

26.中位数M是一个特殊的百分位数,即第50百分位数P50,。百分位数是一种位置指标,样本的第X百分位数记为Px,它表示将全部观测值X1、X2,„,Xn由小到大依次排列后位于第X百分位置的数值。

27.方差和标准差用于描述正态分布计量资料的离散程度。

28.均数与标准差结合用于全面描述正态分布计量资料的集中趋势与离散趋势。

29.变异系数描述的是相对离散程度,无度量衡单位。用于单位不同,或虽单位相同,但均数相差较大的资料间变异程度的比较。

30.正态分布是横轴上方以均数处最高的单峰对称分布,以均数为中心,左右两侧对称。正态分布N(μ,σ²)中有两个参数:总体均数μ和总体标准差σ。μ是位置参数,σ是变异度参数。

31.正态分布曲线下的面积是1,其分布有一定的规律,x±1.64s内的面积为90%,x±1.96s内的面积为95%,x±2.58s内的面积为99%。32.常用相对数有:率、构成比、相对比。

33.率是说明某现象发生的频率或强度。某一分率的改变不影响其他分率变化。

34.构成比是表示某事物内部各组成部分所占的比重或分布。某一部分构成比的改变将影响其他构成比的变化。

35.相对比表示两个有关事物指标,用以说明一个指标是另一个指标的几倍或几分之几。两个指标可以是绝对比、相对数或平均数。

36.应用相对数注意事项:(1)计算相对数时分母应该有足够数量即例数不能太小。(2)计算合计率或平均率时,不能把n个率相加后除以n,应该绝对数相加后再计算相对数。(3)正确区分构成比与率,分析时不能以构成比代替率。(4)相对数的比较应注意其可比性。对比组之间除了被研究的因素不同以外,其他相对数造成影响的因素应可能在构成比代替率。(5)样本率或样本构成比在比较时应做假设检验。

37.常用的标准化方法有直接标准化法、间接标准化法和反推标准法,简称直接法、间接法和反推法。

38.一般选择“标准”的方法有两种:(1)选择具有代表性的,较稳定的、数量较大的人群作为“标准”;(2)互相比较资料中任选一组数据作“标准”。

39.标准化死亡比(SMR)是被标化组的实际死亡数与预期死亡数之比,若SMR>1,表示被标化组死亡率高于标准组;若SMR<1,表示被标化组死亡率低于标准组; 40.计算标准化率的步骤:⑴根据资料所具备的条件选用直接法或间接法;⑵选定标准构成;⑶选择公式计算标准化率。

41.应用标准化法的注意事项:(1)标准化法只适用于内部构成不同影响到总率比较的情况;

(2)由于选择的标准不同,算出的标准化率也不同,但比较的结论一致;(3)标准化后的标准化率,已经不再反映当时当地的实际水平,它只表示相互比较的资料间的相对水平;(4)样本标准化率也存在抽样误差,也需要进行假设检验。

42.发病率是计算一定期间内某人群中的新发病例数,而患病率是计算调查时点被调查人群中的现患病例数。

43.在一定期间内某人可能发病一次以上而成为多个病例,所以发病率可能会大于100%;;而患病率不会出现大于100%的情况。

44.发病率高的疾病称为多发病;患病率高的疾病称为常见病。患病率高,发病率也高的疾病称为常见多发病。

45.统计表一般由标题、标目、线条、数字和备注等部分组成。统计表的编制应:⑴重点突出,简单明了,一张统计表至应包括一个中心内容;⑵主谓分明,层次清楚;⑶结构完整,有自明性。

46.常用的统计图有条图、圆图、百分条图、直方图、线图、半对数线图、散点图、箱式图和统计地图等。

47.单个构成比的描述,可选用圆图或百分条图;多个构成比的描述和比较,宜选用百分条图。

48.普通线图适用于描述某项指标随某个连续型数值变量变化而变化的幅度(绝对变化趋势);半对数线图适用于描述某项指标随某个连续型数值变量变化而变化的速度(相对变化趋势)。

49.箱式图通常选用5个描述统计量来绘制,即最小值、下四分位数(P25)、中位数(M)、上四分位数(P75)、最大值;可用于描述某个连续型数值变量的分布特征,也可用于比较不同类别之间某个连续型数值变量分布特征的差异。

50.均数抽样误差是抽样产生的由于个体差异所导致的样本均数与样本均数之间、样本均数与总体均数之间的差异。

51.标准误是样本均数的标准差,是描述均数抽样误差大小的指标。增加样本含量可减小样本均数的标准误,从而降低抽样误差。

52.参数估计是指用样本指标(统计量)来推断总体指标(参数)。估计方法有点估计和区间估计,区间估计是按预先给定的概率1-α,由样本指标确定的包含总体参数的一个范围。

53.可信区间是指总体均数可能所在的范围。用于推断总体参数所在的范围。总体均数95%可信区间的意义为:总体均数在x±t0.05,νSx或x±1.96Sx范围内的可能性为95%。

54.在抽样研究中,由于有抽样误差存在,不能直接通过比较样本均数与样本均数之间、样本均数与总体均数之间的大小得出结论,要进行假设检验。55.假设检验的基本思想包括小概率思想和反证法思想。56.假设检验是先对总体作出某种假定(检验假设),然后根据样本信息来推断其是否成立的一类统计方法的总称。用于推断总体参数是否相等。

57.假设检验的基本步骤:⑴建立检验假设,确定检验水准;⑵计算检验统计量;⑶确定P值,作出统计判断。

58.单样本t检验的目的是推断样本均数所代表的总体均数与已知总体均数是否相同,它要求样本取自正态总体。

59.配对设计包括:⑴两个受试对象按某特征相同或相近配成对子,分别给予不同的处理;⑵同一受试对象给予不同处理或处理前后比较。它可以降低抽样误差,提高统计效率。60.配对t检验适用于配对设计的计量资料的比较,且要求差值服从正态分布。

61.完全随机设计可以将一批同质受试对象随机分配到各组,也可以是随机抽取几组不同的受试对象,观察其实验效应。

62.完全随机设计两样本均数比较的t检验是推断计量资料的两个总体均数之间有无差别的假设检验方法,要求样本来自正态总体,且两总体方差相等(方差齐)。

63.方差齐性检验的适用条件是两样本均来自正态分布的总体,方差齐性检验中的检验统计量F服从F分布,有两个自由度,分子的自由度(较大方差)和分母的自由度(较小方差)。F值越大,P值越小。

64.两个样本均数比较,方差不齐时刻选择:⑴近似t′检验;⑵通过一定的变量变换以达到方差齐;⑶选用非参数统计,如秩和检验等。65.Z检验适用于大样本资料的假设检验。

66.第Ⅰ类错误:检验假设H0本来是成立的,经过检验后被拒绝了,即“弃真”。其发生的的概率为α,为已知。

67.第Ⅱ类错误:检验假设H0本来是不成立的,经过检验后被接受了,即“存伪”。其发生的概率为β,属未知数。68.假设检验的注意事项:⑴要有严密的研究设计;⑵选用的假设检验方法应符合应用条件;⑶有统计学意义不等于有实际意义;⑷结论不能绝对化;⑸正确理解P值与差别有无统计意义;⑹平衡Ⅰ类错误和Ⅱ类错误。69.方差分析是一种以分析数据的变异为基础,以F值为检验统计量的计量资料的假设检验方法,主要用于推断计量资料单因素k水平(k≧3)或多因素不同水平总体均数间的差异性,其前提条件为资料服从正态分布,各组方差齐。

70.随机区组设计资料的总变异被分解为3个部分,即处理组间变异、区组间变异和误差。区组变异和误差两部分相当于单因素方差分析的组内变异。

71.两两比较的方法很多,常用q检验、LSD—t检验等;q检验适用于探索性研究,对每两个样本均数都进行检验;LSD—t检验适用于事先有明确假设的证实性研究。72.常用数据变换的方法有对数变换、平方根变换、平方根反正弦变换、倒数变换。

273.X检验是一种以Χ²分布为基础,以Χ²值为检验统计量的计数资料的假设检验方法。

274.X值反映实际频数(A)和理论频数(T)的符合程度。

275.X检验的主要用途:⑴推断两个或两个以上总体率(或构成比)之间有无差别;⑵两变量间有无相关关系;⑶检验频数分布的拟合优度。

2276.四格表X检验的注意事项:(1)当n≥40,T≥5时,用四格表x检验的基本公式或专用22公式计算X 值;(2)当n≥40,1≤T<5时,需要用校正公式计算X 值;(3)当n<40或2T

2277.行×列表资料X检验的注意事项:(1)行×列表X检验允许有1/5的基本格子的理论频数小于5大于1,但不能有理论频数小于1。⑵如果有1/5以上格子的理论频数小于5大于1,或有一个格子的理论频数小于1,可采用以下处理方法:①增加样本含量:可以增大理论频数;②将理论频数太小的行或列与性质相近的邻行或邻列中的实际频数合并;③删去理论频数太小的格子所对应的行或例。

78.依次增减四格表中某个格子(一般选用行合计与列合计均为最小的那个格子)的数据,可列出周边合计不变条件下各种组合的四格表(一般可列出最小周边合计数加1个四格表)。

79.非参数检验是一类不依赖于总体分布类型的检验,即在应用中可以不考虑被研究对象为何种分布以及分布是否已知,检验假设中没有包括总体参数的一类统计方法。80.秩和检验的适用范围:⑴未加精确测量的资料(包括等级资料);⑵偏态分布且无法转化为正态分布的资料;⑶分布不清的资料。

81.配对资料的秩和检验用于配对设计计量资料差值的比较和单一样本与总体中位数的比较。

82.直线相关是分析服从正态分布的两个随机变量x和y有无线性相关关系的一种统计分析方法。

83.相关系数是描述两个变量间线性相关关系的密切程度与方向的统计指标。相关系数的符号表示两变量的线性相关的方向。其特点为:⑴相关系数r没有单位;⑵取值范围在﹣1和1之间;⑶r为正表示正相关,r为1表示完全正相关;r值为负表示负相关,r为﹣1表示完全负相关;⑷r绝对值越接近1,表示两个变量间相关关系密切程度越高;越接近0,则相关关系越不密切。

84.相关分析的前提条件:两个随机变量;散点图呈线性相关;服从双变量正态分布。85.在有相关关系时,根据r值判断两变量相关的密切程度:⑴|r|≥0.7,两变量有高度相关关系;⑵0.7>|r|≥0.4,两变量有中度相关关系;⑶|r|<0.4,两变量有低度相关关系。

86.直线回归分析的前提条件:⑴线性:两个变量间存在线性关系;⑵独立性:任意两个观察值互相独立;⑶正态性:应变量y是服从正态分布的随机变量;⑷方差齐:给定x后,应变量y的方差相等。

87.等级相关应用范围:⑴不服从双变量正态分布或偏态分布;⑵总体分布类型未知;⑶原始数据是等级变量。

88.对同一资料,相关系数t检验与回归系数t 检验效果相同。

89.决定系数r²决定回归效果的好坏,r²越接近1,回归的效果越好。

90.直线回归方程:y=a+bx其中a为回归直线在Y轴上的截距:⑴a>0表示直线与纵轴的交点在原点的上方;⑵a<0则交点在原点的下方;⑶a=0则回归直线通过原点;b为回归系数,即直线的斜率:⑴b>0表示直线从左下方走向右上方,即 y随 x的增大而增大;⑵b<0表示直线从左上方走向右下方,即 y随 x的增大而减小;⑶b=0表示直线与 x轴平行,即x与 y无直线关系;⑷b的统计学意义是x每增(减)一个单位,y平均改变b个单位。

91.实验设计的特点:⑴研究者能人为设置处理因素;⑵受试对象接受何种处理因素或水平是由随机分配而定的。

92.医学实验设计包括处理因素或研究因素,受试对象和实验效应三个基本要素。

93.常用对照的形式为空白对照、安慰剂对照、实验对照、标准对照、自身对照、相互对照及历史对照等。

94.随机化包括随机抽样和随机分组,随机抽样指保证总体中的每一个个体都有同等的机会被抽出来作为样本;随机分组指保证样本中的每一个个体都有同等的机会被分配到实验组或对照组。

95.实验设计的基本原则:对照、随机、重复、均衡。

96.重复是指研究样本要有一定的数量,即在保证研究结果具有一定可靠性的条件下,确定最少的样本例数。

97.均衡原则又称齐同对比原则,指实验组和对照组或各实验组之间,除了处理因素以外,其他一切条件应尽可能相同或一致。

98.完全随机设计又称随机对照试验,属于单因素研究设计。

99.样本含量估计需要确定四个基本因素:α、1-β、σ、δ。α、δ与样本含量成反比,σ(或s)、1-β与样本含量成正比。

100.剂量反应是实验物质引起实验动物总体中产生某种反应的剂量。

第三篇:医学统计学知识点总结

知识点

1.统计学是应用概率论和数理统计的基本原理和方法,研究数据的搜集、整理、分析、表

达和解释的一门学科。

2.医学统计学是应用统计学的基本原理和方法,研究医学及其有关领域数据信息的搜集、整理、分析、表达和解释的一门学科。

3.统计软件包是对资料进行各种统计处理分析的一系列程序的组合。

4.统计工作的基本步骤:研究设计、搜集资料、整理资料和分析资料。

5.科研结果的好坏取决于研究设计的好坏,研究设计是统计工作中的基础和关键,决定着

整个统计工作的成败。

6.统计分析包括统计描述和统计推断。统计描述是对已知的样本(或总体)的分布情况或

特征值进行分析表述;统计推断是根据已知的样本信息来推断未知的总体。

7.医学原始资料的类型有:计量资料、计数资料、等级资料。

8.计量资料是用定量的方法对每一个观察单位的某项指标进行测定所得的资料。

9.计数资料是把观察单位按某种属性(性质)或类别进行分组,清点各组观察单位数所得

资料。

10.等级资料是把观察单位按属性程度或等级顺序分组,清点各组观察单位数所得资料。各

属性之间有程度的差别。等级资料的等级顺序不能任意颠倒。

11.同质:是指所研究的观察对象具有某些相同的性质或特征。

12.变异:是同质个体的某项指标之间的差异,即个体变异或个体差异性。

13.总体是根据研究目的确定的同质研究对象的总体。样本是总体中具有代表性的一部分个

体。

14.抽样研究是通过从总体中随机抽取样本,对样本信息进行分析,从而推断总体的研究方

法。抽样误差是由随机抽样造成的样本指标与总体指标之间、样本指标与样本指标之间的差异,其根源在于总体中的个体存在变异性,只要是抽样研究,就一定存在抽样误差,不能用样本的指标直接下结论。

15.统计学的主要任务是进行统计推断,包括参数估计和假设检验。

16.概率是某随机事件发生可能性大小(或机会大小)的数值度量。概率的取值为0≤P≤1。

小概率事件是指P≤0.05的随机事件。

17.频数表和频数分布图的用途:(1)揭示计量资料的分布类型。(2)揭示计量资料分布的重

要特征—集中趋势与离散趋势。(3)便于发现特大或特小的可疑值。(4)作为陈述资料的形式。例数大时,可以频率估计概率。(5)便于资料的进一步统计分析。

18.均数应用于计量资料的正态分布或近似正态分布资料。

19.当资料呈正态分布时,均数位于分布的中心。

20.每个观察值都加一个常数a,则均数为原均数加常数a;每个观察值都乘以一个常数b,则均数为原均数的b倍。

21.几何均数应用于对数正态分布或近似正态分布资料,也可用于呈倍数关系的等比资料。

在医院中主要用于抗原(体)滴度资料。

22.计算几何均数的资料一般不能有观察值为0,也不能同时包含正负观察值。

23.中位数可用于描述任何分布类型计量资料的集中趋势,但对于正态分布或近似正态分布的资料,中位数不利于进一步的统计分析,故对正态分布或近似正态分布资料应首选均数描述其集中趋势。

24.中位数适用于描述偏态分布资料、一端或两端无确定数据的资料和分布不明资料的集中

趋势。

25.极差与四分位数间距可用于描述计量资料的离散程度,但都比较粗略,而四分位数间距

较极差稳定,他们用于描述偏态分布资料。

26.中位数M是一个特殊的百分位数,即第50百分位数P50,。百分位数是一种位置指标,样本的第X百分位数记为Px,它表示将全部观测值X1、X2,„,Xn由小到大依次排列后位于第X百分位置的数值。

27.方差和标准差用于描述正态分布计量资料的离散程度。

28.均数与标准差结合用于全面描述正态分布计量资料的集中趋势与离散趋势。

29.变异系数描述的是相对离散程度,无度量衡单位。用于单位不同,或虽单位相同,但均

数相差较大的资料间变异程度的比较。

30.正态分布是横轴上方以均数处最高的单峰对称分布,以均数为中心,左右两侧对称。正

态分布N(μ,σ²)中有两个参数:总体均数μ和总体标准差σ。μ是位置参数,σ是变异度参数。

31.正态分布曲线下的面积是1,其分布有一定的规律,±1.64s内的面积为90%,±

1.96s内的面积为95%,±2.58s内的面积为99%。

32.常用相对数有:率、构成比、相对比。

33.率是说明某现象发生的频率或强度。某一分率的改变不影响其他分率变化。

34.构成比是表示某事物内部各组成部分所占的比重或分布。某一部分构成比的改变将影响

其他构成比的变化。

35.相对比表示两个有关事物指标,用以说明一个指标是另一个指标的几倍或几分之几。两

个指标可以是绝对比、相对数或平均数。

36.应用相对数注意事项:(1)计算相对数时分母应该有足够数量即例数不能太小。(2)计算

合计率或平均率时,不能把n个率相加后除以n,应该绝对数相加后再计算相对数。(3)正确区分构成比与率,分析时不能以构成比代替率。(4)相对数的比较应注意其可比性。对比组之间除了被研究的因素不同以外,其他相对数造成影响的因素应可能在构成比代替率。(5)样本率或样本构成比在比较时应做假设检验。

37.常用的标准化方法有直接标准化法、间接标准化法和反推标准法,简称直接法、间接法

和反推法。

38.一般选择“标准”的方法有两种:(1)选择具有代表性的,较稳定的、数量较大的人群

作为“标准”;(2)互相比较资料中任选一组数据作“标准”。

39.标准化死亡比(SMR)是被标化组的实际死亡数与预期死亡数之比,若SMR>1,表示被

标化组死亡率高于标准组;若SMR<1,表示被标化组死亡率低于标准组;

40.计算标准化率的步骤:⑴根据资料所具备的条件选用直接法或间接法;⑵选定标准构成;

⑶选择公式计算标准化率。

41.应用标准化法的注意事项:(1)标准化法只适用于内部构成不同影响到总率比较的情况;

(2)由于选择的标准不同,算出的标准化率也不同,但比较的结论一致;(3)标准化后的标准化率,已经不再反映当时当地的实际水平,它只表示相互比较的资料间的相对水平;

(4)样本标准化率也存在抽样误差,也需要进行假设检验。

42.发病率是计算一定期间内某人群中的新发病例数,而患病率是计算调查时点被调查人群

中的现患病例数。

43.在一定期间内某人可能发病一次以上而成为多个病例,所以发病率可能会大于100%;;

而患病率不会出现大于100%的情况。

44.发病率高的疾病称为多发病;患病率高的疾病称为常见病。患病率高,发病率也高的疾

病称为常见多发病。

45.统计表一般由标题、标目、线条、数字和备注等部分组成。统计表的编制应:⑴重点突

出,简单明了,一张统计表至应包括一个中心内容;⑵主谓分明,层次清楚;⑶结构完

整,有自明性。

46.常用的统计图有条图、圆图、百分条图、直方图、线图、半对数线图、散点图、箱式图

和统计地图等。

47.单个构成比的描述,可选用圆图或百分条图;多个构成比的描述和比较,宜选用百分条

图。

48.普通线图适用于描述某项指标随某个连续型数值变量变化而变化的幅度(绝对变化趋

势);半对数线图适用于描述某项指标随某个连续型数值变量变化而变化的速度(相对变化趋势)。

49.箱式图通常选用5个描述统计量来绘制,即最小值、下四分位数(P25)、中位数(M)、上四分位数(P75)、最大值;可用于描述某个连续型数值变量的分布特征,也可用于比较不同类别之间某个连续型数值变量分布特征的差异。

50.均数抽样误差是抽样产生的由于个体差异所导致的样本均数与样本均数之间、样本均数

与总体均数之间的差异。

51.标准误是样本均数的标准差,是描述均数抽样误差大小的指标。增加样本含量可减小样

本均数的标准误,从而降低抽样误差。

52.参数估计是指用样本指标(统计量)来推断总体指标(参数)。估计方法有点估计和区

间估计,区间估计是按预先给定的概率1-α,由样本指标确定的包含总体参数的一个范围。

53.可信区间是指总体均数可能所在的范围。用于推断总体参数所在的范围。总体均数95%可信区间的意义为:总体均数在±t0.05,νS或±1.96S范围内的可能性为95%。

54.在抽样研究中,由于有抽样误差存在,不能直接通过比较样本均数与样本均数之间、样

本均数与总体均数之间的大小得出结论,要进行假设检验。

55.假设检验的基本思想包括小概率思想和反证法思想。

56.假设检验是先对总体作出某种假定(检验假设),然后根据样本信息来推断其是否成立的一类统计方法的总称。用于推断总体参数是否相等。

57.假设检验的基本步骤:⑴建立检验假设,确定检验水准;⑵计算检验统计量;⑶确定P

值,作出统计判断。

58.单样本t检验的目的是推断样本均数所代表的总体均数与已知总体均数是否相同,它要

求样本取自正态总体。

59.配对设计包括:⑴两个受试对象按某特征相同或相近配成对子,分别给予不同的处理;

⑵同一受试对象给予不同处理或处理前后比较。它可以降低抽样误差,提高统计效率。

60.配对t检验适用于配对设计的计量资料的比较,且要求差值服从正态分布。

61.完全随机设计可以将一批同质受试对象随机分配到各组,也可以是随机抽取几组不同的受试对象,观察其实验效应。

62.完全随机设计两样本均数比较的t检验是推断计量资料的两个总体均数之间有无差别的假设检验方法,要求样本来自正态总体,且两总体方差相等(方差齐)。

63.方差齐性检验的适用条件是两样本均来自正态分布的总体,方差齐性检验中的检验统计

量F服从F分布,有两个自由度,分子的自由度(较大方差)和分母的自由度(较小方差)。F值越大,P值越小。

64.两个样本均数比较,方差不齐时刻选择:⑴近似t′检验;⑵通过一定的变量变换以达

到方差齐;⑶选用非参数统计,如秩和检验等。

65.Z检验适用于大样本资料的假设检验。

66.第Ⅰ类错误:检验假设H0本来是成立的,经过检验后被拒绝了,即“弃真”。其发生的的概率为α,为已知。

67.第Ⅱ类错误:检验假设H0本来是不成立的,经过检验后被接受了,即“存伪”。其发

生的概率为β,属未知数。

68.假设检验的注意事项:⑴要有严密的研究设计;⑵选用的假设检验方法应符合应用条件;

⑶有统计学意义不等于有实际意义;⑷结论不能绝对化;⑸正确理解P值与差别有无统计意义;⑹平衡Ⅰ类错误和Ⅱ类错误。

69.方差分析是一种以分析数据的变异为基础,以F值为检验统计量的计量资料的假设检验

方法,主要用于推断计量资料单因素k水平(k≧3)或多因素不同水平总体均数间的差异性,其前提条件为资料服从正态分布,各组方差齐。

70.随机区组设计资料的总变异被分解为3个部分,即处理组间变异、区组间变异和误差。

区组变异和误差两部分相当于单因素方差分析的组内变异。

71.两两比较的方法很多,常用q检验、LSD—t检验等;q检验适用于探索性研究,对每两

个样本均数都进行检验;LSD—t检验适用于事先有明确假设的证实性研究。

72.常用数据变换的方法有对数变换、平方根变换、平方根反正弦变换、倒数变换。

273.X检验是一种以Χ²分布为基础,以Χ²值为检验统计量的计数资料的假设检验方法。274.X值反映实际频数(A)和理论频数(T)的符合程度。

275.X检验的主要用途:⑴推断两个或两个以上总体率(或构成比)之间有无差别;⑵两变量间有无相关关系;⑶检验频数分布的拟合优度。

2276.四格表X检验的注意事项:(1)当n≥40,T≥5时,用四格表x检验的基本公式或专用

22公式计算X 值;(2)当n≥40,1≤T<5时,需要用校正公式计算X 值;(3)当n<40或

2T

2277.行×列表资料X检验的注意事项:(1)行×列表X检验允许有1/5的基本格子的理论

频数小于5大于1,但不能有理论频数小于1。⑵如果有1/5以上格子的理论频数小于5大于1,或有一个格子的理论频数小于1,可采用以下处理方法:①增加样本含量:可以增大理论频数;②将理论频数太小的行或列与性质相近的邻行或邻列中的实际频数合并;③删去理论频数太小的格子所对应的行或例。

78.依次增减四格表中某个格子(一般选用行合计与列合计均为最小的那个格子)的数据,可列出周边合计不变条件下各种组合的四格表(一般可列出最小周边合计数加1个四格表)。

79.非参数检验是一类不依赖于总体分布类型的检验,即在应用中可以不考虑被研究对象为

何种分布以及分布是否已知,检验假设中没有包括总体参数的一类统计方法。

80.秩和检验的适用范围:⑴未加精确测量的资料(包括等级资料);⑵偏态分布且无法转

化为正态分布的资料;⑶分布不清的资料。

81.配对资料的秩和检验用于配对设计计量资料差值的比较和单一样本与总体中位数的比

较。

82.直线相关是分析服从正态分布的两个随机变量x和y有无线性相关关系的一种统计分析

方法。

83.相关系数是描述两个变量间线性相关关系的密切程度与方向的统计指标。相关系数的符

号表示两变量的线性相关的方向。其特点为:⑴相关系数r没有单位;⑵取值范围在﹣1和1之间;⑶r为正表示正相关,r为1表示完全正相关;r值为负表示负相关,r为﹣1表示完全负相关;⑷r绝对值越接近1,表示两个变量间相关关系密切程度越高;越接近0,则相关关系越不密切。

84.相关分析的前提条件:两个随机变量;散点图呈线性相关;服从双变量正态分布。

85.在有相关关系时,根据r值判断两变量相关的密切程度:⑴|r|≥0.7,两变量有高度

相关关系;⑵0.7>|r|≥0.4,两变量有中度相关关系;⑶|r|<0.4,两变量有低度相关关系。

86.直线回归分析的前提条件:⑴线性:两个变量间存在线性关系;⑵独立性:任意两个观

察值互相独立;⑶正态性:应变量y是服从正态分布的随机变量;⑷方差齐:给定x后,应变量y的方差相等。

87.等级相关应用范围:⑴不服从双变量正态分布或偏态分布;⑵总体分布类型未知;⑶原

始数据是等级变量。

88.对同一资料,相关系数t检验与回归系数t 检验效果相同。

89.决定系数r²决定回归效果的好坏,r²越接近1,回归的效果越好。

90.直线回归方程:y=a+bx其中a为回归直线在Y轴上的截距:⑴a>0表示直线与纵轴的交点在原点的上方;⑵a<0则交点在原点的下方;⑶a=0则回归直线通过原点;b为回归系数,即直线的斜率:⑴b>0表示直线从左下方走向右上方,即 y随 x的增大而增大;⑵b<0表示直线从左上方走向右下方,即 y随 x的增大而减小;⑶b=0表示直线与 x轴平行,即x与 y无直线关系;⑷b的统计学意义是x每增(减)一个单位,y平均改变b个单位。

91.实验设计的特点:⑴研究者能人为设置处理因素;⑵受试对象接受何种处理因素或水平

是由随机分配而定的。

92.医学实验设计包括处理因素或研究因素,受试对象和实验效应三个基本要素。

93.常用对照的形式为空白对照、安慰剂对照、实验对照、标准对照、自身对照、相互对照

及历史对照等。

94.随机化包括随机抽样和随机分组,随机抽样指保证总体中的每一个个体都有同等的机会

被抽出来作为样本;随机分组指保证样本中的每一个个体都有同等的机会被分配到实验组或对照组。

95.实验设计的基本原则:对照、随机、重复、均衡。

96.重复是指研究样本要有一定的数量,即在保证研究结果具有一定可靠性的条件下,确定

最少的样本例数。

97.均衡原则又称齐同对比原则,指实验组和对照组或各实验组之间,除了处理因素以外,其他一切条件应尽可能相同或一致。

98.完全随机设计又称随机对照试验,属于单因素研究设计。

99.样本含量估计需要确定四个基本因素:α、1-β、σ、δ。α、δ与样本含量成反比,σ(或s)、1-β与样本含量成正比。

100.剂量反应是实验物质引起实验动物总体中产生某种反应的剂量。

第四篇:《统计学原理》知识点概括总结

统计的研究对象、方法

统计

统计研究的特点

统计的职能

统计工作

统计学

统计资料

统计调查

总体、总体单位(变换关系)

统计整理

指标

标志(关系、可转换)

统计分析

数量指标/质量指标

品质/数量标志

不变标志/可变标志

统计调查 要求:准确、及时、完整

分类:全面调查/非全面、经常性/一次性调查、统计报表/专门调查(普查、重点、典型、抽样)、方法

方案:6w

组织形式:报表/普查/重点/典型/抽样调查

统计调查体系:

统计整理

内容:分组、汇总、编表

分组:作用(类型、比例关系、依存关系)

关键(选择分组标志)

分布数列:构成要素、组中值、频率、频数、累计次数分布

类型:钟形、U、J(反J)

统计表:从形式上:

从内容:

综合指标

总量指标(总体单位总量指标/总体标志总量指标、时期指标/时点指标)

相对指标:计划完成、结构、比例、比较、强度、动态相对数

平均指标:算术平均数 简单算术平均数

加权算术平均数

说明:

1、x,f;

2、f,f/sigemaf;

3、f相等,4、性质:

调和平均数 简单调和平均数

加权调和平均数:说明:

1、m=xf,2、m相同,3、使用条件:

几何平均数:简单/加权

众数:上限/下限公式

中位数:上限/下限公式

关系:

标志变异指标:极差R

平均差

标准差(方差)

离散系数:标准差系数 用途:当平均数相等且单位相同的情况下,直接用R、AD、sigema来比较;如果平均数不等或计量单位不同时,用离散系数来比较。

是非标志的平均数和标准差:

时间数列

构成要素:t,a 总量指标时间数列(时期/时点数列)

相对指标数列

平均指标数列

水平分析:发展水平

平均发展水平

总量指标时间数列—时期数列:a平均=sigema a/n

--时点数列:四种 相对数列/平均数列:

增长量:累计、逐期

平均增长量

速度分析:发展速度(定基/环比、数量关系)

增长速度(=发展速度-

1、定基增长速度/环比增长速度)

平均发展速度(几何法、方程法)

平均增长速度=平均发展速度-1

增长1%的绝对值=前期水平/100 统计指数 分类:总指数/个体指数、综合指数/平均指标指数、数量指标指数/质量指标指数

综合指数编制:数量指标指数

质量指标指数

(同度量因素、指数化因素、编制原则)

平均指标指数:加权算术平均数指数

加权调和平均数指数

(变形)

指数体系:相对数体系

绝对数体系

应用:指数推算

因素分析:总量两因素分析

平均指标对比指数因素分析

可变构成指数=固定构成指数 * 结构影响指数

抽样调查

特点:三个

区间估计:抽样平均误差(Ux,Up,影响因素)

抽样极限误差(t,f(t)四个)

估计

N的确定(准确度、可靠度,影响因素)

组织形式 相关与回归

相关:r

回归:一元线性回归

A,b B,含义,与相关系数

估计标准误差

可决系数=相关系数的平方

第五篇:医学统计学考试

医学统计学是运用概率论和数理统计原理、方法结合医药卫生工作的实际情况,阐述医学科研设计的基本原理,研究医学资料(信息)的搜集、整理和分析的方法学总称,他是认识医学现象数量特征的重要工具。医学统计工作基本步骤包括4步:设计、搜集资料、整理和分析资料。这四个步骤是相互联系的,科学、周密、严谨的设计是搜集准确可靠资料的保证,准确、完整、及时地搜集资料、恰当地整理资料是统计分析的基础,在此基础上选择正确的方法分析资料才能得出科学的结论。下面就《血压管理对脑出血患者预后的影响》进行一下分析,表述下我自己通过学习医学统计学这门课程对医学统计学的理解和掌握。

设计:对医学研究来说,设计实际上是指制定周密的医学研究计划,通常包括调查设计和实验设计。

1、调查设计一般包括专业设计和统计设计。统计设计包括资料搜集、整理和分析资料的计划。搜集资料的计划在整个设计中占主要地位,一般包括:(1、明确调查目的和确定研究指标;(2、确定研究对象和观察单位;(3、选择调查方法;

(4、决定采取的调查方式;(5、设计调查项目和调查表;(6、样本含量估计。本文章实验的目的是研究探讨血压管理对脑出血预后的的影响。研究指标为两组患者入院时及入院1周、2周、3个月时神经功能缺损程度评分(ccss)及斯堪的那维亚卒中量表(sss)神经功能评分。研究对象为2011年1月--2012年12月收治的脑出血患者210例,男132例,女78例,年龄(60.3±4.2)岁,所有患者诊断均符合全国脑血管病会议制定的卒中诊断标准。并经CT、MRI明确诊断,入院

时平均出血量(14.78±4.78),排除既往有卒中史且有明显后遗症者$有其他颅内病变及并发其他影响肢体运动、共济功能及言语功能的疾病,影响日常生活自理能力患者也除外。样本含量适当是抽样调查应遵循的基本原则。应根据a等计算允许误差的最小样本量,从而确定n所需样本量而不是随机指定。

2、实验设计要严格尊循3个原则,即对照、随机和重复原则。本实验研究组(105例)给予规范化血压控制治疗;对照组(105例)给予传统血压治疗。但实验称随机选取2011年1月-2012 年12月收治的脑出血患者,随机平均分为两组。此处不够谨慎,因为研究对象是患者,首先患者疾病比较复杂,可能并发多种疾病,如糖尿病、脑动脉瘤等,对脑出血的复发及预后均有影响,可重复性差,应绝对控制这些因素。且在临床试验中无论是研究人员或是受试者,都可能为某种原因有意无意的给试验结果带来偏倚,应采用盲法尽量减少此种偏倚。

搜集资料:即选择得到资料的最佳途径和获取完整、准确、可靠资料的过程,但此试验按照神经功能缺损程度评分(ccss)及斯堪的那维亚卒中量表(sss)神经功能评分,具有主观性,给试验结果带来偏倚。

整理资料:其目的是将搜集到的原始资料系统化、条理化,便于进一步计算统计指标和深入分析。资料整理前在次审查,无误后设计分组。

分析资料:根据研究设计的目的、要求、资料的类型和分布特征选择正确的统计方法进行分析。常常从两个方面分析,一是进行统计描

述,即计算统计指标,如平均值等;二是进行统计推断包括参数估计和假设检验部分。此实验处只给出了整体的对比,未给出具体单项对比数据可能不够呢详细。且此表格尚需要进一步完善应给出具体的卡方值,表达可能会更清楚详细。

以上仅是我自己对医学统计学的初步理解与掌握,思想仍不够完善与成熟,在以后的学习与应用中会继续努力的。

下载统计学考试知识点总结[小编整理]word格式文档
下载统计学考试知识点总结[小编整理].doc
将本文档下载到自己电脑,方便修改和收藏,请勿使用迅雷等下载。
点此处下载文档

文档为doc格式


声明:本文内容由互联网用户自发贡献自行上传,本网站不拥有所有权,未作人工编辑处理,也不承担相关法律责任。如果您发现有涉嫌版权的内容,欢迎发送邮件至:645879355@qq.com 进行举报,并提供相关证据,工作人员会在5个工作日内联系你,一经查实,本站将立刻删除涉嫌侵权内容。

相关范文推荐

    2014统计学考试重点

    统计学重点 第一章 着重考查对数据的理解,注意后面的习题 注意几个概念:样本、总体、统计量、变量以及数据的来源等 第二章 中位数、四分位数、均值的计算,分组均值、分组分位......

    统计学总结

    统计学(Statistics):应用统计学的原理与方法,研究数据的搜集、整理与分析的科学,对不确定性数据作出科学的推断。 医学统计学(Medical Statistics):应用统计学的原理与方法,研究医学......

    儿科考试总结知识点

    ★小儿年龄分期①胎儿期(从受精卵形成到胎儿出生为止,共40周)②新生儿期(自胎儿娩出脐带结扎至28天的时期,按年龄划分,此期实际包含在婴儿期内)3。婴儿期(自出生到1周岁之前为婴儿期......

    报检员考试相关知识点总结.

    一 关于时间上的有效期 1. 一般货物的出运期限为60天;植物和植物产品为21天,北方冬季可适当延长至35天;鲜活类货物为14天 2. 《出境货物通关单》的有效期限,一般商品为60天;植物......

    教育法考试知识点总结

    第一题:教育法治化要求做到:教育法制化是教育法律化和制度化的简称,它是指国家机关制定完备的教育法律,并依照法律的规定来领导和管理教育失误,促进教育管理的法制化、制度化。1.主......

    教育法考试知识点总结

    教育法考试知识点总结 第一题:教育法治化要求做到(重点看看,概念和四个方面的要求,第11-12页) 教育法制化是教育法律化和制度化的简称,它是指国家机关制定完备的教育法律,并依照法......

    教育法考试知识点总结

    教育法考试知识点总结 第一题:教育法治化是教育法律化和制度化的简称,它是指国家机关制定完备的教育法律,并依照法律的规定来领导和管理教育失误,促进教育管理的法制化、制度化......

    教育法考试知识点总结

    教育法考试知识点总结 选择题(10题,每题2分,20分) 名词解释(5题,每题3分,15分) 简答(5题,每题7分,35分) 论述(1分,15分) 案例分析(1题,15分,问两小题,可能是材料分析或写法律文书)第一次课 第一题:教育法治化要求做到......