教育统计学知识点学前教育统计学复习总结(共5篇)

时间:2019-05-12 02:37:15下载本文作者:会员上传
简介:写写帮文库小编为你整理了多篇相关的《教育统计学知识点学前教育统计学复习总结》,但愿对你工作学习有帮助,当然你在写写帮文库还可以找到更多《教育统计学知识点学前教育统计学复习总结》。

第一篇:教育统计学知识点学前教育统计学复习总结

1.1教育统计学是运用数理统计的原理和方法,研究教育问题的一门应用科学。它的主要任务是研究如何搜集、整理、分析由教育调查和教育试验所获得的数字资料,并以此为依据,进行科学推断,揭示教育现象所蕴含的客观规律。

1.2教育统计学的研究内容从具体应用的角度来分,可分为性质类别和数量类别。性质类别是按事物的不同性质进行分类。数量类别是按数值的大小进行分类,并排成顺序。

3.1统计表的结构及其编制的原则和要求

1.标题:表的名称;上方;简明扼要;2.表号:表的序号;左方;时间顺序。3.标目:表中对统计数可以分成:1.描述统计2.推断统计3.试验设计 1.3统计推理的方法是归纳法。1.4教育统计学是教育科研定量分析的重要工具。

1.5教育统计学的的具体意义:①可以顺利的阅读运用统计方法进行定量分析的科研报告和文献,从中可以间接地学习国内外先进的研究成果;②可以提高教育工作的科学性和效率;③为学习教育测量和教育评价打下基础。

1.6变量:试验结果的数值不是恒定不变的量,我们把它称为变量,也说是 可变的数量标志。常量:数值保持恒定的量。随机变量:能表示随机现象各种结果的变量称为随机变量。统计处理的变量都是随机变量。一般用X、Y、Z来表示。

1.7随机现象:第一,一次试验有多种可能结果,其所有可能结果是已知的;第二,试验之前不能预料哪一种结果会出现;第三,在相同的条件下可以重复试验。1.8标志:人或事物的属性或特征的名称。1.9总体:是我们所研究的具有某种共同特征的个体的总和。有同质性、大量性、变异性的特点。2.1个体:总体中的每个单位称为个体。

2.2样本:是从总体中抽取的作为观察对象的一部分个体。样本中包含的个体数目称为样本的容量,一般用n表示。样本中个体数目大于30称为大洋本,等于或小于30称为小样本。

2.3统计量:样本上的数字特征是统计量。也就是说,根据教育调查或试验获得的数据所计算出来的能够描述这组数据各种特征的数量是统计量。2.4参数:总体上的各种数字特征是参数。也即反映总体上各种特征的数量是参数。

2.5数据的分类:经常性资料、专题性资料

2.6教育调查:是指在没有预定因子、不施行控制的条件下,对现成的教育方面有关客观事实所进行的观察和分析。它是教育科学研究中普遍采用的一种方法。从调查方法来分,可分为现情调查、回顾调查和追踪调查。从调查范围来分,可分为全面调查和费全面调查。

2.7教育实验:是指在预定的控制因子影响下,对教育方面有关客观事实所进行的的观察和分析。2.8数据的种类数据就是随机变量的观察值。1.按来源分:点计数据和度量数据。

点计数据是指计算个数所获得的数据。度量数据是指用一定的工具或一定的标准测量所获得的数据。2.按随机变量取值是否具有连续性分:

间断型随机变量的数据:取值个数有限的数据 连续型随机变量的数据:取值个数无限的数据 2.9数据的统计分类:数据的统计分类,是指按照研究对象的本质特征,根据分析研究的目的、任务,以及统计分析时所用统计方法的可能性,将所获得的数据进行分组归类。它是对数据进行归纳、整理、简化、概括的第一步,为进一步分析研究打下了基础。统计分类不仅以研究对象的本质特性为依据,还要以研究目的、任务的需要为依据,当然也应当考虑到统计方法的可能性。分类标志按形式划分,据分类的项目。4.线条:四条基本线条;不宜多。5.数字:一般用阿拉伯数字表示;如又小数,数位要一致,要对齐;尽量不要有空格;咱却数字可用省略号或问号表示;无数字可画横杠。6.表注:不是必要组成部分;下方;补充说明表的来源或补充说明数字;字号不要大于表中的其他文字。基本原则:简单明了重点突出(科学简明使用美观)3.2统计表的种类

1.简单表:只列出观察对象的名称、地点、时序或统计指标名称的统计表为简单表。2.分组表:只按一个标志分组的统计表为分组表。3.复合表:按两个或两个以上标志分组的统计表为复合表。3.3频数:某一个随机事件在n次试验中出现的次数称为这个随机事件的频数。一般用f表示。频数分布:各种随机事件在n次试验种出现的次数分布称为频数分布,即把随机事件出现的次数都呈现出来。频数分布表:把频数分布用表格的形式表示出来就是频数分布表。

3.4频数分布表分类: 1.简单频数分布表(1)间断变量的频数分布表(2)连续变量的频数分布表2.累积频数和累积百分比分布表:累积频数就是把频数一组一组累加起来,得到的频数叫累积频数。累积百分比就是把频数用百分比变成相对频数。用表格把这两种频数表示出来就是累积频数分布表和累积百分比分布表。

3.5累积频数分布表制作A.先制作频数分布表B.从最低一组的频数开始登记

3.6统计图是用来表达统计指标与被说明的事物之间数量关系的图形。它是整理数据的一种方法。在运用统计图时,一般附有统计表。3.7统计图的结构及其绘制规则

统计图由标题、图号、标目、图形、图注等项构成。1.标题。简明扼要;切合内容;必要时注明时间地点;字体在图中为最大;一般在图的下方。

2.图号。按出现的顺序编序号;在图题的左前方。3.标目。即统计的项目。对于有纵横轴的统计图,应在纵横轴上分别标明统计项目及其尺度。

4.图形。图形线在图中为最粗,要清晰,图形的高与宽之比3:5为宜,以美观为准。5.图注。不是必要组成部分,而是补充说明;文字简明扼要;字体要小;写在图题的下方。

3.8算术平均数的概念及特性

1.算术平均数是所有观察值的总和除以总频数所得之商,简称平均数或均数、均值。2.算术平均数的特性:(1)观察值的总和等于算术平均数的N倍,即:X=∑x/n(2)各观察值与其算术平均数之差的总和等于零,即:∑x=Xn(3)若一组观察值是由两部分或几部分组成,这组观察值的算术平均数可以组成部分的算术平均数而求得。即:X= naXa+nbXb/na+nb

(4)各个观察值与其算术平均数之差的平方和最小。即:∑(x-X)2=min 3.计算法:X=∑fx/n

3.9算术平均数:最常用,优点也最多。

优点:1感应灵敏2严密确定3简明易懂,计算简便4适合代数运算5受抽样变动的影响较小

缺点:1易受两极端数值的影响2有一两个数据模糊不请时,无法计算。这时通常选择中位数。

4.1中位数是位于以一定顺序(从小到大或从大到小)排列的一组数据中央位置的数值,在这一数值上、下各有一半频数分布着。用Md表示。它是集中量的一种指标,也是百分位数的一种。

4.2中位数频数分布表计算法:Md=Lmd+(n/2-n1)i/fmd 4.3百份位数是位于以一定顺序(一般是由小到大)排列的一组数据中某一百分位置的 计算方法: 常用的百分位距有两种:

P90=L90+(0.9n-n1)i/f90

P10=L10+(0.1n-n2)i/f10

5.6平均差的概念:所谓平方差就是每一个数据与该组数据的中位数(或算术平均数)离差的绝对值的算术平均数。通常用MD表示。5.7平均差的计算方法

1.原始数据计算法:MD=∑∣x-Md∣/n 2.频数分布表计算法:MD=∑f∣x-Md∣/n

评价1.优点:意义明确,计算容易,每个数据都参加了运算,考虑到全面的离差,反应灵敏。

2.缺点:因为计算要用绝对值,不适合代数运算。正是由于这个缺点,在统计分析中应用较少。

Pp=Lp+(pn-n1)i/fp

4.4中位数 :优点有严密确定、容易理解、计算简便、受抽样变动影响较小 主要优点,即区别于别的集中量的优点在于适用于以下几种情况:1一组数据中有特大或特小两极端数值时;2一组数据中有个别数据不确切、不清楚时; 3资料属于等级性质时。缺点:1反应不灵敏,所以代表性不如算术平均数;2不稳定可靠3不适合代数运算所以,中位数一般情况下不用,除非别无选择。

4.5众数是集中量的一种指标,用M0表示。

理论众数是指与频数分布曲线最高点相对应的横坐标上的一点。

粗略众数是指一组数据中频数出现最多的那个数。4.6众数的求法

1.观察法。直接查找粗略众数的方法 先把数据列出来,然后找出现频数最大的数,即为众数。2.公式计算法(近似计算法):

(1)皮尔逊的经验法:M0≈ 3Md-2X

使用条件:频数呈正态分布或者接近正态分布。(2)金氏插补法:M0=Lmo+fa/fa+fb * i当频数呈正态分布或偏态分布时,都可使用此公式。4.7众数 优点少:(1)可以很快捷地知道变化的趋势;知道一组数据的代表值。如了解一个年级的代表年龄。缺点多:(1)不准确,受分组的影响比较大;受波动的影响比较大;受抽样的影响比较大。(2)不适合作进一步的代数运算。所以只有当我们想了解数据的大概水平时,才使用。4.8算术平均数,中位数,众数三者的关系 当频数分布呈正态时,三者重合为一点。

当频数分布为正偏态时,X-Md/X-M0=1/3,且X>Md>M0, 负偏态时,X

5.1几何平均数:Xng=√x1x2…xn

当一个数列的后一个数据时以前一个数据为基础成比率(即等比级数)增长时,要用几何平均数求其平均增长率(即等比级数中的比率)。常用作速率的集中量。

5.2调和平均数:是一组数据倒数的算术平均数的倒数,亦称倒数平均数。XH=1/∑(1/x)/n

5.3全距一组数据的最大值和最小值之差又称极差。5.4四分位距: 以一定顺序排列的一组数据中间部位50%个频数距离的一半作为差异量指标。原始数据计算法: QD=Q3-Q1/2 Q3 表示第三个四分位数(第75百分位数)Q1 表示第一个四分位数(第25百分位数)Q1=LQ1+(n/4-n1)i/fQ1 5.5百分位距:百分位距是指两个百分位数之差。

5.8方差也叫变异数,是指离差平方的算术平均数。每个数据与算术平均数的离差平方的平均值。

其定义公式为:ó2∑(x-X)

2x=/n数学性质:

1、ó

2=X2-x22、ó2=∑(x-A)2/n-[∑(x-A)/n]2

3、ó2=∑x2/n-(∑x/n)

24、ó2=i*∑[(x-A)/i]

2/n-i*[∑

(x-A)/n]2 /n

标准差是指离差平方和平均后的方根。其定义公式为:ó=√∑(x-X)2

x/n

二、方差和标准差的计算方法

1.原始数据计算法:ó2/n-(∑x/n)

2x=√∑x

2.频数分布表计算法:ó22

x=√∑fx/n-(∑fx/n)评价1.优点:反应灵敏;严密确定;适合代数计算;计算简单;用样本数据推断总体差异量时,方差和标准差是最好的估计量。一般和算术平均数结合在一起使用。2.缺点:不太容易理解;易受两极端数值的影响;有个别数值模糊时,无法计算;单位的平方不好理解。

5.9差异系数的用途:比较不同单位资料的差异程度;或比较单位相同而两个平均数相差较大的资料的差异程度;可判断他书差异情况。所谓差异系数是指标准差与其算术平均数的百分比。用公式可表示为:CV=óx/X*100% 6.1差异系数的应用条件:

主要用于等比量表的数据。即既具有等距的单位,有具有绝对的零点(即测量的起点为绝对零)6.2偏态量有两种计算方法。

1.利用算术平均数与众数或中位数的距离来计算 公式为:①SK=X-M0/óx当SK=0,则分布呈对称型;当SK>0,分布为正偏态;当SK<0,分布为负偏态。②由于M0具有不稳定性,不确定性,常可用中位数和算术平均数来表示众数。SK=3(X-Md)/óx 2.根据动差来计算:用三级动差来计算频数分布的偏态系数:u=∑(x-X)3/n或u

333=∑f(x-X)/n,则a=∑(x-X)3/n/ó333

3x或a3=∑f(x-X)/n/óx

当a3=0,表明频数分布呈对称形;a3>0,表明频数分布呈正偏态;a3<0,表明频数分布呈负偏态。当总频数n>200时,所计算出的偏态系数才比较可靠。

二、峰态量计算方法:1.用两个百分位距来计算。判断是高狭峰还是低阔峰。Ku=P75-P25/2(P90-P10)当Ku=0.263,分布呈正态峰,当Ku<0.263,分布呈高狭峰;Ku>0.263,分布呈低阔峰。

2.根据动差来计算。a∑(x-X)4/n/ó4

4=x-3或a4=∑

f(x-X)4/n/ó4

x-3当a4=0,分布呈正态峰;a4>0, 分布呈高狭峰;a4<0,分布呈低狭峰。只有当n>1000时,所计算出的峰态系数才比较可靠。

第二篇:统计学复习总结

3.样本:从总体中抽样部分个体的过程称为抽样,所抽得的部分为样本。(从样本中随机抽取的有代表性的一部分)

4.统计量:是统计理论中用来对数据进行分析、检验的变量。

5.频率:是指单位时间内完成振动的次数,是描述振动物体往复运动频繁程度的量。

6.概率:是描写某一事件发生的可能性大小的一个量度。

8.系统误差:在收集资料过程中,由于仪器初始状态未调整到零、标准试剂未经校正、医生掌握疗效标准偏高或偏低等原因,可造成观察结果倾向性的偏大或偏小。

9.随机测量误差:在收集原始资料过程中,即使仪器初始状态及标准试剂以校正,但是由于各种偶然因素的影响也会造成同一对象多次测定的结果完全不一致。这种误差往往没有固定的倾向,有时高有时低。

12.标准误:也称标准误差,即样本均数的标准差,是描述均数抽样分布的离散程度及衡量均数抽样误差大小的尺度。

13.标准差:是一种表示分散程度的统计观念。

14.指标:指预期中打算达到的指数、规格、标准。

15.相对数:是两个相关的绝对数之比,也可以是两个统计指标之比。

16.率:表示在一定范围内某现象的发生数与可能发生的总数之比,说明某现象出现的强度活频率。

17.构成比:表示某事物内部各组成部分在整体中所占的比重,常以百分比表示。

18.相对比:是A、B两个关联指标之比,用以描述两者的对比水平。19 统计学是一门用于观察资料的应用科学它具有严密的科学逻辑无限的应用性和以高等数学为基础的计算性它广泛的涉及到自然科学人文科学和管理科学的各个领域

20医学统计研究对象及特征同质性 大量性变异性平均数是描述一组同质的计量资料集中趋势(平均水平)的指标 22 算术均数 是描述一组同质的计量资料集中趋势(平均水平)的指标

23几何均数是描述一组同质的呈对数整台分布的计量资料变异系数的指标 1极差即最大值与最小值之差。四分位数间距2离均差平方和 方差 标准差 变异系数 3方差4标准差5变异系数 25参数估计包括点估计和区间估计搜集资料

一资料来源

1统计报表

2报告卡如报出生率换染率

3日常工作记录如 住院病历

4专题研究或实验研究

5学术专题研究会讨论会经验交流会

6图书资料

7国际互联网

二资料要求

(一)三性及时性 正确性完整性

(二)四原则对照原则均衡原则随机化原则重复原则

三 整理资料核对 2 分组按质量等级分组3 归纳 手工法 机械法 4 列表

1.什么叫医学统计学?医学统计学与统计学、卫生统计学、生物统计学有何联系与区别?

医学统计学:是统计学的重要应用领域,它运用概率论、数理统计的原理和方法,结合医学实践,阐述统计设计的基本原理和步骤,研究资料和信息收集、整理和分析,进行科学推断的一门应用统计学。医学统计学与生物统计学、卫生统计学是统计学原理和方法在互有联系的不同学科领域的应用,三者间既有区别,又有交叉,故难以截然划定界限。生物统计学应用于生物学研究,从生物范畴的角度来看,显然比医学统计学的范围更广,其原理和方法一般均可应用于医学研究。医学统计学和卫生统计学均应用于医学研究,而前者侧重于医学的生物性方面,后者侧重于公共卫生学的社会性方面。

2.标准差和标准误有何区别和联系?

区别:标准差与标准误的意义、作用和使用范围均不同。

(1)标准差一般用s 表示,是表示个体间变异大小的指标,反映了整个样本对样本平均数的离散程度,是数据精密度的衡量指标。

标准误一般用sx 表示,反映样本平均数对总体平均数的变异程度,从而反映抽样误差的大小,是量度结果精密度的指标。

(2)随着样本数(或测量次数)n 的增大, 标准差趋向某个稳定值,即样本标准差s 越接近总体标准差σ。

标准误则随着样本数(或测量次数)n 的增大逐渐减小,即样本平均数越接近总体平均数μ;故在实验中也经常采用适当增加样本数(或测量次数)n 减小sx 的方法来减小实验误差,但样本数太大意义也不大。

(3)标准差是最常用的统计量, 一般用于表示一组样本变量的分散程度,当资料呈正态分布时,与均数结合可估计正常值范围,计算变异系数等

标准误一般用于统计推断中,主要包括假设检验和参数估计,如样本平均数的假设检验、参数的区间估计与点估计等。

联系:标准差与标准误尽管都是反映变异程度的指标。标准误是标准差的1/ n;二者都是衡量样本变量(观测值)随机性的指标,只是从不同角度来反映误差;二者在统计推断和误差分析中都有重要的应用。

3.方差分析的基本思想是什么?

通过分析研究中不同来源的变异对总变异的贡献大小,从而确定可控因素对研究结果影响力的大小。将总变异及自由度按其来源分解

4.常用相对数指标有哪些?它们在计算和意义上有何不同? 常用的有率、构成比和相对比,5.x2检验的适用范围和各个公式的适用条件是什么?

6.简述非参数统计方法的概念及适用范围?

在对总体的分布不作假设或仅作非常一般性假设条件下的统计方法

称为“非参数统计”。适用范围:(1)待分析数据不满足参数检验所要求的假定,因而无法应用参数检验。(2)仅由一些等级构成的数据,不能应用参数检验。(3)所提的问题中并不包含参数,也不能用参数检验。(4)当我们需要迅速得出结果时,也可以不用参数统计方法而用非参数统计方法来达到目的。

7.非参数统计方法有何优缺点?

优点 1等级资料2对资料没有特殊要求总体为偏态总体分布未知计量资料(N《30)有过大或过小的数值 3总体方差不齐

缺点检验效率低容易犯第二类错误

8.相关与回归的区别与联系?

回归分与相关分的联系:研究在专业上有一定联系的两个变量之间是否存在直线关系以及如何求得直线回归方程等问题,需进行直线相关和回归分析。从研究的目的来说,若仅仅为了了解两变量之间呈直线关系的密切程度和方向,宜选用线性相关分析;若仅仅为了建立由自变量推算因变量的直线回归方程,宜选用直线回归分析。从资料所具备的条件来说,作相关分析时要求两变量都是随机变量;作回归分析时要求因变量是随机变量,自变量可以是随机的,也可以是一般变量。差别主要是:(1)在回归分析中,y被称为因变量,处在被解释的特殊地位,而在相关分析中,x与y处于平等的地位,即研究x与y的密切程度和研究y与x的密切程度是一致的;(2)相关分析中,x与y都是随机变量,而在回归分析中,y是随机变量,x可以是随机变量,也可以是非随机的,通常在回归模型中,总是假定x是非随机的;(3)相关分析的研究主要是两个变量之间的密切程度,而回归分析不仅可以揭示x对y的影响大小,还可以由回归方程进行数量上的预测和控制。

9.直线相关与等级相关有何区别?

直线相关又称为简单相关,是探讨服从正态分布的两个随机变量X和Y有无线性相关关系的一种统计分析方法。直线相关的性质可由散点图直观地说明。等级相关又称秩相关,方法简单,易学易用,适用范围较广;两事物或现象间是否存在直线相关关系,也可用等级相关来检验。尤其适用于某些指标不便准确地测量,而只能以严重程度、成效大小、名次先后或综合判断等方式定出等级或次序的资统计工作的基本步骤 1 统计设计2资料搜集3资料整理4资料分析

第三篇:统计学复习总结

第二章 统计数据的搜集

1、四种统计测量尺度(定类、定序、定距、定比)的含义

2、四种专门调查(普查、重点调查、典型调查、抽样调查)的适用条件 第三章 统计数据的整理与显示

1、单值数列的编制程序

2、组距数列的编制程序

3、向上(下)累计次数的计算 第四章 统计资料的描述

1、时期指标、时点指标的含义

2、结构、比例、比较、动态、强度相对数的含义

3、计划任务数为计划期内各年的总和时计划完成程度和提前计划完成时间的计算

4、计划任务数为计划末期应达到的水平时计划完成程度和提前计划完成时间的计算

5、计划任务数为相对数时计划完成程度的计算

6、算术平均数的计算(数学性质的内容)

7、几何平均数的计算

8、未分组资料中位数的计算

9、单值数列中位数的计算

10、组距数列中位数的计算

11、单值数列众数的计算

12、组距数列众数的计算

13、众数、中位数和平均数的关系公式

14、未分组资料四分位差的计算

15、组距数列四分位差的计算

16、标准差的计算(简捷公式)

17、离散系数的计算(比较不同均值总体的离散程度)

18、偏态系数的说明

19、峰度系数的说明 第五章 统计资料的推断

1、总体、样本的含义

2、是非标志总体指标(均值、标准差、离散系数)的计算

3、样本方差的计算

4、重复抽样和不重复抽样下样本均值和样本成数抽样平均误差的理论公式计算

5、重复抽样和不重复抽样下样本均值和样本成数抽样平均误差的实际公式计算(不重复抽样下修正系数的两点说明)

6、大样本下样本均值和样本成数抽样极限误差的计算

9、总体均值的区间估计步骤

10、大样本下总体比例的区间估计步骤

11、总体均值的假设检验步骤(单侧检验和双侧检验)

12、大样本下总体比例的假设检验步骤(单侧检验和双侧检验)

13、常见Z值(注意:如假设检验需区分单侧和双侧的情况)第六章 方差分析

1、单因素方差分析的步骤

2、双因素方差分析的步骤 第七章 相关与回归

1、常见散点图的形式

2、相关系数的公式及含义

3、相关与回归的关系(胡说相关)

4、一元线性回归直线方程系数a和b的计算

5、系数b和相关系数r的关系

6、可决系数的计算及直观含义和经济含义 第八章 时间数列分析

1、绝对数时期数列序时平均数的计算

2、绝对数连续时点数列序时平均数的计算

3、绝对数间断时点数列序时平均数的计算

4、三种情况下相对数时间数列序时平均数的计算

5、平均增长量的计算

6、发展速度与增长速度的计算

7、增长1%的绝对值

8、平均发展速度和平均增长速度及相关指标的计算

9、偶数项移动平均需作移正平均

10、移动平均的几点说明

11、最小二乘法测定长期趋势时简捷公式如何令

12、三种趋势方程的数据特征 第九章 统计指数

1、数量指标综合指数的计算

2、质量指标综合指数的计算

3、数量指标加权算术平均指数的计算

4、质量指标加权调和平均指数的计算

5、总量指标变动两因素分析绝对数、相对数形式的计算

6、平均指标变动两因素分析绝对数、相对数形式的计算

t0

第四篇:医学统计学知识点总结

知识点

1.统计学是应用概率论和数理统计的基本原理和方法,研究数据的搜集、整理、分析、表达和解释的一门学科。

2.医学统计学是应用统计学的基本原理和方法,研究医学及其有关领域数据信息的搜集、整理、分析、表达和解释的一门学科。

3.统计软件包是对资料进行各种统计处理分析的一系列程序的组合。4.统计工作的基本步骤:研究设计、搜集资料、整理资料和分析资料。

5.科研结果的好坏取决于研究设计的好坏,研究设计是统计工作中的基础和关键,决定着整个统计工作的成败。

6.统计分析包括统计描述和统计推断。统计描述是对已知的样本(或总体)的分布情况或特征值进行分析表述;统计推断是根据已知的样本信息来推断未知的总体。7.医学原始资料的类型有:计量资料、计数资料、等级资料。

8.计量资料是用定量的方法对每一个观察单位的某项指标进行测定所得的资料。

9.计数资料是把观察单位按某种属性(性质)或类别进行分组,清点各组观察单位数所得资料。

10.等级资料是把观察单位按属性程度或等级顺序分组,清点各组观察单位数所得资料。各属性之间有程度的差别。等级资料的等级顺序不能任意颠倒。11.同质:是指所研究的观察对象具有某些相同的性质或特征。

12.变异:是同质个体的某项指标之间的差异,即个体变异或个体差异性。13.总体是根据研究目的确定的同质研究对象的总体。样本是总体中具有代表性的一部分个体。

14.抽样研究是通过从总体中随机抽取样本,对样本信息进行分析,从而推断总体的研究方法。抽样误差是由随机抽样造成的样本指标与总体指标之间、样本指标与样本指标之间的差异,其根源在于总体中的个体存在变异性,只要是抽样研究,就一定存在抽样误差,不能用样本的指标直接下结论。

15.统计学的主要任务是进行统计推断,包括参数估计和假设检验。16.概率是某随机事件发生可能性大小(或机会大小)的数值度量。概率的取值为0≤P≤1。小概率事件是指P≤0.05的随机事件。

17.频数表和频数分布图的用途:(1)揭示计量资料的分布类型。(2)揭示计量资料分布的重要特征—集中趋势与离散趋势。(3)便于发现特大或特小的可疑值。(4)作为陈述资料的形式。例数大时,可以频率估计概率。(5)便于资料的进一步统计分析。18.均数应用于计量资料的正态分布或近似正态分布资料。19.当资料呈正态分布时,均数位于分布的中心。

20.每个观察值都加一个常数a,则均数为原均数加常数a;每个观察值都乘以一个常数b,则均数为原均数的b倍。

21.几何均数应用于对数正态分布或近似正态分布资料,也可用于呈倍数关系的等比资料。在医院中主要用于抗原(体)滴度资料。

22.计算几何均数的资料一般不能有观察值为0,也不能同时包含正负观察值。

23.中位数可用于描述任何分布类型计量资料的集中趋势,但对于正态分布或近似正态分布的资料,中位数不利于进一步的统计分析,故对正态分布或近似正态分布资料应首选均数描述其集中趋势。

24.中位数适用于描述偏态分布资料、一端或两端无确定数据的资料和分布不明资料的集中趋势。

25.极差与四分位数间距可用于描述计量资料的离散程度,但都比较粗略,而四分位数间距较极差稳定,他们用于描述偏态分布资料。

26.中位数M是一个特殊的百分位数,即第50百分位数P50,。百分位数是一种位置指标,样本的第X百分位数记为Px,它表示将全部观测值X1、X2,„,Xn由小到大依次排列后位于第X百分位置的数值。

27.方差和标准差用于描述正态分布计量资料的离散程度。

28.均数与标准差结合用于全面描述正态分布计量资料的集中趋势与离散趋势。

29.变异系数描述的是相对离散程度,无度量衡单位。用于单位不同,或虽单位相同,但均数相差较大的资料间变异程度的比较。

30.正态分布是横轴上方以均数处最高的单峰对称分布,以均数为中心,左右两侧对称。正态分布N(μ,σ²)中有两个参数:总体均数μ和总体标准差σ。μ是位置参数,σ是变异度参数。

31.正态分布曲线下的面积是1,其分布有一定的规律,x±1.64s内的面积为90%,x±1.96s内的面积为95%,x±2.58s内的面积为99%。32.常用相对数有:率、构成比、相对比。

33.率是说明某现象发生的频率或强度。某一分率的改变不影响其他分率变化。

34.构成比是表示某事物内部各组成部分所占的比重或分布。某一部分构成比的改变将影响其他构成比的变化。

35.相对比表示两个有关事物指标,用以说明一个指标是另一个指标的几倍或几分之几。两个指标可以是绝对比、相对数或平均数。

36.应用相对数注意事项:(1)计算相对数时分母应该有足够数量即例数不能太小。(2)计算合计率或平均率时,不能把n个率相加后除以n,应该绝对数相加后再计算相对数。(3)正确区分构成比与率,分析时不能以构成比代替率。(4)相对数的比较应注意其可比性。对比组之间除了被研究的因素不同以外,其他相对数造成影响的因素应可能在构成比代替率。(5)样本率或样本构成比在比较时应做假设检验。

37.常用的标准化方法有直接标准化法、间接标准化法和反推标准法,简称直接法、间接法和反推法。

38.一般选择“标准”的方法有两种:(1)选择具有代表性的,较稳定的、数量较大的人群作为“标准”;(2)互相比较资料中任选一组数据作“标准”。

39.标准化死亡比(SMR)是被标化组的实际死亡数与预期死亡数之比,若SMR>1,表示被标化组死亡率高于标准组;若SMR<1,表示被标化组死亡率低于标准组; 40.计算标准化率的步骤:⑴根据资料所具备的条件选用直接法或间接法;⑵选定标准构成;⑶选择公式计算标准化率。

41.应用标准化法的注意事项:(1)标准化法只适用于内部构成不同影响到总率比较的情况;

(2)由于选择的标准不同,算出的标准化率也不同,但比较的结论一致;(3)标准化后的标准化率,已经不再反映当时当地的实际水平,它只表示相互比较的资料间的相对水平;(4)样本标准化率也存在抽样误差,也需要进行假设检验。

42.发病率是计算一定期间内某人群中的新发病例数,而患病率是计算调查时点被调查人群中的现患病例数。

43.在一定期间内某人可能发病一次以上而成为多个病例,所以发病率可能会大于100%;;而患病率不会出现大于100%的情况。

44.发病率高的疾病称为多发病;患病率高的疾病称为常见病。患病率高,发病率也高的疾病称为常见多发病。

45.统计表一般由标题、标目、线条、数字和备注等部分组成。统计表的编制应:⑴重点突出,简单明了,一张统计表至应包括一个中心内容;⑵主谓分明,层次清楚;⑶结构完整,有自明性。

46.常用的统计图有条图、圆图、百分条图、直方图、线图、半对数线图、散点图、箱式图和统计地图等。

47.单个构成比的描述,可选用圆图或百分条图;多个构成比的描述和比较,宜选用百分条图。

48.普通线图适用于描述某项指标随某个连续型数值变量变化而变化的幅度(绝对变化趋势);半对数线图适用于描述某项指标随某个连续型数值变量变化而变化的速度(相对变化趋势)。

49.箱式图通常选用5个描述统计量来绘制,即最小值、下四分位数(P25)、中位数(M)、上四分位数(P75)、最大值;可用于描述某个连续型数值变量的分布特征,也可用于比较不同类别之间某个连续型数值变量分布特征的差异。

50.均数抽样误差是抽样产生的由于个体差异所导致的样本均数与样本均数之间、样本均数与总体均数之间的差异。

51.标准误是样本均数的标准差,是描述均数抽样误差大小的指标。增加样本含量可减小样本均数的标准误,从而降低抽样误差。

52.参数估计是指用样本指标(统计量)来推断总体指标(参数)。估计方法有点估计和区间估计,区间估计是按预先给定的概率1-α,由样本指标确定的包含总体参数的一个范围。

53.可信区间是指总体均数可能所在的范围。用于推断总体参数所在的范围。总体均数95%可信区间的意义为:总体均数在x±t0.05,νSx或x±1.96Sx范围内的可能性为95%。

54.在抽样研究中,由于有抽样误差存在,不能直接通过比较样本均数与样本均数之间、样本均数与总体均数之间的大小得出结论,要进行假设检验。55.假设检验的基本思想包括小概率思想和反证法思想。56.假设检验是先对总体作出某种假定(检验假设),然后根据样本信息来推断其是否成立的一类统计方法的总称。用于推断总体参数是否相等。

57.假设检验的基本步骤:⑴建立检验假设,确定检验水准;⑵计算检验统计量;⑶确定P值,作出统计判断。

58.单样本t检验的目的是推断样本均数所代表的总体均数与已知总体均数是否相同,它要求样本取自正态总体。

59.配对设计包括:⑴两个受试对象按某特征相同或相近配成对子,分别给予不同的处理;⑵同一受试对象给予不同处理或处理前后比较。它可以降低抽样误差,提高统计效率。60.配对t检验适用于配对设计的计量资料的比较,且要求差值服从正态分布。

61.完全随机设计可以将一批同质受试对象随机分配到各组,也可以是随机抽取几组不同的受试对象,观察其实验效应。

62.完全随机设计两样本均数比较的t检验是推断计量资料的两个总体均数之间有无差别的假设检验方法,要求样本来自正态总体,且两总体方差相等(方差齐)。

63.方差齐性检验的适用条件是两样本均来自正态分布的总体,方差齐性检验中的检验统计量F服从F分布,有两个自由度,分子的自由度(较大方差)和分母的自由度(较小方差)。F值越大,P值越小。

64.两个样本均数比较,方差不齐时刻选择:⑴近似t′检验;⑵通过一定的变量变换以达到方差齐;⑶选用非参数统计,如秩和检验等。65.Z检验适用于大样本资料的假设检验。

66.第Ⅰ类错误:检验假设H0本来是成立的,经过检验后被拒绝了,即“弃真”。其发生的的概率为α,为已知。

67.第Ⅱ类错误:检验假设H0本来是不成立的,经过检验后被接受了,即“存伪”。其发生的概率为β,属未知数。68.假设检验的注意事项:⑴要有严密的研究设计;⑵选用的假设检验方法应符合应用条件;⑶有统计学意义不等于有实际意义;⑷结论不能绝对化;⑸正确理解P值与差别有无统计意义;⑹平衡Ⅰ类错误和Ⅱ类错误。69.方差分析是一种以分析数据的变异为基础,以F值为检验统计量的计量资料的假设检验方法,主要用于推断计量资料单因素k水平(k≧3)或多因素不同水平总体均数间的差异性,其前提条件为资料服从正态分布,各组方差齐。

70.随机区组设计资料的总变异被分解为3个部分,即处理组间变异、区组间变异和误差。区组变异和误差两部分相当于单因素方差分析的组内变异。

71.两两比较的方法很多,常用q检验、LSD—t检验等;q检验适用于探索性研究,对每两个样本均数都进行检验;LSD—t检验适用于事先有明确假设的证实性研究。72.常用数据变换的方法有对数变换、平方根变换、平方根反正弦变换、倒数变换。

273.X检验是一种以Χ²分布为基础,以Χ²值为检验统计量的计数资料的假设检验方法。

274.X值反映实际频数(A)和理论频数(T)的符合程度。

275.X检验的主要用途:⑴推断两个或两个以上总体率(或构成比)之间有无差别;⑵两变量间有无相关关系;⑶检验频数分布的拟合优度。

2276.四格表X检验的注意事项:(1)当n≥40,T≥5时,用四格表x检验的基本公式或专用22公式计算X 值;(2)当n≥40,1≤T<5时,需要用校正公式计算X 值;(3)当n<40或2T

2277.行×列表资料X检验的注意事项:(1)行×列表X检验允许有1/5的基本格子的理论频数小于5大于1,但不能有理论频数小于1。⑵如果有1/5以上格子的理论频数小于5大于1,或有一个格子的理论频数小于1,可采用以下处理方法:①增加样本含量:可以增大理论频数;②将理论频数太小的行或列与性质相近的邻行或邻列中的实际频数合并;③删去理论频数太小的格子所对应的行或例。

78.依次增减四格表中某个格子(一般选用行合计与列合计均为最小的那个格子)的数据,可列出周边合计不变条件下各种组合的四格表(一般可列出最小周边合计数加1个四格表)。

79.非参数检验是一类不依赖于总体分布类型的检验,即在应用中可以不考虑被研究对象为何种分布以及分布是否已知,检验假设中没有包括总体参数的一类统计方法。80.秩和检验的适用范围:⑴未加精确测量的资料(包括等级资料);⑵偏态分布且无法转化为正态分布的资料;⑶分布不清的资料。

81.配对资料的秩和检验用于配对设计计量资料差值的比较和单一样本与总体中位数的比较。

82.直线相关是分析服从正态分布的两个随机变量x和y有无线性相关关系的一种统计分析方法。

83.相关系数是描述两个变量间线性相关关系的密切程度与方向的统计指标。相关系数的符号表示两变量的线性相关的方向。其特点为:⑴相关系数r没有单位;⑵取值范围在﹣1和1之间;⑶r为正表示正相关,r为1表示完全正相关;r值为负表示负相关,r为﹣1表示完全负相关;⑷r绝对值越接近1,表示两个变量间相关关系密切程度越高;越接近0,则相关关系越不密切。

84.相关分析的前提条件:两个随机变量;散点图呈线性相关;服从双变量正态分布。85.在有相关关系时,根据r值判断两变量相关的密切程度:⑴|r|≥0.7,两变量有高度相关关系;⑵0.7>|r|≥0.4,两变量有中度相关关系;⑶|r|<0.4,两变量有低度相关关系。

86.直线回归分析的前提条件:⑴线性:两个变量间存在线性关系;⑵独立性:任意两个观察值互相独立;⑶正态性:应变量y是服从正态分布的随机变量;⑷方差齐:给定x后,应变量y的方差相等。

87.等级相关应用范围:⑴不服从双变量正态分布或偏态分布;⑵总体分布类型未知;⑶原始数据是等级变量。

88.对同一资料,相关系数t检验与回归系数t 检验效果相同。

89.决定系数r²决定回归效果的好坏,r²越接近1,回归的效果越好。

90.直线回归方程:y=a+bx其中a为回归直线在Y轴上的截距:⑴a>0表示直线与纵轴的交点在原点的上方;⑵a<0则交点在原点的下方;⑶a=0则回归直线通过原点;b为回归系数,即直线的斜率:⑴b>0表示直线从左下方走向右上方,即 y随 x的增大而增大;⑵b<0表示直线从左上方走向右下方,即 y随 x的增大而减小;⑶b=0表示直线与 x轴平行,即x与 y无直线关系;⑷b的统计学意义是x每增(减)一个单位,y平均改变b个单位。

91.实验设计的特点:⑴研究者能人为设置处理因素;⑵受试对象接受何种处理因素或水平是由随机分配而定的。

92.医学实验设计包括处理因素或研究因素,受试对象和实验效应三个基本要素。

93.常用对照的形式为空白对照、安慰剂对照、实验对照、标准对照、自身对照、相互对照及历史对照等。

94.随机化包括随机抽样和随机分组,随机抽样指保证总体中的每一个个体都有同等的机会被抽出来作为样本;随机分组指保证样本中的每一个个体都有同等的机会被分配到实验组或对照组。

95.实验设计的基本原则:对照、随机、重复、均衡。

96.重复是指研究样本要有一定的数量,即在保证研究结果具有一定可靠性的条件下,确定最少的样本例数。

97.均衡原则又称齐同对比原则,指实验组和对照组或各实验组之间,除了处理因素以外,其他一切条件应尽可能相同或一致。

98.完全随机设计又称随机对照试验,属于单因素研究设计。

99.样本含量估计需要确定四个基本因素:α、1-β、σ、δ。α、δ与样本含量成反比,σ(或s)、1-β与样本含量成正比。

100.剂量反应是实验物质引起实验动物总体中产生某种反应的剂量。

第五篇:医学统计学知识点总结

知识点

1.统计学是应用概率论和数理统计的基本原理和方法,研究数据的搜集、整理、分析、表

达和解释的一门学科。

2.医学统计学是应用统计学的基本原理和方法,研究医学及其有关领域数据信息的搜集、整理、分析、表达和解释的一门学科。

3.统计软件包是对资料进行各种统计处理分析的一系列程序的组合。

4.统计工作的基本步骤:研究设计、搜集资料、整理资料和分析资料。

5.科研结果的好坏取决于研究设计的好坏,研究设计是统计工作中的基础和关键,决定着

整个统计工作的成败。

6.统计分析包括统计描述和统计推断。统计描述是对已知的样本(或总体)的分布情况或

特征值进行分析表述;统计推断是根据已知的样本信息来推断未知的总体。

7.医学原始资料的类型有:计量资料、计数资料、等级资料。

8.计量资料是用定量的方法对每一个观察单位的某项指标进行测定所得的资料。

9.计数资料是把观察单位按某种属性(性质)或类别进行分组,清点各组观察单位数所得

资料。

10.等级资料是把观察单位按属性程度或等级顺序分组,清点各组观察单位数所得资料。各

属性之间有程度的差别。等级资料的等级顺序不能任意颠倒。

11.同质:是指所研究的观察对象具有某些相同的性质或特征。

12.变异:是同质个体的某项指标之间的差异,即个体变异或个体差异性。

13.总体是根据研究目的确定的同质研究对象的总体。样本是总体中具有代表性的一部分个

体。

14.抽样研究是通过从总体中随机抽取样本,对样本信息进行分析,从而推断总体的研究方

法。抽样误差是由随机抽样造成的样本指标与总体指标之间、样本指标与样本指标之间的差异,其根源在于总体中的个体存在变异性,只要是抽样研究,就一定存在抽样误差,不能用样本的指标直接下结论。

15.统计学的主要任务是进行统计推断,包括参数估计和假设检验。

16.概率是某随机事件发生可能性大小(或机会大小)的数值度量。概率的取值为0≤P≤1。

小概率事件是指P≤0.05的随机事件。

17.频数表和频数分布图的用途:(1)揭示计量资料的分布类型。(2)揭示计量资料分布的重

要特征—集中趋势与离散趋势。(3)便于发现特大或特小的可疑值。(4)作为陈述资料的形式。例数大时,可以频率估计概率。(5)便于资料的进一步统计分析。

18.均数应用于计量资料的正态分布或近似正态分布资料。

19.当资料呈正态分布时,均数位于分布的中心。

20.每个观察值都加一个常数a,则均数为原均数加常数a;每个观察值都乘以一个常数b,则均数为原均数的b倍。

21.几何均数应用于对数正态分布或近似正态分布资料,也可用于呈倍数关系的等比资料。

在医院中主要用于抗原(体)滴度资料。

22.计算几何均数的资料一般不能有观察值为0,也不能同时包含正负观察值。

23.中位数可用于描述任何分布类型计量资料的集中趋势,但对于正态分布或近似正态分布的资料,中位数不利于进一步的统计分析,故对正态分布或近似正态分布资料应首选均数描述其集中趋势。

24.中位数适用于描述偏态分布资料、一端或两端无确定数据的资料和分布不明资料的集中

趋势。

25.极差与四分位数间距可用于描述计量资料的离散程度,但都比较粗略,而四分位数间距

较极差稳定,他们用于描述偏态分布资料。

26.中位数M是一个特殊的百分位数,即第50百分位数P50,。百分位数是一种位置指标,样本的第X百分位数记为Px,它表示将全部观测值X1、X2,„,Xn由小到大依次排列后位于第X百分位置的数值。

27.方差和标准差用于描述正态分布计量资料的离散程度。

28.均数与标准差结合用于全面描述正态分布计量资料的集中趋势与离散趋势。

29.变异系数描述的是相对离散程度,无度量衡单位。用于单位不同,或虽单位相同,但均

数相差较大的资料间变异程度的比较。

30.正态分布是横轴上方以均数处最高的单峰对称分布,以均数为中心,左右两侧对称。正

态分布N(μ,σ²)中有两个参数:总体均数μ和总体标准差σ。μ是位置参数,σ是变异度参数。

31.正态分布曲线下的面积是1,其分布有一定的规律,±1.64s内的面积为90%,±

1.96s内的面积为95%,±2.58s内的面积为99%。

32.常用相对数有:率、构成比、相对比。

33.率是说明某现象发生的频率或强度。某一分率的改变不影响其他分率变化。

34.构成比是表示某事物内部各组成部分所占的比重或分布。某一部分构成比的改变将影响

其他构成比的变化。

35.相对比表示两个有关事物指标,用以说明一个指标是另一个指标的几倍或几分之几。两

个指标可以是绝对比、相对数或平均数。

36.应用相对数注意事项:(1)计算相对数时分母应该有足够数量即例数不能太小。(2)计算

合计率或平均率时,不能把n个率相加后除以n,应该绝对数相加后再计算相对数。(3)正确区分构成比与率,分析时不能以构成比代替率。(4)相对数的比较应注意其可比性。对比组之间除了被研究的因素不同以外,其他相对数造成影响的因素应可能在构成比代替率。(5)样本率或样本构成比在比较时应做假设检验。

37.常用的标准化方法有直接标准化法、间接标准化法和反推标准法,简称直接法、间接法

和反推法。

38.一般选择“标准”的方法有两种:(1)选择具有代表性的,较稳定的、数量较大的人群

作为“标准”;(2)互相比较资料中任选一组数据作“标准”。

39.标准化死亡比(SMR)是被标化组的实际死亡数与预期死亡数之比,若SMR>1,表示被

标化组死亡率高于标准组;若SMR<1,表示被标化组死亡率低于标准组;

40.计算标准化率的步骤:⑴根据资料所具备的条件选用直接法或间接法;⑵选定标准构成;

⑶选择公式计算标准化率。

41.应用标准化法的注意事项:(1)标准化法只适用于内部构成不同影响到总率比较的情况;

(2)由于选择的标准不同,算出的标准化率也不同,但比较的结论一致;(3)标准化后的标准化率,已经不再反映当时当地的实际水平,它只表示相互比较的资料间的相对水平;

(4)样本标准化率也存在抽样误差,也需要进行假设检验。

42.发病率是计算一定期间内某人群中的新发病例数,而患病率是计算调查时点被调查人群

中的现患病例数。

43.在一定期间内某人可能发病一次以上而成为多个病例,所以发病率可能会大于100%;;

而患病率不会出现大于100%的情况。

44.发病率高的疾病称为多发病;患病率高的疾病称为常见病。患病率高,发病率也高的疾

病称为常见多发病。

45.统计表一般由标题、标目、线条、数字和备注等部分组成。统计表的编制应:⑴重点突

出,简单明了,一张统计表至应包括一个中心内容;⑵主谓分明,层次清楚;⑶结构完

整,有自明性。

46.常用的统计图有条图、圆图、百分条图、直方图、线图、半对数线图、散点图、箱式图

和统计地图等。

47.单个构成比的描述,可选用圆图或百分条图;多个构成比的描述和比较,宜选用百分条

图。

48.普通线图适用于描述某项指标随某个连续型数值变量变化而变化的幅度(绝对变化趋

势);半对数线图适用于描述某项指标随某个连续型数值变量变化而变化的速度(相对变化趋势)。

49.箱式图通常选用5个描述统计量来绘制,即最小值、下四分位数(P25)、中位数(M)、上四分位数(P75)、最大值;可用于描述某个连续型数值变量的分布特征,也可用于比较不同类别之间某个连续型数值变量分布特征的差异。

50.均数抽样误差是抽样产生的由于个体差异所导致的样本均数与样本均数之间、样本均数

与总体均数之间的差异。

51.标准误是样本均数的标准差,是描述均数抽样误差大小的指标。增加样本含量可减小样

本均数的标准误,从而降低抽样误差。

52.参数估计是指用样本指标(统计量)来推断总体指标(参数)。估计方法有点估计和区

间估计,区间估计是按预先给定的概率1-α,由样本指标确定的包含总体参数的一个范围。

53.可信区间是指总体均数可能所在的范围。用于推断总体参数所在的范围。总体均数95%可信区间的意义为:总体均数在±t0.05,νS或±1.96S范围内的可能性为95%。

54.在抽样研究中,由于有抽样误差存在,不能直接通过比较样本均数与样本均数之间、样

本均数与总体均数之间的大小得出结论,要进行假设检验。

55.假设检验的基本思想包括小概率思想和反证法思想。

56.假设检验是先对总体作出某种假定(检验假设),然后根据样本信息来推断其是否成立的一类统计方法的总称。用于推断总体参数是否相等。

57.假设检验的基本步骤:⑴建立检验假设,确定检验水准;⑵计算检验统计量;⑶确定P

值,作出统计判断。

58.单样本t检验的目的是推断样本均数所代表的总体均数与已知总体均数是否相同,它要

求样本取自正态总体。

59.配对设计包括:⑴两个受试对象按某特征相同或相近配成对子,分别给予不同的处理;

⑵同一受试对象给予不同处理或处理前后比较。它可以降低抽样误差,提高统计效率。

60.配对t检验适用于配对设计的计量资料的比较,且要求差值服从正态分布。

61.完全随机设计可以将一批同质受试对象随机分配到各组,也可以是随机抽取几组不同的受试对象,观察其实验效应。

62.完全随机设计两样本均数比较的t检验是推断计量资料的两个总体均数之间有无差别的假设检验方法,要求样本来自正态总体,且两总体方差相等(方差齐)。

63.方差齐性检验的适用条件是两样本均来自正态分布的总体,方差齐性检验中的检验统计

量F服从F分布,有两个自由度,分子的自由度(较大方差)和分母的自由度(较小方差)。F值越大,P值越小。

64.两个样本均数比较,方差不齐时刻选择:⑴近似t′检验;⑵通过一定的变量变换以达

到方差齐;⑶选用非参数统计,如秩和检验等。

65.Z检验适用于大样本资料的假设检验。

66.第Ⅰ类错误:检验假设H0本来是成立的,经过检验后被拒绝了,即“弃真”。其发生的的概率为α,为已知。

67.第Ⅱ类错误:检验假设H0本来是不成立的,经过检验后被接受了,即“存伪”。其发

生的概率为β,属未知数。

68.假设检验的注意事项:⑴要有严密的研究设计;⑵选用的假设检验方法应符合应用条件;

⑶有统计学意义不等于有实际意义;⑷结论不能绝对化;⑸正确理解P值与差别有无统计意义;⑹平衡Ⅰ类错误和Ⅱ类错误。

69.方差分析是一种以分析数据的变异为基础,以F值为检验统计量的计量资料的假设检验

方法,主要用于推断计量资料单因素k水平(k≧3)或多因素不同水平总体均数间的差异性,其前提条件为资料服从正态分布,各组方差齐。

70.随机区组设计资料的总变异被分解为3个部分,即处理组间变异、区组间变异和误差。

区组变异和误差两部分相当于单因素方差分析的组内变异。

71.两两比较的方法很多,常用q检验、LSD—t检验等;q检验适用于探索性研究,对每两

个样本均数都进行检验;LSD—t检验适用于事先有明确假设的证实性研究。

72.常用数据变换的方法有对数变换、平方根变换、平方根反正弦变换、倒数变换。

273.X检验是一种以Χ²分布为基础,以Χ²值为检验统计量的计数资料的假设检验方法。274.X值反映实际频数(A)和理论频数(T)的符合程度。

275.X检验的主要用途:⑴推断两个或两个以上总体率(或构成比)之间有无差别;⑵两变量间有无相关关系;⑶检验频数分布的拟合优度。

2276.四格表X检验的注意事项:(1)当n≥40,T≥5时,用四格表x检验的基本公式或专用

22公式计算X 值;(2)当n≥40,1≤T<5时,需要用校正公式计算X 值;(3)当n<40或

2T

2277.行×列表资料X检验的注意事项:(1)行×列表X检验允许有1/5的基本格子的理论

频数小于5大于1,但不能有理论频数小于1。⑵如果有1/5以上格子的理论频数小于5大于1,或有一个格子的理论频数小于1,可采用以下处理方法:①增加样本含量:可以增大理论频数;②将理论频数太小的行或列与性质相近的邻行或邻列中的实际频数合并;③删去理论频数太小的格子所对应的行或例。

78.依次增减四格表中某个格子(一般选用行合计与列合计均为最小的那个格子)的数据,可列出周边合计不变条件下各种组合的四格表(一般可列出最小周边合计数加1个四格表)。

79.非参数检验是一类不依赖于总体分布类型的检验,即在应用中可以不考虑被研究对象为

何种分布以及分布是否已知,检验假设中没有包括总体参数的一类统计方法。

80.秩和检验的适用范围:⑴未加精确测量的资料(包括等级资料);⑵偏态分布且无法转

化为正态分布的资料;⑶分布不清的资料。

81.配对资料的秩和检验用于配对设计计量资料差值的比较和单一样本与总体中位数的比

较。

82.直线相关是分析服从正态分布的两个随机变量x和y有无线性相关关系的一种统计分析

方法。

83.相关系数是描述两个变量间线性相关关系的密切程度与方向的统计指标。相关系数的符

号表示两变量的线性相关的方向。其特点为:⑴相关系数r没有单位;⑵取值范围在﹣1和1之间;⑶r为正表示正相关,r为1表示完全正相关;r值为负表示负相关,r为﹣1表示完全负相关;⑷r绝对值越接近1,表示两个变量间相关关系密切程度越高;越接近0,则相关关系越不密切。

84.相关分析的前提条件:两个随机变量;散点图呈线性相关;服从双变量正态分布。

85.在有相关关系时,根据r值判断两变量相关的密切程度:⑴|r|≥0.7,两变量有高度

相关关系;⑵0.7>|r|≥0.4,两变量有中度相关关系;⑶|r|<0.4,两变量有低度相关关系。

86.直线回归分析的前提条件:⑴线性:两个变量间存在线性关系;⑵独立性:任意两个观

察值互相独立;⑶正态性:应变量y是服从正态分布的随机变量;⑷方差齐:给定x后,应变量y的方差相等。

87.等级相关应用范围:⑴不服从双变量正态分布或偏态分布;⑵总体分布类型未知;⑶原

始数据是等级变量。

88.对同一资料,相关系数t检验与回归系数t 检验效果相同。

89.决定系数r²决定回归效果的好坏,r²越接近1,回归的效果越好。

90.直线回归方程:y=a+bx其中a为回归直线在Y轴上的截距:⑴a>0表示直线与纵轴的交点在原点的上方;⑵a<0则交点在原点的下方;⑶a=0则回归直线通过原点;b为回归系数,即直线的斜率:⑴b>0表示直线从左下方走向右上方,即 y随 x的增大而增大;⑵b<0表示直线从左上方走向右下方,即 y随 x的增大而减小;⑶b=0表示直线与 x轴平行,即x与 y无直线关系;⑷b的统计学意义是x每增(减)一个单位,y平均改变b个单位。

91.实验设计的特点:⑴研究者能人为设置处理因素;⑵受试对象接受何种处理因素或水平

是由随机分配而定的。

92.医学实验设计包括处理因素或研究因素,受试对象和实验效应三个基本要素。

93.常用对照的形式为空白对照、安慰剂对照、实验对照、标准对照、自身对照、相互对照

及历史对照等。

94.随机化包括随机抽样和随机分组,随机抽样指保证总体中的每一个个体都有同等的机会

被抽出来作为样本;随机分组指保证样本中的每一个个体都有同等的机会被分配到实验组或对照组。

95.实验设计的基本原则:对照、随机、重复、均衡。

96.重复是指研究样本要有一定的数量,即在保证研究结果具有一定可靠性的条件下,确定

最少的样本例数。

97.均衡原则又称齐同对比原则,指实验组和对照组或各实验组之间,除了处理因素以外,其他一切条件应尽可能相同或一致。

98.完全随机设计又称随机对照试验,属于单因素研究设计。

99.样本含量估计需要确定四个基本因素:α、1-β、σ、δ。α、δ与样本含量成反比,σ(或s)、1-β与样本含量成正比。

100.剂量反应是实验物质引起实验动物总体中产生某种反应的剂量。

下载教育统计学知识点学前教育统计学复习总结(共5篇)word格式文档
下载教育统计学知识点学前教育统计学复习总结(共5篇).doc
将本文档下载到自己电脑,方便修改和收藏,请勿使用迅雷等下载。
点此处下载文档

文档为doc格式


声明:本文内容由互联网用户自发贡献自行上传,本网站不拥有所有权,未作人工编辑处理,也不承担相关法律责任。如果您发现有涉嫌版权的内容,欢迎发送邮件至:645879355@qq.com 进行举报,并提供相关证据,工作人员会在5个工作日内联系你,一经查实,本站将立刻删除涉嫌侵权内容。

相关范文推荐

    统计学复习要点

    第1章统计和统计数据数据类别;总体、样本;几种概率抽样(简单随机抽样,分层抽样,系统抽样,整群抽样) 第2章用图表展示数据 定性数据表:频数分布表,列联表 图:条形图(复式),帕累托图,饼图,环......

    《统计学原理》知识点概括总结

    统计的研究对象、方法 统计 统计研究的特点 统计的职能 统计工作统计学 统计资料 统计调查总体、总体单位(变换关系)统计整理指标 标志(关系、可转换)统计分析数量指标/质量指......

    统计学总结

    统计学(Statistics):应用统计学的原理与方法,研究数据的搜集、整理与分析的科学,对不确定性数据作出科学的推断。 医学统计学(Medical Statistics):应用统计学的原理与方法,研究医学......

    大学统计学考点复习总结

    统计学考点小结一、名词解释 统计学:是研究大量社会现象(主要是经济现象)的总体数量方面的方法论科学。 总体:亦称统计总体,是指客观存在的,在同一性质基础上结合起来的许多个别单......

    统计学考试知识点总结[小编整理]

    第一章 统计这个概念,其实包括三种不同而又密切相关的涵义:即统计资料、统计工作和统计学 统计资料:是反映被调查研究的客观事物及其过程的数字资料以及与之相关的文字资料、图......

    统计学复习单选题答案

    1某研究部门准备在全市200万个家庭中抽取2000个家庭,推断该城市所有职工家庭的年人均收入,这项研究的总体是(B ) A.2000个家庭B.200万个家庭C.2000个家庭的人均收入D.200万个家......

    国贸统计学总复习专题

    统计学总复习 考试题型:单项选择题(20分) 填空题(10分)判断题(10分) 回答问题(15分)论述题(10) 计算分析题(45分) 第一章、导论 12、什么是描述统计?什么是推断统计? 3、统计数据有几种类型......

    医学统计学复习二(范文大全)

    医学统计学复习之二 1.描述一组同质定量资料集中趋势和离散趋势的常用指标有哪些?(注意应用条件!) 2.医学参考值范围与总体均数的可信区间分别如何计算? 3.常用的相对数指标有哪些?率......