第一篇:统计学资料
1.统计三个方面得含义和之间的关系。
三个方面含义:统计工作,统计资料和统计学。统计工作是指对数据资料进行收集整理和分析;统计资料是统计工作中所得到得数据资料;统计学是指统计工作、统计实践的总结。三者关系:三者具有密切的含义。统计工作是人们统计实践,是主观反映客观的认识过程。统计资料是统计工作的结果。统计工作与统计资料是过程和成果的关系,统计学是统计工作经验的总结和概括,反之,统计学所阐述的理论和方法又是指导统计工作的原则和方法。因此,统计学和统计工作之间存在着理论和实践的辩证关系。
2.标志和统计指标的区别和联系。
标志是用来说明总体单位特征的名称。指标是说明总体的综合数量特征。
区别:a说明对象不同,标志是说明总体单位特征,而指标是说明总体特征的。b : 表现方式不同。标志可以用数字和文字表现,指标只可以用数字表现。c : 指标数值是经过一定的汇总取得的,而标志中的数量标志不一定经过汇总可直接取得。d :标志一般不具备时间地点等条件,但作为一个完整的统计指标一定要讲时间地点范围。
联系:a :大多数指标值都是由标志值汇总计量得来的。b : 数量标志和指标在一定条件下可以相互转化。
3.统计调查方案的内容有哪些?
确定调查目的、调查对象和调查单位、调查项目、调查时间和调查期限、制定调查的组织和实施计划、选择调查方法什么是统计分组以及作用?
统计分组,就是根据统计研究的需要将统计总体按照一定的标志区分为若干个组成部分的一种统计方法。
作用:划分现象的类型,揭示现象内部结构,分析现象之间的依存关系,时期数列和时点数列各有什么特点?
时期数列:a.数列中各个指标的数值可以相加的,即相加具有一定的经济意义;b.数列中每一个指标数值的大小与所属时期长短有直接的联系;c.数列中每个指标的数值通常是通过连续不断的登记而取得的。
时点数列:a.数列中各个指标的数值时不能相加的,相加不具有实际的经济意义;b.数列中每个指标数值的大小与其时间间隔没有直接联系; c.数列中的每个指标的数值通常是通过一定时期登记一次而取得的。影响抽样平均误差的因素。
全及总体标志的变动程度;抽样单位数的多少;抽样的组织方式;直线回归的特点。
a.两个变量是不对等的,要区分自变量和因变量; b.当X为自变量,Y为因变量时,Y以X为回归方程。当Y为自变量,X为因变量时,X 以Y 为回归方程;c.回归系数必有正负号。若为正,说明两个变量为正相关。若为负,则说明两个变量为负相关;d.可依据回归方程,用自变量的值推算因变量的估计量;e.因变量时随机的,而自变量不是随机的,是给定的值。相关分析的主要内容有哪些?
a.确定现象之间是否存在依存关系以及相关的形态如何(做散点图);b.确定相关关系的密切程度(计算相关系数);c.确定相关关系的数学表达式:Y=F(x)+u;d.确定因变量估计值的误差程度;e.对相关系数进行显著性检验。
第二篇:企业经营统计学简答题整理资料
1、简述企业数据处理的流程(P16)
(1)数据的整理和审核(2)数据的录入(3)数据的编辑
(4)数据的存储和处理(5)数据的利用
2、简述企业实物性投入表的基本构成(P98)
企业实物性投入产出表以实物单位为计量单位,一般有四个部分构成,分别称为第一、第二、第三、第四象限。
第一象限为左上角的一个n*n的自产产品间的方阵,反映的是企业内部各产品部门之间的产品消耗和供应关系;
第二象限为右上角的两个n维向量,分别反映的是各生产部门自产产品的最终使用数量和各生产部门自产产品的总量;
第三象限为左下角的一个k*n的矩阵,它反映的是企业各生产部门,在生产过程中消耗外购产品数量,说明企业各生产部门与企业以外的经济技术联系;
第四象限为右下角的两个k维向量,分别反映的是企业外购产品经过中间使用以后剩余部分的使用数量和企业外购产品总量
3、简述企业产品原是实物量应遵循的原则(P67)
a)在货物生产企业产出的实物量中,企业产出统计必须符合规定的产品质量标准; b)在货物生产企业产出的实物数量中,企业产出统计必须是当期生产的产品;
c)在货物生产企业产出的实物数量中,企业产出统计必须是通过企业人力资本作用,并完后了一定工序的产品;
d)必须严格按照产品目录的规格填报;
e)必须坚持入库原则;
4、如何从统计上反映企业产品市场占有情况(P165)、市场占有率和市场覆盖率
市场占有率是指企业、部门或地区生产的某种(某大类)产品在市场上的销售量(额)占市场同类或同行业产品市场销售总量(额)的比重。其计算公示为:
市场占有率=某种产品(某大类)的销售量(额)/该类产品的市场销售总量(额)或市场占有率=企业的全部商品的销售额/同行业的商品销售额
市场覆盖率是指某企业某种产品的行销地区数占该产品行销地区总数的比重。它是从市场占有的广度方面反映企业某种产品的市场占有情况和企业产品竞争能力、辐射能力的指标。其计算公式为:
市场覆盖率=企业生产的某种产品销售地区数/该种产品行销地区总数
5、影响企业员工需求的基本因素(P235)
(1)产品的需求(2)企业支付给员工的薪酬(3)资本的价格
(4)企业的发展战屡和经营规划(5)生产技术和管理水平的变化
6、简述企业综合评价的基本步骤(P352)
(1)明确评价对象系统和评价目的(2)根据企业综合评价的目的,选择若干个指标,建立综合指标体系
(3)对不同计量单位的指标数值进行同度量处理
(4)确定指标体系中各指标的权数,以保证评价的科学性
(5)对指标进行汇总,计算综合统计评价值
第三篇:医学统计学各种资料比较_选择方法小结
医学统计学各种资料比较 选择方法小结
一、两组或多组计量资料的比较 1.两组资料:
1)大样本资料或服从正态分布的小样本资料(1)若方差齐性,则作成组t检验
(2)若方差不齐,则作t’检验或用成组的Wilcoxon秩和检验 2)小样本偏态分布资料,则用成组的Wilcoxon秩和检验 2.多组资料:
1)若大样本资料或服从正态分布,并且方差齐性,则作完全随机的方差分析。如果方差分析的统计检验为有统计学意义,则进一步作统计分析:选择合适的方法(如:LSD检验,Bonferroni检验等)进行两两比较。
2)如果小样本的偏态分布资料或方差不齐,则作Kruskal Wallis的统计检验。如果Kruskal Wallis的统计检验为有统计学意义,则进一步作统计分析:选择合适的方法(如:用成组的Wilcoxon秩和检验,但用Bonferroni方法校正P值等)进行两两比较。
二、分类资料的统计分析 1.单样本资料与总体比较 1)二分类资料:
(1)小样本时:用二项分布进行确切概率法检验;(2)大样本时:用U检验。2)多分类资料:用Pearson c2检验(又称拟合优度检验)。2.四格表资料
1)n>40并且所以理论数大于5,则用Pearson c2
2)n>40并且所以理论数大于1并且至少存在一个理论数<5,则用校正c2或用Fisher’s 确切概率法检验
3)n£40或存在理论数<1,则用Fisher’s 检验 3.2×C表资料的统计分析
1)列变量为效应指标,并且为有序多分类变量,行变量为分组变量,则行评分的CMH c2或成组的Wilcoxon秩和检验
2)列变量为效应指标并且为二分类,列变量为有序多分类变量,则用趋势c2检验
3)行变量和列变量均为无序分类变量
(1)n>40并且理论数小于5的格子数<行列表中格子总数的25%,则用Pearson c2
(2)n£40或理论数小于5的格子数>行列表中格子总数的25%,则用Fisher’s 确切概率法检验 4.R×C表资料的统计分析
1)列变量为效应指标,并且为有序多分类变量,行变量为分组变量,则CMH c2或Kruskal Wallis的秩和检验
2)列变量为效应指标,并且为无序多分类变量,行变量为有序多分类变量,作none zero correlation analysis的CMH c2
3)列变量和行变量均为有序多分类变量,可以作Spearman相关分析 4)列变量和行变量均为无序多分类变量,(1)n>40并且理论数小于5的格子数<行列表中格子总数的25%,则用Pearson c2
(2)n£40或理论数小于5的格子数>行列表中格子总数的25%,则用Fisher’s 确切概率法检验
三、Poisson分布资料 1.单样本资料与总体比较:
1)观察值较小时:用确切概率法进行检验。2)观察值较大时:用正态近似的U检验。2.两个样本比较:用正态近似的U检验。
配对设计或随机区组设计
四、两组或多组计量资料的比较 1.两组资料:
1)大样本资料或配对差值服从正态分布的小样本资料,作配对t检验 2)小样本并且差值呈偏态分布资料,则用Wilcoxon的符号配对秩检验
2.多组资料:
1)若大样本资料或残差服从正态分布,并且方差齐性,则作随机区组的方差分析。如果方差分析的统计检验为有统计学意义,则进一步作统计分析:选择合适的方法(如:LSD检验,Bonferroni检验等)进行两两比较。
2)如果小样本时,差值呈偏态分布资料或方差不齐,则作Fredman的统计检验。如果Fredman的统计检验为有统计学意义,则进一步作统计分析:选择合适的方法(如:用Wilcoxon的符号配对秩检验,但用Bonferroni方法校正P值等)进行两两比较。
五、分类资料的统计分析 1.四格表资料
1)b+c>40,则用McNemar配对c2检验或配对边际c2检验 2)b+c£40,则用二项分布确切概率法检验 2.C×C表资料:
1)配对比较:用McNemar配对c2检验或配对边际c2检验 2)一致性问题(Agreement):用Kap检验
变量之间的关联性分析
六、两个变量之间的关联性分析 1.两个变量均为连续型变量
1)小样本并且两个变量服从双正态分布,则用Pearson相关系数做统计分析
2)大样本或两个变量不服从双正态分布,则用Spearman相关系数进行统计分析
2.两个变量均为有序分类变量,可以用Spearman相关系数进行统计分析
3.一个变量为有序分类变量,另一个变量为连续型变量,可以用Spearman相关系数进行统计分析
七、回归分析
1.直线回归:如果回归分析中的残差服从正态分布(大样本时无需正态性),残差与自变量无趋势变化,则直线回归(单个自变量的线性回归,称为简单回归),否则应作适当的变换,使其满足上述条件。2.多重线性回归:应变量(Y)为连续型变量(即计量资料),自变量(X1,X2,…,Xp)可以为连续型变量、有序分类变量或二分类变量。如果回归分析中的残差服从正态分布(大样本时无需正态性),残差与自变量无趋势变化,可以作多重线性回归。
1)观察性研究:可以用逐步线性回归寻找(拟)主要的影响因素 2)实验性研究:在保持主要研究因素变量(干预变量)外,可以适当地引入一些其它可能的混杂因素变量,以校正这些混杂因素对结果的混杂作用
3.二分类的Logistic回归:应变量为二分类变量,自变量(X1,X2,…,Xp)可以为连续型变量、有序分类变量或二分类变量。1)非配对的情况:用非条件Logistic回归
(1)观察性研究:可以用逐步线性回归寻找(拟)主要的影响因素(2)实验性研究:在保持主要研究因素变量(干预变量)外,可以适当地引入一些其它可能的混杂因素变量,以校正这些混杂因素对结果的混杂作用
2)配对的情况:用条件Logistic回归
(1)观察性研究:可以用逐步线性回归寻找(拟)主要的影响因素(2)实验性研究:在保持主要研究因素变量(干预变量)外,可以适当地引入一些其它可能的混杂因素变量,以校正这些混杂因素对结果的混杂作用
4.有序多分类有序的Logistic回归:应变量为有序多分类变量,自变量(X1,X2,…,Xp)可以为连续型变量、有序分类变量或二分类变量。
1)观察性研究:可以用逐步线性回归寻找(拟)主要的影响因素 2)实验性研究:在保持主要研究因素变量(干预变量)外,可以适当地引入一些其它可能的混杂因素变量,以校正这些混杂因素对结果的混杂作用
5.无序多分类有序的Logistic回归:应变量为无序多分类变量,自变量(X1,X2,…,Xp)可以为连续型变量、有序分类变量或二分类变量。
1)观察性研究:可以用逐步线性回归寻找(拟)主要的影响因素 2)实验性研究:在保持主要研究因素变量(干预变量)外,可以适当地引入一些其它可能的混杂因素变量,以校正这些混杂因素对结果的混杂作用
八、生存分析资:要求资料记录结局和结局发生的时间(如;死亡和死亡发生的时间)
1.用Kaplan-Meier方法估计生存曲线 2.大样本时,可以寿命表方法估计
3.单因素可以用Log-rank比较两条或多条生存曲线 4.多个因素时,可以作多重的Cox回归
1)观察性研究:可以用逐步线性回归寻找(拟)主要的影响因素 2)实验性研究:在保持主要研究因素变量(干预变量)外,可以适当地引入一些其它可能的混杂因素变量,以校正这些混杂因素对结果的混杂作用
第四篇:医学统计学各种资料比较选择方法小结
一、两组或多组计量资料的比较 1.两组资料:
1)大样本资料或服从正态分布的小样本资料(1)若方差齐性,则作成组t检验
(2)若方差不齐,则作t’检验或用成组的Wilcoxon秩和检验 2)小样本偏态分布资料,则用成组的Wilcoxon秩和检验 2.多组资料:
1)若大样本资料或服从正态分布,并且方差齐性,则作完全随机的方差分析。如果方差分析的统计检验为有统计学意义,则进一步作统计分析:选择合适的方法(如:LSD检验,Bonferroni检验等)进行两两比较。
2)如果小样本的偏态分布资料或方差不齐,则作Kruskal Wallis的统计检验。如果Kruskal Wallis的统计检验为有统计学意义,则进一步作统计分析:选择合适的方法(如:用成组的Wilcoxon秩和检验,但用Bonferroni方法校正P值等)进行两两比较。
二、分类资料的统计分析 1.单样本资料与总体比较 1)二分类资料:
(1)小样本时:用二项分布进行确切概率法检验;(2)大样本时:用U检验。
2)多分类资料:用Pearson c2检验(又称拟合优度检验)。2.四格表资料
1)n>40并且所以理论数大于5,则用Pearson c2 2)n>40并且所以理论数大于1并且至少存在一个理论数<5,则用校正c2或用Fisher’s 确切概率法检验
3)n£40或存在理论数<1,则用Fisher’s 检验 3.2×C表资料的统计分析
1)列变量为效应指标,并且为有序多分类变量,行变量为分组变量,则行评分的CMH c2或成组的Wilcoxon秩和检验
2)列变量为效应指标并且为二分类,列变量为有序多分类变量,则用趋势c2检验 3)行变量和列变量均为无序分类变量
(1)n>40并且理论数小于5的格子数<行列表中格子总数的25%,则用Pearson c2(2)n£40或理论数小于5的格子数>行列表中格子总数的25%,则用Fisher’s 确切概率法检验
4.R×C表资料的统计分析
1)列变量为效应指标,并且为有序多分类变量,行变量为分组变量,则CMH c2或Kruskal Wallis的秩和检验
2)列变量为效应指标,并且为无序多分类变量,行变量为有序多分类变量,作none zero correlation analysis的CMH c2 3)列变量和行变量均为有序多分类变量,可以作Spearman相关分析 4)列变量和行变量均为无序多分类变量,(1)n>40并且理论数小于5的格子数<行列表中格子总数的25%,则用Pearson c2(2)n£40或理论数小于5的格子数>行列表中格子总数的25%,则用Fisher’s 确切概率法检验
三、Poisson分布资料 1.单样本资料与总体比较:
1)观察值较小时:用确切概率法进行检验。2)观察值较大时:用正态近似的U检验。2.两个样本比较:用正态近似的U检验。
配对设计或随机区组设计
四、两组或多组计量资料的比较 1.两组资料:
1)大样本资料或配对差值服从正态分布的小样本资料,作配对t检验 2)小样本并且差值呈偏态分布资料,则用Wilcoxon的符号配对秩检验 2.多组资料:
1)若大样本资料或残差服从正态分布,并且方差齐性,则作随机区组的方差分析。如果方差分析的统计检验为有统计学意义,则进一步作统计分析:选择合适的方法(如:LSD检验,Bonferroni检验等)进行两两比较。
2)如果小样本时,差值呈偏态分布资料或方差不齐,则作Fredman的统计检验。如果Fredman的统计检验为有统计学意义,则进一步作统计分析:选择合适的方法(如:用Wilcoxon的符号配对秩检验,但用Bonferroni方法校正P值等)进行两两比较。
五、分类资料的统计分析 1.四格表资料
1)b+c>40,则用McNemar配对c2检验或配对边际c2检验 2)b+c£40,则用二项分布确切概率法检验 2.C×C表资料:
1)配对比较:用McNemar配对c2检验或配对边际c2检验 2)一致性问题(Agreement):用Kap检验
变量之间的关联性分析
六、两个变量之间的关联性分析 1.两个变量均为连续型变量
1)小样本并且两个变量服从双正态分布,则用Pearson相关系数做统计分析 2)大样本或两个变量不服从双正态分布,则用Spearman相关系数进行统计分析 2.两个变量均为有序分类变量,可以用Spearman相关系数进行统计分析
3.一个变量为有序分类变量,另一个变量为连续型变量,可以用Spearman相关系数进行统计分析
七、回归分析
1.直线回归:如果回归分析中的残差服从正态分布(大样本时无需正态性),残差与自变量无趋势变化,则直线回归(单个自变量的线性回归,称为简单回归),否则应作适当的变换,使其满足上述条件。
2.多重线性回归:应变量(Y)为连续型变量(即计量资料),自变量(X1,X2,…,Xp)可以为连续型变量、有序分类变量或二分类变量。如果回归分析中的残差服从正态分布(大样本时无需正态性),残差与自变量无趋势变化,可以作多重线性回归。1)观察性研究:可以用逐步线性回归寻找(拟)主要的影响因素
2)实验性研究:在保持主要研究因素变量(干预变量)外,可以适当地引入一些其它可能的混杂因素变量,以校正这些混杂因素对结果的混杂作用
3.二分类的Logistic回归:应变量为二分类变量,自变量(X1,X2,…,Xp)可以为连续型变量、有序分类变量或二分类变量。1)非配对的情况:用非条件Logistic回归
(1)观察性研究:可以用逐步线性回归寻找(拟)主要的影响因素
(2)实验性研究:在保持主要研究因素变量(干预变量)外,可以适当地引入一些其它可能的混杂因素变量,以校正这些混杂因素对结果的混杂作用 2)配对的情况:用条件Logistic回归
(1)观察性研究:可以用逐步线性回归寻找(拟)主要的影响因素
(2)实验性研究:在保持主要研究因素变量(干预变量)外,可以适当地引入一些其它可能的混杂因素变量,以校正这些混杂因素对结果的混杂作用 4.有序多分类有序的Logistic回归:应变量为有序多分类变量,自变量(X1,X2,…,Xp)可以为连续型变量、有序分类变量或二分类变量。1)观察性研究:可以用逐步线性回归寻找(拟)主要的影响因素
2)实验性研究:在保持主要研究因素变量(干预变量)外,可以适当地引入一些其它可能的混杂因素变量,以校正这些混杂因素对结果的混杂作用
5.无序多分类有序的Logistic回归:应变量为无序多分类变量,自变量(X1,X2,…,Xp)可以为连续型变量、有序分类变量或二分类变量。1)观察性研究:可以用逐步线性回归寻找(拟)主要的影响因素
2)实验性研究:在保持主要研究因素变量(干预变量)外,可以适当地引入一些其它可能的混杂因素变量,以校正这些混杂因素对结果的混杂作用
第五篇:统计学
标志是用来说明总体单位特征的名称
指标也称统计指标,是说明总体的中和数量特征的调查对象就是我们需要进行研究的总体范围,即调查总体
调查单位就是我们索要研究的总体单位,也即所要登记的标志的承担者
调查时间是指调查资料所属的时点或时期
调查期限是指调查工作进行的起讠乞时间(从开始到结束),包括搜集资料和报送资料的整个工作所需的时间
普查是专门组织的一次性的全面调查
抽样调查是一种飞全面调查,它是在全部调查单位中按照随机原则抽取一部分单位进行调查,根据调查的结果推断总体的一种调查方法
重点调查是在调查对象范围内选择部分重点调查单位搜集统计资料的非全面调查
典型调查就是在调查对象中有意识地选取若干具有典型意义的或有代表性的单位进行非全面调查
分配数列是在统计分组的基础上,将总体的所有单位按组归类整理,并按一定顺序排列,形成各个单位在各组间的分布
CPI居民消费价格指数,居民消费指数反映居民家庭一般所购买的消费品和服务价格水平变动情况的标准
随机误差是指遵守了随机原则但可能抽到各种不同样本而产生的误差
统计的三重意义:即统计工作、统计资料和统计学。统计工作是指对社会经济现象数量方面进行搜集、整理和分析工作的总结,它是一种社会调查研究活动。统计资料也即统计信息,是统计部门或单位进行工作所搜集、整理、编制的各种统计数据资料的总称,它是进行国民经济宏观调控的决策依据,是社会公众了解国情、国力和社会发展状况的信息主体,统计学是关于统计过程的理论和方法的科学
时期和时点指标的区别:1.时期指标的数值是连续计数的,它的每一个数值是表示现象在一段时期内发生的总量;而时点指标的数值是间断计数的,它的每一个数值是表示现象发展到一定时点上的所处的水平2.时期指标具有累加性,即各期数值相加可以说明现象在较长时期内发生的总量;而时点指标不具有累加性,即各时点数值相加是没有意义的 3.时期指标数值的大小受时期长短的制约;而时点指标数值的大小与时点间的间隔长短无直接的关系
指数的概念:广义的指数是指一切说明社会经济现象数量变动或差异程度的相对数,如动态相对数、比较相对数、计划完成相对数等都可称为指数。狭义指数是一种特殊的相对数,也即专指不能直接相加和对比的复杂社会经济现象综合变动程度的相对数