第一篇:语言研究中的统计学试题2014.4
语言研究中的统计学试题
硕 士 研 究 生 课 程 考 试 试 题
考试科目:课程编号:
年级:学院:
说明:所有答案必须写在答题册上,否则无效。共页第页 Answer the following questions briefly.1.描述数据的中间位置与总体变化的量有哪些,他们的区别是什么,分别对于区间型数据与次序(分类)数据举例进行说明。(10%)
2.正态分布数据有何特点,举例说明。(10%)
3.表示变量相关的量有哪些,如何在实际中应用分别举例说明。(10%)
4.如何建立一个一元回归模型和多元回归模型,请用实际数据举例说明(重在建模过程和结果分析)。(20%)
5.比较两组数据分哪几种情况,分别用什么方法,请举例说明。(20%)
6.比较两组以上数据分哪几种情况,分别用什么方法,请举例说明。(20%)
7.请举例说明你对因素分析应用的理解。(10%)
注:以上题目在举例过程中都用spss软件。
命题人:学科负责人签字:出题日期:2014.04.22
第二篇:统计学中几个基本理论
统计学中几个基本理论的释疑
文章摘要:如果仍用教材中的公式计算样本成数,则所计算出来结果就会与实际不符。
在计算加权算术平均数时,即使各组的单位数相等,权数也不一定会失去其应有的作用。正确的说法应该是:当各组权数相等且都等于某一任意常数时,权数就失去了其应有作用。此时,加权算术平均数就变成了简单算术平均数。也正是因为如此,所以我们说简单算术平均数是加权算术平均数的一个特例,是各组权数相等时的一种特殊的加权算术平均数。
对“下限在内,上限不在内”原则的辨析现行统计学教材在讲到组距式变量数列的编制时,指出 “凡遇到某单位的变量值刚好等于相邻两组界限时,例行规定是将这个单位归入作为下限的组内,即所谓„下限在内,上限不在内‟的原则。”代写理论统计学论文笔者认为,对其变量值刚好等于相邻两组界限值的单位,究竟是归入作为下限的组内,还是归入作为上限的组内,不应简单地像教材中所说的那样用一条“下限在内,上限不在内”的原则去解决,而是应当视变量的取值是越大越好还是越小越好来分别解决。具体说来,对于其取值越大越好的变量,当某一单位的变量值刚好等于相邻两组的界限值时,应按“下限在内 ,上限不在内”的原则归组;而对于其取值越小越好的变量,当某一单位的变量值刚好等于相邻两组的界限值时,则应按“上限在内,下限不在内”的原则归组。因为只有这样,才能将性质不同的单位分别划归到不同的组里去,从而实现统计分组的目的。否则,就不能做到这一点。以下分别举例说明。
“下限在内,上限不在内”原则的例题资料如表6所示。表 6 按耐穿时间分组(天)鞋数(双)280~300 300~320 320~340 340~360 360~380 2 000 3 000 26 000 8 000 1 000 ∑40 000
注:国家规定,该种鞋的耐穿时间在300天以上(含300 天)为合格。此例中,由于鞋的耐穿时间是一个取值越大越好的变量, 因此,当某一双鞋的耐穿时间刚好等于300天时,理应将其归入300天作为下限的第二组,而不应将其归入300天作为上限的第一组。因为只有这样,才能保证第一组的鞋都是不合格的,第二组的鞋都是合格品。现在如果硬要将耐穿时间刚好等于300天的鞋划归到第一组中去,则第一组的全部鞋中,既有合格品,又有不合格品,这样就达不到统计分组的目的。“上限在内,下限不在内”的原则的例题资料如表7所示 因为只有这样,才能确保第三组中的零件都为不合格品。否则的话,如果硬要将尺寸误差刚好等于3mm 的零件划归到第三组中去,则就会使第三组的全部零件中,既有合格品,又有不合格品,从而也就不能 达到统计分组的目的。对“整群抽样中样本成数计算公式”的质疑与释疑现行统计学教材中, 在谈到整群抽样方式下样本成数的计算公式时,往往是这样介绍的:若已知样本中各群的成数分别 P1, P2, P3,…Pr,则样本成数计算公式为: P=P1+P2+P3+…Prr=∑Pir(i=1, 2, 3,…, r)例如,从某县的50个村中随机不重复抽取5个村,对被抽中的5个村的所有养猪专业户进行全面调查,以推算该县存栏牲猪数及其优良品种率。调查结果,各村养猪专业户存栏牲猪的优良品种率分别为90%、80%、50%、70%和55%,则该县养猪专业户样本存栏牲猪的优良品种率为: P =∑Pir =90%+80%+50%+70%+55%5 =69% 笔者认为,用上述公式计算样本成数是不正确的 一方面,在介绍平均数时,所有教材都讲到如果只知道若干个比率而要求计算其平均数,则最合适的方法应是简单几何平均法,而不应是简单算术平均法;另一方面,在实际抽样中,所获取的信息往往是计算各样本群成数的原始信息,此时,如果仍用教材中的公式计算样本成数,则所计算出来结果就会与实际不符。
因此,我认为,在计算样本成数时,应针对不同的已知条件,采取不同的计算方法:(1)当已知样本中各样本群内具有某种特征的单位数n1i、不具有某种特征的单位数noi和样本单位总数n三个中的任意两个时,可采用下列公式计算样本成数: P=∑n1i∑ni或=∑(ni-noi)∑ni=∑n1i∑(n1i+noi)(i=1, 2, 3, …, r)如,假设原例中被抽中的5个村养猪专业户的存栏牲猪数分别为5 000头、8 000头、7 000头、8 800头和6 500头, 且其中的优良品种数分别为4 500头、6 400头、3 500头、6 160头和3 575头,则该县养猪专业户样本存栏牲猪的优良品种率为: P =∑n1i∑ni =4 500+6 400+3 500+6 160+3 5755 000+8 000+7 000+8 800+6 500 =68·37%(2)当已知样本中各样本群内具有某种特征的单位数占各样本群内单位总数的比重Pi和各样本群的单位总数ni时,可采用下列公式计算样本成数: P= Pini ni(i=1, 2, 3,…, r)如,假设原例中被抽中的5个村中各村养猪专业户的牲猪存栏数分别为5 000头、8 000头、7 000头、8 800头和 6 500头,且其优良品种率分别为90%、80%、50%、70%和 55%,则该县养猪专业户样本存栏牲猪的优良品种率为: P = Pini ni =68·37%
第三篇:美国统计学研究方向
美国统计学专业研究方向
发表日期: 2012-02-03 15:29
收藏
阅读(132)
回复(0)
统计学研究方向基础方面包括:样本设计、数据挖掘、随机过程、建立统计模型、模型的选择、时间序列、非参数统计方法、蒙特卡罗法、生存分析、空间统计、贝叶斯推论、各种经典的统计模型的学习、各种概率论理论等等。
统计学研究方向应用方面包括:生物统计、环境统计、金融统计、经济统计、遗传统计、农业统计等等。这些是统计在其他领域的应用而形成的研究分支。其中生物统计的发展非常快,现在很多学校都专门设立了独立的生物统计系。
从美国的开设统计学专业的学校来看,统计学大致可以分为两类,一类是偏向于理论研究的,另一类是偏向于实际应用的。前者主要包括统计系或者数学系下统计学,后者包含的方面就非常的广泛了,包括目前非常热门的生物统计,还有经济统计、以及社会统计学等。每个方向未来的发展也是不同的。
统计学属于申请美国留学的申请人热衷申请的热门专业,统计学是应用数学的一个分支,所以这势必要求申请人数学背景要过应。美国统计学的下设分支领域主要涵盖四个方面,生物统计、金融统计、应用统计,以及数理统计,下面分别为大家详细介绍一下。
一、生物统计。该专业是探讨如何进行生物学实验研究的设计、取样、分析、资料整理与推论的学科,是美国统计学专业最热门的领域。该专业的毕业生就业前景广阔,可以进入大学从事教学和科研工作,也可以在生物科技公司和制药公司进行统计分析,还有相当数量的毕业生进入了医疗机构、证券分析和保险公司工作。
二、金融统计。该专业主要关注中央银行和各金融机构的统计部门如何对各项金融业务的活动情况和资料进行调查、收集、整理和分析,从而提供统计信息和统计咨询意见,进行金融统计管理和监督。该专业的毕业生一般进入银行、证券公司、投资基金、会计师事务所和保险公司等金融机构工作。
三、应用统计。该专业主要研究统计学的一般理论和方法在社会、自然、经济、工程等各个领域的应用,它是统计学和其他学科之间形成的交叉学科。毕业生可从事数学研究、统计学研究、运筹学研究、计算机编程、数据分析、会计、证券分析等多种职业。
四、数理统计。该专业应用概率论的分析结果更深入地研究统计资料,通过对某些现象发生频率的观察来揭示其内在规律,并通过构建数学模型来做出相应的判断和预测。该专业的毕业生在政府部门、金融机构和计算机公司等单位同样拥有广阔的就业前景。
虽然统计学从属于数学类,但是从美国大学的设置来看,统计已经慢慢从数学系中独立出来,成为单独的统计系。现在越来越多的学校成立统计系就是最好的证明。在科学技术飞速发展的今天,统计学广泛吸收和融合其他学科的新理论,不断开发应用新技术和新方法,深化和丰富了统计学传统领域的理论与方法,并拓展了新的领域。
第四篇:2013统计学复试笔试题
2013年统计学复试笔试题(经统、概统同卷,7选5)
一、(马尔科夫链)有一个序列{Xt},证明至少有一个常反状态。
二、(随机过程)
三、抽样误差和非抽样误差来源有哪些?说说下列定义及相互关系:均方误差、方差和偏差,标准差和标准误。
四、有一个健康保险公司在全国有25个分公司,现总公司想进行一次全国性的客户满意度调查,并以此作为考核每个分公司的指标之一,请你设计一个调查方案,并说说应该注意的因素。
五、现在有一个时间序列,拟建立ARMA(p,q)模型,说说要怎么建立这个模型。
六、说说主成分分析的步骤,并说出主成分的至少2个性质,并说说实际中选择主成分的标准是什么,说明主成分分析需要对数据有分布的假定吗?
七、题目给了10个数据,从小到大排列,3个数小于8,7个数大于8,现在要用Wilcoxon符号秩检验:检验中位数是否为8。叙述Wilcoxon检验的步骤。如果你对Wilcoxon检验不熟悉,请应用或者设计一个方法进行检验。
注:复试笔试分3部分:
第一部分英语听力,放的是6级真题去掉第三部分写单词及句子,共25小题。
第二部分英语笔试,分汉译英和英译汉两部分,题量为一张A4纸。第三部分如上所述为专业课,共一张A4纸。
第五篇:统计学中的基本概念
变异
同质~性质相同。是指基本条件相同
变异~同质事物之间的差异。是指不同的个体在相同的条件下,对外界环境因素的反应不同
总体 Population:根据研究目的所确定的同质观察单位的全体;
个体 Individual:是构成总体的最基本观察单位;
根据随机化原则有总体中随机抽取部分个体组成总体的过程
样本 Sample:是从总体中按照一定的目的随机抽取的一部分个体。为什么要抽样? 样本含量Sample Size:样本中包含的个体个数。
抽样原则
一个样本应具有:
“代表性(representative)”
“随机性(randomization)”
“可靠性(reliability)”
如果进行两个或多个样本之间的比较,要求:每二个样本之间应具有:可比性(comparable)可比性是指处理组(临床设计中称为治疗组)与对照组之间,除处理因素不同外,其他可能影响实验结果的因素要求基本齐同,也称为齐同对比原则。
误差(error)
系统误差(system error)
由于固定的原因(常见实验条件),影响资料的准确性。可以克服。
随机测量误差(random measurement error)
由于偶然的因素造成同一对象多次测量结果的差异。可控制但不可
消除。
应采取措施,尽最大可能在一定的允许范围内
抽样误差(sampling error)
抽样的原因造成统计量与总体参数或不同样本统计量之间的差异。
原因:①个体变异②抽样
抽样误差,对它要用统计方法进行正确分析
概率
概率有古典概率与统计概率之分, 医学上常用的是统计概率f/N
必然事件,概率为 1
不可能事件,概率为 0
小概率事件,P≤0.05 或 P≤0.01
常把 P≤0.05 作为事物差别有统计学意义的界限,