第一篇:教案_第七章 假设检验
《统计学》教案
第七章
假设检验
教学目的: 介绍假设检验的基本思想、步骤和规则,两类错误的概念,以及重要总体参数的检验方法。
基本要求: 通过本章学习要求同学们理解假设检验的基本思想、规则和两类错误的概念,掌握假设检验的步骤和总体均值、成数、方差的检验方法。
重点和难点: 假设检验的基本思想、规则和两类错误的概念。
教学内容:§1假设检验的一般问题
§2 一个正态总体的参数检验 体的参数检验
§4假设检验中的其它问题
学时分配:4学时 主要参考书目:
1、陈珍珍等,统计学,厦门:厦门大学出版社,2003年版
2、于磊等,统计学,上海:同济大学出版社,2003年
3、徐国强等,统计学,上海:上海财经大学出版社,2001年版 思考题:
1、请阐述假设检验的步骤
2、假设检验的结果是接受原假设,是否表明原假设是正确的?
3、如何构造检验统计量?
§1假设检验的一般问题
教学内容
一、假设检验的概念 1.概念
事先对总体参数或分布形式作出某种假设 然后利用样本信息来判断原假设是否成立
2.类型
参数假设检验----检验总体参数 非参数假设检验----检验总体分布形式
3.特点
采用逻辑上的反证法
3二个正态总 § 依据统计上的小概率原理----小概率事件在一次试验中不会发生
二、假设检验的步骤
提出原假设和备择假设 确定适当的检验统计量 规定显著性水平 计算检验统计量的值 作出统计决策
三、假设检验中的小概率原理
在一次试验中小概率事件一旦发生,我们就有理由拒绝原假设。因为我们拒绝发生错误的可能性至多是
四、假设检验中的两类错误
1.第一类错误(弃真错误)
原假设为真时,我们拒绝了原假设 第一类错误的概率为 2.第二类错误(取伪错误)
原假设为假时,我们接受了原假设 第二类错误的概率为 比第一类错误更容易发生
即接受原假设很容易发生
五、Neyman和Pearson检验原则
在控制犯第一类错误的概率条件下, 尽可能使犯第二类错误的概率减小。
该原则的含义是, 原假设要受到维护, 使它不致被轻易否定, 若要否定原假设, 必须有充分的理由---小概率事件发生了;接受原假设, 只说明否定它的理由还不充分
六、双侧检验和单侧检验
教学方法
采用课堂教学方法
提问与讨论
1.在假设检验中显著性水平有什么意义?
2.显著性水平相同时,双侧检验和单侧检验的拒绝域是否相同?
板书设计
主要运用多媒体课件展示。重要内容采用书写板书
§2一个正态总体的参数检验
教学内容
一、总体方差已知时的均值检验
1.假定条件
总体服从正态分布
若不服从正态分布, 可用正态分布来近似(n30)2.原假设为:H0: =0;备择假设为:H1: 0
或
H0: ≥0 H1:<0
或
H0: ≤0 H1:>0 3.使用z-统计量
二、例题
1.某机床厂加工一种零件,根据经验知道,该厂加工零件的椭圆度近似服从正态分布,其总体均值为0=0.081mm,总体标准差为= 0.025。今换一种新机床进行加工,抽取n=200个零件进行检验,得到的椭圆度为0.077mm。试问新机床加工零件的椭圆度的均值与以前有无显著差异?(=0.05)
2某批发商欲从生产厂家购进一批灯泡,根据合同规定,灯泡的使用寿命平均不能低于1000小时。已知灯泡使用寿命服从正态分布,标准差为200小时。在总体中随机抽取100只灯泡,测得样本均值为960小时。批发商是否应该购买这批灯泡?(=0.05)
三、总体方差未知时的均值检验
1.假定条件 总体为正态分布
如果不是正态分布, 只有轻微偏斜和大样本(n 30)条件下 2.使用t 统计量
四、例题
1.某厂采用自动包装机分装产品,假定每包产品的重量服从正态分布,每包标准重量为1000克。某日随机抽查9包,测得样本平均重量为986克,样本标准差为24克。试问在0.05的显著性水平上,能否认为这天自动包装机工作正常?
2.一个汽车轮胎制造商声称,某一等级的轮胎的平均寿命在一定的汽车重量和正常行驶条件下大于40000公里,对一个由20个轮胎组成的随机样本作了试验,测得平均值为41000公里,标准差为5000公里。已知轮胎寿命的公里数服从正态分布,我们能否根据这些数据作出结论,该制造商的产品同他所说的标准相符?( = 0.05)
五、总体比例的假设检验
1.在大样本条件下,样本比例p渐近服从正态分布
2.比例检验的 z 统计量
六、例题
某研究者估计本市居民家庭的电脑拥有率为30%。现随机抽查了200的家庭,其中68个家庭拥有电脑。试问研究者的估计是否可信?( = 0.05)
七、总体方差的检验
1.检验一个总体的方差或标准差 2.假设总体近似服从正态分布 3.原假设为 H0: 2 = 02 4.检验统计量
八、例题
根据长期正常生产的资料可知,某厂所产维尼纶的纤度服从正态分布,其方差为0.0025。现从某日产品中随机抽取20根,测得样本方差为0.0042。试判断该日纤度的波动与平日有无显著差异?
教学方法
采用课堂教学方法
提问与讨论
1.结合实例讨论,选取不同的显著性水平,会否影响检验结果
2.结合实例讨论,有些问题若将原假设与备择假设对调,检验结果为什么矛盾?
板书设计
主要运用多媒体课件展示。重要内容采用书写板书
§3两个正态总体的参数检验
教学内容
一、两个总体均值之差的检验
1.假定条件
两个样本是独立的随机样本 两个总体都是正态分布
若不是正态分布, 可以用正态分布来近似(n130和 n230)2.原假设:H0: 1-2 =0;备择假设:H1: 1-2 0 3.检验统计量
若两个总体方差已知,用Z统计量;若两个总体方差未知,用t统计量
二、例题
有两种方法可用于制造某种以抗拉强度为重要特征的产品。根据以往的资料得知,第一种方法生产出的产品其抗拉强度的标准差为8公斤,第二种方法的标准差为10公斤。从两种方法生产的产品中各抽取一个随机样本,样本容量分别为n1=32,n2=40,测得x1 = 50公斤,x2 = 44公斤。问这两种方法生产的产品平均抗拉强度是否有显著差别?( = 0.05)
三、两个总体比例之差的检验
对两个大型企业青年工人参加技术培训的情况进行调查,调查结果如下:
甲厂调查60人,18人参加技术培训。乙厂调查40人,13人参加技术培训。能否根据以上调查结果认为甲乙两厂工人参加技术培训的人数比例相同?( = 0.05)
教学方法
采用课堂教学方法
提问与讨论
1.如何检验一个总体的均值大于另一个总体的均值?
2.如何检验一个总体的某个成数小于另一个总体的相应成数?
板书设计
主要运用多媒体课件展示。重要内容采用书写板书
§4假设检验中的其它问题
教学内容
一、利用置信区间进行假设检验
置信区间对应接受域
二、例题
一种袋装食品每包的标准重量应为1000克。现从生产的一批产品中随机抽取16袋,测得其平均重量为991克。已知这种产品重量服从标准差为50克的正态分布。试确定这批产品的包装重量是否合格?( = 0.05)
三、利用 P-值进行假设检验 1.单侧检验
若p-值 ,接受 H0 若p-值 < , 拒绝 H0 5 2.双侧检验
若p-值 , 接受 H0 若p-值 < , 拒绝 H0
四、例题
欣欣儿童食品厂生产的盒装儿童食品每盒的标准重量为368克。现从某天生产的一批食品中随机抽取25盒进行检查,测得每盒的平均重量为x = 372.5克。企业规定每盒重量的标准差为15克。确定P-值并进行检验。
教学方法
采用课堂教学方法
提问与讨论
1.为什么说参数估计中的置信区间对应假设检验中的接受域? 2.什么是 P 值??
板书设计
主要运用多媒体课件展示。重要内容采用书写板书
第二篇:假设检验练习题
假设检验练习题
一、判断题
1、大多数的统计调查研究的都是样本而不是整个总体。
2、零假设和研究假设是相互对立的关系。
3、当我们拒绝了一个真的零假设时,所犯错误为第二类错误。
4、我们可以通过减少α来降低β错误。
5、如果α=.05,当我们拒绝H0时我们就有5%的可能犯错误。
6、如果α=.05,则当我们接受H0时,我们就有95%的可能犯错误。
7、如果取α=.01,我们拒绝了H0,则取α=.05时,我们仍然可以拒绝H0。
8、如果取α=.01,我们接受了H0,则取α=.05时,我们仍然可以接受H0。
9、如果H0为假,采用单侧检验比双侧检验更容易得到拒绝H0的结论。
10、即使我们更多地利用样本,还是有必要对一个给定总体的所有个体进行研究。
二、选择题
1、总体是:
A、很难被穷尽研究; B、可以通过样本进行估计; C、通常是假设性的; D、可能是无限的; E、以上都对。
2、如果要研究100个选民在预选时的投票结果表明,我们的主要兴趣应该是:
A、推断他们将会把票投给谁
B、推断所有选民的投票情况;
C、估计什么样的个人会投票;
D、以上都是;
E、以上都不是。
3、如果我们从一个已知的总体中抽取大量的样本,我们将毫不惊讶地得到:
A、样本统计结果值之间有差异;
B、样本统计结果分布在一个中心值附近;
C、许多样本平均数不等于总体平均数;
D、以上都可能;
E、以上都不可能。
4、对零假设的拒绝通常是:
A、直接的;
B、间接的;
C、建立对研究假设的拒绝的基础上;
D、建立在对研究假设的直接证明上;
E、以上都不对。
5、研究者考察了生字密度高低两种条件下各30名学生阅读成绩的情况,得到两种条件下两组被试的成绩分别为:78±10和84±8,从中你可以得到:
A、两种条件下学生成绩的差异非常显著;
B、因为84≠78,所以两种条件下学生成绩差异非常显著;
C、因为84>78,所以生字密度低的条件下学生成绩非常显著地高于生字密度高的条件下学生的成绩;
D、以上都对;
E、以上都不对。
三、综合计算题
1、根据下列陈述写出零假设和研究假设:
1)样本的平均数23与总体的均值30有统计差异。
2)样本的平均数56小于总体的均值70。
3)样本的平均数75大于总体的均值70。
2、一研究者调查了一个容量为31的样本,得到被试在测验一上的平均数为75,标准差S=4.7;在测验二上的平均数为80,标准差S=5.2;已知两个测验的相关系数为.85。则两次测验是否有差异?
3、根据某次调查,从中抽取30名男生与30名女生,得到其测验分数分别为:83±12和86±9,请问男女生成绩是否有差异?
第三篇:第五章 统计估计和假设检验
第五章 统计估计和假设检验
统计学的基本问题就是根据样本所提供的信息对总体的分布以及分布的数字特征作出统计推断。统计推断包括两大部分:一是统计估计,二是假设检验。
统计估计问题就是根据样本的数字特征来估计总体参数的数字特征,因此通常也称作参数估计。参数估计根据所得出结论的方式不同有两种形式:点估计和区间估计。
假设检验就是对关于总体分布的一些数字特征或分布函数所做的假设进行检验,以判断其正确性。假设检验也分为两类:一类是对总体分布的一些数字特征进行检验,称为参数假设检验;另一类是要求根据样本所提供的信息对关于分布函数的假设进行检验,此时只检验分布,而不对参数作检验,这称作非参数的假设检验。非参数检验将在第六章进行讨论,本章着重讨论参数检验。
第一节 点估计
一、点估计的极大似然法
点估计就是以单个数据对总体参数值作出估计。若未知的总体参数为,这时是一个未知的常数。我们根据抽样样本的观察值构造一个统计量()来估计总体参数。由于抽样的随机性,统计量是一个随机变量。点估计就是将的具体值作为的估计值。显然,这样做必然会有误差产生。这种误差就称为抽样误差。
极大似然法是一种对参数点估计的重要方法之一。我们先用一个例子说明其原理。
例5-1。设有一批产品,质量上分为正品与次品。产品的次品率有两种估计:0.1和0.4,今随机抽样15件产品,发现只有一件是次品。现根据这一抽样情况,来决定用哪一种次品率来估计更为可靠呢?
记
A
=“抽取15件产品,只有一件是次品”,设抽得正品用X=0,抽得次品用X=1来表示。抽样结果只有
X=0
与
X=1
两种情形,于是,可得事件
A发生的概率为:
P(A)=
其中:是这批产品的次品率。
若次品率=0.1,则P(A)=×0.1=0.0229
若次品率=0.4,则P(A)=×0.4=0.0003。
现在事件A
既然在一次观察中就发生了,直观地我们可以认为事件A发生的概率P(A)不会小,故应选择使P(A)较大的次品率作为产品的次品率的估计更为可靠些。
由于0.0229>0.0003,故应选择0.1作为产品的次品率比选择0.4更可靠些。
把上例推广到一般的情形,我们就可以得到极大似然法的一般原理。设是取自密度函数为f(x,)的总体的一组样本。其中:x和都为参数,待估计。的极大似然估计的基本思路是,若记A
=“一次观察中,所得一组样本的样本值为()”。现在在一次观察中A发生了,即P(A)应尽可能地大,即应在所有可能取值的集合中选出一个使P(A)达到最大值的作为的估计值。此时的又称为的极大似然估计值。由于
相互独立,且都与X具有相同的分布,由此可以得到,P(A)就相当于事件:
同时发生的概率,也就是P(A)=,记为L()=L(),于是有:
L()=
L()称为的似然函数。求极大似然值的问题就是求似然函数L()的最大值问题,根据微分学的结果,L()取到最大值的必要条件是它对的导数为零。因为ln
L()与L()取得极大值的点相同,为计算方便,我们通常就用对数似然方程来求解最大似然估计值。
在我们上述例子中,f(1,)=,f(0,)=1-,于是得到似然函数:
L()=
令=0,舍去=1,得的最大似然估计值=0.067。
实际上,正是在15次抽样中得到一次次品的频率,用频率估计概率,当n充分大时无疑是合理的。
例5-2。从一个正态总体中抽取容量为n的样本,求总体参数的极大似然估计。
解:构造似然函数
为了求和,使ln的极大,令
解上述方程得到:
所以得到和的极大似然估计量为:
二、估计量好坏的评选标准
前面讨论了如何利用极大似然法来求参数的估计量。但对于同一个参数可以用不同的方法来求其估计量,于是,在参数估计中就存在怎样选择一个比较好的统计量来推断总体参数的理论问题。那么,什么样的估计量是好的估计量呢。这就有一个如何对估计进行评价的问题。请看下面一个例子。
例5-3。假如某一建设单位购进了一批建筑用的线材,就需要了解这批线材的平均抗拉强度是多少。现在要通过抽样,选择样本的某个函数(统计量)来推断总体指标值。由于随机原因,每次抽取样本的测量结果是不同的。如果样本容量为3,抽取4组样本,测得结果如表5-1所示。
表5-1
一组抽样样本的观察值
样本值
样本顺序
均值
900
999
1011
970
995
1050
1105
1065
1010
941
890
947
950
910
1140
1000
为了说明的方便起见,我们假定,实际上μ=1000公斤,当然这在事先是不知道的。我们要求利用样本信息来推断总体指标,并使其误差最小。第一组样本的中位数最接近总体指标,第二组样本是最小值最接近总体指标,第三组样本是最大值最接近总体指标,第四组样本是均值刚好等于总体指标。于是就产生了一个问题,在大量的实验中,究竟采用哪一个指标来推断总体指标更合理呢?
评价点估计的结果通常有无偏性、有效性和一致性等标准。
1.无偏性
无偏性的含义是个别样本由于随机原因可能偏大或偏小,然而一个好的估计量从平均上看应该等于所估计的那个指标,其直观意义是估计量的值应在参数的真值周围摆动而无系统误差。一般地,无偏性的定义为:设为被估计参数,若有估计量(),对一切n,有=,则称为的无偏估计量。
若-=b,则称b为估计量的偏差。若b≠0,则称为的有偏估计量。如果,则称为的渐近无偏估计量。
不论是重复抽样或不重复抽样,也不论样本容量大小,样本均值及样本比例都是总体均值和总体比例的无偏估计,即,但样本方差并不是总体方差的无偏估计量。这是因为如果我们把定义为
=,则:
产生偏差的原因是总体方差的无偏估计应该是,但抽样时由于μ是未知的,因而用估计量来代替。根据最小平方原理,变量X距样本均值的离差平方和为最小,因此就小于,从而用代替μ计算的方差就低估了,为了得到的无偏估计,令
这时,由于,就是的无偏估计了。
样本方差与之差称为偏差。但当n很大时,所以它是渐近无偏差估计。当样本容量很大时,也可以直接用样本方差作为总体方差的估计值。但如样本容量较小时偏差就比较大了。
图5-1
估计的无偏性和有效性
2.有效性
即使是符合无偏性要求的估计统计量,在抽取个别样本时也会产生误差。为了使误差尽量地小,要求估计量围绕其真值的变动愈小愈好,也就是说要求统计量的离散程度要小,或者说其方差要小。一般地,有效性的定义为:设、是未知参数的两个估计量,若对任意的正常数c,有,则称比有效。有效性反映了估计量分布的集中程度,估计量的分布越是集中在参数真值附近,则其估计效率越高,如图5-1所示。
但是为了方便起见,在实际上有效性可定义为:、是未知参数的两个无偏估计量,若用V(),V()分别表示各自的方差,若V()/V()<1,则称比有效。
例如,对正态总体,利用样本均值及样本中位数M来估计总体的均值时,均为无偏估计,那末哪一个更有效呢?
均值的抽样分布为,统计上可以证明中位数的分布为,由于。这就说明比有效,即用样本均值来估计总体的均值比用中位数来估计总体的均值效率高。换句话说,用中位数来估计总体均值的平均误差要比用样本均值来估计总体均值时的更大。如果用中位数作为估计量要达到与以样本均值作为估计量同样可靠的程度,就要增加样本。设用均值估计的样本为,中位数估计的样本为,设其估计效率相等,即方差相等,则,由此得到=1.57,即用中位数估计时要比用样本均值来估计时多抽57%的样本单位。
3.一致性
这就是要使统计量随样本容量n的增加,不断趋近于总体指标。在n→∞(有限总体n→N)时,估计值与总体参数完全一致。一般地,点估计的一致性定义如下:设
()为未知参数的估计量,若依概率收敛于,则为的一致估计量。
现在来看样本均值这一统计量是否符合一致性的要求。根据切比雪夫等式:
令
当时
一致性是从极限意义上来说明统计量与总体参数关系的。这种性质只有当样本容量很大时才起作用。另外,符合一致性的统计量也不止一个,因此,仅考虑一致性是不够的。事实上,我们也可以证明,当总体为正态分布时,中位数这一统计量也符合一致性的要求。而样本的最小值和最大值尽管在个别的抽样中可能取得好的效果,但从总体上来看并不是一个好的估计量。
第二节 区间估计
一、区间估计的概念和步骤
点估计用一个确定的值去估计未知的参数,具有较大的风险。因为估计量来自于一个随机抽取的样本,结果也就带有随机性。样本估计量刚好等于所估计的总体参数的可能性极小。但是如果说所估计的总体参数就落在估计值附近,即所估计的总体参数就落在以点估计所得到的估计值为中心的某一个小区间内,那就比较有把握了。这种方法就是区间估计法。
在第四章中我们已经知道,一个足够大样本的均值的抽样分布是正态的,并且所抽到的样本均值落在总体均值的两侧范围内的概率是0.683,落在总体均值范围内的概率是0.955,落在总体均值范围内的概率是0.997等等。由此可见,我们可以按照概率来估计总体均值是落在某一区间范围内的。我们把这种对总体均值的估计称作区间估计。从上述说明可以看到:
1.如果所估计的区间越大,参数被包含在该区间内的概率就越大。
2.如果样本的方差越小,则在相同的概率下区间估计所得到的结果就越短。
一般地,设为总体的一个未知参数,分别为由一组样本所确定的对的两个估计量,对于给定的,若P()=,则称区间[]为置信度是的置信区间。分别为置信区间的下限和上限。称为置信度或置信概率,表示区间估计的可靠度。称为置信度水平。
常用的置信度有 0.80,0.90,0.95 0.99等。一般来说,对于估计要求比较精确的问题,置信程度也要求高一些,在社会经济现象中,通常采用95%就可以了。置信度反过来也表示可能犯错误的概率。如置信度为95%,则犯错误的概率就为1-95%=5%。这一概率也就是置信度水平,也可理解为风险率或风险水平。
图5-2
根据不同样本所得到的置信度为95.5%的置信区间
需要指出的是,P()=不应理解为落在某一固定区间的概率。因为这里是一个参数,而不是随机变量,而是根据抽样的结果计算出来的,因此,[]是一个随机区间。即每一个样本都可产生一个估计区间[],因此,上述概率可以理解为随机区间[]中包括参数的概率。
图5-2表示根据不同样本所得到的置信度为95.5%的置信区间与总体均值的位置关系。从所有样本得到的置信区间中有95.5%的区间将包括总体均值,因此可以说所得到的估计区间包括总体均值具有95.5%的置信度。
二、单个总体参数的区间估计
(一)正态总体,方差已知,总体均值的区间估计
根据第四章关于样本均值分布的结果,有
~N(0,1)
在给定了估计置信度为时,我们有
我们可以根据这一原理用样本均值来推断总体均值的区间估计值。若样本的均值为,同时若规定置信度为,则总体均值的区间估计的公式是
这一置信区间的估计可以用图5-3来表示。
上述估计公式仅适用于无限总体的情形,对于有限总体的不放回抽样来说,如果总体规模为N,样本大小为n,则区间估计的公式中还需要乘上一个修正系数。因此,总体均值的区间估计的公式就变为
图5-3
置信度为的置信区间
从上述说明中我们可以总结出对于正态总体,方差已知,总体均值的区间估计的步骤如下:
1.计算出样本的统计量并确定该统计量的抽样分布。例如,若总体是正态的,那么样本均值也必然服从正态分布。
2.根据研究的目的确定置信度或置信度水平大小。按照要求的置信度或置信度水平查出相应的系数。
3.计算样本均方差,即抽样的标准误。
4.最后把上述数据代入公式,得到区间估计的结果。
其实,这些步骤也同样适用于其他类型的区间估计问题。
(二)非正态总体,方差未知,大样本,总体均值的区间估计
实际中所遇到的总体,往往不一定服从正态分布,而且总体方差也是未知的。在这种情况下要推断总体均值,就要借助于中心极限定理,这需要抽取足够大的样本。这样样本均值仍服从正态分布。此时尽管总体方差未知,但当样本足够大时,一般当时,我们可用样本标准差来代替总体标准差,直接把S代入上式中的就可以了。
(三)正态总体、方差未知,用小样本对总体均值的区间估计
在总体方差未知的情况下,如果抽取的样本就必须采用其他的估计办法。我们已知服从t分布,其自由度为n-1。因此我们就可以利用t分布来进行估计。此时
与前面同样地,上述估计公式仅适用于无限总体的情形,对于有限总体来说,如果总体规模为N,样本大小为n,不放回抽样的情形,则区间估计公式中也还需要乘上一个修正系数。
(四)总体比例的区间估计
根据第四章关于样本比例分布的结果,我们有
若样本的比例为,同时规定估计的置信度为,则总体比例的区间估计的公式就是
这里有一个问题,就是在确定总体比例的置信区间时要用到本身,而又恰恰是待估值。但由点估计理论我们知道,样本比例是总体比例P的无偏估计,于是在估计样本比例的方差时,直接用样本比例代替总体比例P。只要样本容量n足够大,并且满足和都大于5就可以保证结果是可靠的。最后,得到总体比例的置信区间为:
当然对于有限总体不放回抽样的情形,也同样需要乘上一个修正系数。
(五)正态总体方差的区间估计
在第四章关于分布的结果中我们介绍过,来自正态总体的一组样本的方差和总体方差之比服从于分布,即
~
于是对于给定的置信度,我们可以利用分布的特性,查表得到和,则有
于是总体方差的区间估计为
三、两个总体参数的区间估计
(一)两总体均值之差的区间估计
1.两个正态总体,方差已知,大样本
从两个总体中所抽取的样本都是大样本,并且两个总体的方差已知时,则两个样本均值之差也服从正态分布。此时,因此。
由此可以得到,在置信度水平为的情况下,的置信区间为
2.两正态总体,方差未知,但相等,大样本
两个样本都为大样本时,两样本均值之差也服从正态分布,由于假设两总体方差相等,但未知,需要根据样本方差进行估计。由于样本方差具有随机性,一般地,因此,合并推算总体方差,所以,两个样本均值之差的抽样分布的方差为,于是,对两总体均值之差估计的置信区间为。
3.两正态总体,方差未知但相等,小样本
根据上一章的结果,总体方差未知时,我们用样本的方差代替总体的方差,由于小样本,相应的统计量不再服从正态分布而服从t分布。由于,则如大样本时一样,应将两个样本合并起来代替总体方差。即
其自由度为,则两总体差的区间估计结果为。
(二)两总体比例之差的区间估计
根据两个样本比例之差的抽样分布,两个样本比例之差的均值为两个总体比例之差。两个样本比例之差的方差为
当两个比例的样本容量为大样本时,两个比例之差也服从正态分布,所以当置信度为时,两总体比例之差的置信区间为:
(三)两正态总体方差比的区间估计
根据第四章所介绍的F分布的结果,来自于两个正态分布总体的总体方差和样本方差和,和所构成的统计量
故对于给定的置信度水平,我们可以从F分布表查得置信区间的临界值:
和
从而
于是
最后我们得到的置信度为1-的置信区间为
第三节
样本容量的确定
在区间估计中我们发现,对于某一个总体的参数进行估计时,在样本数目一定的条件下,要提高估计结果的可靠性,就需要扩大置信区间,这就要增加估计中的误差,减少了估计的实际意义。如果要减少估计的误差,就要缩短置信区间,但这样就必须要降低估计的可靠性。可见在样本数目一定的条件下,估计的精确性和估计的可靠性不能两全其美。既要提高估计的精确性,减少误差,又要提高估计可靠性的办法就是增加样本容量。但是增加样本就要同时增加抽样调查的成本,同时又可能延误时间。因此就需要研究能够满足对估计的可靠性和精确性要求的最小样本数问题。
一、均值估计问题中,样本大小的决定
在总体均值的估计问题中,要决定必要的样本大小,必须先明确如下三个问题:
1.要规定允许的估计误差的大小,即允许的估计值与实际值之间的最大偏离值是多少,实际上也就是估计区间的大小,
2.规定置信度,即估计所要求达到的可靠性,也就是实际的抽样误差不超过所规定的误差的可信度。
3.要明确总体的标准差,即要求了解总体的分布情况。总体的标准差小,只要抽较少的样本就能满足对估计精确度和可靠性的要求,若总体标准差大,就必须抽取较多的样本才能达到对估计精确度和可靠性的要求。
设总体标准差为,样本均值的标准差为。估计的置信度为,于是可以相应地得到置信系数。于是对总体均值的估计可由下式得到:
上式中的实际上就表示估计所允许的最大误差,我们用Δ表示,于是根据上式有
则
由此只要规定了允许误差的大小Δ和总体的标准差σ,由置信度查表得到相应的,代入公式,求得满足要求的最小整数就是满足估计误差不大于Δ和置信度为的要求的最少样本数。
上述公式适用于重复抽样或无限总体不放回抽样时的情形。但对于有限总体不放回抽样的情形,公式变为如下的形式:
由此可求得满足上式要求的最小的整数为。
其中:Δ为允许最大误差,为有限总体的个体数,为置信度水平,为根据置信度水平查表得到的置信系数。
二、比例估计问题中,样本大小的决定
关于总体比例的估计问题中,要决定样本大小首先也要明确关于均值的估计问题中同样的三个问题:
1.允许误差的大小,即规定估计值与实际值的最大偏离值。
2.规定置信度,即估计所要求达到的可信度。
3.对总体比例的事先估计值,即大致的或估计的总体比例是多少。
与均值的估计问题完全平行地,我们可以得到以下的结果。
对于重复抽样或无限总体不重复(放回)抽样时的情形为
但对于有限总体不放回抽样的情形,公式变为如下的形式:
第四节 假设检验
一、假设检验的基本原理
假设总体的均值为某一个值,为了检验这一假设的正确性,我们收集样本的数据,计算出假设值与样本均值之间的差异,然后根据差异的大小来判断所作假设的正确性,这就是假设检验。直观地,我们知道差异越小,对于总体均值的假设正确的可能性就愈大。差异越大,对总体均值的假设正确的可能性就愈小。
然而在多数情况下,对总体参数的假设值与样本统计量之间的差异既不至于大到显而易见,应该拒绝假设,也不至于小到可以完全肯定,应该接受假设的程度。于是就不能简单地决定接受或拒绝所作的假设,而需要判断所作的假设在多大的程度上是正确的。于是就需要研究假设和判断假设是否正确的程度。
(一)假设检验中的假设
假设检验中通常把所要检验的假设称作原假设或零假设,记作。例如要检验总体均值μ=100这个假设是否正确,就表示为:μ=100。如果样本所提供的信息无法证明原假设成立,则我们就拒绝原假设。此时,我们只能接受另外备选的假设了,称之为备择假设,我们以表示备择假设。备择假设可以有三种形式,例如,在原假设:μ=100的条件下,备择假设可以是:
:μ100。这表示备择假设是总体的均值不等于100。或者是
:μ>100。这表示备择假设是总体的均值大于100。或者是
:μ<100。这表示备择假设是总体的均值小于100。
上述备择假设的选择与检验的要求是密切相关的。我们根据假设检验的目的要求不同又把假设检验分为双侧检验和单侧检验。
如果样本均值高于或低于假设的总体均值很显著时都拒绝原假设,我们称作双侧检验。在双侧检验时有左右两个拒绝区域。当原假设是::μ=100,备择假设是::μ100时就必须使用双侧检验。
若只有在样本的均值高于(或低于)假设的总体均值很显著时才拒绝原假设,这就称作单侧检验。单侧检验只有一个拒绝区域。若假设检验只有在样本均值高于假设的总体均值很显著时才拒绝原假设,这种假设检验称作右侧检验。此时,原假设实际上变为:μ100,备择假设为:μ>100。反之,如果只有在样本均值低于假设的总体均值很显著时才拒绝原假设,则称作左侧检验。此时,原假设实际上变为:μ100,备择假设为:μ<100。由此可见,原假设和备择假设总是排他性的。
(二)检验的显著性水平
假设检验需要确定一个是接受还是拒绝原假设的标准,这个标准就是显著性水平。所谓检验的显著性水平就表示,在假设正确的条件下落在某个界限以外的样本均值所占的百分比。具体地说,“在5%的显著性水平下检验假设”就是说,假定对总体参数所作的假设正确,那么样本均值同假设的总体均值差异过大的,在每100个样本中不应超过5个。如果样本均值与总体均值差异过大的超过这一数目就认为这个样本不可能抽自所假设的总体,所以拒绝零假设。
我们可以用图5-4来直观地解释假设检验的原理。假如设检验的显著性水平=5%,我们已知在概率密度曲线下包括在假设的均值两侧直线间的面积是95%,两边每一个尾端的面积各为2.5%。于是若样本的均值落在95%的区域内,我们就认为样本统计量与假设的总体参数的差异是不显著的。结果就接受原假设。若样本统计量落在左右尾端的各为2.5%的区域内,则差异就是显著的。我们就拒绝原假设。接受备择假设。
图5-4
假设检验的接受区域和拒绝区域
不过应该强调指出,在假设检验中“接受原假设”的意思仅仅是意味着没有充分的统计证据拒绝原假设。在假设检验中“接受原假设”的特定含义就是不拒绝原假设。但实际上,即使样本统计量落在95%的面积内,也并不能证明原假设就是正确的。因为只有在知道了总体参数的真实值与假设值完全相同才能证明假设正确。但我们无法知道总体参数的真实值。
在给定了检验的显著性水平后,我们可以根据假设来确定接受还是拒绝原假设的区域或范围。如果样本均值落在某一区域内我们就接受原假设,则就称这一区域为接受区域。如果样本均值落在某一区域内就拒绝原假设,我们就称这一区域为拒绝区域。
对于显著性水平的选择没有一个唯一的或通用的标准。实际上在任何显著性水平下检验某个假设都是可能的,但是必须注意不管选择什么样的显著性水平,都存在假设为真而被拒绝的可能性。另一方面,在检验同一个假设时,使用的显著性水平愈高,原假设为真时而被拒绝的概率也就愈高。这就需要研究假设检验中的错误,我们在以后将对此进行讨论。
二、假设检验的步骤
1.提出原假设和备择假设。原假设和备择假设必须由题意来决定。在一般情况下总是把检验的目的作为备择假设,这样可以有充分的把握拒绝原假设。
2.选择检验的显著性水平,从而确定检验的拒绝区域或临界点。表示在假设检验时当原假设为真而我们却拒绝了原假设,接受备择假设的错误概率。假设检验中还可能犯另一种错误,这将在下面讨论。
3.确定样本的统计量和分布。样本统计量又称检验统计量。不同的统计量具有不同的分布,用于检验不同的假设,要根据所检验的假设来正确地选择检验统计量。
4.计算检验统计量并由此作出决策。根据样本数据计算出检验统计量的值,如果统计量的值落在拒绝区(包括临界点)内就说明原假设与样本所反映的情形有显著的差异,应该拒绝原假设。如果统计量的值落在接受区域内,就说明原假设与样本所反映的情形的差异并不显著,应该接受原假设。
三、几种常用的假设检验
(一)平均数的假设检验
1.双侧检验
让我们研究下面的例子。
例5-4。某食品厂规定某种罐头每罐的标准重量是500克。多年的经验表明这个厂每罐重量的标准差是15克。今随机抽取了49个罐头,发现这些罐头的平均重量是506克。问在=0.05的显著性水平下能否认为这批罐头的重量符合标准的要求?
要检验这批罐头的重量是否符合标准的要求就是要检验这批样本的平均重量与标准重量之间是否具有明显的差别。因此可以列出要检验的假设为:
:μ=500
:μ500。
这是一个双侧检验问题。根据区间估计的结论可知原假设的接受区域为
由于置信度水平=0.05,=1.96。由此得到接受区域为[495.8,504.2]。但现在样本的实际均值为506,落在拒绝区域内,因此拒绝原假设接受备择假设。我们无法认为这批罐头的重量符合标准的要求,即这批罐头的重量不符合标准的要求。
当总体方差未知,样本数量又小于等于30时,检验统计量样本均值服从t分布。这就要用t分布确定原假设的接受区域和拒绝区域了。在得到接受区域后也就可以利用上面同样的方法,根据样本均值所处的位置作出判断。
2.单侧检验
再看下面的例子。
例5-5。某饮料厂规定某种纸罐包装饮料的容量不得少于500ml。今随机抽取了25个纸罐,发现这些罐头的平均重量是498
ml,标准差S=10。问在=0.05的显著性水平下能否认为这批纸罐的容重符合标准的要求?
根据问题的要求可以列出要检验的假设为:
:μ500
:μ<500
由于总体方差未知,样本容量又小于30,检验统计量服从t分布,其自由度为n-1。因此我们就必须利用t分布来进行检验。这又是一个单侧(左侧)检验问题。根据区间估计的结论可知原假设的接受区域为
根据置信度水平=0.05,查表得到。所以计算得到接受区域的临界点是496.6。现样本均值=498>496.6。可见样本均值落在原假设的接受区域内。我们接受原假设,即认为这批纸罐的容重符合标准的要求。
例5-6。某特种建材生产厂规定某种规格新型墙体材料的重量不得大于500公斤。今随机抽取了16块这种规格新型墙体材料,测得其平均重量为505公斤,标准差S=10。问在=0.05的显著性水平下能否认为这批新型墙体材料的重量符合标准的要求?
这次要检验的假设为:
:μ500
:μ>500
这次也需要利用t分布来进行检验。这是一个右侧检验问题。原假设的接受区域为
根据置信度水平=0.05,查表得到。由此可以得到原假设的接受区域临界点是504.4。现样本均值=505>504.4。可见样本均值落在原假设的拒绝区域内。我们拒绝原假设,接受备择假设,即认为这批新型墙体材料的重量不符合标准的要求。
(二)比例的假设检验
例5-7。某酒厂规定某种酒中含有的糖度应为12%,产品才能算合格。今随机抽取了100瓶这种酒,发现平均的糖度为11.3%。问在显著性水平=0.10的条件下,这批酒与合格产品对糖度的要求有无明显的差别?
问题要检验的假设为:
:μ=0.12
:μ0.12
这是比例的双侧检验问题。根据区间估计的结果,原假设的接受区域是
由于=0.10,则=1.64。计算得到原假设的接受区域是[0.114,0.126]。由于样本比例0.113<0.114,落在原假设的拒绝区域内。我们拒绝原假设,接受备择假设,即认为这批酒与合格产品对糖度的要求有明显的差别。
对于比例问题也同样可以进行单侧的假设检验。方法也几乎与总体均值的单侧检验的情形相同。
此外,参照两个总体区间估计的情形,我们也可以对两个总体均值和比例差进行假设检验,所用的方法几乎是完全同样的。
四、假设检验中的两类错误
假设检验是根据概率来进行判断的,因此有可能判断失误。在三种不同显著性水平下,例如=0.01,0.10,或0.50时,进行假设检验所得到的结果就可能是完全不同的。对于同一组样本的均值的位置,在=0.01和0.10的显著性水平下可能是接受零假设的,而在=0.50的显著性水平下拒绝零假设。可见,采用高的显著性水平不大可能接受一个不正确的零假设,但却很可能拒绝掉正确的零假设。
在假设检验中,如果原假设正确而被拒绝时,就称为犯了第一类错误,这是弃真的错误,犯第一类错误的概率记作。相反,如果原假设错误而被接受时,称作犯了第二类错误,这是取伪的错误,犯第二类错误的概率记作。表5-3表示了两者之间的关系。这两种错误是互相替补的,这就是说,在样本容量一定的情况下,要减少第一类错误的概率就不得不增加发生第二类错误的概率,反过来也一样。实际上,为了减少第一类错误的概率就要增大接受区域,减少拒绝区域。但此时由于接受区域的增大,不正确的原假设也被接受的概率也随之增大,即增加了,如图5-4所示。要减少接受不正确的原假设的概率,就要减少的值,此时不正确的零假设被接受的概率减少了,但随着拒绝区域的增大,正确的零假设被拒绝的概率就上升,即增大了,如图5-4所示,表5-2
两类错误之间的关系
接受
接受
为真
正确
弃真,第一类错误概率
α
为假
取伪,第二类错误概率β
正确
图5-5
假设检验中的两类错误
由于两类错误之间的这种替补关系,在管理上决定检验第一类错误或第二类错误的显著性水平时就要具体考察同这两类错误相联系的费用和可能造成的损失。由此来决定究竟宁可发生第一类错误,而不愿发生第二类错误,还是宁可发生第二类错误,而不愿发生第一类错误。
练习题
5-1
对某机器生产的滚动轴承随机抽取196个样本,测得直径的均值为0.826厘米,样本标准差0.042厘米,求这批轴承均值的95%与99%的置信区间。
5-2
某灯泡厂生产的灯泡的平均寿命是1120小时,现从一批新生产的灯泡中抽取8个样本,测得其平均寿命为1070小时,样本方差=(),试检验灯泡的平均寿命有无变化(=0.05和=0.01)?
5-3
设正态总体的方差为已知,问要抽取的样本容量n应为多大,才能使总体均值的置信度为0.95的置信区间的长不大于L。
5-4有人在估计总体均值时要求在置信度为99%的条件下保证样本平均数与总体均值之间的误差不超过标准差的25%。问应抽取多少样本?
5-5为降低贷款风险,某银行内部规定要求平均每笔贷款数额不能超过120万元。随着经济发展,贷款规模有增大趋势。现从一个n=144的样本测得平均贷款额为128.1万元,S=45万元,用=0.01的显著水平检验贷款的平均规模是否明显超过120万元。
5-6
正常人的脉搏平均为72次/分,今对某种疾病患者10人测得其脉搏为54
71(次/分)设患者的脉搏次数服从正态分布,试在显著性水平=0.05下检验患者与正常人在脉搏上有无显著差异?
5-7
从A市的16名学生测得其智商的平均值为107,样本标准差为10,而B市的16名学生测得智商的平均值为112,标准差为8,问在下这两组学生的智商有无显著差别?
5-8
用简单随机重复抽样方法选取样本时,如果要使抽样平均误差降低50%,则样本容量需要扩大到原来的()。(单选题)
A.2倍
B.3倍
C.4倍
D.5倍
5-9
某产品规定的标准寿命为1300小时,甲厂称其产品超过此规定。随机选取甲厂100件产品,测得均值为1345小时,已知标准差为300小时,计算得到样本均值大于等于1345的概率是0.067,则在:μ=1300,:μ>1300的情况下,有()成立。(单选题)
A.若=0.05,则接受
B.若=0.05,则接受
C.若=0.10,则接受
D.若=0.10,则拒绝
5-10下面关于假设检验的陈述正确的是()。(多选题)
A.假设检验实质上是对原假设进行检验
B.假设检验实质上是对备择假设进行检验
C.当拒绝原假设时,只能认为肯定它的根据尚不充分,而不能认为它绝对错误
D.假设检验并不是根据样本结果简单地或直接地判断原假设和备择假设哪一个更有可能正确
E.当接受原假设时,只能认为否定它的根据尚不充分,而不是认为它绝对正确
5-11
某种新型建材单位面积的平均抗压力服从正态分布,均值为5000公斤,标准差为120公斤。公司每次对50块这种新型建材的样本进行检验以决定这批建材的平均抗压力是否小于5000公斤。公司规定样本均值如小于4970就算不合格,求这种规定下犯第一类错误的概率。
第四篇:关于假设检验的详细总结与典型例题
关于假设检验的详细总结与典型例题
假设检验是数一考生普遍反映非常头疼的一块内容,因为它入门较难,其思想在初次复习时理解起来较难。虽然这一部分在历年真题中考查次数很少,但为了做到万无一失,我们也应该准备充分,何况相对来说这一部分内容的难度和变化并不大。为了让各位考生对假设检验有一个全面深入的理解和掌握,我们给出如下总结与例题。
对于假设检验,首先要理解其基本原理,即小概率原理,假设检验的方法即是从此原理衍生而来;其次,要掌握其步骤,会根据显著性水平,即第一类心理学考研错误,来求拒绝域与接收域,其求法要根据不同的条件来套用公式,能根据理解推导公式是上策,如果时间不够,可以选择记忆各种不同条件下的求拒绝域的公式。最后,相比之下两个正态总体参数的假设检验的考查可能性要低于一个正态总体参数的假设检验。
假设检验的基本概念
数理统计的基本任务是根据样本推断总体,对总体的分布律或者分布参数作某种假设,然后根据抽得的样本,运用统计分析的方法来检验这一假设是否正确,从而作出接受假设或者拒绝假设的决定,这就是假设检验.根据实际问题提出的假设H0称为原假设,其对立假设H1称为备择假设.假设检验中推理的依据是小概率原理:小概率事件在一次试验中实际上不会发生.假设检验中的小概率称为显著性水平,通常取0.05或者0.01.假设检验中使用的推理方法是:为了检验原假设H0是否成立,我医学考研论坛们先假定原假设H0成立.如果抽样的结果导致小概率事件在一次试验中发生了,根据小概率原理,有理由怀疑H0的正确性,从而拒绝H0,否则接受H0.假设检验的步骤
⑴根据实际问题提出原假设H0和备择假设H1; ⑵确定检验统计量T;
⑶根据给定的显著水平,查概率分布表,确定拒绝域W;
⑷利用样本值计算统计量T的值t,若tW,则拒绝H0,否则接受H0.假设检验中可能犯的两类错误
由于小概率事件还是可能发生的,根据小概率作出的判断可能是错误的.事件H0真而拒绝H0,称为第一类(弃真)错误,犯第一类错误的概率为PtWH0,因此显著性水平是用来控制犯第一类错误的概率的.H0假而接受H0,称为第二类(纳伪)错误,犯第二类错误的概率为PtWH1,记作. 典型例题
1.X1,,X36是取自正态总体N(,0.04)的简单随机样本,检验假设H0:0.5,备择假设
05.检验的显著水平0.05,取否医学考研论坛定域为Xc,则c
,若16H1:10.5,则犯第二类错误的概率
.,0.04),36c0.5c0.50.05PXcH01(),()0.95(1.645),0.1/30.1/3c0.51.645,得c0.5548.0.1/30.04⑵H1成立时,X~N(0.65,)
360.55480.65PXcH1()(2.856).0.1/3解
⑴H0成立时,X~N(0.5,1(2.856)10.99790.0021
0已知,2.设总体X~N(,0),检验假设H0:0,备择假设H1:0,取否定域为Xc,则对固定的样本容量n,犯第一类错误的概率随c的增大而
.(减小)
解
H0成立时,X~N(0,2202n),犯第一类(弃真)错误的概率PXcH01(故犯第一类错误的概率随c的增大而减小.一个正态总体N(,)参数的假设检验 ⑴ 已知,关于的检海文考研验(u检验)检验假设H0:0
统计量U22c00/n),X0/n
拒绝域Uu 检验假设H0:0
统计量UX0/nX0
拒绝域Uu
检验假设H0:0
统计量U2/n
拒绝域Uu
⑵未知,关于的检验(t检验)检验假设H0:0
统计量tX0S/nX0S/nX0S/n
拒绝域tt(n1)
2检验假设H0:0
统计量t
拒绝域tt(n1)
检验假设H0:0
统计量t2
2拒绝域tt(n1)
⑶未知,关于的检验(检验)检验假设H0:220 统计量2(n1)S202(n1)S2202
拒绝域2(n1)或者22(n1)
212检验假设H0:220 统计量2
拒绝域1(n1)
22检验假设H0:
统计量▲拒绝域均采用上侧分位数.2202(n1)S202
拒绝域(n1)
22两个正态总体N(1,)、N(2,)参数的假设检验.⑴两个正态总体N(1,)、N(2,)均值的假设检验(t检验)检验假设H0:1
2统计量t2222XY
拒绝域tt(n1n22)
112Swn1n2XY
拒绝域tt(n1n22)
11Swn1n23 检验假设H0:12
统计量t 检验假设H0:12
统计量tXY
拒绝域tt(n1n22)
11Swn1n22⑵两个正态总体N(1,1)、N(2,2)方差的假设检验(F检验)检验假设H0:2122 2S12 统计量F2
拒绝域FF(n11,n21)或者FF(n11,n21)
1S222S12 统计量F2
拒绝域FF1(n11,n21)
S2检验假设H0:2122
S12检验假设H0:
统计量F2
拒绝域FF(n11,n21)
S22122▲拒绝域均采用上侧分位数.典型例题
1.设X1,X2,,Xn是来自正态总海文考研体N(,)的简单随机样本,其中参数,未知,记n1n2XXi,Q(XiX)2,则假设H0:0的t检验使用统计量t
.ni1i122解
统计量tXnX2S/nQ/(n1)n(n1)X.Q
2.某酒厂用自动装瓶机装酒,每瓶规定重500克,标准差不超过10克,每天定时检查,某天抽取9瓶,测得平均重X=499克,标准差S=16.03克.假设瓶装酒的重量X服从正态分布.问这台机器是否工作正常?(0.05).解
先检验H0:500,统计量tX500,拒绝域tt0.025(8)2.3060,S/ntX5004995000.187,接受H0; 16.03/3S/n4(n1)S222:10,统计量再检验H0,拒绝域0.05(8)15.507,210222(n1)S2816.03222H:10,拒绝,20.55702210102故该机器工作无系统误差,但不稳定
3.设X1,X2,,X7是来自正态总体N(1,1)的简单随机样本,设Y1,Y2,,Y8是来自正态总体2N(2,2)的简单随机样本,且两个样本相互独立,它们的样本均值分别为X13.8,Y17.8,样本标
2准差S13.9,S24.7,问在显著性水平0.05下,是否可以认为12?
S12解
先检验H0:,检验统计量F2,拒绝域FF0.025(6,7)5.12或者
S22122S123.92110.6885,接受H0; FF0.975(6,7),F22S24.7F0.025(7,6)5.70:12,统计量t再检验H0XY,拒绝域tt0.05(13)1.7709,11Swn1n2tXY,即可以认为12.1.7773,接受H011Swn1n2▲检验两个正态总体均值相等时,应先检验它们的方差相等.
第五篇:关于“标准差不相等且都未知,样本容量不同的双正态总体均值差的假设检验”的讨论
关于“1222且都未知,样本容量不同的双正态总体均
值差的假设检验”的讨论
摘要:对于双正态总体均值差的假设检验中,相对于几种比较常见的类型来说,还有一种比较复杂的类型就是
1222且都未知、样本容量不同的双正态总体均值差的假设检验,这种情况下,有时我们需要进行两次构造。下面就着重系统介绍一下这种检验方法。
关键词:双正态
样本容量
假设检验
正文: 我们在讨论双正态总体均值差的假设检验时,有一种情况是比较复杂的。那就是关于“
1222且都未知,样本容量不同的双正态总体均值差的假设检验”的,如果我们像讨论其它那些情况一样去试图构造一个统计量进行计算时,发现并不是那么的容易。
首先,在一些简单计算中,如果样本容量比较大的时候,我们还是可以进行近似的假设检验的,H比US0:12;H1:12这样,较XY21方H0真22便,n1S22构
n2造统计量n1Sn2XY(12)S21~N(0,1)
,然后,可
但是这种方法仅仅是由P{Uz/2},即得拒绝域Uz/2;而对应的单边问题的拒绝域分别是Uz与Uz.相对于样本的容量比较大的前提下,才可以的。如果样本容量比
较小,我们就不能这样近似计算了。
所以,我们就要更加深入的讨论这种情况下的假设检验。此时,面对着样本容量比较小的情况,我们可以将双正态均值差假设检验转化成常见的单正态总体方差未知时均值是否为零的常见问题,叫做“斯切非Scheffe法”。
首先,要构造一个正态随机变量包含这双正态总体,这样就要求进行第一次构造。我们记这两个正态总体的容量分别为
n1、n2(n1n2n1n2)。不妨假设
n1n1<
n2此时, 可令ZiXiYi1n1n2Yj1jY,i1,...,n1,则仍有
Z1, …,2iidZn1~N(,Z).212,Z12n1n222其中,其中的zi就是构造的随机变量。然后,再进行第二次构造,构造出TZ0SnH0真ZSn~t(n1)。由P{|T|>t/2(n 1)} =,可得拒绝域|T|>t/2(n1),查表、计算,比较大小即得结论。此时,对于单边问题H0:=0;H1:< 0,有拒绝域T<t(n1)=t1(n 1);对于H0: =0 ;H1: >0,有拒绝域T>t(n1)。
从上面的分析可知,对于这种类型的问题,其实就是两次构造,难就转化为易了。将复杂问题转化成简单的已经解决的问题,这是一种在研究中经常要用到的一种思维方式。