第一篇:中心极限定理证明
中心极限定理证明
一、例子
高尔顿钉板试验.图中每一个黑点表示钉在板上的一颗钉子.每排钉子等距排列,下一排的每个钉子恰在上一排两相邻钉子之间.假设有排钉子,从入口中处放入小圆珠.由于钉板斜放,珠子在下落过程中碰到钉子后以的概率滚向左边,也以的概率滚向右边.如果较大,可以看到许多珠子从处滚到钉板底端的格子的情形如图所示,堆成的曲线近似于正态分布.如果定义:当第次碰到钉子后滚向右边,令;当第次碰到钉子后滚向左边,令.则是独立的,且
那么由图形知小珠最后的位置的分布接近正态.可以想象,当越来越大时接近程度越好.由于时,.因此,显然应考虑的是的极限分布.历史上德莫佛第一个证明了二项分布的极限是正态分布.研究极限分布为正态分布的极限定理称为中心极限定理.二、中心极限定理
设是独立随机变量序列,假设存在,若对于任意的,成立
称服从中心极限定理.设服从中心极限定理,则服从中心极限定理,其中为数列.解:服从中心极限定理,则表明
其中.由于,因此
故服从中心极限定理.三、德莫佛-拉普拉斯中心极限定理
在重贝努里试验中,事件在每次试验中出现的概率为为次试验中事件出现的次数,则
用频率估计概率时的误差估计.由德莫佛—拉普拉斯极限定理,由此即得
第一类问题是已知,求,这只需查表即可.第二类问题是已知,要使不小于某定值,应至少做多少次试验?这时利用求出最小的.第三类问题是已知,求.解法如下:先找,使得.那么,即.若未知,则利用,可得如下估计:.抛掷一枚均匀的骰子,为了至少有0.95的把握使出现六点的概率与之差不超过0.01,问需要抛掷多少次?
解:由例4中的第二类问题的结论,.即.查表得.将代入,便得.由此可见,利用比利用契比晓夫不等式要准确得多.已知在重贝努里试验中,事件在每次试验中出现的概率为为次试验中事件出现的次数,则服从二项分布:的随机变量.求.解:
因为很大,于是
所以
利用标准正态分布表,就可以求出的值.某单位内部有260架电话分机,每个分机有0.04的时间要用外线通话,可以认为各个电话分机用不用外线是是相互独立的,问总机要备有多少条外线才能以0.95的把握保证各个分机在使用外线时不必等候.解:以表示第个分机用不用外线,若使用,则令;否则令.则.如果260架电话分机同时要求使用外线的分机数为,显然有.由题意得,查表得,故取.于是
取最接近的整数,所以总机至少有16条外线,才能有0.95以上的把握保证各个分机在使用外线时不必等候.根据孟德尔遗传理论,红黄两种番茄杂交第二代结红果植株和结黄果植株的比率为3:1,现在种植杂交种400株,试求结黄果植株介于83和117之间的概率.解:将观察一株杂交种的果实颜色看作是一次试验,并假定各次试验是独立的.在400株杂交种中结黄果的株数记为,则.由德莫佛—拉普拉斯极限定理,有
其中,即有
四、林德贝格-勒维中心极限定理
若是独立同分布的随机变量序列,假设,则有
证明:设的特征函数为,则的特征函数为
又因为,所以
于是特征函数的展开式
从而对任意固定的,有
而是分布的特征函数.因此,成立.在数值计算时,数用一定位的小数来近似,误差.设是用四舍五入法得到的小数点后五位的数,这时相应的误差可以看作是上的均匀分布.设有个数,它们的近似数分别是,.,.令
用代替的误差总和.由林德贝格——勒维定理,以,上式右端为0.997,即以0.997的概率有
设为独立同分布的随机变量序列,且互相独立,其中,证明:的分布函数弱收敛于.证明:为独立同分布的随机变量序列,且互相独立,所以仍是独立同分布的随机变量序列,易知有
由林德贝格——勒维中心极限定理,知的分布函数弱收敛于,结论得证.作业:
p222EX32,33,34,3
5五、林德贝尔格条件
设为独立随机变量序列,又
令,对于标准化了的独立随机变量和的分布
当时,是否会收敛于分布?
除以外,其余的均恒等于零,于是.这时就是的分布函数.如果不是正态分布,那么取极限后,分布的极限也就不会是正态分布了.因而,为了使得成立,还应该对随机变量序列加上一些条件.从例题中看出,除以外,其余的均恒等于零,在和式中,只有一项是起突出作用.由此认为,在一般情形下,要使得收敛于分布,在的所有加项中不应该有这种起突出作用的加项.因为考虑加项个数的情况,也就意味着它们都要“均匀地斜.设是独立随机变量序列,又,这时
(1)若是连续型随机变量,密度函数为,如果对任意的,有
(2)若是离散型随机变量,的分布列为
如果对于任意的,有
则称满足林德贝尔格条件.以连续型情形为例,验证:林德贝尔格条件保证每个加项是“均匀地斜.证明:令,则
于是
从而对任意的,若林德贝尔格条件成立,就有
这个关系式表明,的每一个加项中最大的项大于的概率要小于零,这就意味着所有加项是“均匀地斜.六、费勒条件
设是独立随机变量序列,又,称条件为费勒条件.林德贝尔格证明了林德贝尔格条件是中心极限定理成立的充分条件,但不是必要条件.费勒指出若费勒条件得到满足,则林德贝尔格条件也是中心极限定理成立的必要条件.七、林德贝尔格-费勒中心极限定理
引理1对及任意的,证明:记,设,由于
因此,其次,对,用归纳法即得.由于,因此,对也成立.引理2对于任意满足及的复数,有
证明:显然
因此,由归纳法可证结论成立.引理3若是特征函数,则也是特征函数,特别地
证明定义随机变量
其中相互独立,均有特征函数,服从参数的普哇松分布,且与诸独立,不难验证的特征函数为,由特征函数的性质即知成立.林德贝尔格-费勒定理
定理设为独立随机变量序列,又.令,则
(1)
与费勒条件成立的充要条件是林德贝尔格条件成立.证明:(1)准备部分
记
(2)
显然(3)
(4)
以及分别表示的特征函数与分布函数,表示的分布函数,那么(5)
这时
因此林德贝尔格条件化为:对任意,(6)
现在开始证明定理.设是任意固定的实数.为证(1)式必须证明
(7)
先证明,在费勒条件成立的假定下,(7)与下式是等价的:
(8)
事实上,由(3)知,又因为
故对一切,把在原点附近展开,得到
因若费勒条件成立,则对任意的,只要充分大,均有
(9)
这时
(10)
对任意的,只要充分小,就可以有
(11)
因此,由引理3,引理2及(10),(11),只要充分大,就有
(12)
因为可以任意小,故左边趋于0,因此,证得(7)与(8)的等价性.(2)充分性
先证由林德贝尔格条件可以推出费勒条件.事实上,(13)
右边与无关,而且可选得任意小;对选定的,由林德贝尔格条件(6)知道第二式当足够大时,也可以任意地小,这样,费勒条件成立.其次证明林德贝尔格条件能保证(1)式成立.注意到(3)及(4),可知,当时,当时,因此
(14)
对任给的,由于的任意性,可选得使,对选定的,用林德贝尔格条件知只要充分大,也可使.因此,已证得了(8),但由于已证过费勒条件成立,这时(8)与(7)是等价的,因而(7)也成立.(3)必要性
由于(1)成立,因此相应的特征函数应满足(7).但在费勒条件成立时,这又推出了(8),因此,(15)
上述被积函数的实部非负,故
而且
(16)
因为对任意的,可找到,使,这时由(15),(16)可得
故林德贝尔格条件成立.八、李雅普诺夫定理
设为独立随机变量序列,又.令,若存在,使有
则对于任意的,有
第二篇:第六章 第三节中心极限定理
第六章 大数定律和中心极限定理
第三节 中心极限定理
在对大量随机现象的研究中发现,如果一个量是由大量相互独立的随机因素所造成,而每一个别因素在总影响中所起的作用较小,那么这种量通常都服从或近似服从正态分布.例如测量误差、炮弹的弹着点、人体体重等都服从正态分布,这种现象就是中心极限定理的客观背景.设随机变量X,X,,X,独立
12n同分布,且Xi~N(,),2(i1,2,)
记YX,(EYn,DYn),2nni1inn 1 YEYYn Y称为Y的标准DYn*nnnnnn化, 则有Y~N(0,1)
FY*(x)P{Yn*x}(x)
n*n对任意实数x,有
Ynx}
limP{nnnP{Yn limn(x)x*x}limF(x)
nYn*1edt.2t22一般地,有下述结果。定理三(同分布的中心极限定理)设随机变量X,X,,X,独立同分布,且存在有限的数学期望和方差
EX,DX0,12n2ii(i1,2,)
记YX,(EYn,DYn),2nni1innYEYYn Y称为Y的标DYn*nnnnnn 2 准化, FYn*(x)P{Yx}
n*则对任意实数x,有
Ynx}
limP{nnnP{Yn limn(x)x*x}limF(x)
nYn*1edt.2t22
定理表明,当n充分大时,随机变量Xni1inn近似地服从标准正
ni1i态分布N(0,1).因此,X近似地服从正态分布N(n,n).由此可见,正态分布在概率论中占有重要的地位.定理四(De Moivre-Laplace定理)
2设n是n次独立重复试验中事件A发生的次数,p是事件A在每次 试验中发生的概率, 则对任意区间[a,b],成立 limP{annpnnp(1p)b}
ba1edt(b)(a)2t22 证明 引人随机变量
1,第i次试验中A发生 X ,0,第i次试验中A不发生i则n次试验中事件A发生的次数
nXXX ,12n12n由于是独立试验,所以X,X,,X相互独立,且都服从相同的(0—1)分布,即
P{X1}p,P{X0}1p,i1,2,,nii于是
EXiip, DXp(1p)
由定理三,即得
limP{nnpnnp(1p)ni1ix}
limP{nXnpnp(1p)x}
x1edt(x), 2t22于是对任意区间[a,b],有
limP{anp(1p)b}
nnnpt22ba1edt(b)(a).2
近似计算公式:
npNnpMnp,NMnp(1p)np(1p)np(1p)nnP{NM}nn
npNnpMnpP{}np(1p)np(1p)np(1p)MnpNnp()().np(1p)np(1p)例1 某计算机系统有120个终端,每个终端有5%的时间在使用,若各终端使用与否是相互独立的,试求有10个以上的终端在使用的概率.解 以X表示使用终端的个数, 引人随机变量 1,第i个终端在使用 X ,0,第i个终端不使用i i1,2,,120 , 则
XXXX ,121202120由于使用与否是独立的,所以X,X,,X相互独立,且都服从相同的(0—1)分布,即 P{X1}p0.05,P{X0}1p,i1,2,,120 1ii于是,所求概率为
P{X10}1P{X10}
Xnp10np1P{},np(1p)np(1p)由中心极限定理得
P{X10}1P{X10}
Xnp10np1P{}
np(1p)np(1p)10np)
1(np(1p)101200.051()
1200.050.951(1.68)10.95350.0465.例2 现有一大批种子,其中良种占1.现从中任选6000粒,试问在这些61种子中,良种所占的比例与之误差
6小于1%的概率是多少? 解 设X表示良种个数, 则
1X~B(n,p),n6000,p , 所求概率为 X1P{||0.01}P{|Xnp|n0.01}n6
Xnpn0.01P{||}
np(1p)np(1p)Xnp60000.01P{||}
15np(1p)600066(2.078)(2.078)
2(2.078)120.9810.96.例3 设有30个电子器件D,D,,D,它们的使用情况如下: 1230D损坏,D接着使用;D损坏,D接1223着使用等等.设器件D的使用寿命服从参数0.1(单位:h)的指数分布.令T
为30个器件使用的总时数,问T超过350h的概率是多少?
i1 8 解 设Xi为 器件D的使用
i寿命,Xi 服从参数0.1(单位:h)
1的指数分布, X,X,,X相互独1230立, TX1X2Xnn30, EX11i0.110 , 2DXi1210.12100, 由中心极限定理得
P{T350}1P{T350}
1P{Tnn350nn} 1(3503003010)1(530)1(0.91)10.8186
0.1814.,例4 某单位设置一电话总机,共有200架电话分机.设每个电话分机有5%的时间要使用外线通话,假定每个电话分机是否使用外线通话是相互独立的,问总机需要安装多少条外线才能以90%的概率保证每个分机都能即时使用.解 依题意
设X为同时使用的电话分机个数, 则X~B(n,p),n200,p0.05, 设安装了N条外线, 引人随机变量
1,第i个分机在使用 X ,0,第i个分机不使用i i1,2,,200 , 则
XXXX ,122002200由于使用与否是独立的,所以X,X,,X相互独立,且都服从相同的(0—1)分布,即 1 10 P{X1}p0.05,iP{X0}1p,i1,2,,200, i {XN}保证每个分机都能即时使用, P{XN}0.9 , 0.9P{XN}
XnpNnp} P{np(1p)np(1p)Nnp)
(np(1p)N2000.05()
2000.050.95N10N10()(),3.089.5查标准正态分布表
N10z1.28, 3.080.9N1.283.081013.94, 取 N14, 答: 需要安装14条外线.例5 设随机变量X的概率密度为
xe,x0 f(x)m!,0,x0其中m为正整数,证明
mxmP{0X2(m1)}.m1 证明
xEXxf(x)dxxedx
m!1xedx m!mx0m21x011 (m2)(m1)!m1, m!m!
xEXxf(x)dxxedxm!m222x0
1x m!0m31edx
x
11(m3)(m2)!(m2)(m1), m!m!
DXEX(EX)
222
(m2)(m1)(m1)
m1 , 利用车贝谢不等式,得 P{0X2(m1)}
P{(m1)X(m1)(m1)} P{|X(m1)|(m1)} P{|XEX|(m1)}
DXm111
(m1)(m1)m .m122 13
第三篇:中心极限定理的教学
中心极限定理的教学
摘 要: 中心极限定理是概率论与数理统计课程中一个重要的定理,也是学生学习过程中的难点,因此教学也有一定的难度.本文首先分析学生学习的主要困惑,其次针对性地理解了中心极限定理的实质,教学过程中设计了具体事例鼓励学生自主发现探索,从而对中心极限定理容易接受,最后用实例巩固中心极限定理的应用.关键词: 中心极限定理 正态分布 自主探索 概率近似
中心极限定理是概率论与数理统计课程中一个重要的定理,衔接着概率论知识与数理统计的相关知识,是教学中的一个难点.利用中心极限定理,数理统计中许多纷乱复杂的随机变量序列和的分布都可以用正态分布进行近似,而正态分布有着许多完美的结论,从而可以获得实用且简单的统计分析方法和结论.然而,由于中心极限定理的教学课时少而定理本身又较抽象,学生很难在短时间内理解该定理并能够加以应用.为此,不少教师对该内容进行了探讨.本文结合学生的基础和知识结构,产生的疑惑,以及教学的需要,提高学生的应用能力,对该定理的教学方法进行探讨.一、学生学习中心极限定理的困难
中心极限定理这一节的教学目标是要求学生理解中心极限定理,并熟练运用该定理进行事件概率的近似计算,然而在讲解这一内容只有2个课时,学生又不熟悉相应的概率基础,导致无论是数学专业还是非数学专业的学生对该知识点都存在疑惑,主要表现在:不知道中心极限定理是什么意思,具体形式是什么,怎么用.针对这三方面的问题,教师首先应该要理解深刻,概括恰当,简明扼要.1.中心极限定理的背景
在实际问题中,许多随机现象都是由大量微小的相互独立的随机因素综合影响所产生的,比如误差受到材料、环境、设备、操作者等因素的影响,每个因素都是微小的、随机的,但综合起来就产生实验过程中的误差,即误差是大量的随机因素的总和,我们关心误差就是关心大量独立随机变量和的问题.中心极限定理告诉我们,大量独立随机变量和的极限分布是正态分布.这一点突出了正态分布在概率论与数理统计中的重要地位,在应用中凸显了正态分布的许多优势,同时在总体为非正态的统计问题中发挥着重要的指导作用.在实际问题中,首先分析随机现象,将其可分解成大量的随机变量的和,那么无论随机变量服从正态还是非正态,其和近似看做正态分布,进而求相关的概率计算问题.学生对此不理解,主要是因为太抽象、太笼统,在教学中可让学生自主探讨,发现总结.2.中心极限定理的具体形式
中心极限定理探讨的是随机变量和的极限分布,教材中给出了不同条件下的中心极限定理的多种结论,其形式复杂,证明繁琐,但总结起来本质是一个形式.棣莫佛-拉普拉斯中心极限定理是Lindeberg-Levy中心极限定理的特例,两个中心极限定理归根到底是说独立同分布的随机变量和的极限分布为正态分布,可变形为标准正态分布.3.中心极限定理的应用
学生对中心极限定理内容不理解,也导致无法将理论用于实践,偶尔的依葫芦画瓢并没有掌握其实质.中心极限定理常用作概率近似计算,需要根据问题的实际含义定义多个随机变量并给出分布,然后变为独立随机变量和,再利用中心极限定理和正态分布的查表求概率.只有在教学中选择恰当的例题,深入分析,合理总结,才能取到良好的效果.中心极限定理包含极限理论,因此理论上利用中心极限定理处理极限问题.在经济问题中,质检问题中也有广泛的应用.教学中可引申生活实际等有趣的问题,让学生体会学以致用的乐趣.二、中心极限定理的教学设计
首先利用简单的引例,让学生自主探索,总结规律.例1:有一个总体X,它是取值于[2,8]的随机数,在等可能被取出的假设下,总体X的分布为均匀分布U(2,8).学生自主观察直方图的特点,得出的规律是“中间高,两边低,左右基本对称”.比照正态分布的密度曲线:
上述直方图轮廓曲线,用如下概率函数表示关于u对称的钟形曲线最合适.将这一规律概括起来就是中心极限定理:
其具体形式体现出三个定理.(1)中心极限定理是用极限理论反映的一个重要定理,其优势体现在非正态分布或不知道分布类型时,为数理统计的学习奠定基础.(2)主要应用两方面:第一,求随机变量之和落在某区间的概率;第二,已知随机变量之和的概率,求.(3)解题中分析随机总体可分解为许多独立随机变量的和的形式甚为关键.例2:某保险公司有2500个人参加保险,每人每年付1200元保险费,在一年内一个人死亡的概率为0.002,死亡时其家属可向保险公司领得20万元,问保险公司亏本的概率.学生处理实际问题的难点就在于不知如何进行问题的转化.提示两点:第一,将问题用随机变量表示,每个人参保是随机的独立的,如何刻画?第二,保险公司所得的总收益如何表示,学生经整理后发现,所求总收益正好可以看成2500个独立同分布随机变量之和,n=2500足够大,故想到用中心极限定理将其近似为正态分布.求出变量和的期望和方差,利用正态分布查表求概率.为了加强对中心极限定理的理解和巩固,对学生提出如下思考:
2.列举贴近生活实例,让学生巩固练习,加以总结.3.学有余力拓展中心极限定理的应用领域.通过本节的学习,让学生自主发现规律,善于总结,容易接受,形成解决实际问题的统计思维,熟悉中心极限定理和正态分布相关理论很有必要.参考文献:
[1]茆诗松,程依明,濮晓龙.概率论与数理统计教程第二版[M].北京:高等教育出版社,2011.[2]黎玉芳.中心极限定理的教学方法探讨[J].科技教育创新,2010(24):220-221.[3]孙碑.中心极限定理及其在若干实际问题中的应用[J].论谈教学,2012(6):65-67.
第四篇:中心极限定理和概率统计
若{Xn}的分布函数序列{Fn(x)}与X的分布函数F(x)有,在任意连续点x,limFn(x)F(x)。n
依概率收敛
n若0,有P(XnX)0。准确的表述是,0,0,N,nN,有P(XnX)成立
(3)几乎必然收敛
如果有P(limXnX)1。准确的表述是,除掉一个0概率集A,对所有的A,n
有limXn()X()成立。这是概率空间上的点收敛。n
定理1。(切贝雪夫大数律){Xn}相互独立,且有相同的期望和方差,(不一定同分布)
1nPE(Xn)uD(Xn),n,记YnXi,则Ynu。ni1
2统计发生——事物某方面的定量记录事前是不确定的,发生后的数据由真值和误差两部分构成,X。X是数据,是真值,是误差。导致误差的原因有:
1. 系统性误差:偏离真值的本质性错误,有内在原因所致;
2. 随机性误差:偏离真值的偶然性错误,没有内在原因,是纯偶然因素所致。
总体就是一个特定的随机变量
通过抽样,获得样本,构造样本统计量,由此推断总体中某些未知的信息
从总体中抽样是自由的,且当总体数量足够大,有放回与无放回抽样区别不大,有理由认为,取得的抽样观察值是没有关系的。所以,样本在未抽取前它们是与总体X同分布的随机变量,且是相互独立的,称此为随机样本。
定义2。设x1,,xn是取自总体X的一组样本值,g(x1,,xn)是Borel 可测函数,则称随机变量g(X1,,Xn)是一个样本统计量。
如果总体X中分布函数有某些参数信息是未知的,我们用统计量g(X1,,Xn)去推断这些信息,称此问题为统计推断问题。
给样本值x(x1,,xN),y(y1,,yN),定义:(1)样本均值
(xi/n)
i
1n
(2)样本方差
1n
ˆx)ˆvar((xi)2 n1i1
ˆ样本标准差
s.e.e)
x)i(y)
1n
(3)样本协方差cˆov(x,y)(1x
n1i1
样本相关系数
xy
ˆ(x,y)cov
1/2
ˆ(x)varˆ(y)][var
1nk
(4)样本k阶矩 Akxi k1,2,
ni11n
(5)样本k阶中心矩 Bk(xi)k
ni1
k1,2,
X的左侧分位点F,P(XF)dF(x)。左分位点的概率含义是,随机变量
F
不超过该点的概率等于
设总体X分布已知,但其中有一个或多个参数未知,抽样X1,,Xn,希望通过样本来估计总体中的未知参数,称此为参数估计问题,它是统计推断理论中最重要的基础部分。
用样本矩作为总体矩的估计量,以及用样本矩的连续函数作为总体矩的连续函数的估计量,这种方法称为矩估计法,这是一种最自然的估计方法。
ˆ(x,,x))对任意成立。当样本是称ˆ是参数的一个无偏估计,如果E(1n
有限的时候,我们首先要考虑的是无偏性。
n1n22
ˆS(Xi)2才是方差的无偏估计。故我们在样本统计量中定义n1n1i1
S2为样本方差。
ˆ是参数的一个一致估计,如果依概率有limˆ(x1,,xn)对任意成立。
n
有效性
在所有关于参数的无偏估计类中0,或所有的一致估计类1中,如果存在ˆ*是参数的一个无偏有效估计或一ˆ*)D(ˆ)对任意ˆ或任意ˆ成立,称D(01
ˆ具有最小方差性。致渐近有效估计。即
*
。无论总体X分布是什么,任意样本Xi和都是X的无偏估计,但比单独的样本估计Xi更有效。
DXi,所以n
设总体X关于分布F(x,)存在两类问题,一类是分布的形式未知,一类是分布的形式已知但参数未知,提出的问题是,需要对分布的形式作出推断,此称为非参数检验的问题; 或需要对参数作出推断,此称为参数检验问题。
奈克—皮尔逊定理告诉我们,当样本容量n固定,若要减少犯第一类错误的概率则犯第二类错误的概率会增加,要使两类错误都减少当且仅当增加样本容量。
超过了我们设定的F,(如,体温超过37度。)此意味一个小概率事件发生了。于是,我们有理由拒绝命题H0是真的。
X~N(u1,12),Y~N(u2,2),且相互独立,取样有(x1xn1),(y1yn2)。
欲检验H0:u1u2,或更一般,H0:u1u2u(u已知)。如何检验?
2(1)若12、2已知
因为~N(u1,1
2n
1),~N(u2,22
n2),且相互独立,所以~N(u1u2,122
n1
n2),~N(0,1),所以可找到检验统计量U。
(2)若1222,但未知,欲检验H0:u1u20,因为V
222
[(n1)S(n1)S]~(n1n22),11222
且与
U
~N(0,1)独立,n11n212
~t(n1n22),令S2,S12S2
n1n22n1n22可得
V2S2,所以可找到统计量
n1n22
T
~t(n1n22)。
注:如果u未知,问题就变困难了,可以证明此时统计量T就是一个非中心的t分布。
(3)又如何知道1222?
12(n1)(n1)2可做假设检验H0:21。因为12S12~2(n11),22S2 ~2(n21)且独立。
122
S12
所以,可找到统计量F2~F(n11,n21)。
S2
(4)若122,且未知。问题就变困难多了,我们找不到合适的统计量。如果样本容量
足够大,那么,可以用渐近检验的办法处理。注意,U
中,因为12,2未
知,但已知S12,S2是12,2的一致估计,故用它们代替,有:
n1,n2
limU
~N(0,1)。
从而当n1,n2充分大时可用渐近正态检验。
又当n1n2n较小时,可以证明,~t(n),注意,此与T
~t(n1n22)
自由度不同。此意味当期望、方差相同时,样本可以合并,认为X,Y属于同一总体。当期望相同,方差不同时,样本不能简单合并。
注:关于H0:u1u2u,或H0:u1u2u,统计量相同,并采用单侧的右分位点或单侧的左分位点检验。
ˆ是无偏线性估计类中的有效估计。OLS
ˆ 的极大似然估计在基本模型假定下就是OLS
估计做出后,评价、判断模型中的假定是否合理是对事前设定的模型做一个整体的把握。我们可以把这些假定、设定归结为一些对未知参数的判断,如果这些判断基本正确或错误,那么从整体数据中就能够反映出来。假设检验是估计完成后对模型的设定做进一步的确认。它以证否的形式完成。拒绝原假设,意味着命题真时犯错误的可能性可控制在一定的概率范围内。
第五篇:浅谈中心极限定理及其应用 论文
浅谈中心极限定理及其应用
李月20091103558
数学科学学院信息与计算科学09信息一班
指导老师韩文忠
摘要:概率论中讨论随机变量序列部分和的分布渐近于正态分布的一类定理。在自然界与生产中,一些现象受到许多相互独立的随机因素的影响,如果每个因素所产生的影响都很微小时,总的影响可以看作是服从正态分布的。中心极限定理就是从数学上证明了这一现象。本文主要叙述中心极限定理在现实中的应用。关键字:中心极限定理 随机变量 正态分布
1.定理一(独立同分布的中心极限定理)设随机变量X1,X2,…,Xn,…相互独
立,服从同一分布,且具有数学期望和方差,E(Xk),n
D(Xk)=
>0(k=1,2,3),则随机变量之和Xk的标准化变量
k1
n
n
n
X
k
E(Xk)
k1n
=
k1
X
K
n
Yn=
k1
D(Xk)
k1
n的分布函数Fn(x)对于任意x满足
n
x
limFn(x)=limFn(x)=limP{
n
k
n
x
k1
n
}=
x
12
t
dt= (x).这就是说,均值为,方差为20 的独立同分布的随机变量
n
X1,X2,…,Xn之和Xk的标准化变量,当n充分大时,有
k1
n
k1
X
n
n
n
~N(0,1)
1.1:一加法器同时接收20个噪声电压Vk(k=1,2,3,20),设它们是相互独
立的随机变量,且都在区间(0,10)上服从均匀分布,记V
P{V105}的近似值。
V,求
k
k1
解:易知E(Vk)5,D(Vk)100/12(k=1,2,3,20),由定理一,随机
变量Z
V
K1
k
=
V205
近似服从正态分布N(0,1),于是
P{V105}P{
V20520
10520520
V20520
0.387}
1P{
V20520
0.387}
1
0.387
12
t
dt1(0.387)0.384.即有P{V105}0.34
2.(李雅谱诺夫(Lyapunov)定理)设随机变量X1,X2,…,Xn,…相互独立,它们具有数学期望和方差
0,k1,2,E(Xk),D(XK)K
nn
记k
k1
.k
k1
若存在正数,使得当n时,n
1B
2n
n
k1
E{Xkk
2
}0,则随机变量之和Xk的标准化变量
k1
nnnn
Zn
k1
X
k
E(Xk)
k1n
k1
X
k
Bn
k1
X
k
D(Xk)
k1
n
n
的分布函数limFn(x)limP{
n
n
k1
X
k
Bn
k1
k
x}
x
12
t
dt= (x).
此定理表明,在定理的条件下,随机变量
n
n
k
X
Zn
k1
Bn
X
k1
k
当n很大时,近似的服从正态分布
n
n
N(0,1),由此,当n很大,n
k1
X
k
BnZn
k1
k
近似的服从正态分布
N(k,Bn)
k1
.这就是说,无论各个随机变量
n
Xk(k1,2)
服从什么分布,只要满足定理的条件,那么它们的和k1
X
k
当n很大时就近似地服从正态
分布,在很多问题中所考虑的随机变量可以表示成很多个独立的随机变量之和。请看下面的例子。
2.1:设有一条河流经某城市,河上有一座桥,该桥的强度服从正态分布
N(300,40)(强度的单位是t(吨))。有很多车要经过此桥,如果各车的平
均重量是5t,方差是2t2。问:为保证此桥不出问题的概率(安全度)不小于0.99997.最多允许在桥上同时出现多少车辆?
解:用Y表示该桥的强度,若有M辆车在桥上,第i辆车的重量Xi
M
(i1,2M),则M辆车的总重量SM
i1
Xi,我们可以认为
Y,X1,X2XM是相互独立的,E(Xi)5,var(Xi)2,该桥不出现问
题的概率为
RP(M辆车的总重量不超过桥的强度)。
显然RP(SMY)RP(SMY0),我们要找满足不等式
R0.99997的最大的M,不难想到,这个M,由于
SM)
E(SM
=,M1,var(=
M1
(这里
1E(Xi)5
1var(Xi)2,i1,2M),由定理可知SM近似的服从
N(M1,M1)
.又N
(300,40),可知SMY
近似服从
N(M1300,M1240),于是
R[
0(M1300)
M
]
40
由于(4)=0.99997,故为了R0.99997,必须且只需
令x
0(M1300)
M
2M40
4
40
(x40),上述不等式化为,则M
x4x4000
((11.87)400))
由此知x11.87,从而M=50.就是说,最多允许50辆车
同时在桥上。
下面介绍另一个中心极限定理,它是定理一的特殊情况。
3.(棣莫弗-拉普拉斯(De Moirve-Laplace)定理)设随机变量(n1,2,)服从参数为n,p(0p1)的二项分布,则对于任意x,有limP{
n
npnp(1p)
x}=
x
12
t
dt=(x)。
这个定理表明,二项分布的极限分布式正态分布
n
Xk~N(np,npq)当n充分大时,服从二项分布的随机变量的概
k1
率计算可以转化为正态随机变量的概率计算。
3.1 :对于一个学生而言,来参加家长会的家长人数是一个随机变量,设一个学
生无家长,1名家长,2名家长来参加会议的概率分别为0.05,0.8,0.15,若学校共有400名学生,设各学生参加会议的家长人数相互独立且服从同一分布。(1)求参加会议的家长人数x超过450的概率:
(2)求有1名家长来参加会议的学生人数不多于340的概率。
解(1)以Xk(k1,2,400)记第k个学生来参加会议的家长人数,则Xk的分布率为
400
易知E(Xk)1.1,D(Xk)0.19,k1,2400.而X随机变量
400
X。由定理一
k
k1
X
k1
k
4001.1
0.19
X4001.1400
0.19
400
近似服从正态分布N(0,1),于是
P{X450
}=P{
X4001.1400
0.19
4504001.1400
0.19
=1-P{
X4001.1400
0.19
1.147}
1(1.147)0.1251’
(3)以Y记有一名家长参加会议的学生人数,则Y~b(400,0.8),由定理三
P{Y340}
=P{
Y4000.84000.80.2Y4000.84000.80.2
3404000.84000.80.2
}
=P{2.5}(2.5)=0.9938
小结 中心极限定理表明,在相当一般的条件下,当独立随机变量的个数不断增加时,其和态分布趋于正态分布,这一事实阐明了正态分布的重要性,也揭示了为什么在实际应用中会经常用到正态分布,也就揭示了产生正态分布变量的源泉,另一方面,它提供了独立同分布变量随机变量之和Xk(其中Xk的方
k1
n
差存在的近似分布,只要和式中加项的个数充分大,就可以不必考虑和式中的随机变量服从什么分布。都可以用正态分布来近似,这在应用上是有效和重要的。
参考文献
[1] 盛骤概率论与数理统计,高等教育出版社,2006 [2] 陈家鼎 郑中国概率与统计 高等教育出版社 2004