第一篇:中心极限定理应用
中心极限定理及其应用
【摘要】中心极限定理的产生具有一定的客观背景,最常见的是德莫佛-拉普拉斯中心极限定理和林德贝格-勒维中心极限定理。它们表明了当n充分大时,方差存在的n个独立同分布的随机变量和近似服从正态分布,在实际中的应用相当广泛。本文讨论了中心极限定理的内容、应用与意义。
【关键词】:中心极限定理 正态分布 随机变量
一、概述
概率论与数理统计是研究随机现象、统计规律性的学科。随机现象的规律性只有在相同条件下进行大量重复的实验才会呈现出来,而研究大量的随机现象常常采用极限的形式,由此导致了对极限定理的研究。极限定理的内容很广泛,中心极限定理就是其中非常重要的一部分内容。中心极限定理主要描述了在一定条件下,相互独立的随机变量序列X1、X2、…Xn、…的部分和的分布律:当n→∞时的极限符合正态分布。因此中心极限定理这个结论使正态分布在数理统计中具有很重要的地位,也使得中心极限定理有了广泛的应用。
二、定理及应用
1、定理一(林德贝格—勒维定理)
若
k1,=a,2,…是一列独立同分布的随机变量,且ED
k=kx2(2>0),k=1,2,…则有limp(k
1nnnax)n
n12et22dt。
当n充分大时,k1kna
n~N(0,1),k1nk~N(na,n)
22、定理二(棣莫弗—拉普拉斯中心极限定理)
在n重伯努利试验中,事件A在每次试验中出现的概率为错误!未找到引用源。, 错误!未
找到引用源。为n次试验中事件A出现的次数,则limp(nnnpnpqx)21xet22dt
其中q1p。这个定理可以简单地说成二项分布渐近正态分布,因此当n充分大时,可
以利用该定理来计算二项分布的概率。
同分布下中心极限定理的简单应用
独立同分布的中心极限定理可应用于求随机变量之和Sn落在某区间的概率和已知随机变量之和Sn取值的概率,求随机变量的个数。
例1:设各零件的重量都是随机变量,它们相互独立且服从相同的分布,其数学期望为0.5kg,均方差为0.1kg,问5000只零件的总重量超过2510kg的概率是多少?
解:设Xi(i=1,2,…,5000)表示第i个零件的重量X1,X2,…,X5000独立同分布且E(Xi)=0.5,D(Xi)=0.12。
由独立同分布的中心极限定理可知
[3]
=I-φ(1.414)=1-0.921
5=0.0785
例2:一生产线生产的产品成箱包装,每箱的重量是随机的且同分布,设每箱平均重50kg,标准差为5kg,若用最大载重为50吨的汽车承运,每辆车最多可以装多少箱才能保证不超载的概率大于0.977?
解:设Xi(i=1,2,…,n)是装运第i箱的重量,n为所求箱数。由条件可把X1,X2,…,Xn看作独立同分布的随机变量,而n箱的总重量为Tn=X1+X2+…+Xn,是独立同分布的随机变量之和。
由E(Xi)=50、D(Xi)=52得:E(Tn)=50n,D(Tn)=52n
根据独立同分布的中心极限定理:
[3]
即最多可以装98箱。
例3:报名听心理学课程的学生人数K是服从均值为100的泊松分布的随机变量,负责这门课的教授决定,如果报名人数不少于120,就分成两班,否则就一班讲授。问该教授讲授两个班的概率是多少?
分析:该教授讲授两个班的情况出现当且仅当报名人数x不少于120,精确解为P(x≥120)=e-100 100i/i!很难求解,如果利用泊松分布的可加性,想到均值为100的泊松分布随机变量等于100个均值为1的独立泊松分布随机变量之和,即X= Xi,其中每个Xi具有参数1的泊松分布,则我们可利用中心极限定理求近似解。[2]
解:可知E(X)=100,D(X)=100
教授讲授两个班的概率是0.023。
例4:火炮向目标不断地射击,若每次射中目标的概率是0、1。
(1)求在400次射击中击中目标的次数在区间[30,50]内的概率。
(2)问最少要射击多少次才能使击中目标的次数超过10次的概率不小于0.9?
分析:显然火炮射击可看作是伯努利实验。[1]即
我们知道,正态分布可近似于二项分布,而且泊松分布可近似于二项分布,当二项分布b(n,p),n较大、p较小时可用泊松分布估计近似值。如果p接近1,有q=l-p很小,这时也可用泊松分布计算;但是当n较大,p不接近0或1时,再用泊松分布估计二项分布的概率就不够精确了,这时应采用拉普拉斯定理来计算。
解:(1)设在射击中击中目标的次数为Yn,所求概率(30≤Yn<50)等于:
最小正整数n=147就是所要求的最小射击数。
以上例子都是独立同分布的随机变量,可以用中心极限定理近似估算,但是如果不同分布,中心极限定理是否也成立呢?
李雅普诺夫定理
当随机变量Xi独立,但不一定同分布时,中心极限定理也成立。定理3[2](李雅普诺夫定理):
设X1,X2,…,Xn,…为独立随机变量序列,且E(Xn)=an,D(Xn)=σn2存在,Bn2= σn2(n=1,2,…),若存在δ>0,使得:
也就是说,无论各个随机变量Xi服
从什么分布,只要满足李雅普诺夫条件,当n很大时,它们的和近似服从正态分布。由于在大学本科阶段接触的不同分布的样本较少,本文对它的应用将不举例说明。
中心极限定理以严格的数学形式阐明了在大样本条件下,不论总体的分布如何,样本均值总是近似地服从正态分布。正是这个结论使得正态分布在生活中有着广泛的应用。
四、中心极限定理的意义
首先,中心极限定理的核心内容是只要n足够大,便可以把独立同分布的随机变量和的标准化当作正态变量,所以可以利用它解决很多实际问题,同时这还有助于解释为什么很多自然群体的经验频率呈现出钟形曲线这一值得注意的事实,从而正态分布成为概率论中最重要的分布,这就奠定了中心极限定理的首要功绩。其次,中心极限定理对于其他学科都有着重要作用。例如数理统计中的参数(区间)估计、假设检验、抽样调查等;进一步,中心极限定理为数理统计在统计学中的应用铺平了道路,用样本推断总体的关键在于掌握样本特征
值的抽样分布,而中心极限定理表明只要样本容量足够地大,得知未知总体的样本特征值就近似服从正态分布。从而,只要采用大量观察法获得足够多的随机样本数据,几乎就可以把数理统计的全部处理问题的方法应用于统计学,这从另一个方面也间接地开辟了统计学的方法领域,其在现代推断统计学方法论中居于主导地位。参考文献
[1]邓永录 著 应用概率及其理论基础.清华大学出版社。
[2]魏振军 著 概率论与数理统计三十三讲.中国统计出版社。
[3]程依明 等 著 概率论与数理统计习题与解答.高等数学出版社。
第二篇:浅谈中心极限定理及其应用 论文
浅谈中心极限定理及其应用
李月20091103558
数学科学学院信息与计算科学09信息一班
指导老师韩文忠
摘要:概率论中讨论随机变量序列部分和的分布渐近于正态分布的一类定理。在自然界与生产中,一些现象受到许多相互独立的随机因素的影响,如果每个因素所产生的影响都很微小时,总的影响可以看作是服从正态分布的。中心极限定理就是从数学上证明了这一现象。本文主要叙述中心极限定理在现实中的应用。关键字:中心极限定理 随机变量 正态分布
1.定理一(独立同分布的中心极限定理)设随机变量X1,X2,…,Xn,…相互独
立,服从同一分布,且具有数学期望和方差,E(Xk),n
D(Xk)=
>0(k=1,2,3),则随机变量之和Xk的标准化变量
k1
n
n
n
X
k
E(Xk)
k1n
=
k1
X
K
n
Yn=
k1
D(Xk)
k1
n的分布函数Fn(x)对于任意x满足
n
x
limFn(x)=limFn(x)=limP{
n
k
n
x
k1
n
}=
x
12
t
dt= (x).这就是说,均值为,方差为20 的独立同分布的随机变量
n
X1,X2,…,Xn之和Xk的标准化变量,当n充分大时,有
k1
n
k1
X
n
n
n
~N(0,1)
1.1:一加法器同时接收20个噪声电压Vk(k=1,2,3,20),设它们是相互独
立的随机变量,且都在区间(0,10)上服从均匀分布,记V
P{V105}的近似值。
V,求
k
k1
解:易知E(Vk)5,D(Vk)100/12(k=1,2,3,20),由定理一,随机
变量Z
V
K1
k
=
V205
近似服从正态分布N(0,1),于是
P{V105}P{
V20520
10520520
V20520
0.387}
1P{
V20520
0.387}
1
0.387
12
t
dt1(0.387)0.384.即有P{V105}0.34
2.(李雅谱诺夫(Lyapunov)定理)设随机变量X1,X2,…,Xn,…相互独立,它们具有数学期望和方差
0,k1,2,E(Xk),D(XK)K
nn
记k
k1
.k
k1
若存在正数,使得当n时,n
1B
2n
n
k1
E{Xkk
2
}0,则随机变量之和Xk的标准化变量
k1
nnnn
Zn
k1
X
k
E(Xk)
k1n
k1
X
k
Bn
k1
X
k
D(Xk)
k1
n
n
的分布函数limFn(x)limP{
n
n
k1
X
k
Bn
k1
k
x}
x
12
t
dt= (x).
此定理表明,在定理的条件下,随机变量
n
n
k
X
Zn
k1
Bn
X
k1
k
当n很大时,近似的服从正态分布
n
n
N(0,1),由此,当n很大,n
k1
X
k
BnZn
k1
k
近似的服从正态分布
N(k,Bn)
k1
.这就是说,无论各个随机变量
n
Xk(k1,2)
服从什么分布,只要满足定理的条件,那么它们的和k1
X
k
当n很大时就近似地服从正态
分布,在很多问题中所考虑的随机变量可以表示成很多个独立的随机变量之和。请看下面的例子。
2.1:设有一条河流经某城市,河上有一座桥,该桥的强度服从正态分布
N(300,40)(强度的单位是t(吨))。有很多车要经过此桥,如果各车的平
均重量是5t,方差是2t2。问:为保证此桥不出问题的概率(安全度)不小于0.99997.最多允许在桥上同时出现多少车辆?
解:用Y表示该桥的强度,若有M辆车在桥上,第i辆车的重量Xi
M
(i1,2M),则M辆车的总重量SM
i1
Xi,我们可以认为
Y,X1,X2XM是相互独立的,E(Xi)5,var(Xi)2,该桥不出现问
题的概率为
RP(M辆车的总重量不超过桥的强度)。
显然RP(SMY)RP(SMY0),我们要找满足不等式
R0.99997的最大的M,不难想到,这个M,由于
SM)
E(SM
=,M1,var(=
M1
(这里
1E(Xi)5
1var(Xi)2,i1,2M),由定理可知SM近似的服从
N(M1,M1)
.又N
(300,40),可知SMY
近似服从
N(M1300,M1240),于是
R[
0(M1300)
M
]
40
由于(4)=0.99997,故为了R0.99997,必须且只需
令x
0(M1300)
M
2M40
4
40
(x40),上述不等式化为,则M
x4x4000
((11.87)400))
由此知x11.87,从而M=50.就是说,最多允许50辆车
同时在桥上。
下面介绍另一个中心极限定理,它是定理一的特殊情况。
3.(棣莫弗-拉普拉斯(De Moirve-Laplace)定理)设随机变量(n1,2,)服从参数为n,p(0p1)的二项分布,则对于任意x,有limP{
n
npnp(1p)
x}=
x
12
t
dt=(x)。
这个定理表明,二项分布的极限分布式正态分布
n
Xk~N(np,npq)当n充分大时,服从二项分布的随机变量的概
k1
率计算可以转化为正态随机变量的概率计算。
3.1 :对于一个学生而言,来参加家长会的家长人数是一个随机变量,设一个学
生无家长,1名家长,2名家长来参加会议的概率分别为0.05,0.8,0.15,若学校共有400名学生,设各学生参加会议的家长人数相互独立且服从同一分布。(1)求参加会议的家长人数x超过450的概率:
(2)求有1名家长来参加会议的学生人数不多于340的概率。
解(1)以Xk(k1,2,400)记第k个学生来参加会议的家长人数,则Xk的分布率为
400
易知E(Xk)1.1,D(Xk)0.19,k1,2400.而X随机变量
400
X。由定理一
k
k1
X
k1
k
4001.1
0.19
X4001.1400
0.19
400
近似服从正态分布N(0,1),于是
P{X450
}=P{
X4001.1400
0.19
4504001.1400
0.19
=1-P{
X4001.1400
0.19
1.147}
1(1.147)0.1251’
(3)以Y记有一名家长参加会议的学生人数,则Y~b(400,0.8),由定理三
P{Y340}
=P{
Y4000.84000.80.2Y4000.84000.80.2
3404000.84000.80.2
}
=P{2.5}(2.5)=0.9938
小结 中心极限定理表明,在相当一般的条件下,当独立随机变量的个数不断增加时,其和态分布趋于正态分布,这一事实阐明了正态分布的重要性,也揭示了为什么在实际应用中会经常用到正态分布,也就揭示了产生正态分布变量的源泉,另一方面,它提供了独立同分布变量随机变量之和Xk(其中Xk的方
k1
n
差存在的近似分布,只要和式中加项的个数充分大,就可以不必考虑和式中的随机变量服从什么分布。都可以用正态分布来近似,这在应用上是有效和重要的。
参考文献
[1] 盛骤概率论与数理统计,高等教育出版社,2006 [2] 陈家鼎 郑中国概率与统计 高等教育出版社 2004
第三篇:中心极限定理证明
中心极限定理证明
一、例子
高尔顿钉板试验.图中每一个黑点表示钉在板上的一颗钉子.每排钉子等距排列,下一排的每个钉子恰在上一排两相邻钉子之间.假设有排钉子,从入口中处放入小圆珠.由于钉板斜放,珠子在下落过程中碰到钉子后以的概率滚向左边,也以的概率滚向右边.如果较大,可以看到许多珠子从处滚到钉板底端的格子的情形如图所示,堆成的曲线近似于正态分布.如果定义:当第次碰到钉子后滚向右边,令;当第次碰到钉子后滚向左边,令.则是独立的,且
那么由图形知小珠最后的位置的分布接近正态.可以想象,当越来越大时接近程度越好.由于时,.因此,显然应考虑的是的极限分布.历史上德莫佛第一个证明了二项分布的极限是正态分布.研究极限分布为正态分布的极限定理称为中心极限定理.二、中心极限定理
设是独立随机变量序列,假设存在,若对于任意的,成立
称服从中心极限定理.设服从中心极限定理,则服从中心极限定理,其中为数列.解:服从中心极限定理,则表明
其中.由于,因此
故服从中心极限定理.三、德莫佛-拉普拉斯中心极限定理
在重贝努里试验中,事件在每次试验中出现的概率为为次试验中事件出现的次数,则
用频率估计概率时的误差估计.由德莫佛—拉普拉斯极限定理,由此即得
第一类问题是已知,求,这只需查表即可.第二类问题是已知,要使不小于某定值,应至少做多少次试验?这时利用求出最小的.第三类问题是已知,求.解法如下:先找,使得.那么,即.若未知,则利用,可得如下估计:.抛掷一枚均匀的骰子,为了至少有0.95的把握使出现六点的概率与之差不超过0.01,问需要抛掷多少次?
解:由例4中的第二类问题的结论,.即.查表得.将代入,便得.由此可见,利用比利用契比晓夫不等式要准确得多.已知在重贝努里试验中,事件在每次试验中出现的概率为为次试验中事件出现的次数,则服从二项分布:的随机变量.求.解:
因为很大,于是
所以
利用标准正态分布表,就可以求出的值.某单位内部有260架电话分机,每个分机有0.04的时间要用外线通话,可以认为各个电话分机用不用外线是是相互独立的,问总机要备有多少条外线才能以0.95的把握保证各个分机在使用外线时不必等候.解:以表示第个分机用不用外线,若使用,则令;否则令.则.如果260架电话分机同时要求使用外线的分机数为,显然有.由题意得,查表得,故取.于是
取最接近的整数,所以总机至少有16条外线,才能有0.95以上的把握保证各个分机在使用外线时不必等候.根据孟德尔遗传理论,红黄两种番茄杂交第二代结红果植株和结黄果植株的比率为3:1,现在种植杂交种400株,试求结黄果植株介于83和117之间的概率.解:将观察一株杂交种的果实颜色看作是一次试验,并假定各次试验是独立的.在400株杂交种中结黄果的株数记为,则.由德莫佛—拉普拉斯极限定理,有
其中,即有
四、林德贝格-勒维中心极限定理
若是独立同分布的随机变量序列,假设,则有
证明:设的特征函数为,则的特征函数为
又因为,所以
于是特征函数的展开式
从而对任意固定的,有
而是分布的特征函数.因此,成立.在数值计算时,数用一定位的小数来近似,误差.设是用四舍五入法得到的小数点后五位的数,这时相应的误差可以看作是上的均匀分布.设有个数,它们的近似数分别是,.,.令
用代替的误差总和.由林德贝格——勒维定理,以,上式右端为0.997,即以0.997的概率有
设为独立同分布的随机变量序列,且互相独立,其中,证明:的分布函数弱收敛于.证明:为独立同分布的随机变量序列,且互相独立,所以仍是独立同分布的随机变量序列,易知有
由林德贝格——勒维中心极限定理,知的分布函数弱收敛于,结论得证.作业:
p222EX32,33,34,3
5五、林德贝尔格条件
设为独立随机变量序列,又
令,对于标准化了的独立随机变量和的分布
当时,是否会收敛于分布?
除以外,其余的均恒等于零,于是.这时就是的分布函数.如果不是正态分布,那么取极限后,分布的极限也就不会是正态分布了.因而,为了使得成立,还应该对随机变量序列加上一些条件.从例题中看出,除以外,其余的均恒等于零,在和式中,只有一项是起突出作用.由此认为,在一般情形下,要使得收敛于分布,在的所有加项中不应该有这种起突出作用的加项.因为考虑加项个数的情况,也就意味着它们都要“均匀地斜.设是独立随机变量序列,又,这时
(1)若是连续型随机变量,密度函数为,如果对任意的,有
(2)若是离散型随机变量,的分布列为
如果对于任意的,有
则称满足林德贝尔格条件.以连续型情形为例,验证:林德贝尔格条件保证每个加项是“均匀地斜.证明:令,则
于是
从而对任意的,若林德贝尔格条件成立,就有
这个关系式表明,的每一个加项中最大的项大于的概率要小于零,这就意味着所有加项是“均匀地斜.六、费勒条件
设是独立随机变量序列,又,称条件为费勒条件.林德贝尔格证明了林德贝尔格条件是中心极限定理成立的充分条件,但不是必要条件.费勒指出若费勒条件得到满足,则林德贝尔格条件也是中心极限定理成立的必要条件.七、林德贝尔格-费勒中心极限定理
引理1对及任意的,证明:记,设,由于
因此,其次,对,用归纳法即得.由于,因此,对也成立.引理2对于任意满足及的复数,有
证明:显然
因此,由归纳法可证结论成立.引理3若是特征函数,则也是特征函数,特别地
证明定义随机变量
其中相互独立,均有特征函数,服从参数的普哇松分布,且与诸独立,不难验证的特征函数为,由特征函数的性质即知成立.林德贝尔格-费勒定理
定理设为独立随机变量序列,又.令,则
(1)
与费勒条件成立的充要条件是林德贝尔格条件成立.证明:(1)准备部分
记
(2)
显然(3)
(4)
以及分别表示的特征函数与分布函数,表示的分布函数,那么(5)
这时
因此林德贝尔格条件化为:对任意,(6)
现在开始证明定理.设是任意固定的实数.为证(1)式必须证明
(7)
先证明,在费勒条件成立的假定下,(7)与下式是等价的:
(8)
事实上,由(3)知,又因为
故对一切,把在原点附近展开,得到
因若费勒条件成立,则对任意的,只要充分大,均有
(9)
这时
(10)
对任意的,只要充分小,就可以有
(11)
因此,由引理3,引理2及(10),(11),只要充分大,就有
(12)
因为可以任意小,故左边趋于0,因此,证得(7)与(8)的等价性.(2)充分性
先证由林德贝尔格条件可以推出费勒条件.事实上,(13)
右边与无关,而且可选得任意小;对选定的,由林德贝尔格条件(6)知道第二式当足够大时,也可以任意地小,这样,费勒条件成立.其次证明林德贝尔格条件能保证(1)式成立.注意到(3)及(4),可知,当时,当时,因此
(14)
对任给的,由于的任意性,可选得使,对选定的,用林德贝尔格条件知只要充分大,也可使.因此,已证得了(8),但由于已证过费勒条件成立,这时(8)与(7)是等价的,因而(7)也成立.(3)必要性
由于(1)成立,因此相应的特征函数应满足(7).但在费勒条件成立时,这又推出了(8),因此,(15)
上述被积函数的实部非负,故
而且
(16)
因为对任意的,可找到,使,这时由(15),(16)可得
故林德贝尔格条件成立.八、李雅普诺夫定理
设为独立随机变量序列,又.令,若存在,使有
则对于任意的,有
第四篇:大数定律与中心极限定理的若干应用
大数定律与中心极限定理的若干应用
摘要:在概率论中,大数定律是比较重要的内容,他主要就是以严格的数学形式来表达概率中随机现象的性质,也是一定稳定性的表现。大数定律在数学的应用中比较重要,一般都是利用大数定律和中心极限定理一起来应用。本文根据在不同的条件下存在的大数定律和中心极限定理做了具体的分析,对几种比较常见的大数定律进行了介绍,结合他们条件的不同,分析了不同数学模型的特定,并在各个领域应列举它们的应用。这也是将理论具体化的一种表现形式,使得大数定律与中心极限定理在实际的生活中应用更加广泛,应用价值更深一层。关键词:大数定律;中心极限定理;应用;范围 1前言
大数定律是概率历史上第一个极限定理。由于随机变量序列向常数的收敛有多种不同的形式,按其收敛为依概率收敛,以概率 1 收敛或均方收敛,分别有弱大数定律、强大数定律和均方大数定律。常见的大数定律有伯努利大数定理、辛钦大数定律、重对数定理等等。中心极限定理是是概率论中讨论随机变量序列部分和的分布渐近于正态分布的一类定理。这组定理是数理统计学和误差分析的理论基础,指出了大量随机变量近似服从正态分布的条件。
概率理论是数理理论都是研究现实世界随机现象的一种统计科学,大数定律与中心极限极限定理都是数学重要的组成部分,在自然学科与经济发展中有着广泛的应用,大数定律与中心极限定理都是重要定理,也是概率论与数理统计的一个枢纽中心,大数定律主要阐明的是平均结果具有稳定性,证明了在样本的条件下,样本平均值与总体平均值是一样的,这也是算术平均值法则的基本理论,在现实的生活中,经常可以看到这样的数据模型。取一个物体的平均值,一般都是反复测量的结果,当时测量结果在不断增大时,算术平均值的偏差就会越来越小,也是1nni1的偏差也是越来越小。这种思想贯穿在整个的概率理论中,并且占有着重要的左右,在其他的数学领域中占有着重要的地位,中心极限定理与大数定律相比就更加详细,中心极限定理是在严格的数学形势下阐明的条件,无论总体是怎样分布,样本的平均值都是呈正态的形式分布,中心极限定理也是以正态分布作为广泛的理论基础应用。目前无论是在国内还是在国外,大数定律与中心极限定理已经被广泛的研究,尤其是在实际生活中的应用,银行业就是根据中心极限定理来发展,而大数定律更是应用在保险行业,很多研究者在这个领域都研究了具有一定价值的成果。推广大数定律与中心极限定理的应用问题是一个非常有研究价值的方向,通过这些问题来不断的推广,这样不仅仅能够加深大叔定理与中心极限定律的理解,并且很多问题也能够加以解决。2相关定义定理以及应用 2.1相关定义
定义:设X1,X2,,Xn,是一个随机变量序列,a是一个常数,若对于任意正数,有limPXna1,nP则称序列X1,X2,,Xn,依概率收敛于a.记为Xna.切比雪夫不等式
设随机变量具有有限的期望与方差,则对0,有
P(E())D()2或P(E())1D()2
证明:我们就连续性随机变量的情况来证明。设~p(x),则有
(xE())2P(E())xE()p(x)dxxE()D()2p(x)dx
12(xE())p(x)dx22
该不等式表明:当D()很小时,P(E())也很小,即的取值偏离E()的可能性很小。这再次说明方差是描述取值分散程度的一个量。
切比雪夫不等式常用来求在随机变量分布未知,只知其期望和方差的情况下,事件{E}概率的下限估计;同时,在理论上切比雪夫不等式常作为其它定理证明的工具。
定理1(切比雪夫大数定律)
设{n}是相互独立的随机变量序列,每一随机变量都有有限的方差,且一致有界,即存在常数C,使D(i)ClimP{1nii1,2,,则对任意的0,有nni11niE(ni1)}0[即
ni11niE(pni11ni)(n)] 证明:由切比雪夫不等式知:0,有:
n0P{1nnii11nnE(i)}1i12D(1nnDi1ii)i1n22nCn22Cn20(n)
该定理表明:当n很大时,随机变量1,,n的算术平均值ni1nni1i接近于其数学期望E(ni11),这种接近是在概率意义下的接近。通俗的说,在定理的条件下,n个相互独立的随机变量算术平均值,在n无限增加时将几乎变成一个常数。
推论:设1,,n是相互独立的随机变量,由相同的数学期望和方差E(i),D(i)2i1,2,,则0,有
limP{n1nni1i}0(即
1nini1以概率收敛于)
这个结论有很实际的意义:人们在进行精密测量时,为了减少随机误差,往往重复测量多次,测得若干实测值1,,n,然后用其平均值
1nini1来代替。
定理2(De Moivre-Laplace极限定理)(定理1的特殊情形)设n(n1,2,)是n重Bernoulli试验中成功的次数,已知每次试验成功的概率为p0p1,则对xR,有 limP{nnnpnpqx}12ext22dtx。
该定理也可改写为:ab,有limP{annnpnpqb}ba
1证明: 令i0第i次试验出现成功第i次试验不出现成功 则
{i}为独立同分布的随机变量序列,且Eip,Dip(1p)均存在
n显然:ni,此时ni1nnpnpq
该定理为上定理的一个特殊情形,故由上定理该定理得证。2.2几个大数定律的关系及适用场合
2.2.1伯努利定理是泊松定理的特例
泊松定理是指在一定的时间段内,平均若干次发生的时间,有的时候会多,有的时候会少,发生的次数是随机的时间,这也使泊松分配。P(k,T)(T)ke
若是Pk=p,则泊松大数定理也就是伯努利大数定理,伯努利大数定理也完全证明了时间在完全相同的条件下进行重复的试机实验,并且频率比较稳定,随着n的无限增大,n在试验中叶氏趋近于稳定,与A出现的频率的平均值比较接近。
2.2.2泊松大数定律是切比雪夫大数定律的特例
在泊松的大数定理的条件中,Dpiqn1,也能够满足切比雪夫大数定律的条件。
2.2.3切比雪夫大数定律是马尔科夫大数定律的特例
在切比雪夫大数定律中,DiC(i1,2,3,4.....),根据随机变量序列两两不相关的性质可以了解到,1nnD(i)i11nni1D(i)cn0,根据这样的式子也能够看出满足马尔可夫大数定
n律的条件。由此可见,伯努利大数定律与泊松大数定律都是马尔可夫大数定律的特例。伯努利大数定律也使辛钦大数定律的特别情况。在伯努利的大数定律中,由于随机变量时可以变化的,则n必然会是独立分布的,并且都会服从伯努利分布的基本情况:pi1p,pi0q,并且Eip,所以这样的公式必然会满足辛钦大数定律的条件。但是辛钦大数定律并不是泊松大数定律与切比雪夫大数定律的推广。2.2中心极限定理的基本关系
在实际问题中,常常需要考虑许多随机因素所产生总影响.例如:炮弹射击的落点与目标的偏差,就受着许多随机因素的影响.如瞄准时的误差,空气阻力所产生的误差,炮弹或炮身结构所引起的误差等等.对我们来说重要的是这些随机因素的总影响.中心极限定理,正是从理论上证明,对于大量的独立随机变量来说,只要每个随机变量在总和中所占比重很小,那么不论其中各个随机变量的分布函数是什么形状,也不论它们是已知还是未知,而它们的和的分布函数必然和正态分布函数很近似。这就是为什么实际中遇到的随机变量很多都服从正态分布的原因,也正因如此,正态分布在概率论和数理统计中占有极其重要的地位。中心极限定理也可以分为几种情况:由于无穷个随机变量之和可能趋于∞,故我们不研究n个随机变量之和,本身而考虑它的标准化的随机变量。
中心极限定理表明:在相当一般的条件下,当独立随机变量的个数增加时,其和的分布趋于正态分布。因此,只要和式中加项的个数充分大,就可以不必考虑和式中的随机变量服从什么分布,都可以用正态分布来近似,这在应用上是有效的和重要的。
nnZnk1XkE(Xk)k1n的分布函数的极限.D(Xk)k1列维一林德伯格中心极限定理:设随机变量相互独立,服从同一分布,且有n,n,则随机变量之和
n的标准化变量Yni1XiE(Xi)i1nXi1in的分布函数。
D(Xi)i1n将n个观测数据相加时,首先对小数部分按“四舍五入”舍去小数位后化为整数.试利用中心极限定理估计
(1)当n=1500时,舍入误差之和的绝对值大于15的概率;
(2)n满足何条件时,能以不小于0.90的概率使舍入误差之和的绝对值小于10.这就可以根
n据列维林德伯格中心极限定理来解决问题,当n充分大的时候,数据个数n应满足条件:|Sn|P{|Sn|10}Pn/120.90 ,即 2Φ(n/1210i1Xin近似地n~N(0,1),10n/12)10.90 ,Φ(10n/12)0.95 ,10n/121.645 ,n443.5 ,当n<443时,才能够保证误差之后的绝对值小于10,概率不小于0.9。3定理的应用
3.1在生产生活中的应用 一生产线生产的产品成箱包装,每箱的重量是随机的,假设每箱的平均重50千克,标准差5千克.若用最大载重量为5吨的汽车承运,试利用中心极限定理说明每辆车最多可以装多少箱,才能保证不超载的概率大于0.977.解答:设n为第i箱的重量(), YnXi1i由列维-林德伯格中心极限定理,有,近似地~500050n所以n必须满足P{Yn5000}Φ0.977Φ(2),N(50n,25n),5n100010nn也就是最多可以装98箱.2, n98.0199,(供电问题)某车间有200台车床,在生产期间由于需要检修、调换刀具、变换位置及调换零件等常需停车.设开工率为0.6, 并设每台车床的工作是独立的,且在开工时需电力1千瓦.问应供应多少瓦电力就能以99.9%的概率保证该车间不会因供电不足而影响生产? 解:某一时刻开动的车床数,X~B(200, 0.6),要求最小的k,使P{0Xk}0.999.由D-L近似地定理
P{0Xk}Φ(knpnpq)Φ(0npnpq,)X~N(np,npq),P{0Xk}Φ(knpnpq)Φ(0npnpq)Φ(k12048)Φ(12048)Φ(k12048)0.999
所以若供电141.5千瓦,那么由于供电不足而影响生产的可能性不到0.001,相当于8小时内约有半分钟受影响,这一般是允许的。
某产品次品率p = 0.05,试估计在1000件产品中次品数的概率.次品数X~B(1000,0.05),E(X)np10000.0550,D(X)np(1p)500.9547.5,由棣莫弗-拉普拉斯中心极限定理,有:P{40X60}Φ(605047.5)Φ(405047.5)2Φ(1.45)10.853.次品数:X~B(1000,0.05),E(X)np10000.0550,D(X)np(1p)500.9547.5,P{40X60}Φ(605047.5)Φ(405047.5)2Φ(1.45)10.853.若是使用切比雪夫的不等式来进行计算,P{40X60}P{X5010}147.51020.525.但是这样的计算并不完整,有点过于保守。
3.2在数学分析中的应用
在一次试验中事件A出现的概率为0.4,应至少进行多少次试验,才能使事件A出现的频率与概率之差在之间的概率不低于0.9 ?
解答:由中心极限定理知, Xn N(np, npq),P(Xnnp0.1)P(Xnnpnpq0.1npq)
2Φ(0.1npq)10.9 Φ(0.1npq)0.95 0.1npq1.65 n66.设第i次射击得分为,则的分布律为
100E(Xi)9.15,D(Xi)1.227.由中心极限定理,Xi N(915, 122.7)
i1100 P{900i1Xi930}P{1511.08Xi100122.71511.08}2Φ(1.354)120.911510.823.高尔顿(Galton)钉板试验:
如下图中每一黑点表示钉在板上的一颗钉子,它们彼此的距离均相等,上一层的每一颗的水平位置恰好位于下一层的两颗正中间。从入口处放进一个直径略小于两
颗钉子之间的距离的小圆玻璃球,当小圆球向下降落过程中,碰到钉子后皆以1/2的概率向左或向右滚下,于是又碰到下一层钉子。如此继续下去,直到滚到底板的一个格子内为止。把许许多多同样大小的小球不断从入口处放下,只要球的数目相当大,它们在底板将堆成近似于正态 的密度函数图形(即:中间高,两头低,呈左右对称的古钟型),其中 为钉子的层数。
令 量(表示某一个小球在第 次碰了钉子后向左或向右落下这一随机现象相联系的随机变表示向右落下,表示向左落下),由题意,的分布列可设为下述形式:对
则有,对
令,其中 相互独立。则 表示这个小球第 次碰钉后的位置。试验表明近似地服从正态分布。
上述例子表明,需要研究相互独立随机变量和的极限分布是正态分布的问题,这是本章要介绍的中心极限定理刻画的主要内容。这个问题的解决,对概率论在自然科学和技术应用中一个最重要的手段奠定了理论基础,这一手段是把一个现象或过程看作是许多因素的独立影响下出现的,而每一因素对该现象或过程所发生的影响都很小。如果我们关心的是该现象或过程的研究,则只要考虑这些因素的总作用就行了。
3.3在信息论中的应用
设在某保险公司有1万个人参加投保,每人每年付120元保险费.在一年内一个人死亡的概率为0.006,死亡时其家属可向保险公司领得1万元,问:(1)该保险公司亏本的概率为多少?(2)该保险公司一年的利润不少于40,60,80万元的概率各是多少? 设一年内死亡的人数为X,则XB(10000, 0.006),由D-L中心极限定理,(1)P{10000X1200000}P{X120}
P{Xnpnpq120npnpq}1Φ(12060600.994)1Φ(7.77)0,通过计算可得到即该保险公司亏本的概率几乎为0.2)P{120000010000X400000}P{X80}Φ(8060600.994)Φ(2.589)0.995,P{120000010000X600000}P{X60}Φ(6060600.994)Φ(0)0.5, P{120000010000X800000}P{X40}P{X40}
Φ(4060600.994)1Φ(2.589)0.005.假设生产线组装每件成品的时间服从指数分布,统计资料表明每件成品的组装时间平均为10分钟.设各件产品的组装时间相互独立.(1)试求组装100件成品需要15到20小时的概率;(2)以95%的概率在16小时内最多可以组装多少件成品? 解答:设第i件组装的时间为Xi分钟,i=1,„,100.利用独立同分布中心极限定理.100E(Xi)10,D(Xi)10,i1,2,,100,P{9001002i1Xi1200}
P{90010010100102i1Xi10010100102120010010100102}
100P{9001001010010n2i1Xi10010100102120010010100102}
X0.95P{i1i10n96010n100n100n}
Φ(96010n100n通过表可查的),96010n100n1.645,n81.18,故最多可组装81件成品。
Vk(k1,2,,20)20一加法器同时收到20个噪声电压,设它们是相互独立的随变量,且都
V在区间(0,10)上服从均匀分布。记
Vk1k,求P(V105)的近似值。
解:E(Vk)5,D(Vk)10012(k1,2,,20),由定理1,得 P(V105P(V205(1012)20105205(1012)20)P(V100(1012)20V100(100.387)
1P(12)200.387)
1(0.387)
0.348
即有 P(V105)0.348
抽样检查产品质量时,如果发现次品多于10个,则拒绝接受这批产品,设某批产品的次品率为10%,问至少应抽取多少个产品检查才能保证拒绝接受该产品的概率达到0.9?
解 设 为至少应抽取的产品数,为其中的次品数
则
拉斯定理,有,,由德莫佛-拉普
当 充分大时,4结语,随着试验次数的增加,事件发生的频率逐渐稳定于某个常数,这一事实显示了可以用一个数来表征事件发生的可能性大小,这使人们认识到概率是客观存在的,进而由频率的三条性质的启发和抽象给出了概率的定义,而频率的稳定性是概率定义的客观基础。在实践中人们还认识到大量测量值的算术平均值也具有稳定性,而这种稳定性就是本节所要讨论的大数定律的客观背景,而这些理论正是概率论的理论基础。
参考文献 [1] 钱和平宋家乐.强混合鞅差序列部分和乘积的几乎处处中心极限定理 [J].《中国科技信息》 2012年 第8期
[2] 罗中德.中心极限定理教学方法研究 [ J].《现代商贸工业》 2012年 第8期 [3] 冯凤香.独立随机变量序列部分和乘积的几乎处处中心极限定理 [J].《吉林大学学报:理学版》 2012年 第2期
[4] 许道云 秦永彬 刘长云.学习《概率论与数理统计》应该注意的若干问题(6)——极限性质及其应用 [J].《铜仁学院学报》 2011年 第6期
[5] 王丙参 魏艳华 林朱.大数定律及中心极限定理在保险中的应用 [ J].《通化师范学院学报》 2011年 第12期
[6] 任敏 张光辉.非同分布φ-混合序列部分和乘积的几乎处处中心极限定理 [J].《黑龙江大学自然科学学报》 2011年 第6期
[7] 王媛媛.部分和乘积的几乎处处中心极限定理 [J].《桂林理工大学学报》 2011年 第3期
[8] 张鑫.大数定理发展边程初探 [ J].《科技信息》 2011年 第22期
[9] 陈晓材 吴群英 邓光明 周德宏.不同分布φ^~混合序列的弱大数定理 [J].《平顶山学院学报》 2010年 第2期
第五篇:第六章 第三节中心极限定理
第六章 大数定律和中心极限定理
第三节 中心极限定理
在对大量随机现象的研究中发现,如果一个量是由大量相互独立的随机因素所造成,而每一个别因素在总影响中所起的作用较小,那么这种量通常都服从或近似服从正态分布.例如测量误差、炮弹的弹着点、人体体重等都服从正态分布,这种现象就是中心极限定理的客观背景.设随机变量X,X,,X,独立
12n同分布,且Xi~N(,),2(i1,2,)
记YX,(EYn,DYn),2nni1inn 1 YEYYn Y称为Y的标准DYn*nnnnnn化, 则有Y~N(0,1)
FY*(x)P{Yn*x}(x)
n*n对任意实数x,有
Ynx}
limP{nnnP{Yn limn(x)x*x}limF(x)
nYn*1edt.2t22一般地,有下述结果。定理三(同分布的中心极限定理)设随机变量X,X,,X,独立同分布,且存在有限的数学期望和方差
EX,DX0,12n2ii(i1,2,)
记YX,(EYn,DYn),2nni1innYEYYn Y称为Y的标DYn*nnnnnn 2 准化, FYn*(x)P{Yx}
n*则对任意实数x,有
Ynx}
limP{nnnP{Yn limn(x)x*x}limF(x)
nYn*1edt.2t22
定理表明,当n充分大时,随机变量Xni1inn近似地服从标准正
ni1i态分布N(0,1).因此,X近似地服从正态分布N(n,n).由此可见,正态分布在概率论中占有重要的地位.定理四(De Moivre-Laplace定理)
2设n是n次独立重复试验中事件A发生的次数,p是事件A在每次 试验中发生的概率, 则对任意区间[a,b],成立 limP{annpnnp(1p)b}
ba1edt(b)(a)2t22 证明 引人随机变量
1,第i次试验中A发生 X ,0,第i次试验中A不发生i则n次试验中事件A发生的次数
nXXX ,12n12n由于是独立试验,所以X,X,,X相互独立,且都服从相同的(0—1)分布,即
P{X1}p,P{X0}1p,i1,2,,nii于是
EXiip, DXp(1p)
由定理三,即得
limP{nnpnnp(1p)ni1ix}
limP{nXnpnp(1p)x}
x1edt(x), 2t22于是对任意区间[a,b],有
limP{anp(1p)b}
nnnpt22ba1edt(b)(a).2
近似计算公式:
npNnpMnp,NMnp(1p)np(1p)np(1p)nnP{NM}nn
npNnpMnpP{}np(1p)np(1p)np(1p)MnpNnp()().np(1p)np(1p)例1 某计算机系统有120个终端,每个终端有5%的时间在使用,若各终端使用与否是相互独立的,试求有10个以上的终端在使用的概率.解 以X表示使用终端的个数, 引人随机变量 1,第i个终端在使用 X ,0,第i个终端不使用i i1,2,,120 , 则
XXXX ,121202120由于使用与否是独立的,所以X,X,,X相互独立,且都服从相同的(0—1)分布,即 P{X1}p0.05,P{X0}1p,i1,2,,120 1ii于是,所求概率为
P{X10}1P{X10}
Xnp10np1P{},np(1p)np(1p)由中心极限定理得
P{X10}1P{X10}
Xnp10np1P{}
np(1p)np(1p)10np)
1(np(1p)101200.051()
1200.050.951(1.68)10.95350.0465.例2 现有一大批种子,其中良种占1.现从中任选6000粒,试问在这些61种子中,良种所占的比例与之误差
6小于1%的概率是多少? 解 设X表示良种个数, 则
1X~B(n,p),n6000,p , 所求概率为 X1P{||0.01}P{|Xnp|n0.01}n6
Xnpn0.01P{||}
np(1p)np(1p)Xnp60000.01P{||}
15np(1p)600066(2.078)(2.078)
2(2.078)120.9810.96.例3 设有30个电子器件D,D,,D,它们的使用情况如下: 1230D损坏,D接着使用;D损坏,D接1223着使用等等.设器件D的使用寿命服从参数0.1(单位:h)的指数分布.令T
为30个器件使用的总时数,问T超过350h的概率是多少?
i1 8 解 设Xi为 器件D的使用
i寿命,Xi 服从参数0.1(单位:h)
1的指数分布, X,X,,X相互独1230立, TX1X2Xnn30, EX11i0.110 , 2DXi1210.12100, 由中心极限定理得
P{T350}1P{T350}
1P{Tnn350nn} 1(3503003010)1(530)1(0.91)10.8186
0.1814.,例4 某单位设置一电话总机,共有200架电话分机.设每个电话分机有5%的时间要使用外线通话,假定每个电话分机是否使用外线通话是相互独立的,问总机需要安装多少条外线才能以90%的概率保证每个分机都能即时使用.解 依题意
设X为同时使用的电话分机个数, 则X~B(n,p),n200,p0.05, 设安装了N条外线, 引人随机变量
1,第i个分机在使用 X ,0,第i个分机不使用i i1,2,,200 , 则
XXXX ,122002200由于使用与否是独立的,所以X,X,,X相互独立,且都服从相同的(0—1)分布,即 1 10 P{X1}p0.05,iP{X0}1p,i1,2,,200, i {XN}保证每个分机都能即时使用, P{XN}0.9 , 0.9P{XN}
XnpNnp} P{np(1p)np(1p)Nnp)
(np(1p)N2000.05()
2000.050.95N10N10()(),3.089.5查标准正态分布表
N10z1.28, 3.080.9N1.283.081013.94, 取 N14, 答: 需要安装14条外线.例5 设随机变量X的概率密度为
xe,x0 f(x)m!,0,x0其中m为正整数,证明
mxmP{0X2(m1)}.m1 证明
xEXxf(x)dxxedx
m!1xedx m!mx0m21x011 (m2)(m1)!m1, m!m!
xEXxf(x)dxxedxm!m222x0
1x m!0m31edx
x
11(m3)(m2)!(m2)(m1), m!m!
DXEX(EX)
222
(m2)(m1)(m1)
m1 , 利用车贝谢不等式,得 P{0X2(m1)}
P{(m1)X(m1)(m1)} P{|X(m1)|(m1)} P{|XEX|(m1)}
DXm111
(m1)(m1)m .m122 13