第一篇:辅导第6讲大数定理和中心极限定理
第六章 大数定律和中心极限定理
第1节 马尔可夫不等式和契比雪夫不等式
马尔可夫不等式
定理 1设随机变量X,若E|X|k存在(k0),则对任意0,成立
E|X|。P{|X|}kk证明 记A{eS:|X(e)|},令IA(e)kk则有IA(e)|X(e)|,eA1,,0,eSAkkkk从而,有EIAE|X|,即得P(A)E|X|,于是成立P{|X|}E|X|。
kk对随机变量X,成立
E(|XEX|),(0,k0)。P{|XEX|}kk
利用f(x)x在[0,)上是递增函数,可得
1xIA1|X|,1|X|从而成立1P{|X|}E|X| ;
1|X|由IA|X||X|IA,(1IA),1|X|1|X|1|X||X||X|IA(1IA),1|X|1|X|1|X|得到E |X||X||X|E(IA)E[(1IA)]
1|X|1|X|1|X|119
E(IA)E即成立E1P{|X|}1,|X|
。P{|X|}1|X|1
切比雪夫不等式
定理2 设随机变量X存在数学期望EX和方差DX,则对任意正数成立
, P{|XEX|}E(|XEX|2)2DX2, P{|XEX|}1P{|XEX|}1
例 1设随机变量
DX2。
X存在数学期望EX和方差DX,且DX0,则对任意a0,DX1 ,(a0).22a(aDX)成立P{|XEX|aDX}
xmxe,x0例2 设随机变量X的概率密度为f(x)m!,其中m为正整数,0,x0证明 P{0X2(m1)}m.m1证明 EX 2xf(x)dx0xmx1xedx xm21exdx
m!0m!11(m2)(m1)!m1, m!m!20EXxf(x)dxxmx1xedxxm31exdx
m!0m!2 11(m3)(m2)!(m2)(m1), m!m!DXEX2(EX)2(m2)(m1)(m1)2m1 , 利用契比雪夫不等式,得
P{0X2(m1)}P{(m1)X(m1)(m1)}P{|X(m1)|(m1)}
P{|XEX|(m1)}1mDXm1.122m1(m1)(m1)kn例 3设随机序列{Xn}和随机变量X,如果对某一k0,有limE|XnX|0,则对任意0,有 limP{|XnX|}0。
n证明 因为 对任意0,成立P{|XnX|}kE|XnX|kk,利用条件limE|XnX|0,即得成立limP{|XnX|}0。
nn例4 设随机变量X的数学期望EX和方差DX均存在,且DX0, 则有 P{XEX}1.证明 由契比雪夫不等式P{|XEX|}DX2,得
1DX10P{|XEX|}0,n1,2,, P{|XEX|}0,n1,2,,1nn()2n又{|XEX|0}1{|XEX|}, nn1110P{|XEX|0}P({|XEX|})P{|XEX|}0,nnn1n1于是P{|XEX|0}0,P{|XEX|0}1,即P{XEX}1.(P(A1A2)P(A1)P(A2)P(A1A2)P(A1)P(A2), P(A1A2A3)P(A1)P(A2)P(A3), P(Ai)P(Ai)
i1i1).第2节 大数定律
定理一(契比雪夫大数定律)设X1,X2,,Xn,是相互独立的随机变量序列,每一个Xi都有有限的方差,且有公共的上界,即D(Xi)C, i1,2,,n,则对任意0,成立
1n1nlimP{|XiEXi|}1 , nni1ni1
121
1n1nlimP{|XiEXi|}0.nni1ni1 定义 对于随机(变量)序列{Xn}和随机变量X(或常数a),若对任意0,有
nlimP{|XnX|}1(或limP{|Xna|}1)
n则称随机(变量)序列{Xn}依概率收敛于X(或常数a).PP(等价于limP{|XnX|}0)简记为Xna,(n))X,(n)(或Xnn推论(辛钦大数定律)若随机变量序列X1,X2,,Xn,独立同分布,且存在有限的数学期望和方差EXi,DXin2,(i1,2,),则对任意
0,有limP{|X|}1 , 1n其中 XXi.ni1定理二(贝努里大数定律)设nA是n次独立重复试验中事件A发生的次数,p是事件A在每次试验中发生的概率, 则对任意0,成立 limP{|nnAp|}1.n例 1 设X1,X2,,Xn,是相互独立的随机变量序列,且其分布律为
P{Xnn}111,P{Xn},P{X0}1,(n1,2,); nn2n12n12n1n记YnXi,(n1,2,)。证明: 对任给0,成立limP{|Yn|}1。
nni1证明 由数学期望和方差的性质及条件,有
EXnnEXn211n00,2n12n111n(n)2n1(n)2n10n,2222DXnEXn1nn1nn1,EYnE(Xi)EXi0, 2ni1ni111nDYnD(Xi)n2ni1对任意
DXii1n11, n2nn0,由契比雪夫不等式,得
1P{|Yn|}P{|YnEYn|}1DYn2, 122 于是成立 limP{|Yn|}1。
n定理 设随机(变量)序列{X}依概率收敛于X,设随机(变量)序列{Yn}依概率收敛于Y,则有{XnYn}依概率收敛于XY。
n证明 对任意0,由{|(XnYn)(XY)|}{|XnX||YnY|}
{|XnX|}{|YnY|},22利用条件,得P{|XnX|}0,P{|YnY|}0,(n)
220P{|(XnYn)(XY)|}
P{|XnX|}P{|YnY|}0,(n),22于是limP{|(XnYn)(XY)|}0n,即得{XnYn}依概率收敛于XY。
第3节 中心极限定理
定理三(独立同分布的中心极限定理)设随机变量X1,X2,,Xn,独立同分布,且存在有限的数学期望和方差
EXi,DXi0,(i1,2,)记Yn2Xi,(EYnn,DYnn2), i1n Yn*YnEYnYnn称为Yn的标准化, FY*(x)nDYnn则对任意实数x,有
P{Ynx}
*limnYn*P{nx}limP{Ynx}limFnnnYn*(x)x12et22dt(x).进一步,成立{FY*(x)}在(,)上一致收敛于(x)。
n定理四(De Moivre-Laplace定理)设n是n次独立重复试验中事件
A发生的次数,p是 123 事件A在每次试验中发生的概率, 则对任意区间[a,b],成立
lim近似计算公式: P{annpnp(1p)nb}ba1e2t22dt(b)(a).由于NnMNnpnnpMnp,np(1p)np(1p)np(1p)所以P{NnM}
P{Nnpnp(1p)nnpnp(1p)Mnpnp(1p)}(Mnpnp(1p))(Nnpnp(1p))。
例1 某计算机系统有120个终端,每个终端有5%的时间在使用,若各终端使用与否是相互独立的,试求有10个以上的终端在使用的概率.解 方法一 以X表示使用终端的个数, 引人随机变量
1,第i个终端在使用 Xi ,i1,2,,120 , 0,第i个终端不使用则 XX1X2X120 ,由于使用与否是独立的,所以X1,X2,,X120相互独立, 且都服从相同的(0—1)分布,即
P{Xi1}p0.05,P{Xi0}1p,i1,2,,120
于是,所求概率为
P{X10}1P{X10}1P{由中心极限定理得
P{XXnpnp(1p)10npnp(1p)}, 10}1P{X10}1P{10npnp(1p)Xnp10np}
np(1p)np(1p)1()1(101200.05)1(1.68)10.95350.0465.1200.050.95方法二 以X表示使用终端的个数,根据题意知
X~B(n,p),n120,p0.05,np6, 所求概率为 P{X10}1P{X10}1
124
Ck010knp(1p)knke66k 1k!k010e66k0.0426,(查泊松分布表).k!k11例2 用契比雪夫不等式确定当投掷一枚均匀硬币时,需投多少次,才能使出现正面的频率在0.4至0.6之间的概率不小于90%.并用德莫弗-拉普拉斯定理计算同一问题,然后进行比较.解 用契比雪夫不等式估计n,设n为投掷n次硬币出现正面的次数,则
n~B(n,), E(n)np由题设 P{0.412nn , D(n)npq , 24nn0.6}P{0.4nn0.6n}
P{0.1nn0.5n0.1n}P{|n0.5n|0.1n} P{|nE(n)|0.1n}0.9, 又由契比雪夫不等式知(取0.1n), P{|nE(n)|0.1n}1由1D(n)0.25n, 1(0.1n)20.01n20.25n0.9,得n250.0.01n2用德莫弗-拉普拉斯定理估计n,设n为投掷n次硬币出现正面的次数,则
n~B(n,), E(n)np由题设 P{0.412nn , D(n)npq , 24nn0.6}P{0.4nn0.6n}
P{0.1nn0.5n0.1n}P{|n0.5n|0.1n}
P{|nE(n)E(n)0.1n|}P{|n|0.2n}
D(n)D(n)D(n)(0.2n)(0.2n)2(0.2n)10.9, 即(0.2n)0.95,查表得0.2nz0.951.645,即n68.计算结果表明, 用契比雪夫不等式估计至少需要掷250次, 才能使出现正面的频率在0.4至0.6之间的概率不小于0.9;而用德莫弗-拉普拉斯定理估计至少需要掷68次, 才能使出现正面的频率在0.4至0.6之间的概率不小于0.9.说明用中心极限定理计算比用契比雪夫不等式估计精确.125 例3 现有一大批种子,其中良种占的比例与
1.现从中任选6000粒,试问在这些种子中,良种所占61之误差小1%的概率是多少? 6解 设X表示良种个数, 则X 所求概率为P{|~B(n,p),n6000,p1 ,6X1|0.01}P{|Xnp|n0.01} n6P{|Xnp60000.01Xnpn0.01|} |}P{|np(1p)15np(1p)np(1p)600066(2.078)(2.078)2(2.078)120.9810.96.例4 设有30个电子器件D1,D2,,D30,它们的使用情况如下: D1损坏,D2接着使
1用;D2损坏,D3接着使用等等.设器件Di的使用寿命服从参数0.1(单位:h)的指数分布.令T为30个器件使用的总时数,问T超过350h的概率是多少?
解
设Xi为 器件Di的使用寿命,Xi 服从参数0.1(单位:h1)的指数分布, 相互独立,TX1X2Xn, n30, EXi1X1,X2,,X30110 , 0.12DXi121100, 20.1由中心极限定理得
350300)
P{T350}1P{T350}1P{Tn350n}1(3010nn1(5)1(0.91)10.81860.1814.30例5 某单位设置一电话总机,共有200架电话分机.设每个电话分机有5%的时间要使用外线通话,假定每个电话分机是否使用外线通话是相互独立的,问总机需要安装多少条外线才能以90%的概率保证每个分机都能即时使用.解 方法一 依题意 设X为同时使用的电话分机个数, 则X~B(n,p),n200,p0.05,1,第i个分机在使用设安装了N条外线,引人随机变量Xi ,i1,2,,200 ,0,第i个分机不使用则XX1X2X200 , 由于使用与否是独立的,所以
X1,X2,,X200相互独立,且都服从相同的(0—1)分布,即
P{Xi1}p0.05,P{Xi0}1p,i1,2,,200,{XN}保证每个分机都能即时使用, P{XN}0.9 , 0.9P{XN}P{NnpXnpNnp)} (np(1p)np(1p)np(1p)(N2000.05N10N10),)()(3.082000.050.959.5N10z0.91.28,N1.283.081013.94,取 N14, 3.08查标准正态分布表
答: 需要安装14条外线.方法二 设X为同时使用的电话分机个数,则
X~B(n,p),n200,p0.05, np10;设安装了N条外线, {XN}保证每个分机都能即时使用, P{XN}0.9 , 0.9P{XN}Cp(1p)knkk0Nnke1010ke1010k, 1k!k!k0kN1Ne1010k0.1,在列出的泊松分布表中没有10的情形,此法就解决不了这个问题.k!kN1方法一是用中心极限定理解决问题的,从而体会中心极限定理的作用.例6 作加法运算时,先对每个数取整(既四舍五进取作整数).设所有取整产生的误差是相互独立的,且都在区间(0.5,0.5]上服从均匀分布,求最多几个数相加,方能保证误差总和的绝对值小于15的概率大于0.90.解 X~U(0.5,0.5],EX0,DX1;设Xi 为第i个加数产生的误差, 12Xi~U(0.5,0.5], X1,X2,,Xn相互独立, 由中心极限定理,Xi1515P{|Xi|15}P{i1}
111i1nnn121212nn(30333)(30)2(30)10.90, nnn(30 333032)0.95, 30z0.951.65,()n,得 n992。
1.65nn127
nnkn1例7 利用中心极限定理证明 lime.nk1k!2证明:设Xk为相互独立同分布的随机变量序列,共同的分布为参数1的泊松分布,服从参数为又由服从泊松分布的独立随机变量具有可加性,即Xk1nk1n的泊松分布,k1nnnknnnnknn所以有PXkne ee,k1k!k1k0k!又因为EXkDXk1,由独立同分布的中心极限定理知
nlimPXkn nk1nXn11nn1k1k0limP,n2n1n1nnnkn1所以limee,nk1k!2nkn1故有lime.n2k1k!n例 8 设随机变量Xn的概率密度为
nfn(x), x, 1n2x2分布函数为Fn(x), 求limFn(x)。
n1解 limFn(x)limnnxfn(t)dtlimnndt
1n2t2x11,x01nx11limdu,x0n1u220,x0例9 设随机变量Xn的概率密度为。
fn(x)n, x, 1n2x21P试证 Xn0,(n)。
证明 对任意由于 0,P{|Xn|}|x|fn(x)dx
22fn(x)dx21ndx
1n2x21n1du0,(n),1u2P所以Xn0,(n)。
例10 设随机变量Xn的概率密度为fn(x)kn1(1x)(1|x|)21n, x, 分布函数为Fn(x),其中常数kn0, 求limFn(x)。
n 解 由
由fn(x)的表达式 及可知
kn于是
fn(x)dx1,2;
limfn(x)n1,x021x,1且是在(,0)和(0,)内是内闭一致收敛的;0fn(x)又nx11x2,n2所以limFn(x)limxfn(t)dtlimfn(t)dt
nx 1111xdtarctant|arctanx。1t221例11设随机变量序列X1,X2,,Xn,独立同分布, 且存在有限的数学期望和方差
EX,DXii2,(i1,2,);
EXi2DXi(EXi)222,1XXnni1i1n,A2Xi2,ni1n1Sn2(XiX)2,ni1试证:(1)PX,(n);
P22A,(n);
(2)2P22X,(n);
(3)(4)Sn2P2,(n)。
证明 利用贝努利大数定律可得(1)的结果;
直接利用辛钦大数定律可得(2)的结果;
22E|X|E|X||X|(3)(E|X|)(E|X|)221222,显然{(E|X|)2}有界,1E|X|2DX20,(n),n22E|X|0,(n),于是进而得PX22,(n);
nn211222S(XiX)[XinX](4)nni1ni121n2 XiX,ni1P(22)22,(n)。
例12 设随机变量X1,X2,,Xn,独立同分布,且存在有限的数学期望和方差
EXk,DXk20,(k1,2,)
n2kXk, 记Ynn(n1)k1P试证Yn,(n)。
证明 由条件,可知
nn222n(n1)EYnkEXk,kn(n1)k1n(n1)k1n(n1)2nn22222DYn()kDXk()k22
n(n1)k1n(n1)k1(2122n12)2n(n1)(2n1)2,n(n1)63n(n1)n显然limDYn0,对任意0,成立
DYn1P{|Yn|}P{|YnEYn|}1在上式中,令n2, n,即得
limP{|Yn|}1,P故得 Yn,(n)。
131
第二篇:第6章大数定理和中心极限定理习题答案
1n
6-1设YnXi,再对Yn利用契比雪夫不等式: ni1
nDXiDYi12nn0PYnEYn2n2222nn
故Xn服从大数定理.6-2设出现7的次数为X,则有
X~B10000,0.1,由棣莫佛-拉普拉斯定理可得
PX968P
6-3EXiEXnp1000,DX900 X100096810001610.14303015 1,2DXi1 12
Xi10
由中心极限定理可知, 101,所以
1010PXi61PXi611i1i1,6-4设报各人数为X,则EX100
由棣莫佛-拉普拉斯定理可得 0.136 DX100..XEX120100P{X120}PDX
120.0228
6-5设Xi第i个人死亡1
0第i个人没有死亡i1,2,,10000,则
PXi00.994 PXi10.006,总保险费为12100001.210(万元)5
(1)当死亡人数在达到1.2105/1000120人时,保险公司无收入.np1040.00660,所以保险公司赚钱概率为
0.1295
PX1X2X10000np0.129512060
7.771
因而亏本的概率为P1P0.(2)若利润不少于40000,即死亡人数少于80人时,PX1X2X10000np0.12958060
2.590.9952
若利润不少于60000,即死亡人数少于60人时,PX1X2X10000np0.12956060
00.5
若利润不少于80000,即死亡人数少于40人时,PX1X2X10000np0.12954060
2.5920.0048
6-6设总机需备Y条外线才能有95%的把握保证每个分机外线不必等候,设随机变量Xi1第i架电话分机用外线
0第i架电话分机不用外线,i1,2,则,260
PX10.04,EXi0.04,由中心极限定理可得 PX00.96 DXi0.040.00160.0384
260Y2600.04PXiY95% 2600.0384i1
Y16
6-7密度函数为fx1当0.5x0.5 其他0
故数学期望为EX0.5
0.5xdx0
20.5
0.5DXEX2EX
(1)设Xi为第i个数的误差,则 x2dx1 12
300PXi15Pi1Xi15i12(3)10.9973 3005DXii1300
300300PXi151PXi150.0027
i1i1
n(2)PXi10210.9n440.77 i1
300Y(3)PXiY210.997Y14.85 5i1
6-8EX5102kg,5103kg
(1)设Xi 为第i个螺钉的重量,则
nEX1005102,51030.05
100XnEXi1005.15i1PXi5.1P1(2)0.02280.05ni1
1第i个螺钉的重量超过5.1kg(2)设Yi0第i个螺钉的重量不超过5.1kgi1,2,,500,则
np11.4np(1p)3.33
500Ynpi5002011.4i1PYi5004%P(2.58)0.9951 3.33i1np(1p)
6-9设随机变量Xi1第i个人按时进入掩体
其他0
n
ii1,2,,1000,按时进入掩体的人数为Y,则YX,Y~B10000,0.9,所以有 i1
EY10000.9900,设有k人按时进入掩体,则 DY9000.190
k9000.95
k9001.645 90
k884或k916
第三篇:第五章 大数定律及中心极限定理
第五章
大数定律及中心极限定理
概率统计是研究随机变量统计规律性的数学学科,而随机现象的规律只有在对大量随机现象的考察中才能显现出来。研究大量随机现象的统计规律,常常采用极限定理的形式去刻画,由此导致对极限定理进行研究。极限定理的内容非常广泛,本章中主要介绍大数定律与中心极限定理。
5.1 切比雪夫Chebyshev不等式
一个随机变量离差平方的数学期望就是它的方差,而方差又是用来描述随机变量取值的分散程度的。下面我们研究随机变量的离差与方差之间的关系式。
定理5-1(切比雪夫不等式)设随机变量X的期望E(X)及方差D(X)存在,则对任意小正数ε>0,有:
或:
[例5-1]设X是抛掷一枚骰子所出现的点数,若给定ε=2,2.5,实际计算P{|X-E(X)|≥ε},并验证切比雪夫不等式成立。
解 X的分布律为
所以
当ε=2时,当ε=2.5时,可见,切比雪夫不等式成立。
[例5-2]设电站供电网有10 000盏灯,夜晚每一盏灯开灯的概率都是0.7,而假定所有电灯开或关是彼此独立的。试用切比雪夫不等式估计夜晚同时开着的灯数在6 800~7 200的概率。
解:设X表示在夜晚同时开着的电灯的数目,它服从参数n=10 000,p=0.7的二项分布。于是有
E(X)=np=10 000×0.7=7 000,D(X)=npq=10 000×0.7×0.3=2100,P{6 800 可见,虽然有10 000盏灯,但是只要有供应7 000盏灯的电力就能够以相当大的概率保证够用。 [例5-3补充] 用切比雪夫不等式估计 解: 的三倍的可能性极 可见,随机变量X取值与期望EX的差的绝对值大于其均方差小。 5.2 大数定律 在第一章中曾经提到过,事件发生的频率具有稳定性,即随着试验次数增多,事件发生的频率将逐渐稳定于一个确定的常数值附近。另外,人们在实践中还认识到大量测量值的算术平均值也具有稳定性,即平均结果的稳定性。大数定律以严格的数学形式表示证明了在一定的条件下,大量重复出现的随机现象呈现的统计规律性,即频率的稳定性与平均结果的稳定性。 5.2.1 贝努利大数定律 定理5-2 设m是n次独立重复试验中事件A发生的次数,p是事件A的概率,则对任意正数ε,有 贝努利大数定律说明,在大量试验同一事件A时,事件A的概率是A的频率的稳定值。 5.2.2 独立同分布随机变量序列的切比雪夫大数定律 先介绍独立同分布随机变量序列的概念。 称随机变量序列X1,X2,…Xn,…是相互独立的,若对任意的n>1,X1,X2,…Xn是相互独立的。此时,若所有的Xi又具有相同的分布,则称X1,X2,…Xn,…是独立同分布随机变量序列。 定理5-3 设X1,X2,…Xn,…是独立同分布随机变量序列E(Xi)=μ,D(Xi)=σ2(i=1,2…)均存在,则对于任意ε>0有 这一定理说明:经过算术平均后得到的随机变量在统计上具有一种稳定性,它的取值将比较紧密聚集在它的期望附近。这正是大数定律的含义。在概率论中,大数定律是随机现象的统计稳定性的深刻描述;同时,也是数理统计的重要理论基础。 5.3 中心极限定理 5.3.1独立同分布序列的中心极限定理 定理5-4 设X1,X2,…Xn,…是独立同分布的随机变量序列,且具有相同数学期望和方差E(Xi)=μ,D(Xi)=σ2(i=1,2,…)。记随机变量 的分布函数为Fn(x),则对于任意实数x,有 (不证) 其中φ(x)为标准正态分布函数。 由这一定理知道下列结论: (1)当n充分大时,独立同分布的随机变量之和的分布近似于正态分布N2(nμ,nσ)。我们知道,n个独立同分布的正态随机变量之和服从正态分布。中心极限定理进一步告诉我们。 不论X1,X2,…Xn,…独立同服从什么分布,当n充分大时,其和Zn近似服从正态分布。 (2)考虑X1,X2,…Xn,…的平均值,有 它的标准化随机变量为,即为上述Yn。因此的分布函数即是上述的F(,nx)因而有 由此可见,当n充分大时,独立同分布随机变量的平均值 的分布近似于正态分布 [例5-3]对敌人的防御地段进行100次射击,每次射击时命中目标的炮弹数是一个随机变量,其数学期望为2,均方差为1.5,求在100次射击中有180颗到220颗炮弹命中目标的概率。解 设Xi为第i次射击时命中目标的炮弹数(i=1,2,…,100),则中命中目标的炮弹总数,而且X1,X2,…X100同分布且相互独立。 为100次射击 由定理5-4可知,随机变量近似服从标准正态分布,故有 [例5-4]某种电器元件的寿命服从均值为100(单位:小时)的指数分布。现随机抽出16只,设它们的寿命是相互独立的,求这16只元件的寿命的总和大于1 920小时的概率。 解 设第i只电器元件的寿命为Xi=(i=1,2,…16),E(Xi)=100,D(Xi)=1002=10 000,则是这16只元件的寿命的总和。 E(Y)=100×16=1 600,D(Y)= 160 000,则所求概率为: 5.3.2 棣莫弗(De Moivre)-拉普拉斯(Laplace)中心极限定理 下面介绍另一个中心极限定理,它是定理5-4的特殊情况。 定理5-5(棣莫弗-拉普拉斯中心极限定理)设随机变量Zn是n次独立重复试验中事件A发生的次数,p是事件A发生的概率,则对于任意实数x 其中q=1-p,φ(x)为标准正态分布函数。由棣莫弗-拉普拉斯中心极限定理得到下列结论: (1)在贝努利试验中,若事件A发生的概率为p。又设Zn为n次独立重复试验中事件A发生的频数,则当n充分大时,Zn近似服从正态分布N(np,npq)。 (2)在贝努利试验中,若事件中A发生的概率为p,发生的频率,则当n充分大时,近似服从正态分布 【例5-5】用中心极限定理得到求解5.1例5-2的概率。 解 设同时开着的灯数为X,则 X-B(1000,0.7),np=1000×0.7=7000,为n次独立重复试验中事件A 【例5-6】设某单位内部有1000台电话分机,每台分机有5%的时间使用外线通话,假定各个分机是否使用外线是相互独立的,该单位总机至少需要安装多少条外线,才能以95%以上的概率保证每台分机需要使用外线时不被占用? 解:把观察每一台分机是否使用外线作为一次试验,则各次试验相互独立,设X为1000台分机中同时使用外线的分机数,则 X~B(1000,0.05),np=1000×0.05=50,根据题意,设N为满足条件的最小正整数 由于φ(-7.255)≈0,故有 查标准正态分布表得φ(1.65)=0.9505,故有 由此 N≥61.37 即该单位总机至少需要62条外线,才能以95%以上的概率保证每台分机在使用外线时不被占用。 小结 本章考核要求 (一)知道切比雪夫不等式 或 并且会用切比雪夫不等式估计事件|X-EX|≥ε或|X-EX|<ε的概率。 (二)知道贝努利大数定律 其中n是试验次数,m是A发生次数,p是A的概率,它说明试验次数很多时,频率近似于概率。 (三)知道切比雪夫不等式大数定律 取值稳定在期望附近。 它说明在大量试验中,随机变量 (四)知道独立同分布中心极限定理 若 记Yn~Fn(x),则有 它说明当n很大时,独立同分布的随机变量之和近似服从正态N(nμ,nσ2)所以,无论n个独立同分布的X1,X2,…Xn服从何种分布,n很大时,X1+X2+…Xn却近似正态N(nμ,nσ2).(五)知道棣莫弗—拉普拉斯中心极限定理 若Zn表示n次独立重复事件发生次数,即 Zn~B(n,p),则有 即Zn近似正态N(np,np(1-p)2)。并会用中心极限定理计算简单应用问题。 CH5 大数定律及中心极限定理 1.设Ф(x)为标准正态分布函数,Xi= 1001,事件A发生;0,事件A不发生,i=1,2,…,100,且P(A)=0.8,X1,X2,…,X100 相互独立。令Y= i1Xi,则由中心极限定理知Y的分布函数F(y)近似于() y80 4A.Ф(y) 2.从一大批发芽率为0.9的种子中随机抽取100粒,则这100粒种子的发芽率不低于88%的概率约为.(已知φ(0.67)=0.7486) 3.设随机变量X1,X2,…,Xn,…独立同分布,且i=1,2…,0 nB.Ф()C.Ф(16y+80)D.Ф(4y+80) Yn i1Xi,n1,2,.Φ(x)为标准正态分布函数,则limPn1()np(1p)Ynnp A.0B.Φ(1)C.1-Φ(1)D.1 4.设 5.设X服从(-1,1)上的均匀分布,试用切比雪夫不等式估计 6.设 7.报童沿街向行人兜售报纸,设每位行人买报纸的概率为0.2,且他们买报纸与否是相互独立的。试求报童在想100为行人兜售之后,卖掉报纸15到30份的概率 8.一个复杂系统由n个相互独立的工作部件组成,每个部件的可靠性(即部件在一定时间内无故障的概率)为0.9,且必须至少有80%的部件工作才能使得整个系统工作。问n至少为多少才能使系统的可靠性为0.95 9.某人有100个灯泡,每个灯泡的寿命为指数分布,其平均寿命为5小时。他每次用一个灯泡,灯泡灭了之后立即换上一个新的灯泡。求525小时之后他仍有灯泡可用的概率近似值相互独立的随机变量,且都服从参数为10的指数分布,求 的下界 是独立同分布的随机变量,设, 求 第四节 大数定理与中心极限定理 概率论与数理统计是研究随机现象统计规律性的学科.而随机现象的规律性在相同的条件下进行大量重复试验时会呈现某种稳定性.例如, 大量的抛掷硬币的随机试验中, 正面出现频率;在大量文字资料中, 字母使用频率;工厂大量生产某种产品过程中, 产品的废品率等.一般地, 要从随机现象中去寻求事件内在的必然规律, 就要研究大量随机现象的问题.在生产实践中, 人们还认识到大量试验数据、测量数据的算术平均值也具有稳定性.这种稳定性就是我们将要讨论的大数定律的客观背景.在这一节中,我们将介绍有关随机变量序列的最基本的两类极限定理----大数定理和中心极限定理.内容分布图示 ★大数定理的引入 ★切比雪夫不等式 ★例1 ★例2 ★大数定理 ★中心极限定理的引入 ★林德伯格—勒维定理 ★例3 ★例6 ★推论 大数定理 ★棣莫佛—拉普拉斯定理 ★例4 ★例5 ★例7 ★例8 ★高尔顿钉板试验 中心极限定理 ★内容小结 ★课堂练习★习题4-4 内容要点: 一、依概率收敛 与微积分学中的收敛性的概念类似, 在概率论中, 我们要考虑随机变量序列的收敛性.定义 1设X1,X2,,Xn,是一个随机变量序列, a为一个常数,若对于任意给定的正数,有 limP{|Xna|}1, 则称序列X1,X2,,Xn,依概率收敛于a, 记为 nXnaP(n).PP定理1 设Xna,Ynb,又设函数g(x,y)在点(a,b)连续, 则 g(Xn,Yn)g(a,b).P 二、切比雪夫不等式 定理2设随机变量X有期望E(X)和方差D(X)2,则对于任给0, 有 P{|X|}22.上述不等式称切比雪夫不等式.注:(i)由切比雪夫不等式可以看出,若2越小, 则事件 {|XE(X)|} 的概率越大, 即, 随机变量X集中在期望附近的可能性越大.由此可见方差刻划了随机变量取值的离散程度.(ii)当方差已知时,切比雪夫不等式给出了X与它的期望的偏差不小于的概率的估计式.如取3, 则有 P{|XE(X)|3}9220.111.故对任给的分布,只要期望和方差2存在, 则随机变量X取值偏离E(X)超过3的概率小于0.111.三、大数定理 1.切比雪夫大数定律 定理3(切比雪夫大数定律)设X1,X2,,Xn,是两两不相关的随机变量序列,它们数学期望和方差均存在, 且方差有共同的上界, 即D(Xi)K,i1,2,, 则对任意0, 有 1limPnnni1Xi1nni1E(Xi) 11nn注: 定理表明: 当n很大时,随机变量序列{Xn}的算术平均值学期望 2.伯努利大数定理 1nni1Xi依概率收敛于其数E(X).ii1定理4(伯努利大数定律)设nA是n重伯努利试验中事件A发生的次数, p是事件A在每次试验中发生的概率, 则对任意的0, 有 nnlimPAp1 或 limPAp0.nnnn注:(i)伯努利大数定律是定理1的推论的一种特例, 它表明: 当重复试验次数n充分大时, 事件A发生的频率nAn依概率收敛于事件A发生的概率p.定理以严格的数学形式表达了频率的稳定性.在实际应用中, 当试验次数很大时,便可以用事件发生的频率来近似代替事件的概率.(ii)如果事件A的概率很小,则由伯努利大数定律知事件A发生的频率也是很小的,或者说事件A很少发生.即“概率很小的随机事件在个别试验中几乎不会发生”,这一原理称为小概率原理,它的实际应用很广泛.但应注意到,小概率事件与不可能事件是有区别的.在多次试验中,小概率事件也可能发生.3.辛钦大数定理 定理5(辛钦大数定律)设随机变量X1,X2,,Xn,相互独立, 服从同一分布,且具有数学期望E(Xi),i1,2,, 则对任意0, 有 1limPnnni1Xi1.注:(i)定理不要求随机变量的方差存在; (ii)伯努利大数定律是辛钦大数定律的特殊情况; (iii)辛钦大数定律为寻找随机变量的期望值提供了一条实际可行的途径.例如, 要估计某地区的平均亩产量, 可收割某些有代表性的地块, 如n块,计算其平均亩产量, 则当n较大时,可用它作为整个地区平均亩产量的一个估计.此类做法在实际应用中具有重要意义.四、中心极限定理 在实际问题中, 许多随机现象是由大量相互独立的随机因素综合影响所形成, 其中每一个因素在总的影响中所起的作用是微小的.这类随机变量一般都服从或近似服从正态分布.以一门大炮的射程为例, 影响大炮的射程的随机因素包括: 大炮炮身结构的制造导致的误差, 炮弹及炮弹内炸药在质量上的误差, 瞄准时的误差, 受风速、风向的干扰而造成的误差等.其中每一种误差造成的影响在总的影响中所起的作用是微小的, 并且可以看成是相互独立的, 人们关心的是这众多误差因素对大炮射程所造成的总影响.因此需要讨论大量独立随机变量和的问题.中心极限定理回答了大量独立随机变量和的近似分布问题, 其结论表明: 当一个量受许多随机因素(主导因素除外)的共同影响而随机取值, 则它的分布就近似服从正态分布.1.林德伯格—勒维定理 定理6(林德伯格—勒维)设X1,X2,,Xn,是独立同分布的随机变量序列, 且 E(Xi),D(Xi),i1,2,,n,2 则 nXini1limPxnnx12et2/2dt 注: 定理6表明: 当n充分大时, n个具有期望和方差的独立同分布的随机变量之和近似服从正态分布.虽然在一般情况下, 我们很难求出X1X2Xn的分布的确切形式, 但当n很大时, 可求出其近似分布.由定理结论有 ni1Xinn1近似n~N(0,1)ni1Xin近似/~N(0,1)X~N(,22/n),X1nni1Xi.故定理又可表述为: 均值为, 方差的0的独立同分布的随机变量X1,X2,,Xn,的算术平均值X, 当n充分大时近似地服从均值为,方差为2/n的正态分布.这一结果是数理统计中大样本统计推断的理论基础.2.棣莫佛—拉普拉斯定理 在第二章中,作为二项分布的正态近似,我们曾经介绍了棣莫佛—拉普拉斯定理,这里再次给出,并利用上述中心极限定理证明之.定理7(棣莫佛—拉普拉斯定理)设随机变量Yn服从参数n,p(0p1)的二项分布, 则对任意x, 有 YnnplimPxnnp(1p)x12et22dt(x) 注: 易见,棣莫佛—拉普拉斯定理就是林德伯格—勒维定理的一个特殊情况.3.用频率估计概率的误差 设n为n重贝努里试验中事件A发生的频率, p为每次试验中事件A发生的概率,q1p,由棣莫佛—拉普拉斯定理,有 nPpPnnpqnnpnpqn pqn1.pq npqn2pq这个关系式可用解决用频率估计概率的计算问题: 4.李雅普诺夫定理 定理8(李雅普诺夫定理)设随机变量X1,X2,,Xn, 相互独立, 它们具有数学期望 n和方差: E(Xk)k,n时, D(Xk)2k0,i1,2,,记B2n.若存在正数, 使得当 k12k1Bn2nnE{|k1Xkk|2}0,则随机变量之和Xk的标准化变量: k1nZnk1nXkEXkk1DXkk1nnnkXk1Bnk1k 的分布函数Fn(x)对于任意x, 满足 nnXkkk1k1limFn(x)limPxnnBnx12et/22dt(x).注:定理8表明, 在定理的条件下, 随机变量 nnZnk1XkBnk1k.nn当n很大时,近似地服从正态分布N(0,1).由此, 当n很大时,XkBnZnk近似地服 k1k1n2.这就是说,无论各个随机变量Xk(k1,2,)服从什么分布,只要满从正态分布N,Bknk1n足定理的条件,那么它们的和Xk当n很大时,就近似地服从正态分布.这就是为什么正态随 k1机变量在概率论中占有重要地位的一个基本原因.在很多问题中,所考虑的随机变量可以表示成很多个独立的随机变量之和,例如,在任一指定时刻,一个城市的耗电量是大量用户耗电量的总和;一个物理实验的测量误差是由许多观察不到的、可加的微小误差所合成的,它们往往近似地服从正态分布.例题选讲: 切比雪夫不等式 例1(讲义例1)已知正常男性成人血液中, 每一毫升白细胞数平均是7300, 均方差是700.利用切比雪夫不等式估计每毫升白细胞数在5200~9400之间的概率.解 设每毫升白细胞数为X, 依题意, 7300,27002,P{5200X9400}P{52007300X730094007300} P{2100X2100}P{|X|2100}.所求概率为 由切比雪夫不等式 P{|X|2100}1222/(2100)1(700/2100)11/98/9,即每毫升白细胞数在5200 ~ 9400之间的概率不小于8/9.例2 在每次试验中, 事件A发生的概率为0.75, 利用切比雪夫不等式求: 事件A出现的频率在0.74~0.76之间的概率至少为0.90? 解 设X为次试验中, 事件A出现的次数, 则 X~b(n,0.75), 0.75n, 20.750.25n0.1875n,所求为满足P{0.74X/n0.76}0.90的最小的n.P{0.74X/n0.76}可改写为 P{0.74nX0.76n}P{0.01nX0.75n0.01n}P{|X|0.01n} 在切比雪夫不等式中取0.01n, 则 P{0.74X/n0.76}P{|X|0.01n}122/(0.01n)2 10.1875n/0.0001n11875/n 依题意, 取n使11875/n0.9, 解得 n1875/(10.9)1875,0 即n取18750 时, 可以使得在n次独立重复试验中, 事件A出现的频率在0.74~0.76之间的概率至少为 0.90.中心极限定理 例3(讲义例2) 一盒同型号螺丝钉共有100个, 已知该型号的螺丝钉的重量是一个随机变量, 期望值是100g, 标准差是10g, 求一盒螺丝钉的重量超过10.2kg的概率.解 设为第i个螺丝钉的重量, i1,2,,100,100且它们之间独立同分布, 于是一盒螺丝钉的重量为XXi1i,且由E(Xi)100,D(Xi)10,n100,知E(X)100E(Xi)10000,由中心极限定理有 P{X10200}PnD(X)100,i1Xinn10200nX10000pn1001020010000 100X10000X10000P21P2 1001001(2)10.977250.02275.例4(讲义例3)计算机在进行数学计算时, 遵从四舍五入原则.为简单计.现在对小数点后面第一位进行舍入运算, 则误差X可以认为服从[0.5,0.5]上的均匀分布.若在一项计算中进行了100次数字计算, 求平均误差落在区间[3/20,3/20]上的概率.解 n100, 用Xi表示第i次运算中产生的误差.相互独立, 都服从[0.5,0.5]上的均匀分布, X1,X2,,X100且E(Xi)0,var(Xi)1/12,i1,2,,100, 从而 Y100100i1Xi1000100/1235100i1近似Xi~N(0,1).故平均误差X1100100i133,Xi落在2020上的概率为 3331PXP201002020100i1Xi320 3P35100i1Xi3(3)(3)0.9973. 例5(讲义例4)某公司有200名员工参加一种资格证书考试.按往年经验考试通过率为0.8,试计算这200名员工至少有150人考试通过的概率.解 1,令10,第i人通过考试第i人未通过考试,i1,2,,200,依题意,P{Xi1}0.8,np2000.8160,np(1p)32.200i1Xi是考试通过人数, 由中心极限定理4, 得 P{XiX160/32~N(0,1),150}P{X160/32}150160/200近似i1i200ii32 P{200i1Xi160/321.77} 1(1.77)(1.77)0.96, 即至少有150名员工通过这种考试的概率为0.96.例6(讲义例5)某市保险公司开办一年人身保险业务, 被保险人每年需交付保险费160元, 若一年内发生重大人身事故, 其本人或家属可获2万元赔金.已知该市人员一年内发生重大人身事故的概率为0.005, 现有5000人参加此项保险, 问保险公司一年内从此项业务所得到的总收益在20万到40万元之间的概率是多少? 解 记Xi1,若第i个被保险人发生重大事0,若第i个被保险人未发生重大故事故(i1,2,,5000) 于是Xi均服从参数为p0.005的两点分布, 且p{Xi1}0.005,np25.5000i1Xi是5000个被保险人中一年内发生重大人身事故的人数, 保险公司一年内从此 5000i1项业务所得到的总收益为0.01650002于是 Xi万元.5000P200.01650002Xi40P20i15000i1Xi30 P2025250.9955000i1Xi25250.995(1)(1)0.6826 250.9953025 例7 对于一个学校而言, 来参加家长会的家长人数是一个随机变量, 设一个学生无家长, 1名家长, 2名家长来参加会议的概率分别0.05, 0.8, 0.15.若学校共有400名学生, 设各学生参加会议的家长数相互独立, 且服从同一分布.求参加会议的家长数X超过450的概率.解 以Xk(k1,2,,400)记第k个学生来参加会议的家长数, 则Xk的分布律为 Xkpk00.0510.820.15 400易知E(Xk)1.1,D(Xk)0.19,k1,2,,400, 而XXk1k,由定理3, 随机变量 400Xk1k4001.1X4001.14000.190.19近似~400N(0,1), 故 X4001.14504001.1P{X450}P 4000.194000.19X4001.11P1.147 4000.191(1.147)0.1357.例8 设有1000人独立行动, 每个人能够按时进入掩蔽体的概率为0.9.以95%概率估计, 在一次行动中, 至少有多少人能进入掩蔽体.解 用Xi表示第i人能够按时进入掩蔽体, 令SnX1X2X1000.设至少有m人能进入掩蔽体, 则要求 P{mSn}0.95,Sn90090 {mSn}m10000.910000.90.1Sn900 90近似由中心极限定理, 有 ~N(0,1), 所以 m900Sn900S900m900P{mSn}Pn1P 90909090查正态分布数值表, 得 m900901.65, 故m90015.65884.35884人.课堂练习 某地有甲、乙两个电影院竞争当地每天的1000名观众, 观众选择电影院是独立的和随机的.问: 每个电影院至少应设有多少个座位, 才能保证观众因缺少座位而离去的概率小于1%?第四篇:CH5 大数定律及中心极限定理--练习题
第五篇:04 第四节 大数定理与中心极限定理