第一篇:第5章大数定律和中心极限定理
第五章大数定律和中心极限定理总述
第17 次教案
§5.1大数定律
人们在长期的实践中发现,事件发生的频率具有稳定性,也就是说随着试验次数的增多,事件发生的频率将稳定与一个确定的常数。对某个随机变量X进行大量的重复观测,所得到的大批观测数据的算术平均值也具有稳定性,由于这类稳定性都是在对随机现象进行大量重复试验的条件下呈现出来的,因而反映这方面规律的定理我们就统称为大数定律。
一、契比雪夫不等式
Theorem 4.1设随机变量X的均值E(X)及方差D(X)存在,则对于任意正数,有不等式
P{|XE(X)|}
D(X)
成立。
或P{|XE(X)|}1
D(X)
我们称该不等式为契比雪夫(Chebyshev)不等式。Proof:(我们仅对连续性的随机变量进行证明)设f(x)为X的密度函数,记E(X),D(X)
则P{|XE(X)|}
1
f(x)dx
x
(x)
x
f(x)dx
22
2
从定理中看出,如果D(X)越小,那么随机变量X取值于开区间(E(X),E(X))中的(x)f(x)dx
D(X)
概率就越大,这就说明方差是一个反映随机变量的概率分布对其分布中心(E(X))的集中程度的数量指标。
利用契比雪夫不等式,我们可以在随机变量X的分布未知的情况下估算事件{|XE(X)|}的概率。
Example 5.1设随机变量X的数学期望E(X)10,方差D(X)0.04,估计P9.2X11的大小。
Solution
P9.2X11P0.8X101PX100.81
0.04(0.8)
0.937
5因而 P9.2X11不会小于0.9375.二、契比雪夫大数定律
Theorem 5.2设相互独立的随机变量X1,X2,,Xn,分别具有均值
E(X1),E(X2),,E(Xn),及方差D(X1)D(X2),,D(Xn),,若存在常数C,使
D(Xk)C,(k1,2,),则对于任意正整数,有
1n1n
limPXkE(Xk)1 nnk
1nk1
Proof:由于X1,X2,,Xn,相互独立,那么对于任意的n1,X1,X2,,Xn相互
独立。于是
D(1n
n
k1
Xk)
1n
n
k1
D(Xk)
Cn
令 yn
1n
n
X
k1
k,则由契比雪夫不等式有 1PYnE(Yn)1
D(Yn)
1
Cn
令n,则有
limPnE(Yn)1
n
1n1n
即limPXkE(Xk)1.nnk1
nk1
Corollary 5.1 设相互独立的随机变量X1,X2,,Xn,有相同的分布,且 E(Xk),1n
D(Xk),(k1,2,)存在,则对于任意正整数,有limPXk1.n
nk1
定理5.2我们称之为契比雪夫大数定理,推论4.1是它的特殊情况,该推论表明,当n很
1n
X大时,事件k的概率接近于1。一般地,我们称概率接近于1的事件为大概nk1
率事件),而称概率接近于0的事件为小概率事件),在一次试验中大概率事件几乎肯定要发生,而小概率事件几乎不可能发生,这一规律我们称之为实际推断原理。
三、贝努里大数定律
Theorem 5.3设m是n次独立重复试验中事件A发生的次数,p是事件A在每次试验中发生的概率,则对于任意正整数,有limP
n
m
p1.n
第k次试验A发生
1(k1,2,),X1,X2,,Xk是n个相互Proof:令XK
第k次试验A不发生0
独立的随机变量,且E(Xi)p,D(Xi)pq.又 mX1X2Xk,因而由推论4.1
有
mlimPp1n
n1
limPn
n
n
k1
Xkp1
定理5.3我们称之为贝努利大数定律,它表明事件A发生的频率mn依概率收敛于事件A的概率p,也就是说当n很大时事件发生的频率与概率有较大偏差的可能性很小。根据实际推断原理,当试验次数很大时,就可以利用事件发生的频率来近似地代替事件的概率。
第 18 次教案
§5.2中心极限定理
n
中心极限定理是研究在适当的条件下独立随机变量的部分和Xk的分布收敛于正态分
k1
布的问题。
Theorem 5.4设相互独立的随机变量X1,X2,,Xn,服从同一分布,且
n
E(Xk),D(Xk)
X
0,(k1,2,),则对于任意x,随机变量Yn
k1
k
n的n
分布函数Fn(x)趋于标准正态分布函数,即有
n
2Xntkx1
limFn(x)limPk1xe2dt
nn
n2
定理的证明从略。
该定理我们通常称之为林德贝格-勒维定理。
Corollary 5。2设相互独立的随机变量X1,X2,,Xn服从同一分布,已知均值为,方
n
差为
0.单分布函数未知,当n充分大时,X
n)).X
k1
k
近似服从正态分布
N(n,(
Corollary 5..3设相互独立的随机变量X1,X2,,Xn服从同一分布,已知均值为,方差为
当n充分大时,X0.单分布函数未知,n
n
Xk近似服从正态分布N(,(n)).k1
由推论5.3知,无论X1,X2,,Xn是什么样的分布函数,他的平均数X当n充分大时总是近似地服从正态分布。
Example 5.2某单位内部有260部电话分机,每个分机有4%的时间要与外线通话,可以认为每个电话分机用不同的外线是相互独立的,问总机需备多少条外线才能95%满足每个分机在用外线时不用等候? 第k个分机要用外线1
(k1,2,,260),X1,X2,,X260 Solution令XK
0第k个分机不要用外线
是260个相互独立的随机变量,且E(Xi)0.04,mX1X2X260表示同时使用外
线的分机数,根据题意应确定最小的x使P{mx}95%成立。由上面定理,有
m260px260p
260p(1p)260p(1p)
查得(1.65)0.95050.95,故,取b1.65,于是
P{mx}P
b
12
e
t
dt
xb260p(1p)260p1.652600.040.962600.0415.61
也就是说,至少需要16条外线才能95%满足每个分机在用外线时不用等候。
Example 5.3用机器包装味精,每袋净重为随机变量,期望值为100克,标准差为10克,一箱内装200袋味精,求一箱味精净重大于20500克的概率。
Solution设一箱味精净重为X克,箱中第k袋味精的净重为Xk克,k1,2,,200.X1,X2,,X200是200个相互独立的随机变量,且E(Xk)100,D(Xk)100,E(X)E(X1X2X200)20000,D(X)20000,D(X)100
2因而有P{X20500}1P{X20500}1P
X20000
500100
1(3.54)0.0002 2
Theorem 5.5(德莫佛—拉普拉斯定理DeMovire-Laplace Theorem)设mA表示n次独立重复试验中事件A发生的次数,p是事件A在每次试验中发生的概率。则对于任意区间
(a,b],恒有
limPan
mnnp
b
np(1p)
t
b
12
a
e
dt
这两个定理表明二项分布的极限分布是正态分布。一般来说,当n较大时,二项分布的概
率计算起来非常复杂,这是我们就可以用正态分布来近似地计算二项分布。
n2
Cnp(1p)
kn1
kknk
P{n1mnn2}P{(n2npnp(1p))(n1npnp(1p)n1npnp(1p)
mnnpnp(1p)
n2npnp(1p))
Example 5.4 设随机变量X服从B(100,0.8),求P{80X100}.n0.80.2
(5)(0)10.50.5SolutionP{80X100}(10080)(8080n0.80.2)
Example 5.5 设电路共电网中内有10000盏灯,夜间每一盏灯开着的概率为0.7,假设各灯的开关彼此独立,计算同时开着的灯数在6800与7200之间的概率。
Solution记同时开着的灯数为X,它服从二项分布B(10000,0.7),于是
P{6800X7200}(72007000
0.70.30.70.3200
2()12(4.36)10.999991
45.8
3)(68007000)
第五章小结
本章介绍了大数定律和中心极限定理。要求了解契比雪夫不等式、契比雪夫定理和伯努利定理;了解独立同分布的中心极限定理和德莫佛—拉普拉斯定理。
第二篇:第五章 大数定律及中心极限定理
第五章
大数定律及中心极限定理
概率统计是研究随机变量统计规律性的数学学科,而随机现象的规律只有在对大量随机现象的考察中才能显现出来。研究大量随机现象的统计规律,常常采用极限定理的形式去刻画,由此导致对极限定理进行研究。极限定理的内容非常广泛,本章中主要介绍大数定律与中心极限定理。
5.1 切比雪夫Chebyshev不等式
一个随机变量离差平方的数学期望就是它的方差,而方差又是用来描述随机变量取值的分散程度的。下面我们研究随机变量的离差与方差之间的关系式。
定理5-1(切比雪夫不等式)设随机变量X的期望E(X)及方差D(X)存在,则对任意小正数ε>0,有:
或:
[例5-1]设X是抛掷一枚骰子所出现的点数,若给定ε=2,2.5,实际计算P{|X-E(X)|≥ε},并验证切比雪夫不等式成立。
解 X的分布律为
所以
当ε=2时,当ε=2.5时,可见,切比雪夫不等式成立。
[例5-2]设电站供电网有10 000盏灯,夜晚每一盏灯开灯的概率都是0.7,而假定所有电灯开或关是彼此独立的。试用切比雪夫不等式估计夜晚同时开着的灯数在6 800~7 200的概率。
解:设X表示在夜晚同时开着的电灯的数目,它服从参数n=10 000,p=0.7的二项分布。于是有
E(X)=np=10 000×0.7=7 000,D(X)=npq=10 000×0.7×0.3=2100,P{6 800 可见,虽然有10 000盏灯,但是只要有供应7 000盏灯的电力就能够以相当大的概率保证够用。 [例5-3补充] 用切比雪夫不等式估计 解: 的三倍的可能性极 可见,随机变量X取值与期望EX的差的绝对值大于其均方差小。 5.2 大数定律 在第一章中曾经提到过,事件发生的频率具有稳定性,即随着试验次数增多,事件发生的频率将逐渐稳定于一个确定的常数值附近。另外,人们在实践中还认识到大量测量值的算术平均值也具有稳定性,即平均结果的稳定性。大数定律以严格的数学形式表示证明了在一定的条件下,大量重复出现的随机现象呈现的统计规律性,即频率的稳定性与平均结果的稳定性。 5.2.1 贝努利大数定律 定理5-2 设m是n次独立重复试验中事件A发生的次数,p是事件A的概率,则对任意正数ε,有 贝努利大数定律说明,在大量试验同一事件A时,事件A的概率是A的频率的稳定值。 5.2.2 独立同分布随机变量序列的切比雪夫大数定律 先介绍独立同分布随机变量序列的概念。 称随机变量序列X1,X2,…Xn,…是相互独立的,若对任意的n>1,X1,X2,…Xn是相互独立的。此时,若所有的Xi又具有相同的分布,则称X1,X2,…Xn,…是独立同分布随机变量序列。 定理5-3 设X1,X2,…Xn,…是独立同分布随机变量序列E(Xi)=μ,D(Xi)=σ2(i=1,2…)均存在,则对于任意ε>0有 这一定理说明:经过算术平均后得到的随机变量在统计上具有一种稳定性,它的取值将比较紧密聚集在它的期望附近。这正是大数定律的含义。在概率论中,大数定律是随机现象的统计稳定性的深刻描述;同时,也是数理统计的重要理论基础。 5.3 中心极限定理 5.3.1独立同分布序列的中心极限定理 定理5-4 设X1,X2,…Xn,…是独立同分布的随机变量序列,且具有相同数学期望和方差E(Xi)=μ,D(Xi)=σ2(i=1,2,…)。记随机变量 的分布函数为Fn(x),则对于任意实数x,有 (不证) 其中φ(x)为标准正态分布函数。 由这一定理知道下列结论: (1)当n充分大时,独立同分布的随机变量之和的分布近似于正态分布N2(nμ,nσ)。我们知道,n个独立同分布的正态随机变量之和服从正态分布。中心极限定理进一步告诉我们。 不论X1,X2,…Xn,…独立同服从什么分布,当n充分大时,其和Zn近似服从正态分布。 (2)考虑X1,X2,…Xn,…的平均值,有 它的标准化随机变量为,即为上述Yn。因此的分布函数即是上述的F(,nx)因而有 由此可见,当n充分大时,独立同分布随机变量的平均值 的分布近似于正态分布 [例5-3]对敌人的防御地段进行100次射击,每次射击时命中目标的炮弹数是一个随机变量,其数学期望为2,均方差为1.5,求在100次射击中有180颗到220颗炮弹命中目标的概率。解 设Xi为第i次射击时命中目标的炮弹数(i=1,2,…,100),则中命中目标的炮弹总数,而且X1,X2,…X100同分布且相互独立。 为100次射击 由定理5-4可知,随机变量近似服从标准正态分布,故有 [例5-4]某种电器元件的寿命服从均值为100(单位:小时)的指数分布。现随机抽出16只,设它们的寿命是相互独立的,求这16只元件的寿命的总和大于1 920小时的概率。 解 设第i只电器元件的寿命为Xi=(i=1,2,…16),E(Xi)=100,D(Xi)=1002=10 000,则是这16只元件的寿命的总和。 E(Y)=100×16=1 600,D(Y)= 160 000,则所求概率为: 5.3.2 棣莫弗(De Moivre)-拉普拉斯(Laplace)中心极限定理 下面介绍另一个中心极限定理,它是定理5-4的特殊情况。 定理5-5(棣莫弗-拉普拉斯中心极限定理)设随机变量Zn是n次独立重复试验中事件A发生的次数,p是事件A发生的概率,则对于任意实数x 其中q=1-p,φ(x)为标准正态分布函数。由棣莫弗-拉普拉斯中心极限定理得到下列结论: (1)在贝努利试验中,若事件A发生的概率为p。又设Zn为n次独立重复试验中事件A发生的频数,则当n充分大时,Zn近似服从正态分布N(np,npq)。 (2)在贝努利试验中,若事件中A发生的概率为p,发生的频率,则当n充分大时,近似服从正态分布 【例5-5】用中心极限定理得到求解5.1例5-2的概率。 解 设同时开着的灯数为X,则 X-B(1000,0.7),np=1000×0.7=7000,为n次独立重复试验中事件A 【例5-6】设某单位内部有1000台电话分机,每台分机有5%的时间使用外线通话,假定各个分机是否使用外线是相互独立的,该单位总机至少需要安装多少条外线,才能以95%以上的概率保证每台分机需要使用外线时不被占用? 解:把观察每一台分机是否使用外线作为一次试验,则各次试验相互独立,设X为1000台分机中同时使用外线的分机数,则 X~B(1000,0.05),np=1000×0.05=50,根据题意,设N为满足条件的最小正整数 由于φ(-7.255)≈0,故有 查标准正态分布表得φ(1.65)=0.9505,故有 由此 N≥61.37 即该单位总机至少需要62条外线,才能以95%以上的概率保证每台分机在使用外线时不被占用。 小结 本章考核要求 (一)知道切比雪夫不等式 或 并且会用切比雪夫不等式估计事件|X-EX|≥ε或|X-EX|<ε的概率。 (二)知道贝努利大数定律 其中n是试验次数,m是A发生次数,p是A的概率,它说明试验次数很多时,频率近似于概率。 (三)知道切比雪夫不等式大数定律 取值稳定在期望附近。 它说明在大量试验中,随机变量 (四)知道独立同分布中心极限定理 若 记Yn~Fn(x),则有 它说明当n很大时,独立同分布的随机变量之和近似服从正态N(nμ,nσ2)所以,无论n个独立同分布的X1,X2,…Xn服从何种分布,n很大时,X1+X2+…Xn却近似正态N(nμ,nσ2).(五)知道棣莫弗—拉普拉斯中心极限定理 若Zn表示n次独立重复事件发生次数,即 Zn~B(n,p),则有 即Zn近似正态N(np,np(1-p)2)。并会用中心极限定理计算简单应用问题。 CH5 大数定律及中心极限定理 1.设Ф(x)为标准正态分布函数,Xi= 1001,事件A发生;0,事件A不发生,i=1,2,…,100,且P(A)=0.8,X1,X2,…,X100 相互独立。令Y= i1Xi,则由中心极限定理知Y的分布函数F(y)近似于() y80 4A.Ф(y) 2.从一大批发芽率为0.9的种子中随机抽取100粒,则这100粒种子的发芽率不低于88%的概率约为.(已知φ(0.67)=0.7486) 3.设随机变量X1,X2,…,Xn,…独立同分布,且i=1,2…,0 nB.Ф()C.Ф(16y+80)D.Ф(4y+80) Yn i1Xi,n1,2,.Φ(x)为标准正态分布函数,则limPn1()np(1p)Ynnp A.0B.Φ(1)C.1-Φ(1)D.1 4.设 5.设X服从(-1,1)上的均匀分布,试用切比雪夫不等式估计 6.设 7.报童沿街向行人兜售报纸,设每位行人买报纸的概率为0.2,且他们买报纸与否是相互独立的。试求报童在想100为行人兜售之后,卖掉报纸15到30份的概率 8.一个复杂系统由n个相互独立的工作部件组成,每个部件的可靠性(即部件在一定时间内无故障的概率)为0.9,且必须至少有80%的部件工作才能使得整个系统工作。问n至少为多少才能使系统的可靠性为0.95 9.某人有100个灯泡,每个灯泡的寿命为指数分布,其平均寿命为5小时。他每次用一个灯泡,灯泡灭了之后立即换上一个新的灯泡。求525小时之后他仍有灯泡可用的概率近似值相互独立的随机变量,且都服从参数为10的指数分布,求 的下界 是独立同分布的随机变量,设, 求 一、选择题 0,事件A不发生 1.设Xi(i1,2,10000),且P(A)=0.8,X1,X2,,X10000相互独立,令 1,事件A发生 10000 Y= X,则由中心极限定理知Y近似服从的分布是(D) ii 1A.N(0,1) C.N(1600,8000)B.N(8000,40)D.N(8000,1600) 2.设X1,X2,……,Xn是来自总体N(μ,σ2)的样本,对任意的ε>0,样本均值X所满足的切比雪夫不等式为(B) Xn≥ n C.PX≤1- A.P 2n X≥1-n n D.PXn≤ B.P 2 3.设随机变量X的E(X)=,D(X)=2,用切比雪夫不等式估计P(|XE(X)|3)(C)A.C.1 98 91912 1B.3D.1 4.设随机变量X服从参数为0.5的指数分布,用切比雪夫不等式估计P(|X-2|≥3)≤(C)A.C.1B.3 D.1 二、填空题 1.将一枚均匀硬币连掷100次,则利用中心极限定理可知,正面出现的次数大于60的概率 近似为___0.0228________.(附:Φ(2)=0.9772) 2.设随机变量序列X1,X2,…,Xn,…独立同分布,且E(Xi)=μ,D(Xi)=σ2>0,i=1,2,…, 则n Xni i1 x_对任意实数x,limP nn ___________.3.设随机变量X的E(X)=,D(X)2,用切比雪夫不等式估计P(|XE(X)|32) ___8/9________。 4.设随机变量X~U(0,1),用切比雪夫不等式估计P(|X-_____1/4___________. 5.设随机变量X~B(100,0.8),由中心极限定量可知,11 |≥)≤2 P74X86_0.8664______.(Φ(1.5)=0.9332) 0,6.设Xi=1,事件A不发生事件A发生(i=1,2,…,100),且P(A)=0.8, X1,X2,…,X100相互独立,令Y=X i1100i,则由中心极限定理知Y近似服从于正态分布,其方差为___16________。 7.设随机变量X ~ B(100,0.2),应用中心极限定理计算P{16X24}=___0.6826_______.(附:Φ(1)=0.8413) 8.设n为n次独立重复试验中事件A发生的次数,p是事件A在每次试验中发生的概率,则对任意的0,limP{|nnp|}=__1________.n 9.设随机变量X~B(100,0.5),应用中心极限定理可算得P{40 10.设X1,X2,,Xn是独立同分布随机变量序列,具有相同的数学期望和方差E(Xi)=0,D(Xi)=1,则当n充分大的时候,随机变量Zn _N(0,1)_______(标明参数).1Xi1ni的概率分布近似服从 第五章、大数定律与中心极限定理 一、选择题: 1.若随机变量X的数学期望与方差分别为EX =1,DX = 0.1,根据切比雪夫不等式,一定有() A.P{1X1}0.9B.P{0x2}0.9 C.P{1X1}0.9D.P{0x2}0.9 2.设X1,X2,X9相互独立,EXi1,DXi1(i1,2,9),根据切比雪夫不等式,1有() A.P{xi1}1B.P{xi1}12 9i1i129 C.P{2D. x9}1P{x9}19ii 2i1i199 3.若X1、X2、21000即都X1000为独立同分布的随机变量,且Xi~B(1,p)i 1、服从参数为p的0-1分布,则()不正确 100011000 A.XiPB.Xi~B(1000、P)1000i1i 11000 C.P{aX i1ib}(b)(a) 1000 D .P{aXib}i1 1,根据切比雪夫不等式,164.设随机变量X的数学期望EX = 1,且满足P{X12} X的方差必满足() 11B.DX 16 41C.DXD.DX1 2A.DX 5.设随机变量X的数学期望EX = 1,方差DX = 1,且满足P{X1}1,根据切16 比雪夫不等式,则应满足() A.4B.4 C. 11D. 44 二、填空题: 1.若随机变量X的数学期望与方差分别为EX = 1,DX = 1,且 P{X1} 切比雪夫不等式,应满足。 2.若随机变量X的数学期望与方差均存在,且EX = 1,P{X11} 夫不等式,DX应满足。 3.设X1,X2,,X9相互独立,且EXi1,DXi1,i1、2、9,根据切比雪夫不等式,则0有P{1,根据41,根据切比雪4X i19i9}。 4.设X1,X2,,X9相互独立,且EXi1,DXi1,i1、2、9,根据切比雪夫不等式,19 则0有PXi1} 9i 1三、计算题: 1.计算机进行加法计算时,把每个加数取为最接近它的整数来计算。设所有的取整误差是 相互独立的随机变量,并且都在[-0.5,0.5]上服从均匀分布,求:300个数相加时误差总和的绝对值小于10的概率。 (附:(1)0.8413,(2)0.9772,(3)0.99865,(4)0.99968) 2. 一颗螺丝钉的重量是一个随机变量,期望值是1两,标准差是0.1两.求一盒 (100个)同型号螺丝钉的重量超过10.2斤的概率.(附:(1)0.8413,(2)0.9772,(3)0.99865,(4)0.99968) 3.已知一本1000页的书中每页印刷错误的个数服从泊松分布P(0.1),求这本书的印刷错 误总数大于120的概率。 (附:(1)0.8413,(2)0.9772,(3)0.99865,(4)0.99968) 4.据以往经验,某种电器元件的寿命服从均值为100小时的指数分布,现随机地取25只,设他们的寿命是互相独立的,求这25只元件的寿命总和大于3000小时的概率。 (附:(1)0.8413,(2)0.9772,(3)0.99865,(4)0.99968)第三篇:CH5 大数定律及中心极限定理--练习题
第四篇:ch5大数定律和中心极限定理答案
第五篇:第五章、大数定律与中心极限定理