第一篇:第六章 第一节和第二节大数定理和中心极限定理
第六章 大数定律和中心极限定理
研究随机变量序列的各种极限(或收敛性)的理论.我们知道,概率论是研究随机现象统计规律的学科,然而随机现象统计规律性只有在相同条件下进行大量重复的试验或观察才能显现出来,这就要用到极限去刻划.随机现象在大量重复试验中呈现明显的规律性,这只是一个信念,其确切含义和理论根据是什么?现在就来解决这些问题.极限定理是概率论中最重要的理论.它在概率论与数理统计的理论研究与应用中起着十分重要的作用.第一节 契比雪夫不等式
这里介绍一个重要的不等式--契比雪夫不等式,它是大数定律和中心极限定理的理论基础.定理 设随机变量X存在数学期望EX和方差DX,则对任意正数, 成立
P{|XEX|}DX2, 此式称为契比雪夫不等式.或等价地
P{|XEX|}1P{|XEX|}1DX.2证明(1)当X为离散型随机变量, 分布律为
P{Xx}p ,i1,2,
ii则有
P{|XEX|}
P{Xx}
i|xiEX||xiEX|(xEX)i222P{Xx}ii(xEX)iDX2P{Xx}
i2;(2)当X为连续型随机变量, 概率密度为f(x), 则有
P{|XEX|}
1|xEX|f(x)dx
2(xEX)|xEX|22f(x)dx
2(xEX)f(x)dxDX2.例
P{|XEX|aDX}
DX(aDX)21a2 ,(a0)
从上述证明方法中,还可以看出(类似可证),成立
P{|X|}(0,k1)P{|XEX|}E(|XEX|)kE|X|kk,;
k,(0,k1);等形式的不等式.(车贝谢夫,车贝晓夫,切比雪夫)例 设随机序列{Xn}和随机变量X,E|XnX如果limn|0,2则对任意有 limn0, P{|XnX|}0。
证明 因为 对任意0,成立P{|XnX|}E|XnX|22,2利用条件limE|XnX|0,nlimP{|XnX|}0。即得成立n
定理 设随机变量X的数学期望EX和方差DX均存在,且DX0, 则有 P{XEX}1.证明 由车比谢夫不等式
P{|XEX|}DX2,1n}DX()n12得0P{|XEX|0, n1,2,, P{|X又
EX|1n}0,n1,2,,1n}{|XEX|0}{|XEX|n1,1n})0P{|XEX|0}P({|XEX|n1
n1P{|XEX|1n}0, 于是P{|XEX|0}1, 即P{XEX}1.(P(A1A2)P(A1)P(A2)P(A1A2)
P(A1)P(A2), P(A1A2A3)P(A1)P(A2)P(A3),P(Ai)i1P(Ai1i).第二节 大数定律
在第一章中我们指出,随机事件的频率f(A)nf(A)nnAn,当
n时, nAn具有某种稳定性和统计概 率的定义5.它们的真正含义,在当时无法说清楚,现在就来说清楚这个问题.对于这一点, 大数定理将给于理论上的依据.下面只介绍大数定理的最基本情形.定理一(契比雪夫大数定律)设X,X,,X,是相互独立的12n随机变量序列,每一个X都有有限
i的方差,且有公共的上界,即
D(X)C, i1,2,,n, 则对任意0,成立
ilimP{|n1n1nnXii11n1nEX|}1 ,ii1
nnlimP{|nXEX|}0.ii1nii1证明 令 Yn1nnX
ii1由数学期望的性质,有
EYE(n1nnX)ii11nnEX,ii1 6 因X,X,,X,相互独立, 由方差的性质,得到
12nDYD(n1nnnX)ii11n2nDX,ii1 1n2Ci1Cn , 利用契比雪夫不等式,可得
1P{|1nnXEX|}
ii11nnii1
P{|YEY|}1nnDYn21Cn2, 在上式中,令n,即得
limP{|n1nnXii11nnEX|}1.ii1
定义 依次序列出的随机变量:X,X,,X, 简记为{Xn},简称12n随机(变量)序列{X}.n 定义 对于随机(变量)序列{X}和随机变量X(或常数a),若对任意0,有
limP{|XX|}1
nnn(或limP{|Xa|}1)nn则称随机(变量)序列{X}依概率收
n敛于X(或常数a).(等价于limP{|XX|}0)
nnX,(n)简记为XPna,(n))(或XPn 推论(辛钦大数定律)若随机变量序列X,X,,X,独立同分布,且存在有限的数学期望和方差
12n EX,DX,(i1,2,)
2ii则对任意0,有
limP{|X|}1 , n其中 X1nnX.ii1 8 证明 由数学期望和方差的性质及条件,有
EXE(X)
nii11n1nnEXii11nn,i1DXD(1n21nnnX)
ii1DXii11n2n2i1n2, 对任意0,有
1P{|X|}
P{|XEX|}
1DX21n22, 于是成立
limP{|X|}1 , n即{X}依概率收敛于常数.这个结论将在第八章中用到,是用样本均值作为总体均值的点估计的理论依据.定理二(贝努里大数定律)设n是n次独立重复试验中事件A发A生的次数,p是事件A在每次试验中发生的概率, 则对任意0,成立
limP{|nnAnp|}1.证明 引人随机变量
1,第i次试验中A发生X , 0,第i次试验中A不发生i
则n次试验中事件A发生的次数
nXXX , A12n由于是独立试验,所以X,X,,X相互独立,且都服从相同的(0—1)分布,即
12nP{X1}p,P{X0}1p,i1,2,,nii于是
EXp, i 10 DXp(1p)pp2i14(12p)214利用契比雪夫大数定律的推论,得
limP{|nnAnp|}limP{|Xp|}1
n 贝努里大数定律表明:事件A发生的频率
nAn依概率收敛于事件A发生的概率.这正是用频率作为概率的估计值的理论依据.在实际应用中,通常做多次试验,获得某事件发生的频率,作为该事件发生的概率的估计值.辛钦大数定律
定理(辛钦大数定律)设随机变量序列X,X,,X,独立同分布,且存在有限的数学期望 12n EX i,(i1,2,)则对任意0,有
limP{|X|}1 , n其中 X1nnX.ii1 这个定理的证明要用到特征函数列的收敛性质,在此证明略去。
第二篇:第二节 中心极限定理
第二节 中心极限定理
独立同分布序列的中心极限定理
定理1设X1,X2,…Xn,…是独立同分布的随机变量序列,且具
有相同数学期望和
方差E(Xi)=μ,D(Xi)=σ2(i=1,2,…)。记随机变量的分布函数为Fn(x),则对于任意实数x,有
(不证)
其中φ(x)为标准正态分布函数。
由这一定理知道下列结论:的分布
(1)当n充分大时,独立同分布的随机变量之和
近似于正态分布N(nμ,nσ2)。我们知道,n个独立同分布的正态随机变量之和服从正态分布。中心极限定理进一步告诉我们。
不论X1,X2,…Xn,…独立同服从什么分布,当n充分大时,其和Zn近似服从正态分布。
(2)考虑X1,X2,…Xn,…的平均值,有
它的标准化随机变量为数即是上述的Fn(x),因而有由此可见,当n充分大时,独立同分布随机变量的平均值态分布
[例5-3]对敌人的防御地段进行100次射击,每次射击时命中目标的炮弹数是一个随机变量,其数学期望为2,均方差为1.5,求在100次射击中有180颗到220颗炮弹命中目标的概率。
解 设Xi为第i次射击时命中目标的炮弹数(i=1,2,…,100),则
为100次射击中命中目标的炮弹总数,而且X1,X2,…X
100同
分布且相互独立。
近似服从标准正态的分布近似于正,即为上述Yn。因此的分布函
由定理1可知,随机变量分布,故有
[例]某种电器元件的寿命服从均值为100(单位:小时)的指数分布。现随机抽出16只,设它们的寿命是相互独立的,求这16只元件的寿命的总和大于1 920小时的概率。
解 设第i只电器元件的寿命为Xi=(i=1,2,…16),E(Xi)=100,D(Xi)=1002=10 000,则
是这16只元件的寿命的总和。
E(Y)=100×16=1 600,D(Y)= 160 000,则所求概率为:
棣莫弗(De Moivre)-拉普拉斯(Laplace)中心极限定理下面介绍另一个中心极限定理,它是定理1的特殊情况。
定理2(棣莫弗-拉普拉斯中心极限定理)设随机变量Zn是n
次独立重复试验中
事件A发生的次数,p是事件A发生的概率,则对于任意实数x
其中q=1-p,φ(x)为标准正态分布函数。由棣莫弗-拉普拉斯中心极限定理得到下列结论:(1)在贝努利试验中,若事件A发生的概率为p。又设Zn为n次独立重复试验中事件A发生的频数,则当n充分大时,Zn近似服从正态分布N(np,npq)。
(2)在贝努利试验中,若事件中A发生的概率为p,为n次独立重复试验中事件A发生的频率,则当n充分大时,近似
服从正态分布
【例】设某单位内部有1000台电话分机,每台分机有5%的时间使用外线通话,假定各个分机是否使用外线是相互独立的,该单位总机至少需要安装多少条外线,才能以95%以上的概率保证每台分机需要使用外线时不被占用?
解:把观察每一台分机是否使用外线作为一次试验,则各次试验相互独立,设X为1000台分机中同时使用外线的分机数,则X~B(1000,0.05),np=1000×0.05=50,根据题意,设N为满足条件的最小正整数
由于φ(-7.255)≈0,故有
查标准正态分布表得φ(1.65)=0.9505,故有
由此
N≥61.37
即该单位总机至少需要62条外线,才能以95%以上的概率保证每台分机在使用外线时不被占用。
第三篇:第五章 大数定律及中心极限定理
第五章
大数定律及中心极限定理
概率统计是研究随机变量统计规律性的数学学科,而随机现象的规律只有在对大量随机现象的考察中才能显现出来。研究大量随机现象的统计规律,常常采用极限定理的形式去刻画,由此导致对极限定理进行研究。极限定理的内容非常广泛,本章中主要介绍大数定律与中心极限定理。
5.1 切比雪夫Chebyshev不等式
一个随机变量离差平方的数学期望就是它的方差,而方差又是用来描述随机变量取值的分散程度的。下面我们研究随机变量的离差与方差之间的关系式。
定理5-1(切比雪夫不等式)设随机变量X的期望E(X)及方差D(X)存在,则对任意小正数ε>0,有:
或:
[例5-1]设X是抛掷一枚骰子所出现的点数,若给定ε=2,2.5,实际计算P{|X-E(X)|≥ε},并验证切比雪夫不等式成立。
解 X的分布律为
所以
当ε=2时,当ε=2.5时,可见,切比雪夫不等式成立。
[例5-2]设电站供电网有10 000盏灯,夜晚每一盏灯开灯的概率都是0.7,而假定所有电灯开或关是彼此独立的。试用切比雪夫不等式估计夜晚同时开着的灯数在6 800~7 200的概率。
解:设X表示在夜晚同时开着的电灯的数目,它服从参数n=10 000,p=0.7的二项分布。于是有
E(X)=np=10 000×0.7=7 000,D(X)=npq=10 000×0.7×0.3=2100,P{6 800 可见,虽然有10 000盏灯,但是只要有供应7 000盏灯的电力就能够以相当大的概率保证够用。 [例5-3补充] 用切比雪夫不等式估计 解: 的三倍的可能性极 可见,随机变量X取值与期望EX的差的绝对值大于其均方差小。 5.2 大数定律 在第一章中曾经提到过,事件发生的频率具有稳定性,即随着试验次数增多,事件发生的频率将逐渐稳定于一个确定的常数值附近。另外,人们在实践中还认识到大量测量值的算术平均值也具有稳定性,即平均结果的稳定性。大数定律以严格的数学形式表示证明了在一定的条件下,大量重复出现的随机现象呈现的统计规律性,即频率的稳定性与平均结果的稳定性。 5.2.1 贝努利大数定律 定理5-2 设m是n次独立重复试验中事件A发生的次数,p是事件A的概率,则对任意正数ε,有 贝努利大数定律说明,在大量试验同一事件A时,事件A的概率是A的频率的稳定值。 5.2.2 独立同分布随机变量序列的切比雪夫大数定律 先介绍独立同分布随机变量序列的概念。 称随机变量序列X1,X2,…Xn,…是相互独立的,若对任意的n>1,X1,X2,…Xn是相互独立的。此时,若所有的Xi又具有相同的分布,则称X1,X2,…Xn,…是独立同分布随机变量序列。 定理5-3 设X1,X2,…Xn,…是独立同分布随机变量序列E(Xi)=μ,D(Xi)=σ2(i=1,2…)均存在,则对于任意ε>0有 这一定理说明:经过算术平均后得到的随机变量在统计上具有一种稳定性,它的取值将比较紧密聚集在它的期望附近。这正是大数定律的含义。在概率论中,大数定律是随机现象的统计稳定性的深刻描述;同时,也是数理统计的重要理论基础。 5.3 中心极限定理 5.3.1独立同分布序列的中心极限定理 定理5-4 设X1,X2,…Xn,…是独立同分布的随机变量序列,且具有相同数学期望和方差E(Xi)=μ,D(Xi)=σ2(i=1,2,…)。记随机变量 的分布函数为Fn(x),则对于任意实数x,有 (不证) 其中φ(x)为标准正态分布函数。 由这一定理知道下列结论: (1)当n充分大时,独立同分布的随机变量之和的分布近似于正态分布N2(nμ,nσ)。我们知道,n个独立同分布的正态随机变量之和服从正态分布。中心极限定理进一步告诉我们。 不论X1,X2,…Xn,…独立同服从什么分布,当n充分大时,其和Zn近似服从正态分布。 (2)考虑X1,X2,…Xn,…的平均值,有 它的标准化随机变量为,即为上述Yn。因此的分布函数即是上述的F(,nx)因而有 由此可见,当n充分大时,独立同分布随机变量的平均值 的分布近似于正态分布 [例5-3]对敌人的防御地段进行100次射击,每次射击时命中目标的炮弹数是一个随机变量,其数学期望为2,均方差为1.5,求在100次射击中有180颗到220颗炮弹命中目标的概率。解 设Xi为第i次射击时命中目标的炮弹数(i=1,2,…,100),则中命中目标的炮弹总数,而且X1,X2,…X100同分布且相互独立。 为100次射击 由定理5-4可知,随机变量近似服从标准正态分布,故有 [例5-4]某种电器元件的寿命服从均值为100(单位:小时)的指数分布。现随机抽出16只,设它们的寿命是相互独立的,求这16只元件的寿命的总和大于1 920小时的概率。 解 设第i只电器元件的寿命为Xi=(i=1,2,…16),E(Xi)=100,D(Xi)=1002=10 000,则是这16只元件的寿命的总和。 E(Y)=100×16=1 600,D(Y)= 160 000,则所求概率为: 5.3.2 棣莫弗(De Moivre)-拉普拉斯(Laplace)中心极限定理 下面介绍另一个中心极限定理,它是定理5-4的特殊情况。 定理5-5(棣莫弗-拉普拉斯中心极限定理)设随机变量Zn是n次独立重复试验中事件A发生的次数,p是事件A发生的概率,则对于任意实数x 其中q=1-p,φ(x)为标准正态分布函数。由棣莫弗-拉普拉斯中心极限定理得到下列结论: (1)在贝努利试验中,若事件A发生的概率为p。又设Zn为n次独立重复试验中事件A发生的频数,则当n充分大时,Zn近似服从正态分布N(np,npq)。 (2)在贝努利试验中,若事件中A发生的概率为p,发生的频率,则当n充分大时,近似服从正态分布 【例5-5】用中心极限定理得到求解5.1例5-2的概率。 解 设同时开着的灯数为X,则 X-B(1000,0.7),np=1000×0.7=7000,为n次独立重复试验中事件A 【例5-6】设某单位内部有1000台电话分机,每台分机有5%的时间使用外线通话,假定各个分机是否使用外线是相互独立的,该单位总机至少需要安装多少条外线,才能以95%以上的概率保证每台分机需要使用外线时不被占用? 解:把观察每一台分机是否使用外线作为一次试验,则各次试验相互独立,设X为1000台分机中同时使用外线的分机数,则 X~B(1000,0.05),np=1000×0.05=50,根据题意,设N为满足条件的最小正整数 由于φ(-7.255)≈0,故有 查标准正态分布表得φ(1.65)=0.9505,故有 由此 N≥61.37 即该单位总机至少需要62条外线,才能以95%以上的概率保证每台分机在使用外线时不被占用。 小结 本章考核要求 (一)知道切比雪夫不等式 或 并且会用切比雪夫不等式估计事件|X-EX|≥ε或|X-EX|<ε的概率。 (二)知道贝努利大数定律 其中n是试验次数,m是A发生次数,p是A的概率,它说明试验次数很多时,频率近似于概率。 (三)知道切比雪夫不等式大数定律 取值稳定在期望附近。 它说明在大量试验中,随机变量 (四)知道独立同分布中心极限定理 若 记Yn~Fn(x),则有 它说明当n很大时,独立同分布的随机变量之和近似服从正态N(nμ,nσ2)所以,无论n个独立同分布的X1,X2,…Xn服从何种分布,n很大时,X1+X2+…Xn却近似正态N(nμ,nσ2).(五)知道棣莫弗—拉普拉斯中心极限定理 若Zn表示n次独立重复事件发生次数,即 Zn~B(n,p),则有 即Zn近似正态N(np,np(1-p)2)。并会用中心极限定理计算简单应用问题。 CH5 大数定律及中心极限定理 1.设Ф(x)为标准正态分布函数,Xi= 1001,事件A发生;0,事件A不发生,i=1,2,…,100,且P(A)=0.8,X1,X2,…,X100 相互独立。令Y= i1Xi,则由中心极限定理知Y的分布函数F(y)近似于() y80 4A.Ф(y) 2.从一大批发芽率为0.9的种子中随机抽取100粒,则这100粒种子的发芽率不低于88%的概率约为.(已知φ(0.67)=0.7486) 3.设随机变量X1,X2,…,Xn,…独立同分布,且i=1,2…,0 nB.Ф()C.Ф(16y+80)D.Ф(4y+80) Yn i1Xi,n1,2,.Φ(x)为标准正态分布函数,则limPn1()np(1p)Ynnp A.0B.Φ(1)C.1-Φ(1)D.1 4.设 5.设X服从(-1,1)上的均匀分布,试用切比雪夫不等式估计 6.设 7.报童沿街向行人兜售报纸,设每位行人买报纸的概率为0.2,且他们买报纸与否是相互独立的。试求报童在想100为行人兜售之后,卖掉报纸15到30份的概率 8.一个复杂系统由n个相互独立的工作部件组成,每个部件的可靠性(即部件在一定时间内无故障的概率)为0.9,且必须至少有80%的部件工作才能使得整个系统工作。问n至少为多少才能使系统的可靠性为0.95 9.某人有100个灯泡,每个灯泡的寿命为指数分布,其平均寿命为5小时。他每次用一个灯泡,灯泡灭了之后立即换上一个新的灯泡。求525小时之后他仍有灯泡可用的概率近似值相互独立的随机变量,且都服从参数为10的指数分布,求 的下界 是独立同分布的随机变量,设, 求 第四节 大数定理与中心极限定理 概率论与数理统计是研究随机现象统计规律性的学科.而随机现象的规律性在相同的条件下进行大量重复试验时会呈现某种稳定性.例如, 大量的抛掷硬币的随机试验中, 正面出现频率;在大量文字资料中, 字母使用频率;工厂大量生产某种产品过程中, 产品的废品率等.一般地, 要从随机现象中去寻求事件内在的必然规律, 就要研究大量随机现象的问题.在生产实践中, 人们还认识到大量试验数据、测量数据的算术平均值也具有稳定性.这种稳定性就是我们将要讨论的大数定律的客观背景.在这一节中,我们将介绍有关随机变量序列的最基本的两类极限定理----大数定理和中心极限定理.内容分布图示 ★大数定理的引入 ★切比雪夫不等式 ★例1 ★例2 ★大数定理 ★中心极限定理的引入 ★林德伯格—勒维定理 ★例3 ★例6 ★推论 大数定理 ★棣莫佛—拉普拉斯定理 ★例4 ★例5 ★例7 ★例8 ★高尔顿钉板试验 中心极限定理 ★内容小结 ★课堂练习★习题4-4 内容要点: 一、依概率收敛 与微积分学中的收敛性的概念类似, 在概率论中, 我们要考虑随机变量序列的收敛性.定义 1设X1,X2,,Xn,是一个随机变量序列, a为一个常数,若对于任意给定的正数,有 limP{|Xna|}1, 则称序列X1,X2,,Xn,依概率收敛于a, 记为 nXnaP(n).PP定理1 设Xna,Ynb,又设函数g(x,y)在点(a,b)连续, 则 g(Xn,Yn)g(a,b).P 二、切比雪夫不等式 定理2设随机变量X有期望E(X)和方差D(X)2,则对于任给0, 有 P{|X|}22.上述不等式称切比雪夫不等式.注:(i)由切比雪夫不等式可以看出,若2越小, 则事件 {|XE(X)|} 的概率越大, 即, 随机变量X集中在期望附近的可能性越大.由此可见方差刻划了随机变量取值的离散程度.(ii)当方差已知时,切比雪夫不等式给出了X与它的期望的偏差不小于的概率的估计式.如取3, 则有 P{|XE(X)|3}9220.111.故对任给的分布,只要期望和方差2存在, 则随机变量X取值偏离E(X)超过3的概率小于0.111.三、大数定理 1.切比雪夫大数定律 定理3(切比雪夫大数定律)设X1,X2,,Xn,是两两不相关的随机变量序列,它们数学期望和方差均存在, 且方差有共同的上界, 即D(Xi)K,i1,2,, 则对任意0, 有 1limPnnni1Xi1nni1E(Xi) 11nn注: 定理表明: 当n很大时,随机变量序列{Xn}的算术平均值学期望 2.伯努利大数定理 1nni1Xi依概率收敛于其数E(X).ii1定理4(伯努利大数定律)设nA是n重伯努利试验中事件A发生的次数, p是事件A在每次试验中发生的概率, 则对任意的0, 有 nnlimPAp1 或 limPAp0.nnnn注:(i)伯努利大数定律是定理1的推论的一种特例, 它表明: 当重复试验次数n充分大时, 事件A发生的频率nAn依概率收敛于事件A发生的概率p.定理以严格的数学形式表达了频率的稳定性.在实际应用中, 当试验次数很大时,便可以用事件发生的频率来近似代替事件的概率.(ii)如果事件A的概率很小,则由伯努利大数定律知事件A发生的频率也是很小的,或者说事件A很少发生.即“概率很小的随机事件在个别试验中几乎不会发生”,这一原理称为小概率原理,它的实际应用很广泛.但应注意到,小概率事件与不可能事件是有区别的.在多次试验中,小概率事件也可能发生.3.辛钦大数定理 定理5(辛钦大数定律)设随机变量X1,X2,,Xn,相互独立, 服从同一分布,且具有数学期望E(Xi),i1,2,, 则对任意0, 有 1limPnnni1Xi1.注:(i)定理不要求随机变量的方差存在; (ii)伯努利大数定律是辛钦大数定律的特殊情况; (iii)辛钦大数定律为寻找随机变量的期望值提供了一条实际可行的途径.例如, 要估计某地区的平均亩产量, 可收割某些有代表性的地块, 如n块,计算其平均亩产量, 则当n较大时,可用它作为整个地区平均亩产量的一个估计.此类做法在实际应用中具有重要意义.四、中心极限定理 在实际问题中, 许多随机现象是由大量相互独立的随机因素综合影响所形成, 其中每一个因素在总的影响中所起的作用是微小的.这类随机变量一般都服从或近似服从正态分布.以一门大炮的射程为例, 影响大炮的射程的随机因素包括: 大炮炮身结构的制造导致的误差, 炮弹及炮弹内炸药在质量上的误差, 瞄准时的误差, 受风速、风向的干扰而造成的误差等.其中每一种误差造成的影响在总的影响中所起的作用是微小的, 并且可以看成是相互独立的, 人们关心的是这众多误差因素对大炮射程所造成的总影响.因此需要讨论大量独立随机变量和的问题.中心极限定理回答了大量独立随机变量和的近似分布问题, 其结论表明: 当一个量受许多随机因素(主导因素除外)的共同影响而随机取值, 则它的分布就近似服从正态分布.1.林德伯格—勒维定理 定理6(林德伯格—勒维)设X1,X2,,Xn,是独立同分布的随机变量序列, 且 E(Xi),D(Xi),i1,2,,n,2 则 nXini1limPxnnx12et2/2dt 注: 定理6表明: 当n充分大时, n个具有期望和方差的独立同分布的随机变量之和近似服从正态分布.虽然在一般情况下, 我们很难求出X1X2Xn的分布的确切形式, 但当n很大时, 可求出其近似分布.由定理结论有 ni1Xinn1近似n~N(0,1)ni1Xin近似/~N(0,1)X~N(,22/n),X1nni1Xi.故定理又可表述为: 均值为, 方差的0的独立同分布的随机变量X1,X2,,Xn,的算术平均值X, 当n充分大时近似地服从均值为,方差为2/n的正态分布.这一结果是数理统计中大样本统计推断的理论基础.2.棣莫佛—拉普拉斯定理 在第二章中,作为二项分布的正态近似,我们曾经介绍了棣莫佛—拉普拉斯定理,这里再次给出,并利用上述中心极限定理证明之.定理7(棣莫佛—拉普拉斯定理)设随机变量Yn服从参数n,p(0p1)的二项分布, 则对任意x, 有 YnnplimPxnnp(1p)x12et22dt(x) 注: 易见,棣莫佛—拉普拉斯定理就是林德伯格—勒维定理的一个特殊情况.3.用频率估计概率的误差 设n为n重贝努里试验中事件A发生的频率, p为每次试验中事件A发生的概率,q1p,由棣莫佛—拉普拉斯定理,有 nPpPnnpqnnpnpqn pqn1.pq npqn2pq这个关系式可用解决用频率估计概率的计算问题: 4.李雅普诺夫定理 定理8(李雅普诺夫定理)设随机变量X1,X2,,Xn, 相互独立, 它们具有数学期望 n和方差: E(Xk)k,n时, D(Xk)2k0,i1,2,,记B2n.若存在正数, 使得当 k12k1Bn2nnE{|k1Xkk|2}0,则随机变量之和Xk的标准化变量: k1nZnk1nXkEXkk1DXkk1nnnkXk1Bnk1k 的分布函数Fn(x)对于任意x, 满足 nnXkkk1k1limFn(x)limPxnnBnx12et/22dt(x).注:定理8表明, 在定理的条件下, 随机变量 nnZnk1XkBnk1k.nn当n很大时,近似地服从正态分布N(0,1).由此, 当n很大时,XkBnZnk近似地服 k1k1n2.这就是说,无论各个随机变量Xk(k1,2,)服从什么分布,只要满从正态分布N,Bknk1n足定理的条件,那么它们的和Xk当n很大时,就近似地服从正态分布.这就是为什么正态随 k1机变量在概率论中占有重要地位的一个基本原因.在很多问题中,所考虑的随机变量可以表示成很多个独立的随机变量之和,例如,在任一指定时刻,一个城市的耗电量是大量用户耗电量的总和;一个物理实验的测量误差是由许多观察不到的、可加的微小误差所合成的,它们往往近似地服从正态分布.例题选讲: 切比雪夫不等式 例1(讲义例1)已知正常男性成人血液中, 每一毫升白细胞数平均是7300, 均方差是700.利用切比雪夫不等式估计每毫升白细胞数在5200~9400之间的概率.解 设每毫升白细胞数为X, 依题意, 7300,27002,P{5200X9400}P{52007300X730094007300} P{2100X2100}P{|X|2100}.所求概率为 由切比雪夫不等式 P{|X|2100}1222/(2100)1(700/2100)11/98/9,即每毫升白细胞数在5200 ~ 9400之间的概率不小于8/9.例2 在每次试验中, 事件A发生的概率为0.75, 利用切比雪夫不等式求: 事件A出现的频率在0.74~0.76之间的概率至少为0.90? 解 设X为次试验中, 事件A出现的次数, 则 X~b(n,0.75), 0.75n, 20.750.25n0.1875n,所求为满足P{0.74X/n0.76}0.90的最小的n.P{0.74X/n0.76}可改写为 P{0.74nX0.76n}P{0.01nX0.75n0.01n}P{|X|0.01n} 在切比雪夫不等式中取0.01n, 则 P{0.74X/n0.76}P{|X|0.01n}122/(0.01n)2 10.1875n/0.0001n11875/n 依题意, 取n使11875/n0.9, 解得 n1875/(10.9)1875,0 即n取18750 时, 可以使得在n次独立重复试验中, 事件A出现的频率在0.74~0.76之间的概率至少为 0.90.中心极限定理 例3(讲义例2) 一盒同型号螺丝钉共有100个, 已知该型号的螺丝钉的重量是一个随机变量, 期望值是100g, 标准差是10g, 求一盒螺丝钉的重量超过10.2kg的概率.解 设为第i个螺丝钉的重量, i1,2,,100,100且它们之间独立同分布, 于是一盒螺丝钉的重量为XXi1i,且由E(Xi)100,D(Xi)10,n100,知E(X)100E(Xi)10000,由中心极限定理有 P{X10200}PnD(X)100,i1Xinn10200nX10000pn1001020010000 100X10000X10000P21P2 1001001(2)10.977250.02275.例4(讲义例3)计算机在进行数学计算时, 遵从四舍五入原则.为简单计.现在对小数点后面第一位进行舍入运算, 则误差X可以认为服从[0.5,0.5]上的均匀分布.若在一项计算中进行了100次数字计算, 求平均误差落在区间[3/20,3/20]上的概率.解 n100, 用Xi表示第i次运算中产生的误差.相互独立, 都服从[0.5,0.5]上的均匀分布, X1,X2,,X100且E(Xi)0,var(Xi)1/12,i1,2,,100, 从而 Y100100i1Xi1000100/1235100i1近似Xi~N(0,1).故平均误差X1100100i133,Xi落在2020上的概率为 3331PXP201002020100i1Xi320 3P35100i1Xi3(3)(3)0.9973. 例5(讲义例4)某公司有200名员工参加一种资格证书考试.按往年经验考试通过率为0.8,试计算这200名员工至少有150人考试通过的概率.解 1,令10,第i人通过考试第i人未通过考试,i1,2,,200,依题意,P{Xi1}0.8,np2000.8160,np(1p)32.200i1Xi是考试通过人数, 由中心极限定理4, 得 P{XiX160/32~N(0,1),150}P{X160/32}150160/200近似i1i200ii32 P{200i1Xi160/321.77} 1(1.77)(1.77)0.96, 即至少有150名员工通过这种考试的概率为0.96.例6(讲义例5)某市保险公司开办一年人身保险业务, 被保险人每年需交付保险费160元, 若一年内发生重大人身事故, 其本人或家属可获2万元赔金.已知该市人员一年内发生重大人身事故的概率为0.005, 现有5000人参加此项保险, 问保险公司一年内从此项业务所得到的总收益在20万到40万元之间的概率是多少? 解 记Xi1,若第i个被保险人发生重大事0,若第i个被保险人未发生重大故事故(i1,2,,5000) 于是Xi均服从参数为p0.005的两点分布, 且p{Xi1}0.005,np25.5000i1Xi是5000个被保险人中一年内发生重大人身事故的人数, 保险公司一年内从此 5000i1项业务所得到的总收益为0.01650002于是 Xi万元.5000P200.01650002Xi40P20i15000i1Xi30 P2025250.9955000i1Xi25250.995(1)(1)0.6826 250.9953025 例7 对于一个学校而言, 来参加家长会的家长人数是一个随机变量, 设一个学生无家长, 1名家长, 2名家长来参加会议的概率分别0.05, 0.8, 0.15.若学校共有400名学生, 设各学生参加会议的家长数相互独立, 且服从同一分布.求参加会议的家长数X超过450的概率.解 以Xk(k1,2,,400)记第k个学生来参加会议的家长数, 则Xk的分布律为 Xkpk00.0510.820.15 400易知E(Xk)1.1,D(Xk)0.19,k1,2,,400, 而XXk1k,由定理3, 随机变量 400Xk1k4001.1X4001.14000.190.19近似~400N(0,1), 故 X4001.14504001.1P{X450}P 4000.194000.19X4001.11P1.147 4000.191(1.147)0.1357.例8 设有1000人独立行动, 每个人能够按时进入掩蔽体的概率为0.9.以95%概率估计, 在一次行动中, 至少有多少人能进入掩蔽体.解 用Xi表示第i人能够按时进入掩蔽体, 令SnX1X2X1000.设至少有m人能进入掩蔽体, 则要求 P{mSn}0.95,Sn90090 {mSn}m10000.910000.90.1Sn900 90近似由中心极限定理, 有 ~N(0,1), 所以 m900Sn900S900m900P{mSn}Pn1P 90909090查正态分布数值表, 得 m900901.65, 故m90015.65884.35884人.课堂练习 某地有甲、乙两个电影院竞争当地每天的1000名观众, 观众选择电影院是独立的和随机的.问: 每个电影院至少应设有多少个座位, 才能保证观众因缺少座位而离去的概率小于1%?第四篇:CH5 大数定律及中心极限定理--练习题
第五篇:04 第四节 大数定理与中心极限定理