两类统计学(描述统计:归纳、总结;
推断统计:样本看总体)
数据类型(分类定性数据、数值型定量数据;
截面数据、时间序列数据)
累积/频数分数(组数、组宽、组限、组中值)、累积/相对或百分数频数分布:组的相对频数=组频数/n
平均数:均值、加权平均数、几何平均数;
中位数:中间值Q2;
众数:次数最多的数;
百分位数:第P百分位数位置
Lp=P100
(n+1);
四分位数:Q1、Q2、Q3、Q4
五数概括法(MIN、Q1、Q2、Q3、MAX)
样本
总体
极差=最大值-最小值
四分位数间距
IQR=Q3-Q1
标准差系数=标准差/均值
偏度=nn-1
(n-2)
xi-xs3
数据分布的偏斜度:左偏(右偏),平均数在中位数左侧(右侧)
观察值个数
n
N
均值
x=xin
u=xiN
方差
标准差
s2=xi-x2(n-1)
Var=σ2=xi-u2N
相关系数
rxy=sxysxsy
ρxy=σxyσxσy
切比雪夫定理
与平均数的距离在z个标准差之内的数据值所占的比例至少为(1-1/z2),其中z为大于1的任意实数
经验法则—对于具有钟形分布的数据(z-分数
zi=(xi-x)s):
大约68%(95%、几乎所有)的数据值与平均数的距离在1(2、3)个标准差之内
组合计数法则
CnN=Nn=N!n!
N-n!;
排列计数法则
PnN=n!Nn=N!N-n!
古典法、相对频数法、主观法
贝叶斯定理
PAiB=PAi
PBAiPA1
PBA1+…+PAn
PBAn;
PAB=PBA
PA=PAB
PB
条件概率
PAB=PA
PBAPB
乘法公式(联合概率)
PAB=PAB=PA
PBA=PB
PAB;
加法公式
PAB=PA+PB-PAB
独立事件
PAB=PAB=PAPB
PBA=PB
PAB=PA
互斥事件
PAB=PAB=0;
PAB=PA+PB
互补事件(对立事件、逆事件)PAB=PAB=0
PA+PB=1
随机变量x(离散型、连续型);
随机变量x的概率分布函数x、f(x)
离散型概率函数的基本条件
f(x)≥0;
f(x)=1
x的数学期望
Ex=u=xf(x);
x的方差
Varx=σ2=(x-u)2f(x)
x的标准差
σ=(x-u)2f(x)
随机变量x和y的协方差
σxy=Varx+y-Varx-Var(y)/2
σxy=x-E(x)y-E(y)f(x,y)=x-uxy-uy)/N
x和y的相关系数
ρxy=σxyσxσy
(判断是否独立)
x和y的线性组合的数学期望
E(ax+by)=aEx+bE(y)
x和y的线性组合的方差
Varax+by=a2Varx+b2Vary+2abσxy
二项实验的性质(0-1分布)
1)
试验由一系列相同的n个试验组成2)
每次试验有两种可能的结果,我们把其中一个称为成功,另一个称为失败
3)
每次试验成功的概率都是相同的,用P来表示;失败的概率也都相同,用1-P表示(平稳性)
4)
试验是相互独立的(独立性)
泊松试验的性质(二线分布的N趋势∞)
1)
在任意两个相等长度的区间上,事件发生的概率相等
2)
事件在某一区间上是否发生与事件在其他去件上是否发生是独立的超几何概率的性质
1)
当从具有r个“成功”元素和N-r个“失败”元素的总体N中抽取n次时,给出恰好有x次成功的概率
2)
各次试验不是独立的,并且各次试验中成功的概率不等
分布类型
符号
概率函数f(x)
概率分布均值μ
概率分布方差Varx=σ2
二项分布
B(n,p)
n-随机实验次数
p-成功概率
fk=Cnkpk1-pn-k, k=0, 1, 2, ⋯, n
np
np(1-p)
泊松分布
P(μ)
或
π(μ)
μ-单位时间内随机事件发生的平均次数
fk=μkk!e-μ, k=0, 1, 2,⋯
μ
μ
均匀分布
U(a,b)
a-下限值
b-上限值
fx=1b-a,a≤x≤b0,xb
a+b2
a-b212
正态分布
N(μ,σ2)
μ-均值
σ2-方差
fx=12πσe-x-μ22σ2
μ
σ2
t-分布
t(n)
n-自由度
—
0
n/(n-2)
卡方分布
χ2(n)
n-自由度
—
n
2n
F分布
F(n,m)
n,m-自由度
—
—
—
指数分布
E(λ)
λ-单位时间内随机事件发生的平均次数
fx=λe-λx,x≥00,x<0
1λ
1λ2
超几何概率分布
fx=rx
N-rn-xNn
nrN
nrN1-rNN-nN-1