第一篇:商务统计例题代码(小编推荐)
商务数据分析与应用
第1章 线性回归
• 移动通信网络的客户价值分析
*指标设计
Y相对利润变化 X1通话总量 X2大网占比 X3小网占比
#读入数据,以数据为第一行
data1=read.csv(“F:/1商务统计/案例数据/第1章.csv”,header=T)names(data1)=c(“Y”,“X1”,“X2”,“X3”)data1[c(1:3),]
## Y X1 X2 X3 ## 1 0.2126197 2.822822 0.9037594 0.21954887 ## 2 0.2756156 2.628389 0.9717647 0.02823529 ## 3 0.1687526 2.537819 0.9913043 0.22318841
*描述分析
N=sapply(data1,length)#样本量 MU=sapply(data1,mean)#均值 SD=sapply(data1,sd)#标准差 MIN=sapply(data1,min)#最小值 MED=sapply(data1,median)#中位数 MAX=sapply(data1,max)#最大值
result=cbind(N,MU,SD,MIN,MED,MAX)result
## N MU SD MIN MED MAX ## Y 1123 0.1930176 0.1324444-0.49801016 0.1870535 0.9925818 ## X1 1123 2.5804381 0.4083604 0.77815125 2.5831988 3.6009729 ## X2 1123 0.8457207 0.1538765 0.09867452 0.8983452 1.0000000 ## X3 1123 0.2521307 0.2112832 0.00000000 0.1983730 0.9734904
*最小二乘估计
lm1=lm(Y~X1+X2+X3,data=data1)lm1
## Call:
## lm(formula = Y ~ X1 + X2 + X3, data = data1)## Coefficients:
##(Intercept)X1 X2 X3 ##-0.488566 0.235569 0.089486-0.007807
*方差分析
anova(lm1)
## Analysis of Variance Table ## Response: Y
## Df Sum Sq Mean Sq F value Pr(>F)## X1 1 10.7177 10.7177 1375.7807 < 2.2e-16 *** ## X2 1 0.2448 0.2448 31.4279 2.606e-08 *** ## X3 1 0.0017 0.0017 0.2216 0.638 ## Residuals 1119 8.7173 0.0078
## Signif.codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
*参数估计
summary(lm1)
## Call:
## lm(formula = Y ~ X1 + X2 + X3, data = data1)## Residuals:
## Min 1Q Median 3Q Max ##-0.62789-0.04540-0.01281 0.03177 0.62598 ## Coefficients:
## Estimate Std.Error t value Pr(>|t|)##(Intercept)-0.488566 0.026160-18.676 < 2e-16 *** ## X1 0.235569 0.006519 36.135 < 2e-16 *** ## X2 0.089486 0.022915 3.905 9.98e-05 *** ## X3-0.007807 0.016586-0.471 0.638
## Signif.codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1 ## Residual standard error: 0.08826 on 1119 degrees of freedom ## Multiple R-squared: 0.5571, Adjusted R-squared: 0.5559 ## F-statistic: 469.1 on 3 and 1119 DF, p-value: < 2.2e-16
*模型诊断()
par(mfrow=c(2,2))
plot(lm1,which=c(1:4))
第2章 方差分析
• 北京市商品房定价分析
*指标设计
Y价格=log(平均售价)X1环线位置 X2装修状况 X3所在区县 X4有无地铁
data2=read.csv(“F:/1商务统计/案例数据/第2章.csv”,header=T)names(data2)=c(“Y”,“X1”,“X2”,“X3”,“X4”)#对因变量做对数变换 data2$Y=log(data2$Y)data2[c(1:3),]
## Y X1 X2 X3 X4 ## 1 1.098612 2至3环 精装修 朝阳 有 ## 2 1.686399 2至3环 精装修 朝阳 无 ## 3 1.386294 2至3环 精装修 朝阳 有
*描述分析(按环线位置)N=tapply(data2$Y,data2$X1,length)#样本量 MU=tapply(data2$Y,data2$X1,mean)#均值 SD=tapply(data2$Y,data2$X1,sd)#标准差 MIN=tapply(data2$Y,data2$X1,min)#最小值 MED=tapply(data2$Y,data2$X1,median)#中位数 MAX=tapply(data2$Y,data2$X1,max)#最大值 result=cbind(N,MU,SD,MIN,MED,MAX)result
## N MU SD MIN MED MAX ## 2至3环 26 1.4409491 0.2395535 0.9162907 1.4816045 1.8405496 ## 3至4环 60 1.2373459 0.3516936 0.5877867 1.1631508 2.1517622 ## 4至5环 30 1.1399181 0.2123769 0.7884574 1.1785366 1.4816045 ## 5至6环 60 0.8595883 0.2113624 0.4700036 0.8541889 1.3609766 ## 6环以外 8 0.2490578 0.3411846-0.2231436 0.3129692 0.5877867
*描述分析(按装修状况)
N=tapply(data2$Y,data2$X2,length)#样本量 MU=tapply(data2$Y,data2$X2,mean)#均值 SD=tapply(data2$Y,data2$X2sd)#标准差 MIN=tapply(data2$Y,data2$X2,min)#最小值 MED=tapply(data2$Y,data2$X2,median)#中位数 MAX=tapply(data2$Y,data2$X2,max)#最大值 result=cbind(N,MU,SD,MIN,MED,MAX)result
## N MU SD MIN MED MAX ## 精装修 100 1.2620118 0.3798301 0.0000000 1.2527630 2.151762 ## 毛胚 84 0.8722567 0.2618101-0.2231436 0.9021733 1.360977
*描述分析(按所在区县)
N=tapply(data2$Y,data2$X3,length)#样本量 MU=tapply(data2$Y,data2$X3,mean)#均值 SD=tapply(data2$Y,data2$X3,sd)#标准差 MIN=tapply(data2$Y,data2$X3,min)#最小值 MED=tapply(data2$Y,data2$X3,median)#中位数 MAX=tapply(data2$Y,data2$X3,max)#最大值 result=cbind(N,MU,SD,MIN,MED,MAX)result
## N MU SD MIN MED MAX ## 朝阳 58 1.3189428 0.3767793 0.6931472 1.2668484 2.151762 ## 丰台 38 1.0169271 0.2329162 0.5007753 1.0296194 1.458615 ## 海淀 52 1.1547562 0.2662418 0.5596158 1.1709029 1.722767 ## 通州 36 0.6744863 0.3172525-0.2231436 0.7175423 1.252763 *描述分析(按有无地铁)
N=tapply(data2$Y,data2$X4,length)#样本量 MU=tapply(data2$Y,data2$X4,mean)#均值 SD=tapply(data2$Y,data2$X4,sd)#标准差 MIN=tapply(data2$Y,data2$X4,min)#最小值 MED=tapply(data2$Y,data2$X4,median)#中位数 MAX=tapply(data2$Y,data2$X4,max)#最大值 result=cbind(N,MU,SD,MIN,MED,MAX)
result## N MU SD MIN MED MAX ## 无 36 1.095447 0.3228303 0.0000000 1.115007 1.686399 ## 有 148 1.081315 0.3977276-0.2231436 1.029619 2.151762
*方差分析
lm2.1=lm(Y~X1*X2+X3+X4,data=data2)
anova(lm2.1)## Analysis of Variance Table
## Response: Y## Df Sum Sq Mean Sq F value Pr(>F)## X1 4 13.4161 3.3540 59.9170 < 2.2e-16 *** ## X2 1 2.2944 2.2944 40.9884 1.439e-09 *** ## X3 3 1.3516 0.4505 8.0485 4.792e-05 *** ## X4 1 0.0133 0.0133 0.2375 0.6266 ## X1:X2 4 0.3153 0.0788 1.4082 0.2333 ## Residuals 170 9.5162 0.0560
## Signif.codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1*去除交互作用X1 × X2以及X4后的方差分析
lm2.2=lm(Y~X1+X2+X3,data=data2)anova(lm2.2)
## Analysis of Variance Table
## Response: Y## Df Sum Sq Mean Sq F value Pr(>F)## X1 4 13.4161 3.3540 59.6205 < 2.2e-16 *** ## X2 1 2.2944 2.2944 40.7856 1.481e-09 *** ## X3 3 1.3516 0.4505 8.0087 4.946e-05 *** ## Residuals 175 9.8448 0.0563
## Signif.codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1*参数估计
summary(lm2.2)
## Call:
## lm(formula = Y ~ X1 + X2 + X3, data = data2)
## Residuals:
## Min 1Q Median 3Q Max ##-0.72379-0.12676 0.00633 0.12498 0.73482
## Coefficients:## Estimate Std.Error t value Pr(>|t|)##(Intercept)1.47950 0.04767 31.037 < 2e-16 *** ## X13至4环-0.06256 0.05984-1.046 0.2972 ## X14至5环-0.17128 0.06794-2.521 0.0126 * ## X15至6环-0.40837 0.07241-5.640 6.73e-08 *** ## X16环以外-1.02414 0.11725-8.734 1.92e-15 *** ## X2毛胚-0.19259 0.04160-4.630 7.10e-06 *** ## X3丰台-0.25072 0.05427-4.620 7.41e-06 *** ## X3海淀-0.02894 0.04940-0.586 0.5588 ## X3通州-0.11002 0.07118-1.546 0.1240
## Signif.codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1## Residual standard error: 0.2372 on 175 degrees of freedom ## Multiple R-squared: 0.6341, Adjusted R-squared: 0.6174
## F-statistic: 37.91 on 8 and 175 DF, p-value: < 2.2e-16*模型诊断
par(mfrow=c(2,2))
plot(lm2.2,which=c(1:4))
第3章 逻辑回归
• 上市企业特别处理ST分析
*指标设计
Y是否ST X1盈利质量ARA=应收账款/总资产 X2公司规模ASSET=log(资产规模)X3资产周转率ATO X4资产收益率ROA X5销售收入增长率GROWTH X6债务资产比率(杠杆比率)LEV X7第一大股东持股比率(股权结构)SHARE data3=read.csv(“F:/1商务统计/案例数据/第3章.csv”,header=T)
names(data3)=c(“X1ARA”,“X2ASSET”,“X3ATO”,“X4ROA”,“X5GROWTH”,“X6LEV”,“X7SHARE”,“YST”)data3[c(1:3),]
## X1ARA X2ASSET X3ATO X4ROA X5GROWTH X6LEV X7SHARE YST
## 1 0.1923096 19.85605 0.0052 0.08770980-0.9507273 0.4458801 26.89 0
## 2 0.2201200 20.91086 0.0056 0.01682038-0.9426563 0.3986864 39.62 0
## 3 0.3252917 19.35262 0.0166 0.04246833-0.9374404 0.3033481 26.46 0
*描述分析
N=sapply(data3,length)#样本量 MU=sapply(data3,mean)#均值 SD=sapply(data3,sd)#标准差 MIN=sapply(data3,min)#最小值 MED=sapply(data3,median)#中位数 MAX=sapply(data3,max)#最大值
result=cbind(N,MU,SD,MIN,MED,MAX)result
## N MU SD MIN MED MAX
## X1ARA 684 0.09504945 0.09228931 0.00000000 0.06832718 0.6346842
## X2ASSET 684 20.77785347 0.83352322 18.66070036 20.70050279 24.0176107
## X3ATO 684 0.51977383 0.36282648 0.00280000 0.43340000 3.1513000 ## X4ROA 684 0.05587011 0.03859391 0.00008170 0.05125798 0.3111300
## X5GROWTH 684 0.11525745 0.30702005-0.95072732 0.10228264 0.9985565
## X6LEV 684 0.40606356 0.16576397 0.01843107 0.40673974 0.9803218
## X7SHARE 684 46.03451754 17.68437717 4.16000000 44.95500000 88.5800000
## YST 684 0.05263158 0.22346029 0.00000000 0.00000000 1.0000000
*描述分析(按X1ARA)
N=tapply(data3$X1ARA,data3$YST,length)#样本量 MU=tapply(data3$X1ARA,data3$YST,mean)#均值 SD=tapply(data3$X1ARA,data3$YST,sd)#标准差 MIN=tapply(data3$X1ARA,data3$YST,min)#最小值 MED=tapply(data3$X1ARA,data3$YST,median)#中位数 MAX=tapply(data3$X1ARA,data3$YST,max)#最大值 result=cbind(N,MU,SD,MIN,MED,MAX)result
## N MU SD MIN MED MAX ## 0 648 0.09060347 0.08673571 0.00000000 0.06634297 0.6346842 ## 1 36 0.17507708 0.14207891 0.01191061 0.13924284 0.5335909
*描述分析(按X2ASSET)
N=tapply(data3$X2ASSET,data3$YST,length)#样本量 MU=tapply(data3$X2ASSET,data3$YST,mean)#均值 SD=tapply(data3$X2ASSET,data3$YST,sd)#标准差 MIN=tapply(data3$X2ASSET,data3$YST,min)#最小值 MED=tapply(data3$X2ASSET,data3$YST,median)#中位数 MAX=tapply(data3$X2ASSET,data3$YST,max)#最大值 result=cbind(N,MU,SD,MIN,MED,MAX)result
## N MU SD MIN MED MAX ## 0 648 20.77346 0.8324296 18.66070 20.6881 24.01761 ## 1 36 20.85695 0.8611029 19.07364 20.8161 23.48810
*描述分析(按X3ATO)
N=tapply(data3$X3ATO,data3$YST,length)#样本量 MU=tapply(data3$X3ATO,data3$YST,mean)#均值 SD=tapply(data3$X3ATO,data3$YST,sd)#标准差 MIN=tapply(data3$X3ATO,data3$YST,min)#最小值 MED=tapply(data3$X3ATO,data3$YST,median)#中位数 MAX=tapply(data3$X3ATO,data3$YST,max)#最大值 result=cbind(N,MU,SD,MIN,MED,MAX)result
## N MU SD MIN MED MAX ## 0 648 0.5254105 0.3676712 0.0028 0.43455 3.1513 ## 1 36 0.4183139 0.2424995 0.0824 0.39110 0.9212
*描述分析(按X4ROA)
N=tapply(data3$X4ROA,data3$YST,length)#样本量 MU=tapply(data3$X4ROA,data3$YST,mean)#均值 SD=tapply(data3$X4ROA,data3$YST,sd)#标准差 MIN=tapply(data3$X4ROA,data3$YST,min)#最小值 MED=tapply(data3$X4ROA,data3$YST,median)#中位数 MAX=tapply(data3$X4ROA,data3$YST,max)#最大值 result=cbind(N,MU,SD,MIN,MED,MAX)result
## N MU SD MIN MED MAX ## 0 648 0.05663345 0.03741736 0.000081700 0.05201964 0.3111300 ## 1 36 0.04212999 0.05459187 0.001052306 0.02567337 0.2350839
*描述分析(按X5GROWTH)
N=tapply(data3$X5GROWTH,data3$YST,length)#样本量 MU=tapply(data3$X5GROWTH,data3$YST,mean)#均值 SD=tapply(data3$X5GROWTH,data3$YST,sd)#标准差 MIN=tapply(data3$X5GROWTH,data3$YST,min)#最小值 MED=tapply(data3$X5GROWTH,data3$YST,median)#中位数 MAX=tapply(data3$X5GROWTH,data3$YST,max)#最大值 result=cbind(N,MU,SD,MIN,MED,MAX)result
## N MU SD MIN MED MAX ## 0 648 0.12304428 0.2994712-0.9507273 0.1063968 0.9985565 ## 1 36-0.02490552 0.4003226-0.8167039-0.1188108 0.8997644
*描述分析(按X6LEV)
N=tapply(data3$X6LEV,data3$YST,length)#样本量 MU=tapply(data3$X6LEV,data3$YST,mean)#均值 SD=tapply(data3$X6LEV,data3$YST,sd)#标准差 MIN=tapply(data3$X6LEV,data3$YST,min)#最小值 MED=tapply(data3$X6LEV,data3$YST,median)#中位数 MAX=tapply(data3$X6LEV,data3$YST,max)#最大值 result=cbind(N,MU,SD,MIN,MED,MAX)result ## N MU SD MIN MED MAX ## 0 648 0.4018435 0.1644874 0.01843107 0.4026904 0.9803218 ## 1 36 0.4820251 0.1726016 0.13810509 0.5042842 0.7937813
*描述分析(按X7SHARE)
N=tapply(data3$X7SHARE,data3$YST,length)#样本量 MU=tapply(data3$X7SHARE,data3$YST,mean)#均值 SD=tapply(data3$X7SHARE,data3$YST,sd)#标准差 MIN=tapply(data3$X7SHARE,data3$YST,min)#最小值 MED=tapply(data3$X7SHARE,data3$YST,median)#中位数 MAX=tapply(data3$X7SHARE,data3$YST,max)#最大值 result=cbind(N,MU,SD,MIN,MED,MAX)result
## N MU SD MIN MED MAX ## 0 648 46.29100 17.69054 4.16 45.45 88.58 ## 1 36 41.41778 17.16103 14.03 37.02 74.44
*盒状图
ST_0=which(data3$YST==0)ST_1=which(data3$YST==1)
boxplot(data3$X1ARA[ST_0],data3$X1ARA[ST_1],xlab=“ST Status”,ylab=“ARA”)
boxplot(data3$X2ASSET[ST_0],data3$X2ASSET[ST_1],xlab=“ST Status”,ylab=“ASSET”)
boxplot(data3$X3ATO[ST_0],data3$X3ATO[ST_1],xlab=“ST Status”,ylab=“ATO”)
boxplot(data3$X4ROA[ST_0],data3X4ROA[ST_1],xlab=“ST Status”,ylab=“ROA”)
boxplot(data3$X5GROWTH[ST_0],data3$X5GROWTH[ST_1],xlab=“ST Status”,ylab=“GROWTH”)
boxplot(data3$X6LEV[ST_0],data3$X6LEV[ST_1],xlab=“ST Status”,ylab=“LEV”)
boxplot(data3$X7SHARE[ST_0],data3$X7SHARE[ST_1],xlab=“ST Status”,ylab=“SHARE”)
*逻辑回归
glm3=glm(YST~X1ARA+X2ASSET+X3ATO+X4ROA+X5GROWTH+X6LEV+X7SHARE, family=binomial(link=logit),data=data3)summary(glm3)
## Call:
## glm(formula = YST ~ X1ARA + X2ASSET + X3ATO + X4ROA + X5GROWTH + ## X6LEV + X7SHARE, family = binomial(link = logit), data = data3)## Deviance Residuals:
## Min 1Q Median 3Q Max ##-1.4165-0.3354-0.2536-0.1958 3.0778 ## Coefficients:
## Estimate Std.Error z value Pr(>|z|)##(Intercept)-8.86924 4.63586-1.913 0.05573.## X1ARA 4.87974 1.49245 3.270 0.00108 ** ## X2ASSET 0.24660 0.22409 1.100 0.27115 ## X3ATO-0.50738 0.65744-0.772 0.44026 ## X4ROA-0.63661 6.22354-0.102 0.91853 ## X5GROWTH-0.83335 0.56706-1.470 0.14167 ## X6LEV 2.35415 1.20138 1.960 0.05005.## X7SHARE-0.01111 0.01115-0.997 0.31891
## Signif.codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1##(Dispersion parameter for binomial family taken to be 1)## Null deviance: 282.07 on 683 degrees of freedom ## Residual deviance: 251.51 on 676 degrees of freedom
## AIC: 267.51## Number of Fisher Scoring iterations: 6
*按照WMCR做模型预测以及评估
pred=predict(glm3,data3)
prob=exp(pred)/(1+exp(pred))yhat=1*(prob>0.0526)table(data3$YST,yhat)## yhat
## 0 1 ## 0 463 185 ## 1 11 25
第4章 定序回归
• 手机商务消费者偏好度研究分析
*指标设计
Y偏好程度 X1手机品牌 X2能否拍照
X3能否收看电视 X4有无触摸屏
X5电话本能否多条记录 X6有无MP3 X7游戏数目
data4=read.csv(“F:/1商务统计/案例数据/第4章.csv”,header=T)names(data4)=c(“Y”,“X1”,“X2”,“X3”,“X4”,“X5”,“X6”,“X7”)data4[c(1:3),]
## Y X1 X2 X3 X4 X5 X6 X7 ## 1 3 诺基亚 0 0 0 1 1 3 ## 2 4 诺基亚 1 0 1 0 1 5 ## 3 4 诺基亚 0 1 1 0 0 7
*描述品牌与偏好度的关系
table(data4$Y,data4$X1)
## 波导 摩托罗拉 诺基亚 三星 ## 1 37 24 34 26 ## 2 80 64 53 66 ## 3 98 138 132 133 ## 4 109 108 116 96 ## 5 28 30 35 44
*描述分析其他功能性指标
#均值
MU2=tapply(data4$X2,data4$Y,mean)MU3=tapply(data4$X3,data4$Y,mean)MU4=tapply(data4$X4,data4$Y,mean)MU5=tapply(data4$X5,data4$Y,mean)MU6=tapply(data4$X6,data4$Y,mean)result=cbind(MU2,MU3,MU4,MU5,MU6)result
## MU2 MU3 MU4 MU5 MU6 ## 1 0.4297521 0.4380165 0.4710744 0.2148760 0.5371901 ## 2 0.3840304 0.4334601 0.4296578 0.3878327 0.5019011 ## 3 0.4830339 0.4890220 0.5369261 0.4231537 0.4530938 ## 4 0.5780886 0.5314685 0.5547786 0.6153846 0.5151515 ## 5 0.5766423 0.6350365 0.3795620 0.8540146 0.5985401
*描述分析(游戏数目)
N=tapply(data4$X7,data4$Y,length)#样本量 MU=tapply(data4$X7,data4$Y,mean)#均值 SD=tapply(data4$X7,data4$Y,sd)#标准差 MIN=tapply(data4$X7,data4$Y,min)#最小值 MED=tapply(data4$X7,data4$Y,median)#中位数 MAX=tapply(data4$X7,data4$Y,max)#最大值 result=cbind(N,MU,SD,MIN,MED,MAX)result
## N MU SD MIN MED MAX ## 1 121 5.066116 1.339997 3 5 7 ## 2 263 5.060837 1.512072 3 5 7 ## 3 501 4.904192 1.582025 3 5 7 ## 4 429 5.037296 1.723534 3 5 7 ## 5 137 5.000000 1.940285 3 5 7
*计算因变量频数
table(data4$Y)
## 1 2 3 4 5 ## 121 263 501 429 137
*极大似然估计
library(MASS)
probit4=polr(as.factor(Y)~as.factor(X1)+X2+X3+X4+X5+X6+X7,method=“probit”,Hess=T,data=data4)summary(probit4)
## Call:
## polr(formula = as.factor(Y)~ as.factor(X1)+ X2 + X3 + X4 + ## X5 + X6 + X7, data = data4, Hess = T, method = “probit”)## Coefficients:
## Value Std.Error t value ## as.factor(X1)摩托罗拉 0.28048 0.09608 2.9193 ## as.factor(X1)诺基亚 0.48908 0.08529 5.7342 ## as.factor(X1)三星 0.27652 0.08613 3.2106 ## X2 0.39145 0.05984 6.5419 ## X3 0.31159 0.06188 5.0357 ## X4 0.25499 0.06176 4.1291 ## X5 0.90094 0.06362 14.1606 ## X6 0.20205 0.07563 2.6714 ## X7-0.01373 0.01761-0.7799 ## Intercepts:
## Value Std.Error t value ## 1|2-0.3036 0.1313-2.3125 ## 2|3 0.5214 0.1295 4.0247 ## 3|4 1.5312 0.1331 11.5057 ## 4|5 2.6876 0.1418 18.9589 ## Residual Deviance: 3984.573 ## AIC: 4010.573
*按照MCR做预测 Y.hat=predict(probit4,data4)table(data4$Y,Y.hat)## Y.hat
## 1 2 3 4 5 ## 1 28 0 72 21 0 ## 2 49 0 145 69 0 ## 3 34 0 303 164 0 ## 4 7 0 188 234 0 ## 5 0 0 24 113 0
第5章 泊松回归
• 付费搜索广告数据分析
*指标设计
Y点击量 X1关键词长度 X2展现量 X3平均点击价格 X4平均排名
data5=read.csv(“F:/1商务统计/案例数据/第5章.csv”,header=T)names(data5)=c(“Y”,“X1”,“X2”,“X3”,“X4”)data5[c(1:3),]
## Y X1 X2 X3 X4 ## 1 11 3 761 146.37 2.28 ## 2 1 5 8 105.72 1.00 ## 3 0 5 2 0.00 3.50
*全变量描述分析
N=sapply(data5,length)#样本量 MU=sapply(data5,mean)#均值 SD=sapply(data5,sd)#标准差 MIN=sapply(data5,min)#最小值 MED=sapply(data5,median)#中位数 MAX=sapply(data5,max)#最大值
result=cbind(N,MU,SD,MIN,MED,MAX)result
## N MU SD MIN MED MAX ## Y 200 0.38500 1.472282 0 0 14.00 ## X1 200 6.70500 2.247942 2 7 13.00 ## X2 200 40.17500 200.657673 1 3 2242.00 ## X3 200 6.83445 22.502247 0 0 146.37 ## X4 200 4.53970 4.068050 1 3 26.00 *泊松回归
pos5=glm(Y~X1+X2+X3+X4,family=poisson(),data=data5)summary(pos5)
## Call:
## glm(formula = Y ~ X1 + X2 + X3 + X4, family = poisson(), data = data5)
## Deviance Residuals:
## Min 1Q Median 3Q Max ##-2.0367-0.6888-0.4143-0.2060 6.3874 ## Coefficients:
## Estimate Std.Error z value Pr(>|z|)##(Intercept)1.2785068 0.4085366 3.129 0.00175 ** ## X1-0.3865588 0.0752822-5.135 2.82e-07 *** ## X2 0.0006558 0.0005122 1.280 0.20043 ## X3 0.0179875 0.0026502 6.787 1.14e-11 *** ## X4-0.2010931 0.0889027-2.262 0.02370 *
## Signif.codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1##(Dispersion parameter for poisson family taken to be 1)
## Null deviance: 358.74 on 199 degrees of freedom## Residual deviance: 173.95 on 195 degrees of freedom ## AIC: 259.75
## Number of Fisher Scoring iterations: 6
*预测与评估()
pred=predict(pos5,data5)lam=exp(pred)
RME=abs(data5$Y-lam)/(1+lam)
summary(RME)## Min.1st Qu.Median Mean 3rd Qu.Max.## 0.000632 0.046380 0.137400 0.249300 0.273000 5.471000
第6章 生存数据回归
• 员工离职管理分析
*指标设计
Y工作年限 C是否离职 X1户籍 X2性别 X3年龄
data6=read.csv(“F:/1商务统计/案例数据/第6章.csv”,header=T)names(data6)=c(“X1”,“X2”,“X3”,“Y”,“C”)data6[c(1:3),] ## X1 X2 X3 Y C ## 1 异地 男 25 9 1 ## 2 本地 男 30 24 0 ## 3 异地 女 20 30 1
*KM估计生存函数
library(survival)
## Warning: package 'survival' was built under R version 3.2.3 summary(survfit(Surv(data6$Y,data6$C)~1))
## Call: survfit(formula = Surv(data6.1$Y, data6.1$C)~ 1)
## time n.risk n.event survival std.err lower 95% CI upper 95% CI ## 3 844 84 0.585 0.01367 0.558 0.612 ## 4 760 62 0.537 0.01383 0.510 0.565 ## 5 698 38 0.508 0.01387 0.481 0.536 ## 6 660 38 0.478 0.01385 0.452 0.506 ## 7 621 47 0.442 0.01378 0.416 0.470
*画出生存函数
plot(survfit(Surv(data6$Y,data6$C)~1))
*分户籍描述
plot(survfit(Surv(Y,C)~X1,data=data6),col=c(1,2),lty=c(1,2))
*分性别描述
plot(survfit(Surv(Y,C)~X2,data=data6),col=c(1,2),lty=c(1,2))
*分年龄描述
nX3=floor(data6$X3/10)*10
plot(survfit(Surv(Y,C)~nX3,data=data6),col=c(1,2,3),lty=c(1,2,3))
*加速失效模型
fit6.1=survreg(Surv(Y+1,C)~X1+X2+X3,data=data6)summary(fit6.1)
##
## Call:
## survreg(formula = Surv(Y + 1, C)~ X1 + X2 + X3, data = data6)## Value Std.Error z p ##(Intercept)0.9118 0.2142 4.26 2.08e-05 ## X1异地-0.2967 0.0708-4.19 2.79e-05 ## X2女 0.2762 0.0742 3.72 1.98e-04 ## X3 0.0605 0.0074 8.18 2.82e-16 ## Log(scale)0.0911 0.0254 3.59 3.31e-04 ##
## Scale= 1.1 ##
## Weibull distribution
## Loglik(model)=-3512.4 Loglik(intercept only)=-3566 ## Chisq= 107.23 on 3 degrees of freedom, p= 0 ## Number of Newton-Raphson Iterations: 5 ## n= 1300
*Cox等比例风险模型
fit6.2=coxph(Surv(Y+1,C)~X1+X2+X3,data=data6)summary(fit6.2)## Call:
## coxph(formula = Surv(Y + 1, C)~ X1 + X2 + X3, data = data6)##
## n= 1300, number of events= 1005
## ## coef exp(coef)se(coef)z Pr(>|z|)## X1异地 0.267386 1.306544 0.064635 4.137 3.52e-05 *** ## X2女-0.235347 0.790297 0.067723-3.475 0.000511 *** ## X3-0.051081 0.950202 0.006755-7.562 3.95e-14 ***
##---## Signif.codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1##
## exp(coef)exp(-coef)lower.95 upper.95 ## X1异地 1.3065 0.7654 1.1511 1.4830 ## X2女 0.7903 1.2653 0.6921 0.9025 ## X3 0.9502 1.0524 0.9377 0.9629 ##
## Concordance= 0.616(se = 0.011)## Rsquare= 0.07(max possible= 1)
## Likelihood ratio test= 94.52 on 3 df, p=0 ## Wald test = 90.35 on 3 df, p=0 ## Score(logrank)test = 90.37 on 3 df, p=0 plot(survfit(fit6.1.2))
第二篇:应用统计典型例题
关于矩估计与极大似然估计的典型例题 例1,设总体X 具有分布律
231X~22(1)(1)2
其中01为未知参数。已经取得了样本值x11,x22,x31,试求参数的矩估计与极大似然估计。
解:(i)求矩估计量,列矩方程(只有一个未知参数)
E(X)222(1)3(1)232X 433X3x53 得 矩2226(ii)求极大似然估计,写出似然函数,即样本出现的概率
L()P(X1x1,X2x2,X3x3)
P(X11,X22,X31)
P(X11)P(X22)P(X31)22(1)225(1)
对数似然
lnL()ln25lnln(1)
dlnL()510 d1得极大似然估计为
5ˆ极 6
例2,某种电子元件的寿命(以
h记)X服从双参数指数分布,其概率密度为
1exp[(x)/],xf(x)
0,其他其中,0均为未知参数,自一批这种零件中随机抽取n件进行寿命试验,xx,,xn.设它们的失效时间分别为1,2(1)求(2)求,的最大似然估计量; ,的矩估计量。
n解:(1)似然函数,记样本的联合概率密度为
L(,)f(x1,x2,,xn;,)f(xi)
i1n1exp[(xi)/],x1,x2,,xni1 0,其他n1nexp((xin)/),x(1)i1 0,x(1)在求极大似然估计时,L(,)0肯定不是最大值的似然函数值,不考
n虑这部分,只考虑另一部分。
取另一部分的对数似然函数
lnL(,)nln(xin)/,x(1)
i1
nxinlnL(,)ni102 lnL(,)n0可知关于,的驻点不存在,但能判定单调性
lnL(,)n0知 由lnL(,)nln(xin)/,x(1),i1n关于是增函数,故
ˆ极x(1)lnL(,)n将之代入到xnii1n20中得
ˆ极xx(1)
ˆˆx则极(1),极xx(1)一定能使得似然函数达到最大,故,的极大似然估计为
ˆ极xx(1) ˆx极(1)
(2)列矩方程组(两个未知参数)
1E(X)xexp[(x)/]dxXn2112222E(X)xexp[(x)/]dx()Xini1解出
n12ˆ(XX)矩ini11nˆ2X(XX)i矩ni1 例3,设总体X~U[0,],其中0为未知参数,X1,X2,,Xn为来自总体X的一组简单随机样本,12大似然估计。
解:似然函数,即样本的联合概率密度
nx,x,,xn为样本观察值,求未知参数的极
1n,0x1,x2,,xnL()f(x1,x2,,xn;)f(xi) i10,elseL()0肯定不是最大值,考虑另一部分的最大值,取对数似然
lnL()nln,x(n)
dlnL()n0 d知lnL()nln在x(n)内是单调递减的,故的极大似然估计值为
取x(n)能使得似然函数达到最大,则ˆx,极大似然估计量为ˆX (n)(n)极极
第三篇:网站如何添加客服统计代码
本文由秀瘦网提供http://www.xiexiebang.com/
首先登入:http://www.xiexiebang.com/
登入后进后台
一般只要设置 账号管理、样式设置、获取代码。
1、样式我们是这样的
本文由秀瘦网提供http://www.xiexiebang.com/
2、账号设置
进入编辑是这样的
本文由秀瘦网提供http://www.xiexiebang.com/
3.最后就是复制代码
获取这代码后 黏贴到后台的统计代码就可以的我们一tugogo的为例
这样就OK 完工了,还有补充点: 代码加到后台后 要是在http://www.54kefu.net/设置您的账号样式这些的,会自动更新过来的。
第四篇:高考数学复习概率统计典型例题
高考数学复习概率统计典型例题
例1 下列命题:
(1)3,3,4,4,5,5,5的众数是5;
(2)3,3,4,4,5,5,5的中位数是4.5;
(3)频率分布直方图中每一个小长方形的面积等于该组的频率;
(4)频率分布表中各小组的频数之和等于1
以上各题中正确命题的个数是 [ ].
A.1个 B.2个 C.3个 D.4个
分析:回忆统计初步中众数、中位数、频数、频率等概念,认真分析每个命题的真假.
解:(1)数据3,3,4,4,5,5,5中5出现次数最多3次,5是众数,是真命题.
(2)数据3,3,4,4,5,5,5有七个数据,中间数据是4不是4.5,是假命题.
(3)由频率分布直方图中的结构知,是真命题.
(4)频率分布表中各小组的频数之和是这组数据的个数而不是1,是假命题.
所以正确命题的个数是2个,应选B.
例2 选择题:
(1)甲、乙两个样本,甲的样本方差是0.4,乙的样本方差是0.2,那么 [ ]
A.甲的波动比乙的波动大;
B.乙的波动比甲的波动大;
C.甲、乙的波动大小一样;
D.甲、乙的波动大小关系不能确定.
(2)在频率直方图中,每个小长方形的面积等于 [ ]
A.组距 B.组数
C.每小组的频数 D.每小组的频率
分析:用样本方差来衡量一个样本波动大小,样本方差越大说明样本的波动越大.
用心 爱心 专心
122号编辑
解:(1)∵0.4>0.2,∴甲的波动比乙的波动大,选A.
例3 为了了解中年人在科技队伍中的比例,对某科研单位全体科技人员的年龄进行登记,结果如下(单位:岁)
44,40,31,38,43,45,56,45,46,42,55,41,44,46,52,39,46,47,36,50,47,54,50,39,30,48,48,52,39,46,44,41,49,53,64,49,49,61,48,47,59,55,51,67,60,56,65,59,45,28.
列出样本的频率分布表,绘出频率分布直方图.
解:按五个步骤进行:
(1)求数据最大值和最小值:
已知数据的最大值是67,最小值是28
∴最大值与最小值之差为67-28=39
(2)求组距与组数:
组距为5(岁),分为8组.
(3)决定分点
(4)列频分布表
用心 爱心 专心
122号编辑
(5)绘频率分布直方图:
例4 某校抽检64名学生的体重如下(单位:千克).
列出样本的频率分布表,绘出频率分布直方图.
分析:对这组数据进行适当整理,一步步按规定步骤进行.
解:(1)计算最大值与最小值的差:48-29=19(千克)
(2)决定组距与组数
样本容量是64,最大值与最小值的差是19千克,如果取组距为2千克,19÷2=9.5,分10组比较合适.
(3)决定分点,使分点比数据多取一位小数,第一组起点数定为28.5,其它分点见下表.
(4)列频率分布表.
用心 爱心 专心
122号编辑
(5)画频率分布直方图(见图3-1)
说明:
长方形的高与频数成正比,如果设频数为1的小长方形的高为h,频数为4时,相应的小长方形的高就应该是4h.
例5 有一个容量为60的样本,(60名学生的数学考试成绩),分组情况如下表:
(1)填出表中所剩的空格;
(2)画出频率分布直方图.
分析:
用心 爱心 专心
122号编辑
各组频数之和为60
各组频率之和为1
解:
因为各小组频率之和=1
所以第4小组频率=1-0.05-0.1-0.2-0.3=0.35
所以第4小组频数=0.35×60=第5小组频数=0.3×60=18
(2)
例6 某班学生一次数学考试成绩的频率分布直方图,其中纵轴表示学生数,观察图形,回答:
(1)全班有多少学生?
用心 爱心 专心
122号编辑
(2)此次考试平均成绩大概是多少?
(3)不及格的人数有多少?占全班多大比例?
(4)如果80分以上的成绩算优良,那么这个班的优良率是多少?
分析:根据直方图的表示意义认真分析求解.
解:(1)29~39分1人,39~49分2人,49~59分3人,59~69分8人,69~79分10人,79~89分14人,89~99分6人.
共计 1+2+3+8+10+14+6=44(人)
(2)取中间值计算
(3)前三个小组中有1+2+3=6人不及格占全班比例为13.6%.
(4)优良的人数为14+6=20,20÷44=45.5%.
即优良率为45.5%.
说明:频率分布表比较确切,但直方图比较直观,这里给出了直方图,从图也可以估计出一些数量的近似值,要学会认识图形.
例7 回答下列问题:
用心 爱心 专心
122号编辑
总是成立吗?
(2)一组数据据的方差一定是正数吗?
总是成立吗?
(4)为什么全部频率的累积等于1?
解:(1)证明恒等式的办法之一,是变形,从较繁的一边变到较简单的一边.这
可见,总是成立.
顺水推舟,我们用类似的方法证明(3);注意
那么有
(2)对任一组数x1,x2,„,xn,方差
这是因为自然数n>0,而若干个实数的平方和为非负,那么S2是有可对等于0的
从而x1=x2=„=xn,就是说,除了由完全相同的数构成的数组以外,任何数组的方差定为正数.
用心 爱心 专心
122号编辑
(4)设一个数组或样本的容量为n,共分为m个组,其频数分别为a1,a2,„,am,按规定,有
a1+a2+„+am=n,而各组的频率分别a1/n,a2/n,„,am/n,因此,有
说明:在同一个问题里,我们处理了同一组数据x1,„,xn有关的两个数组f1,f2,„,fk和a1,a2,„,am,前者是说:在这组数中,不同的只有k个,而每个出现的次数分别为f1,„,fk;后者则说明这组数所占的整个范围被分成了m个等长的区间,出现在各个区间中的xi的个数分别为a1,„,am,可见,a1,„,an是f1,„fk的推广,而前面说过的众数,不过是其fi最大的那个数.
弄清研究数组x1,„,xn的有关数和概念间的联系与区别,是很重要的.
例8 回答下列问题:
(1)什么是总体?个体?样本?有哪些抽样方法?
(2)反映样本(或数据)数量水平的标志值有哪几个?意义是什么?怎样求?
(3)反映样本(或数据)波动(偏差)大小的标志值有哪几个?怎样求?有什么区别?
(4)反映样本(或数据)分布规律的数量指标和几何对象是什么?获得的一般步骤是什么?
解:这是一组概念题,我们简略回答:
(1)在统计学里,把要考查对象的全体叫做总体;其中每个考查对象叫个体;从总体中抽出的一部分个体叫做总体的一个样本;样本中个体的数目,叫做样本的容量.
应指出的是,这里的个体,是指反映某事物性质的数量指标,也就是数据,而不是事物本身,因此,总体的样本,也都是数的集合.
抽样方法通常有三种:随机抽样、系统抽样和分层抽样三种,基本原则是:力求排除主观因素的影响,使样本具有较强的代表性.
(2)反映样本(或数据)数量水平或集中趋势的标志值有三个,即平均数、众数和中位数.
有时写成代换形式;
用心 爱心 专心
122号编辑
有时写成加权平均的形式:
其中,又有总体平均数(总体中所有个体的平均数)和样本平均数(样本中所有个体的平均数)两种,通常,我们是用样本平均数去估计总体平均数.且一般说来,样本容量越大,对总体的估计也就越精确.
(ii)众数,就是在一组数据中,出现次数最多的数.通常采用爬山法或计票画“正”法去寻找.(爬山法是:看第一个数出现次数,再看第二、三、„„有出现次数比它多的,有,则“爬到”这个数,再往后看„„).
(iii)中位数是当把数据按大小顺序排列时,居于中间位置的一个数或两个数的平均,它与数据的排列顺序有关.
此外,还有去尾平均(去掉一个最高和一个最低的,然后平均)、总和等,也能反映总体水平.
(3)反映样本(数据)偏差或波动大小的标志值有两个:
(ii)标准差:一组数据方差的平方根:
标准差有两个优点,一是其度量单位与原数据一致;二是缓解S2过大或过小的现象.方差也可用代换式简化计算:
(4)反映数据分布规律的是频率分布和它的直方图,一般步骤是:
(i)计算极差=最大数-最小数;
用心 爱心 专心
122号编辑
(iii)决定分点(可用比数据多一位小数的办法);
(v)画频率分布直方图.
其中,分布表比较确切,直方图比较直观.
说明:此例很“大”,但是必要的,因为,当前大多数的中考题,很重视基本内容的表述,通过“填空”和“选择”加以考查,我们要予以扎实.而更为重要的,这些概念和方法,正是通过偶然认识必然,通过无序把握有序,通过部分估计整体的统计思想在数学中的实现.
用心 爱心 专心
122号编辑
第五篇:商务统计与经济计量系2009报告
商务统计与经济计量系2009报告
商务统计与经济计量系 2009报告 Department of Business Statistics and Econometrics,2009 Annual Report
北京大学光华管理学院
Guanghua School of Management,Peking University
商务统计与经济计量系2009报告
目录
1.系主任致辞.................................................3 2.师资团队.....................................................3 3.系内新闻.....................................................3 4.出版论文.....................................................4 5.项目资金.....................................................6 6.研讨会.........................................................6 7.参加会议.....................................................7 8.研究生.........................................................7
a)b)
毕业生..................................................................................7 在读研究生..........................................................................8
商务统计与经济计量系2009报告
1.系主任致辞
2.师资团队
陈良焜,教授 陈奇志,讲师 陈松蹊,教授兼系主任 范培华,教授 胡健颖,教授
金赛男,副教授(on leave)苏良军,副教授(on leave)徐敏亚,讲师
王汉生,副教授兼副系主任 王明进,教授 张俊妮,副教授
特聘教授
刁锦寰,北京大学荣誉教授 陈嵘,特聘教授 陈晓红,特聘教授 姚琦伟,特聘教授
3.系内新闻
1.英国伦敦经济与政治科学学院统计学教授姚琦伟接受我院邀请继续我系特聘教授职位。
2.Rutgers University教授陈嵘接受我院邀请继续我系特聘教授职位。
3.陈松蹊教授同时当选为数理统计学会(IMS)资深会员(Fellow)及美国统计学会(ASA)
商务统计与经济计量系2009报告
会士。
4.国际顾问小组成立。普林斯顿大学金融学教授范剑青和芝加哥大学商学院经济计量与统计教授Reuy Tsay担任联合主席。成员分别是:香港中文大学统计学教授、系主任N.H.Chan,墨尔本大学统计学教授、ARC Federation Fellow, Peter Hall和柏林洪堡大学统计与经济计量教授Wolfgang Haerdle。
5.讲师陈奇志辞职。
6.陈松蹊教授将成为统计年鉴副主编,统计年鉴是世界顶尖的统计学学术刊物,他的任期将于2010年开始,为期三年。
7.王汉生老师荣获教育部高等学校科学研究优秀成果奖(人文社科类)统计学一等奖(教社科证字(2009)第038号)。
8.张俊妮老师出版教材“数据挖掘与应用“。
4.出版论文
Chen, Songxi and Wang, D.(2009)Empirical Likelihood for Estimating Equation with Missing Values.The Annals of Statistics, 37, 490-517.Chen, Songxi and Chiu Min Wong(2009)Smoothed Block Empirical Likelihood for Quantiles of Weakly Dependent Processes.Statistica Sinica, 19, 71-82.Chen, Songxi and Wang, D.(2009)Combining quantitative trait loci analyses and microarray data, an empirical likelihood approach.Computational Statistics and Data Analysis, 53, 1661-1673.Chen, Songxi and C.Yong Tang(2009)Parameter estimation and bias correction of diffusion processes.Journal of Econometrics, 149, 65—81.Chen, Songxi, L.Peng and Y-L, Qin(2009)Effects of Dimensionality on empirical likelihood.Biometrika, 96, 711–722.Chen, Songxi and I.Van Keilegom(2009)Empirical Likelihood Test for a Class of Regression Models, Bernoulli, 15, 955-976.Chen, Songxi, Chan, N-H, Peng, L.and C.L.Yu(2009)Empirical Likelihood Methods Based on Characteristic Functions with Applications to Levy Processes.Journal of the American Statistical Association, 104, 1621-1630.Chen, Songxi and I.Van Keilegom(2009)A review on empirical likelihood for regressions(with discussions), Test, 3, 415-447.商务统计与经济计量系2009报告
黄达、王汉生(2009)“GARCH模型估计方法选择及对上证指数的应用”,《数理统计与管理》.罗荣华、王汉生、胡新杰、江明华、(2009)“基于高维0-1变量的EM 算法在移动通信客户细分中的应用”,《数理统计与管理》,第28卷 第2期,第264-269页。Luo, Ronghua, Wang, Hansheng, and Tsai, C.L.(2009)Contour projected dimension reduction.The Annals of Statistics, 37, 3743--3778.Xu, Minya, Arthur Cohen, and H.B.Sackrowitz(2009)A new multiple testing method in the dependent case.The Annals of Statistics, 37, 1518-1544.Wang, Hansheng(2009)Forward regression for ultra-high dimensional variable screening.Journal of the American Statistical Association, 104, 1512--1524.Wang, Hansheng, Li, B., and Leng, C.(2009)Shrinkage tuning parameter selection with a diverging number of parameters.Journal of Royal Statistical Society, Series B, 71, 671-683.Wang, Hansheng and Leng, C.(2009)On general adaptive sparse principal component analysis.Journal of Computational and Graphical Statistics, 18, 201-215.Wang, Hansheng(2009)Rank reducible varying coefficient model.Journal of Statistical Planning and Inference, 139, 999-1011.Wang, Hansheng, Su, X., Tsai, C.L., Nickerson, D.M., and Li, B.(2009)Subgroup analysis via recursive partitioning.Journal of Machine Learning Research, 10, 141-158.Wang, Hansheng and Xia, Y.(2009)Shrinkage estimation of the varying coefficient model.Journal of the American Statistical Association, 104, 747--757.Wang, Hansheng and Tsai, C.L.(2009)Tail index regression.Journal of the American Statistical Association, 104, 1233--1240.Wang, Hansheng and Tsai, C.L.(2009)A discussion on “model selection for generalized linear models with factor-augmented predictors”.Applied Stochastic Models for Business and Industry.25, 241-242.Wang, Mingjin, Penzer Jeremy, Yao Qiwei,(2009), Approxiamating volatilities by Asymmetric Power GARCH Functions, Australian & New Zealand Journal of Statistics, 51(2), 201-225.Wang, Mingjin, and Yue Changjun.(2009).The Comparison of Personal Education return: A Semi-Parametric Method.Statistical Research, 26(6), 51-59.Zhang,Junni, Rubin, D.B., Mealli F.(2009).Lilelihood-based Analysis of Causal Effects via Principal Stratification: New Apporoach to Evaluating Job-Training Programs.Journal of the
商务统计与经济计量系2009报告
American Statistical Association, 104,485.Zhang, Junni.(2009)Pricing of Non-performing Assets.Proceeding of the 57th Session of the International Statistical Institute.Zhang, Junni.(2009)Data Mining and Its Application.Peking University.5.项目资金
陈松蹊.China-US Exchange Grant in Mathematical Sciences,国家科学基金.陈松蹊.连续时间随机过程的统计推断, 国家科学基金: DMS-0604563
王明进 “基于数据降维的多元波动率模型”(项目批准号:70671002)
6.研讨会
演讲人 单位和演讲题目
时间
Jing, Bingyi
香港中文大学
2009.1.6 跳-扩散过程中的方差分析
Huang, Meng 加州大学圣地亚哥分校
2009.2.17
条件独立情况下的一个弹性检验
Yu, Ping
威斯康辛大学麦迪逊分校
2009.2.17
门限回归中的参数有效估计
李莹莹
普林斯顿大学
2009.2.18
波动率估计的稳健性
Vankeilegom, 比利时鲁汶大学
2009.2.23 Ingrid 半参数模型和回归中分散函数的估计
Roth, David WPP欧洲总裁
2009.3.4
在零售中价值对品牌和顾客而言的本质
王汉生
光华管理学院
2009.3.9
极端金融数据分析的回归模型
陈松蹊
光华管理学院
2009.3.23 高维数据中两个样本集的检验及其在基因组检验中的应用
商务统计与经济计量系2009报告
王启华
严加安
安鸿志
Parr, Bill
何书元
童行伟
黄卓
中国科学研究院数学与系统科学研究院
缺失协方差数据中的伪半经验似然 中国科学研究院数学与系统科学研究院
Markowitz策略修正
中国科学研究院数学与系统科学研究院
“红学”中的数学思考
中欧商学院
中国的6-Sigma: 现状和对未来的展望
2009.3.20
2009.4.6
2009.4.16
2009.4.27 北京大学数学科学学院概率统计系
点击排名: 让网民为网页的重要性投票 北京师范大学
截断数据中的不同系数的比例优势模型
2009.5.11
2009.6.17 李辰旭
斯坦福大学
2009.12.14 已实现的GARCH: 收益率和以实现的波动率测量的联合模型
哥伦比亚大学
2009.12.23 控制波动率风险: 金融衍生品的创新,模型和实现
7.参加会议
陈松蹊, Using Option Prices to enhance estimation efficiency for underlying financial dynamics, at a session Financial Econometrics, Joint Statistical Meeting 2009, Washington DC.张俊妮.金融统计与金融计量国际研讨会,西南财经大学统计学院.张俊妮.The 57th Session of the International Statistical Institute, 南非统计局
8.研究生
a)毕业生 博士生
名字
黄达
毕业去向和论文题目
指导老师
姚琦伟
芝加哥大学
GARCH模型估计选择与两种高维数据模型选择法
商务统计与经济计量系2009报告
罗荣华
西南财经大学
王汉生
硕士生
名字
黄思思
黄卓妍
任盼盼
万钊
张琼
毕业去向和论文题目
指导老师
王汉生 中国农业银行
股价波动性的极差估计量在中国股票市场的实证研究 泰康资产管理公司
基于VaR理论评价多元波动率模型 北京市统计局
我国房地产价格影响因素分析 中国工商银行
动态CAPM模型的估计和比较
王明进
王明进
王明进
威斯康辛大学麦迪逊分校
BIC准则的选择相合性在判别分析中的讨论
王汉生
b)在读研究生 博士生
名字
2004级 2009级 孙便霞
刘威仪
硕士生
名字
柴俊
刘侠璐 潘蕊 邱宇谋 赵昕馨 周李超 常晋源 兰伟 马盈盈 汪帆
2007级
2008级
2008级
2008级
2008级
2008级
2009级
2009级
2009级
2009级