第一篇:多元统计分析实验报告
多元统计分析得实验报告 院系:数学系 班级:13级 B 班 姓名:陈翔 学号:20131611233 实验目得:比较三大行业得优劣性 实验过程 有如下得内容:(1)正态性检验;(2)主体间因子,多变量检验 a;(3)主体间效应得检验;(4)对比结果(K 矩阵);
(5)多变量检验结果;
(6)单变量检验结果;
(7)协方差矩阵等同性得 Box 检验a,误差方差等同性得 Levene 检验 a;
(8)估计;
(9)成对比较,多变量检验;(10)单变量检验。
实验结果:综上所述,我们对三个行业得运营能力进行了具体得比较分析,所得数据表明,从总体来瞧,信息技术业要稍好于电力、煤气及水得生产与供应业以及房地产业。
1。
正态性检验
Kolmogorov-Smirnova
Shapir o—Wilk 统计量 df Sig.统计量 df Sig、净资产收益率。113 35、200*
。978 35。677 总资产报酬率。121 35、200*
。964 35、298 资产负债率。086 35。200*
.962 35、265 总资产周转率.180 35、006。864 35。000 流动资产周转率、164 35、018.885 35、002 已获利息倍数、281 35.000。551 35、000 销售增长率.103 35、200*
。949 35、104 资本积累率。251 35。000、655 35。000 *。
这就是真实显著水平得下限。
a。
Lilliefors 显著水平修正 此表给出了对每一个变量进行正态性检验得结果,因为该例中样本中n=35<2000,所以此处选用 Shapiro—Wilk 统计量。由 Sig。值可以瞧到,总资产周转率、流动资产周转率、已获利息倍数及资本积累率均明显不遵从正态分布,因此,在下面得分析中,我们只对净资产收益率、总资产报酬率、资产负债率及销售增长率这四个指标进行比较,并认为这四个变量组成得向量遵从正态分布(尽管事实上并非如此)。这四个指标涉及公司得获利能力、资本结构及成长能力,我们认为这四个指标可以对公司运营能力做出近似得度量。
2.
主体间因子
N 行业 电力、煤气及水得生产与供应业 11 房地行业 15 信息技术业 9 多变量检验a a
效应 值 F 假设 df 误差 df Sig。
截距 Pillai 得跟踪.967 209。405b
4。000 29。000。000 Wilks 得 Lambda、033 209。405b
4.000 29、000、000 Hotelling 得跟踪 28.883 209、405b
4.000 29。000.000 Roy 得最大根 28。883 209。405b
4.000 29.000、000 行业 Pillai 得跟踪、481 2、373 8、000 60、000、027 Wilks 得 Lambda、563 2.411b
8、000 58。000.025 Hotelling 得跟踪.698 2。443 8.000 56、000.024 Roy 得最大根、559 4、193c
4、000 30、000。008
a、设计 : 截距 + 行业 b、精确统计量 c、该统计量就是 F 得上限,它产生了一个关于显著性级别得下限。
上面第一张表就是样本数据分别来自三个行业得个数。第二张表就是多变量检验表,该表给出了几个统计量,由Sig。值可以瞧到,无论从哪个统计量来瞧,三个行业得运营能力(从净资产收益率、总资产报酬率、资产负债率及销售增长率这四个指标得整体来瞧)都就是有显著差别得。
3.主体间效应得检验 源 因变量 III 型平方与 df 均方 F Sig。
校正模型 净资产收益率 306、300a153。150 4。000、028 总资产报酬率 69.464b34、732 3、320.049 资产负债率 302。366c151。183、680。514 销售增长率 2904.588d1452。294 2、154.133 截距 净资产收益率 615.338 1 615.338 16。073.000 总资产报酬率 218、016 1 218。016 20。841。000 资产负债率 105315。459 1 105315。459 473、833、000 销售增长率 1.497 1 1。497.002。963 行业 净资产收益率 306、300 2 153.150 4.000。028 总资产报酬率 69、464 2 34.732 3、320、049 资产负债率 302。366 2 151。183。680.514 销售增长率 2904.588 2 1452、294 2.154、133 误差 净资产收益率 1225、054 32 38、283
总资产报酬率 334。753 32 10、461
资产负债率 7112、406 32 222.263
销售增长率 21579、511 32 674、360
总计 净资产收益率 2238、216 35
总资产报酬率 641.598 35
资产负债率 117585、075 35
销售增长率 24585、045 35
校正得总计 净资产收益率 1531。354 34
总资产报酬率 404.217 34
资产负债率 7414。772 34
销售增长率 24484。099 34
a、R 方 =。200(调整 R 方 =、150)b.R 方 =.172(调整 R 方 =、120)c.R 方 =、041(调整 R 方 = -.019)d。
R 方 =。119(调整 R 方 =、064)此表给出了每个财务指标得分析结果,同时给出了每个财务指标得方差来源,包括
校正模型、截距、主效应(行业)、误差及总得方差来源,还给出了自由度、均方、F统计量及Sig。值 4、对比结果((K 矩阵))行业 简单对比a
因变量 净资产收益率 总资产报酬率 资产负债率 销售增长率 级别 1 与级别 3 对比估算值 -5、649 —3、070 7。259 -13、223 假设值 0 0 0 0 差分(估计-假设)—5。649 -3.070 7.259-13。223 标准 误差 2、781 1.454 6、701 11、672 Sig、。051.043、287。266 差分得 95% 置信区间 下限-11。313-6。031 -6、390 -36、998 上限。016-、109 20。908 10、552 级别 2 与级别 3 对比估算值 1、054 —、057 1。791 -22。696 假设值 0 0 0 0 差分(估计-假设)1、054 —。057 1、791-22。696 标准 误差 2、609 1、364 6.286 10。949 Sig、、689。967.778.046 差分得 95% 置信区间 下限-4.260 -2.834 -11.013 -44。999 上限 6。368 2、721 14、595-.394 a、参考类别 = 3 此表表示,在0.05得显著水平下,第一行业(电力、煤气及水得生产与供应业)与第三行业(信息技术业)得总资产报酬率指标存在显著差别,净资产收益率、资产负债率与销售增长率等财务指标无明显差别,但由第一栏可以瞧到,电力、煤气及水得生产与供应业得净资产收益率、总资产报酬率与销售增长率均低于信息技术业,资产负债率高于信息技术业,似乎说明信息技术业作为新兴行业,其成长能力要更高一些。第二行业(房地产业)与第三行业得销售增长率指标有明显得差别,第三行业大于第二行业,说明信息技术业得获利能力高于房地产业。净资产收益率、总资产报酬率与资产负债率等财务指标没有显著差别。
5、多变量检验结果
值 F 假设 df 误差 df Sig、Pillai 得跟踪、481 2。373 8。000 60。000、027 Wilks 得 lambda、563 2、411a
8.000 58。000.025 Hotelling 得跟踪.698 2、443 8。000 56.000。024 Roy 得最大根。559 4。193b
4。000 30.000.008
a。
精确统计量 b、该统计量就是 F 得上限,它产生了一个关于显著性级别得下限。
此表就是上面多重比较可信性得度量,由Sig、值可以瞧到,比较检验就是可信得。
6。
单变量检验结果 源 因变量平方与 df 均方 F Sig.对比 净资产收益率 306.300 2 153。150 4。000、028 总资产报酬率 69、464 2 34、732 3。320.049 资产负债率 302。366 2 151.183。680、514 销售增长率 2904。588 2 1452。294 2、154.133 误差 净资产收益率 1225。054 32 38.283
总资产报酬率 334。753 32 10、461
资产负债率 7112.406 32 222、263
销售增长率 21579。511 32 674、360
此表就是对每一个指标在三个行业比较得结果、7。
协方差矩阵等同性得
B Box
检验a a
Box 得 M 29.207 F 1。172 df1 20 df2 2585。573 Sig、、269 检验零假设,即观测到得因变量得协方差矩阵在所有组中均相等、a.设计 : 截距 + 行业 误差方差等同性得
Lev en e 检验a a
F df1 df2 Sig。
净资产收益率、500 2 32、611 总资产报酬率 1.759 2 32。188 资产负债率 4。537 2 32、018 销售增长率 1、739 2 32、192 检验零假设,即在所有组中因变量得误差方差均相等。
a。
设计 : 截距 + 行业 上面第一张表就是协方差阵相等得检验,检验统计量就是Box“s M,由Sig.值可以认为三个行业(总体)得协方差阵就是相等得、第二张表给出了各行业误差平方相等得检验,在0、05得显著性水平下,净资产收益率、总资产报酬率以及销售增长
率得误差平方在三个行业间没有显著差别。这似乎说明,除了行业因素,对资产负债率有显著影响得还有其她因素。这与此处均值比较没有太大得关系。
8。
估计 因变量 行业 均值 标准 误差 95% 置信区间 下限 上限 净资产收益率 电力、煤气及水得生产与供应业、169 1、866 —3、631 3、969 房地行业 6、871 1.598 3。617 10、125 信息技术业 5。818 2、062 1、617 10.019 总资产报酬率 电力、煤气及水得生产与供应业、524.975 —1、463 2、510 房地行业 3。537。835 1.836 5.238 信息技术业 3。593 1.078 1.397 5、789 资产负债率 电力、煤气及水得生产与供应业 60、315 4、495 51、158 69.471 房地行业 54.847 3.849 47、006 62.688 信息技术业 53。056 4.969 42。933 63.178 销售增长率 电力、煤气及水得生产与供应业-1.038 7.830-16.987 14.911 房地行业-10.512 6。705 -24。170 3、146 信息技术业 12、184 8.656 —5.448 29.816 此表给出了每一行业各财务指标描述统计量得估计、9、成对比较 因变量(I)行业(J)行业 均值差值(I-J)标准 误差 Sig.b
差分得 95% 置信区间b
下限 上限 净资产收益率 电力、煤气及水得生产与供应业 房地行业 —6.702*
2。456。010 —11、705-1、699 信息技术业 —5.649 2。781。051 —11、313。016 房地行业 电力、煤气及水得生产与供应业 6、702*
2。456。010 1.699 11.705 信息技术业 1、054 2。609。689 —4.260 6。368 信息技术业 电力、煤气及水得生产与供应业 5.649 2、781。051 —.016 11。313 房地行业-1.054 2。609、689 —6。368 4。260
总资产报酬率 电力、煤气及水得生产与供应业 房地行业 -3、013*
1、284 。025 —5.628-.398 信息技术业-3.070*
1、454 。043 —6、031 -、109 房地行业 电力、煤气及水得生产与供应业 3。013*
1、284 。025.398 5、628 信息技术业 —。057 1、364。967 —2、834 2.721 信息技术业 电力、煤气及水得生产与供应业 3、070*
1。454.043.109 6。031 房地行业。057 1.364、967 —2、721 2。834 资产负债率 电力、煤气及水得生产与供应业 房地行业 5.468 5。918、362-6、587 17。523 信息技术业 7、259 6、701.287-6、390 20.908 房地行业 电力、煤气及水得生产与供应业-5。468 5、918。362-17。523 6。587 信息技术业 1。791 6.286。778-11。013 14、595 信息技术业 电力、煤气及水得生产与供应业 -7、259 6.701.287-20.908 6。390 房地行业-1。791 6。286、778-14、595 11。013 销售增长率 电力、煤气及水得生产与供应业 房地行业 9。474 10.308、365 —11.524 30。471 信息技术业-13。223 11、672、266 —36、998 10、552 房地行业 电力、煤气及水得生产与供应业 -9。474 10、308、365-30、471 11.524 信息技术业 —22、696*
10、949 。046 -44、999 -。394 信息技术业 电力、煤气及水得生产与供应业 13。223 11、672、266 —10。552 36.998 房地行业 22。696*
10。949。046、394 44、999 基于估算边际均值 *、均值差值在。05 级别上较显著、b。
对多个比较得调整: 最不显著差别(相当于未作调整)。
多变量检验
值 F 假设 df 误差 df Sig、Pillai 得跟踪、481 2.373 8.000 60.000。027 Wilks 得 lambda.563 2、411a
8、000 58、000.025
Hotelling 得跟踪。698 2、443 8、000 56、000.024 Roy 得最大根。559 4。193b
4、000 30。000、008 每个 F 检验 行业 得多变量效应、这些检验基于估算边际均值间得线性独立成对比较。
a.精确统计量 b、该统计量就是 F 得上限,它产生了一个关于显著性级别得下限。
此两张表给出了不同行业各财务指标得比较与检验及检验得可信性统计量。
10.单变量检验 因变量平方与 df 均方 F Sig。
净资产收益率 对比 306。300 2 153。150 4、000。028 误差 1225、054 32 38、283
总资产报酬率 对比 69、464 2 34.732 3。320。049 误差 334。753 32 10、461
资产负债率 对比 302.366 2 151、183。680。514 误差 7112.406 32 222.263
销售增长率 对比 2904、588 2 1452。294 2、154。133 误差 21579、511 32 674.360
F 检验 行业 得效应、该检验基于估算边际均值间得线性独立成对比较。
此表也就是对三个行业中各财务指标相等得假设得检验,可以瞧到在0.05得显著性水平下,净资产收益率与总资产报酬率在三个行业中有明显得差别。
综上所述,我们对三个行业得运营能力进行了具体得比较分析,所得数据表明,从总体来瞧,信息技术业要稍好于电力、煤气及水得生产与供应业以及房地产业。
第二篇:多元统计分析实验报告格式
多元统计分析实验报告
姓名及学号:(例:张三20110000000)日期:
1、实验内容
2、实验目的(。。指出通过本实验要了解或掌握什么)
3、实验方案分析
(。。指出实验内容属于什么问题,说明用什么方法来实验,如果是检验问题,那么原假设是什么)
4、操作过程
(。。给出有关操作过程)
5、实验结果
(。。给出实验得到的重要结果)
6、讨论
(。。对上述得到的结果做出说明与讨论)
7、结论
(。。根据以上的讨论给出恰当的结论)
第三篇:多元统计分析思考题
《多元统计分析思考题》
第一章 回归分析
1、回归分析是怎样的一种统计方法,用来解决什么问题?
2、线性回归模型中线性关系指的是什么变量之间的关系?自变量与因变量之间一定是线性关系形式才能做线性回归吗?为什么?
3、实际应用中,如何设定回归方程的形式?
4、多元线性回归理论模型中,每个系数(偏回归系数)的含义是什么?
5、经验回归模型中,参数是如何确定的?有哪些评判参数估计的统计标准?最小二乘估计两有哪些统计性质?要想获得理想的参数估计值,需要注意一些什么问题?
6、理论回归模型中的随机误差项的实际意义是什么?为什么要在回归模型中加入随机误差项?建立回归模型时,对随机误差项作了哪些假定?这些假定的实际意义是什么?
7、建立自变量与因变量的回归模型,是否意味着他们之间存在因果关系?为什么?
8、回归分析中,为什么要作假设检验?检验依据的统计原理是什么?检验的过程是怎样的?
9、回归诊断可以大致确定哪些问题?回归分析有哪些基本假定?如果实际应用中不满足这些假定,将可能引起怎样的后果?如何检验实际应用问题是否满足这些假定?对于各种不满足假定的情形,分别采用哪些改进方法?
10、回归分析中的R2有何意义?它能用来衡量模型优劣吗?
11、如何确定回归分析中变量之间的交互作用?存在交互作用时,偏回归系数的意义与不存在交互作用的情形下是否相同?为什么?
12、有哪些确定最优回归模型的准则?如何选择回归变量?
13、在怎样的情况下需要建立标准化的回归模型?标准化回归模型与非标准化模型有何关系?形式有否不同?
14、利用回归方法解决实际问题的大致步骤是怎样的?
15、你能够利用哪些软件实现进行回归分析?能否解释全部的软件输出结果?
第二章 判别分析
1、判别分析的目的是什么?
2、有哪些常用的判别分析方法?这些方法的基本原理或步骤是怎样的?它们各有什么特点或优劣之处?
3、判别分析与回归分析有何异同之处?
4、判别分析对变量与样本规模有何要求?
5、如何度量判别效果?有哪些影响判别效果的因素?
6、逐步判别是如何选择判别变量的?基本思想或步骤是什么?
7、判别分析有哪些现实应用?举例说明。
第三章 聚类分析
1、聚类分析的目的是什么?与判别分析有何异同?这种方法有哪些局限或欠缺?
2、有哪些常用的聚类统计量?
3、系统(谱系)聚类法的基本思想是怎样的?它包含哪些具体方法?
4、聚类分析对变量与样本规模有何要求?有哪些因素影响分类效果?要想减少不利因素的影响,可以采取哪些改进方法?
5、实际应用问题,如何确定分类数目?
6、快速聚类法(K—均值法)的基本思想或步骤是怎样的?
7、有序样品的最优分别法的基本思想或步骤是怎样的?
8、应用聚类分析解决实际问题的基本步骤是怎样的?应该注意哪些方面的问题?
第四章 主成分分析与典型相关分析
1、主成分分析的基本思想是什么?在低维情况下,如何利用几何图形解释主成分的意义?
2、什么是主成分的贡献率与累计贡献率?实际应用时,如何确定主成分的个数?
3、主成分有哪些基本性质?
4、对于任何情形的多个变量,都可以采取主成分方法降维吗?为什么?
5、怎样的情况下需要计算标准化的主成分?
6、主成分有哪些应用?
7、如何解释主成分的实际含义?
8、典型相关分析的基本思想是什么?有何实际用途?
9、典型相关分析与回归分析、判别分析、主成分分析、因子分析有何关联?试比较这些方法的异同之处。
10、典型相关分析有哪些基本假定?
11、如何解释典型相关函数的实际意义?
12、典型相关方法中冗余度分析的意义是什么?
第五章 因子分析与对应分析
1、因子分析是怎样的一种统计方法?它的基本目的和用途是什么?
2、因子分子中的KMO统计量与巴特莱特球形性检验的目的是什么?
3、因子分析有哪些类型?它们有何区别?Q型因子分析与聚类分析有何异同?
4、因子分析中的变量类型是怎样的?因子分析对变量数目有没有要求?对样本规模有没有要求?
5、因子分析有怎样的基本假定?对样本特点(或性质)有何要求?
6、因子分析模型中,因子载荷、变量共同度、方差贡献等统计量的统计意义是什么?
7、因子分析与主成分分析有何区别与联系?它们分别适用于怎样的情况?
8、如何确定公共因子数目?如何解释公共因子的实际意义?
9、怎样的情况下,需要作因子旋转?
10、有哪些估计因子得分的方法?因子得分的估计是普通意义下的参数估计吗?为什么?
11、对应分析的基本思想或原理是什么?试举例说明它的应用。
12、对应分析中总惯量的意义是什么?
第四篇:多元统计分析选择题
选择题 下面哪一项不是判别分析的方法(C)
A.距离判别 B.贝叶斯判别 C.协方差阵判别 D.费歇判别 2 式子cov(AX,BY)=(C)
A.cov(X,Y)B B.cov(X,Y)C.Acov(X,Y)D.Acov(X,Y)B 3 如果正态随机向量X=(1,2,……)的各分量是相互独立的随机变量,那么随机变量X的协方差阵是(B)。A.零矩阵 B.对角阵 C.对称阵 D.单位阵 4 利用主成分分析得到的各个主成分之间(D)
A.相互独立 B.线性相关 C.不完全相关 D.互不相关 5 典型相关分析是研究(B)变量之间相关关系的多元统计方法。
A.一组 B.两组 C.大于两组 D.大于一组 6 典型相关分析的步骤不包括(C)
A.设计典型相关分析 B.确定典型相关分析的目标 C.给出典型相关分析方案 D.验证模型 7 对数线性模型中表示两个因素的交互效应,此模型为非饱和模型的条件是(C)
A.>0 B.<0 C.=0 D.=1 8 贝叶斯判别法中的判别规则所带来的平均损失ECM达到(D)
A.0 B.1 C.一定数值 D.最小 9 一个p维变量的函数f(∙)能作为中某个随机向量的分布函数,当且仅当(B)
A.f x <0 B.f x >0 C.>0 D.<0 10 马氏距离不需要符合下面哪一条基本公理(A)
A.d x,y ≤0 B.d x,y =d(y,x)C.d x,y ≤d x,z +d(z,y)D.d x,y =0,当且仅当x=y。
第五篇:《多元统计分析》习题
《多元统计分析》习题分为三部分:思考题、验证题
和论文题
思 考 题
绪论
1﹑什么是多元统计分析?
2﹑多元统计分析能解决哪些类型的实际问题?
聚类分析
1﹑简述系统聚类法的基本思路。2﹑写出样品间相关系数公式。
3﹑常用的距离及相似系数有哪些 ?它们各有什么特点? 4﹑利用谱系图分类应注意哪些问题?
5﹑在SAS和SPSS中如何实现系统聚类分析?
判别分析
1﹑简述距离判别法的基本思路,图示其几何意义。2﹑判别分析与聚类分析有何异同? 3﹑简述贝叶斯判别的基本思路。4﹑简述费歇判别的基本思路。5﹑简述逐步判别法的基本思想。
6﹑在SAS和SPSS软件中如何实现判别分析?
主成分分析
1﹑主成分分析的几何意义是什么? 2﹑主成分分析的主要作用有那些?
3﹑什么是贡献率和累计贡献率,其意义何在?
4﹑为什么说贡献率和累计贡献率能反映主成分中所包含的原始变量的信息? 5﹑为什么要用标准化数据去估计V的特征向量与特征值? 6﹑证明:对于标准化数据有S=R。
7﹑主成分分析在SAS和SPSS中如何实现?
因子分析
1﹑因子得分模型与主成分分析模型有何不同? 2﹑因子载荷阵的统计意义是什么? 3﹑方差旋转的目的是什么? 4﹑因子分析有何作用?
5﹑因子模型与回归模型有何不同?
6﹑在SAS和SPSS中如何实现因子分析?
对应分析
1﹑简述对应分析的基本思想。2﹑简述对应分析的基本原理。
3﹑简述因子分析中Q型与R 型的对应关系。4﹑对应分析如何在SAS和SPSS中实现?
典型相关分析
1﹑典型相关分析适合分析何种类型的数据? 2﹑简述典型相关分析的基本思想。3﹑典型变量有哪些性质?
4﹑典型相关系数和典型变量有何意义? 5﹑典型相关分析有何作用? ﹑在SAS和SPSS中如何实现典型相关分析?
验 证 题
聚类分析
1、为了更深入了解我国人口的文化程度,现利用1990年全国人口普查数据对全国30个省、直辖市、自治区进行聚类分析。分析选用了三个指标:(1)大学以上文化程度的人口占全部人口的比例(DXBZ);(2)初中文化程度的人都占全部人口的比例(CZBZ);(3)文盲半文盲人口占全部人口的比例(WMBZ),分别用来反映较高、中等、较低文化程度人口的状况。计算样品之间的相似系数,使用最长距离法、重心法和Ward法,将上机结果按样品号画出聚类图,并根据聚类图将30个样品分为四类。
2、根据信息基础设施的发展状况,对世界20个国家和地区进行分类。只要采用6个指标:(1)Call—每千人拥有电话线数,(2)movecall—每千户居民蜂窝移动电话数,(3)fee—高峰时期每三分钟国际电话的成本,(4)Computer—每千人拥有的计算机数,(5)mips—每千人中计算机功率(每秒百万指令),(6)net—每千人互联网络户主数。计算样本之间的距离采用欧式距离,用最长距离法、重心法、离差平方和法进行计算。
3、按照城乡居民消费水平,对我国30个省市自治区分类。
判别分析
1、从1995年世界各国人文发展指数的排序中,选取高发展水平、中等发展水平的国家各五个作为两组样本,另选四个国家作为待判样品做距离判别分析。
2、对全国30个省市自治区1994年影响各地区经济增长差异的制度变量: —经济增长率(%)、—非国有化水平(%)、—开放度(%)、—市场化程度(%)作判别分析。
3、为了解全国各地职工生活费用上涨水平,对29个省市自治区九项指标作判别分析。
主成分分析
1、对全国30个省市自治区经济发展基本情况的八项指标作主成分分析。
2、对30个省市自治区工业企业经济效益作综合评价。
3、对我国城市居民生活费支出作主成分分析。
因子分析
1、利用1995年的数据对我国社会发展状况进行综合考察。
2、对我国30个省市自治区的农业生产情况作因子分析。从农业生产条件和生产结果济效益出发,选取六项指标分别为: —乡村劳动力人口(万人),—人均经营耕地面积(亩),—户均生产性固定资产原值(元),—家庭基本纯收入(元),—人均农业总产值(千元/人),—增加值占总产值比重(%)。
3、对1979-1988年中国人民银行资金来源的10项指标作因子分析。
对应分析
1、用对应分析研究我国部分省份的农村居民家庭人均消费支出结构。选取7个变量: —食品支出比重,—衣着支出比重,—居住支出比重,—家庭设备及服务支出比重,—医疗保健支出比重,—交通和通讯支出比重,—文教娱乐、用品及服务支出比重。样品为10个:山西、内蒙古、辽宁、吉林、黑龙江、海南、四川、贵州、甘肃、青海。
2、对全国31个省市自治区按各种经济类型资产占总资产比重(%),利用1997年数据作对应分析。选取6个变量: —国有经济/总资产,—集体经济/总资产,—联营经济/总资产,—股份制经济/总资产,—外商投资经济/总资产,—港澳台经济/总资产
3、用对应分析研究1991年全国各地区独立核算工业企业的经济效益情况。
典型相关分析
1、对某高中一年级男生38人进行体力测试(共有七项指标)及运动能力测试(共有五项指标),试对两组指标作典型相关分析。体力测试指标: —反复横向跳(次),—纵跳(cm),—背力(kg),—握力(kg),—台阶试验(指数),—立定体前屈(cm),—俯卧上体后仰(cm)。运动能力测试的指标为:
—50米跑(秒),—跳远(cm),—投球(m),—引体向上(次),—耐力跑(秒)。
2、全国30个省市自治区农村居民收入和支出的典型相关分析。反映农村居民收入的变量取4个: —劳动者报酬(元),—家庭经营收入(元),—转移性收入(元),—财产性收入(元)。反映农村居民生活费支出的变量取8个: —食品支出(元),—衣着支出(元),—居住支出(元),—家庭设备及服务支出(元),—医疗保健支出(元),—交通和通讯支出(元),—文教、娱乐用品及服务支出(元),—其它商品及服务支出(元)。
3、社会经济综合发展水平与邮电发展状况的典型相关分析。
论 文 题
通过论文题,可以让学生掌握如何在图书馆查阅数据,录入数据,并根据论文要求对数据进行预处理,使学生了解各分析方法适合解决的问题类型,能够运用所学的多元统计分析方法解决实际数据分析问题。
1、自拟题目,论文中的数据处理方法至少选用对应分析、典型相关分析中的一种。
2、自拟题目,论文中的数据处理方法至少选用主成分分析、因子分析中的一种。
3、自拟题目,论文中的数据处理方法至少选用聚类分析、判别分析中的一种。