第一篇:典型相关分析的SAS实现
典型相关分析的SAS实现
data ex20_1(type=corr);input _name_$3.x1 x2 y1-y4;_type_='corr';cards;x1 1.0 0.8491 0.5106 0.2497 0.5285 0.3019 x2 0.8491 1.0 0.8062 0.5438 0.7887 0.6064 y1 0.5106 0.8062 1.0 0.7833 0.9284 0.8364 y2 0.2497 0.5438 0.7833 1.0 0.6457 0.9051 y3 0.5285 0.7887 0.9284 0.6457 1.0 0.7097 y4 0.3019 0.6064 0.8364 0.9051 0.7097 1.0;proc cancorr edf=102;var x1 x2;with y1-y4;run;
data ex20_2(type=corr);input _name_$ x1-x9 y1-y5;_type_='corr';cards;x1 1-0.027 0.052 0.037 0.003 0.009-0.030 0.014 0.020 0.034 0.071 0.054-0.022 0.012 x2-0.027 1-0.065-0.057-0.016 0.014 0.053-0.080-0.067-0.023 0.019 0.046-0.034 0.012 x3 0.052-0.065 1 0.772 0.018 0.042-0.094 0.279 0.163 0.221 0.093-0.030 0.040-0.118 x4 0.037-0.057 0.772 1 0.003 0.044-0.080 0.098 0.040 0.224 0.116-0.013-0.013-0.096 x5 0.003-0.016 0.018 0.003 1-0.017-0.030 0.019 0.025-0.044-0.021 0.002-0.019 0.002 x6 0.009 0.014 0.042 0.044-0.017 1-0.020 0.009-0.018 0.032 0.047 0.009-0.037-0.015 x7-0.030 0.053-0.094-0.080-0.030-0.020 1-0.057 0.013 0.009-0.032 0.089 0.027 0.014 x8 0.014-0.080 0.279 0.098 0.019 0.009-0.057 1 0.447-0.018-0.036-0.031 0.156-0.041 x9 0.020-0.067 0.163 0.040 0.025-0.018 0.013 0.447 1-0.063-0.017-0.027 0.117-0.019 y1 0.034-0.023 0.221 0.224-0.044 0.032 0.009-0.018-0.063 1 0.156-0.070-0.070-0.116
y2 0.071 0.019 0.093 0.116-0.021 0.047-0.032-0.036-0.017 0.156 1-0.039-0.046-0.052 y3 0.054 0.046-0.030-0.013 0.002 0.009 0.089-0.031-0.027-0.070-0.039 1 0.001 0.013 y4-0.022-0.034 0.040-0.013-0.019-0.037 0.027 0.156 0.117-0.070-0.046 0.001 1-0.019 y5 0.012 0.012-0.118-0.096 0.002-0.015 0.014-0.041-0.019-0.116-0.052 0.013-0.019 1;proc cancorr data=ex20_2 edf=1494 red;var x1-x9;with y1-y5;run;
data ex21_1;input group num;do i=1 to num;input value@@;output;end;cards;1 25 6.5 13.5 12.8 6.2 13.9 14.7 9.5 9.0 6.9 16.8 13.3 10.8 12.2 14.9 13.7 12.8 5.3 11.8 12.4 7.6 13.3 11.9 11.2 12.3 12.7 0 20 8.5 6.4 4.6 1.7 9.7 5.3 4.9 5.7 3.8 6.5 6.3 5.4 3.3 4.7 8.6 6.3 5.9 4.8 4.5 5.2;proc logistic descending;model group=value/scale=none outroc=roc1;run;proc print;run;proc gplot;plot _SENSIT_*_1MSPEC_;run;
第二篇:SAS如何实现典型相关分析
SAS实现典型相关分析
data ex20_1(type=corr);input _name_$3.x1 x2 y1-y4;_type_='corr';cards;x1 1.0 0.8491 0.5106 0.2497 0.5285 0.3019 x2 0.8491 1.0 0.8062 0.5438 0.7887 0.6064 y1 0.5106 0.8062 1.0 0.7833 0.9284 0.8364 y2 0.2497 0.5438 0.7833 1.0 0.6457 0.9051 y3 0.5285 0.7887 0.9284 0.6457 1.0 0.7097 y4 0.3019 0.6064 0.8364 0.9051 0.7097 1.0;proc cancorr edf=102;var x1 x2;with y1-y4;run;
data ex20_2(type=corr);input _name_$ x1-x9 y1-y5;_type_='corr';cards;x1 1-0.027 0.052 0.037 0.003 0.009-0.030 0.014 0.020 0.034 0.071 0.054-0.022 0.012 x2-0.027 1-0.065-0.057-0.016 0.014 0.053-0.080-0.067-0.023 0.019 0.046-0.034 0.012 x3 0.052-0.065 1 0.772 0.018 0.042-0.094 0.279 0.163 0.221 0.093-0.030 0.040-0.118 x4 0.037-0.057 0.772 1 0.003 0.044-0.080 0.098 0.040 0.224 0.116-0.013-0.013-0.096 x5 0.003-0.016 0.018 0.003 1-0.017-0.030 0.019 0.025-0.044-0.021 0.002-0.019 0.002 x6 0.009 0.014 0.042 0.044-0.017 1-0.020 0.009-0.018 0.032 0.047 0.009-0.037-0.015 x7-0.030 0.053-0.094-0.080-0.030-0.020 1-0.057 0.013 0.009-0.032 0.089 0.027 0.014 x8 0.014-0.080 0.279 0.098 0.019 0.009-0.057 1 0.447-0.018-0.036-0.031 0.156-0.041 x9 0.020-0.067 0.163 0.040 0.025-0.018 0.013 0.447 1-0.063-0.017-0.027 0.117-0.019 y1 0.034-0.023 0.221 0.224-0.044 0.032 0.009-0.018-0.063 1 0.156-0.070-0.070-0.116
y2 0.071 0.019 0.093 0.116-0.021 0.047-0.032-0.036-0.017 0.156 1-0.039-0.046-0.052 y3 0.054 0.046-0.030-0.013 0.002 0.009 0.089-0.031-0.027-0.070-0.039 1 0.001 0.013 y4-0.022-0.034 0.040-0.013-0.019-0.037 0.027 0.156 0.117-0.070-0.046 0.001 1-0.019 y5 0.012 0.012-0.118-0.096 0.002-0.015 0.014-0.041-0.019-0.116-0.052 0.013-0.019 1;proc cancorr data=ex20_2 edf=1494 red;var x1-x9;with y1-y5;run;
data ex21_1;input group num;do i=1 to num;input value@@;output;end;cards;1 25 6.5 13.5 12.8 6.2 13.9 14.7 9.5 9.0 6.9 16.8 13.3 10.8 12.2 14.9 13.7 12.8 5.3 11.8 12.4 7.6 13.3 11.9 11.2 12.3 12.7 0 20 8.5 6.4 4.6 1.7 9.7 5.3 4.9 5.7 3.8 6.5 6.3 5.4 3.3 4.7 8.6 6.3 5.9 4.8 4.5 5.2;proc logistic descending;model group=value/scale=none outroc=roc1;run;proc print;run;proc gplot;plot _SENSIT_*_1MSPEC_;run;
第三篇:典型相关分析SAS代码
data fit;input X1 X2 X3 X4 X5 Y1 Y2 Y3;cards;14651000 3446 98.8 2094.51 104.2 2555.14 2637.67 179.76 13985000 3339 113.8 2305.2233 133.8 2462.45 2670.99 161.74 15162900 3093 108.9 2494.6668 93.8 2831.87 3015.04 186 14275800 3084 99.6 2770.48 99.8 2957.2 2259.86 210.3 13966000 3040 101.6 3224.05 142.4 2767.25 2169.47 206.16 13947000 2978 112.4086 3690.34 123.8 2935 2307 218.36 14632000 2952 102.5 3980.44 79.1 3119.91 2332.38 232.33 14123200 2761 106.2 4543.41 97.9 3230.04 2344.04 241.53 14299300 2703 107.3469 5231.33 143.2 3195.12 2411.98 239.79 14849000 2644 111.3 6007.5498 90.8 3342.09 2466.6 252.5 15218000 2604 103.8 6790.899 97.2 3456.7 2471.53 261.34 15344000 2567 99 7565 95.7 3518 2360.31 266.29 run;ods rtf file='F:结果.doc';proccancorr data=fit all vprefix=YING vname='yingxiang' wprefix=CHAN wname='shengchan';var X1 X2 X3 X4 X5;with Y1 Y2 Y3;run;ods rtf close;
第四篇:SAS复习资料
SAS复习资料 2013.6.20
说明:根据老师给的Html版整理,如有错误、遗漏敬请原谅,并及时指出,进行改正。谢谢!
1.研究因子:对试验指标有影响的,在试验中需要加以考察的条件。2.小机率原理:概率很小的事件,在一次试验中是不至于发生的。3.重复:每个参试的品种或处理占有两个或两个以上的小区称有重复。
4.局部控制:通过对小区的合理安排,把试验误差控制在一个局部的范围内。5.试验指标:试验中用来衡量试验效果的量。
6.复因子试验:包含两个或两个以上的因子的试验。7.集团(总体):根据研究目的确定的,凡符合指定条件的全部观察对象。8.偶然误差(机误):由于机会不等所造成的偏差。9.可量资料:能够以测量、称量的方法表示的资料。10.正交互作用(正连应):某些因子综合起来的效果大于这些因子单独作用的效果之和。1.进行随机区组的统计分析,需用何种方差分析?:双方面分类的方差分析 2.进行拉丁方的统计分析,需用何种方差分析?:三方面分类的方差分析 3.进行双方面分类的方差分析,总平方和分解为多少部份?:三部分 4.进行三方面分类的方差分析,总平方和分解为多少部份?:四部分
5.两因素(含交互作用)的方差分析,处理组合平方和应分解为多少部份?:四部分 6.三因素(含一级交互作用)的方差分析,处理组合平方和应分解为多少部份?:七部分 7.在几种常用的试验设计方法中,哪种精确度较高?:拉丁方 8.随机区组设计的误差自由度等于多少?:(m1)9.拉丁方设计的误差自由度等于多少?:(n2)10.只有重复而末实行局部控制的试验,应采用何种方差分析?:单方面分类的方差分析 1.样本标准差的功用?:反映样本的变异程度
2.样本平均数标准差(标准误)的功用?:反映在同一个总体进行抽样,所得的样本平均数间的差异,即抽样误差。
3.变异系数的功用?:用作两类事物的变异程度作比较
4.样本平均数的功用?:指示资料的中心位置,反映资料的一般质量水平,作为代表值同其它资料比较
5.协方差分析的功用?:用处理前的数据(基数)矫正处理后的数据,提高分析的精确度。6.样本均数差异显著性测验的功用?:在一定的概率保证下,判断事物间有否本质差异 7.总体均数区间估计的功用?:通过抽样,由样本的情况估计未知总体平均数的数值范围 8.在试验设计中,局部控制的作用?:减少试验误差
9.在试验设计中,重复的作用?:减少试验误差,估计试验误差,扩大试验的代表性 10.在试验设计中,随机排列的功用?:正确估计试验误差 1.何谓试验指标?:在试验中用来衡量试验效果的一个量
2.什么叫保护行?:防止试验材料受外来因素和周边环境影响作物行
3.某个复因子试验的处理组合数应如何计算?:等于有关因子的水平数乘积 4.在常用的试验设计中,哪种设计方法的精确度最高?:拉丁方 5.在常用的试验设计中,哪种设计方法的精确度最低?:间比法 6.试验设计三大原则是什么?:重复,局部控制,随机排列
7.作改良对比法设计时,参试的品种或处理数一般不大于多少?:不受限制 8.作随机区组设计时,参试的品种或处理数一般不大于多少?:不大于18 9.作配对法设计时,参试的品种或处理数一般不大于多少?:两个
10.作拉丁方设计时,参试的品种或处理数一般不大于多少?:不大于8 1.某个因子的自由度等于多少?:等于该因子的水平数减1 2.某两因子试验中,其交互作用的自由度等于多少?:等于有关因子的自由度的乘积
3.一可量资料样本均数与总体均数差异显箸性进行t检验时,其自由度为多少?:等于样本含量数-1 4.正交表的总自由度等于多少?:等于参试的处理组合数-1 5.作回归关系显著性测验时,回归项的自由度等于多少?:等于自变量的个数 6.作简单相关系数显著性测验时,DF等于多少?:等于N-2 7.2*2联卡平方测验时,DF等于多少?:1 8.两个配对法设计的可量资料样本均数差异显箸性进行t检验,其自由度为多少?:试验资料的配对数-1 9.2*J联卡平方测验时,其自由度为多少?:J-1 10.作拉丁方设计时,参试的品种或处理数一般不大于多少?:2 1.SS:平方和 2.N(0,1):标准正态分布 3.μ:总体平均数
4.CLM:平均数的置信区间 5.∑X :总和
6.VIF:方差膨胀因子 7.MSE:误差均方 8.DF :自由度 9.CV:变异系数 10.V:方差
1.欲进行聚类统计分析,需调用SAS系统的何种过程?:Proc cluster 2.欲进行回归统计分析,需调用SAS系统的何种过程?:Proc reg 3.欲进行方差统计分析,需调用SAS系统的何种过程?:Proc anova 4.欲进行因子统计分析,需调用SAS系统的何种过程?:Proc factor 5.欲进行典型相关统计分析,需调用SAS系统的何种过程?:Proc cancorr 6.欲进行基本统计量统计分析,需调用SAS系统的何种过程?:Proc means 7.欲进行主成分分析,需调用SAS系统的何种过程?:Proc princomp 8.欲进行成组法T测验,需调用SAS系统的何种过程?:Proc ttest 9.欲进行正态分布检验,需调用SAS系统的何种过程?:Procunivariate 10.欲进行作相关点式图,需调用SAS系统的何种过程?:Proc plot 1.单因子随机区组的方差分析模型(MODEL)是:Y=BLOCK T 2.单因子随机区组协方差分析的模型是(MODEL):Y=BLOCK T X 3.三元线性回归分析的模型是(MODEL):Y=X1 X2 X3 4.单方面分类的方差分析模型(MODEL)是:Y=T
5.两个因子变量的反应面分析的模型(MODEL)是:Y=X1 X2
6.单因子随机区组的多元方差分析的模型(MODEL)是:X1 X2 X3 =BLOCK T 7.3*4 复因子试验的方差分析模型(MODEL)是:Y=BLOCK A B A*B 8.拉丁方设计的方差分析模型(MODEL)是:Y=A B T 9.3*2*3复因子试验的方差分析模型(MODEL)是:Y=BLOCK A B C A*B A*C B*C A*B*C 10.正交随机区组(不考查交互作用)的统计分析模型(MODEL)是:Y=BLOCK A B C D 1.协方差分析的功用?:用处理前的数据(基数)矫正处理后的数据,提高分析的精确度 2.主成分分析的功用?:将个数众多、相互有关联的变量,转化为少数几个相互独立的变量 3.聚类分析的功用?:把样本或变量进行分类分
4.典型相关系数的功用?:反映两组不同性质的变量之间的关系密切程度 5.样本平均数的功用?:反映资料的一般质量水平,指示资料的中心位置 6.样本平均数标准差(标准误)的功用?:估计抽样误差
7.在回归分析中,残差的作用:反映实测值与预测值之间的偏差程度 8.在试验设计中,局部控制的作用?:减少试验误差 9.在试验设计中,重复的作用?:估计试验误差
10.变异系数的功用:用于两组资料的变异程度作比较
1.多重比较的方法有很多种,课本介绍了其中的三种: 第一种、最小显著差数法(Least Significant difference---LSD法或t测验法)第二种、Q测验法(最高显著差数法═Tukey测验法)
第三种、新复极差法(Shortest Significant Range---SSR法或Duncan法)哪种测验法的精确度较高?TUKEY法
2.不服从正态分布的数据不能直接作方差分析,必须进行数据转换,数据转换常用的方法有:(1)、平方根代换(2)、对数代换(3)、反正弦代换
问如果数据为二项分布的百分率,即可数百分数,且大于70%或小于30%,应采用何种代换?反正弦代换
3.计算步骤为:
第一步、将数据进行标准化; 第二步,求相关矩阵;
第三步,求相关矩阵的特征根、特征向量、各特征根的方差贡献率和累计方差贡献。第四步,根据特征根的累计方差贡献率保留前几个公共因子。
第五步,用前几个特征根的平方根乘相应的特征向量,构成因子载荷阵; 第六步,求相关系数矩阵的逆阵;
第七步,用因子载荷阵与相关矩阵的逆阵相乘,得回归系数阵; 第八步,用回归系数与标准化数据相乘得因子得分值。问这是何种统计分析方法?因子分析
4.计算步骤为:
第一步,将数据进行中心化; 第二步,求方差协方差矩阵; 第三步,求方差协方差矩阵的特征根、特征向量、各特征根的方差贡献率和累计方差贡献率。第四步,根据特征根的累计方差贡献率保留前几个主成分。
第五步,用中心化数据与前三个特征向量相乘,求得前三个主成分得分。
第六步,如果觉得有必要,用前三个特征根的平方根(即前几个主成分的标准差,)除前几个主成分得分值,得标准化主成分得分。第七步,如果有必要的话,利用这些标准化主成分得分作进一步的分析。问这是何种统计分析方法?主成分分析
5.计算步骤为:
第一步,计算X、Y、X*Y项的各种平方和(X为基数,Y为处理后的实测值;
第二步,进行X与Y项的回归关系显著性测验,若相关不显著,则进行一般的方差分析; 第三步,若相关显著,则扣除回归关系后,再进行方差分析; 第四步,用回归系数矫正处理后的数据测验,再进行多重比较。问这是何种统计分析方法?协方差分析
6.计算步骤为:
第一步,计算出k个类别的方差协方差矩阵的逆阵。
第二步,计算出各个训练样本到这k个类别的马氏距离,比较这k个距离,把训练样本归到距离最短的类中。
第三步,计算在第二步中判别错误的样本数占总样本数的百分率。第四步,如果还有新的待判样本,计算各个新样本到这k个类别的马氏距离,比较k个距离,把各个新样本归到距离最短的类中,再计算在待判样本中判别错误的样本数占待判样本总数的百分率。
问这是何种统计分析方法?判别分析
7.计算步骤为:
第一步,计算出Y的矫正数及各种平方和(Y为处理后的实测值)。第二步,列方差分析表并进行F测验。第三步,若F测验显著则进行多重比较。第四步,写出统计结论。
问这是何种统计分析方法?一元方差分析
8.计算步骤为:
第一步,按一定的原则选择k个凝聚点;
第二步,将所有事例点归到最靠近它的凝聚点所代表的类中,得到k个初始分类;
第三步,按最近距离的原则对初始分类进行修改;反复进行,直至分类合理为止。问这是何种统计分析方法?动态聚类
9.计算步骤为:
第一步,将原始数据进行中心化,按研究目的分为两组,记变量数(m1)较少的那组为X1,记变量数(m2)较多的那组为X2。
第二步,求X1和X2的方差协方差矩阵S11、S12和S22以及S12的转置阵S21,并利用它们构成非对称的方阵。
第三步,求非对称的方阵的特征根和对应的特征向量。
第四步,将这些特征向量除以非对称的方阵的特征根的平方根转换为第一组的典型系数。第五步,利用两个典型系数的关系式求出另一组的典型系数。第六步,将中心化数据和典型系数相乘得典型相关系数。问这是何种统计分析方法?典型相关分析 10.用SAS系统作数据分析,首要的问题是如何排列数据,你熟悉SAS系统对各种统计分析方法的数据排列的要求吗?问单因子试验采用随机区组设计,有四个试验指标时,数据应排多少列?。6列
:平方和
乘积和
合并样本百分数
样本标准差
样本平均数标准差
两样本百分数之差的总体标准差
两样本平均数之差的样本标准差
总体标准差
样本变异系数
样本差数平均数标准差
可量资料大样本均数与总体均数差异显箸性测验
可量资料两大样本均数差异显箸性测验 可数资料样本百分数与总体百分数差异显箸性测验
可数资料两大样本百分数差异显箸性测验
可量资料小样本均数与总体均数差异显箸性测验
可量资料两小样本均数差异显箸性测验(配对法)
可量资料两小样本均数差异显箸性测验(成组法)
由可量资料大样本对总体均数进行估计
由可量资料小样本对总体均数进行估计
由可数资料大样本百分数对总体百分数进行估计
第五篇:典型相关分析
典型相关分析
在SPSS中可以有两种方法来拟合典型相关分析,第一种是采用Manova过程来拟合,第二种是采用专门提供的宏程序来拟合,第二种方法在使用上非常简单,而输出的结果又非常详细,因此这里只对他进行介绍。该程序名为Canonical correlation.sps,就放在SPSS的安装路径之中,调用方式如下: 文件——新建——语法
INCLUDE ' C:Program FilesSPSSIncPASWStatistics18SamplesEnglishCanonical correlation.sps'.CANCORR SET1=体重 腰围 脉搏 /SET2=单杠 仰卧起坐 跳高.1.Correlations for Set-1 Correlations for Set-2 首先给出的是两组变量内部各自的相关矩阵,可见生理指标之间具有相关性、训练指标之间也有相关性。
2.Correlations Between Set-1 and Set-2 接着给出的是两组变量间各变量的两两相关矩阵,可见生理指标与训练指标之间确实存在相关性。
3.Canonical Correlations 提取典型相关系数的大小,可见第一典型相关系数为0.796
4.Test that remaining correlations are zero 检验各典型相关系数有无统计学意义,可见第一典型相关系数有统计学意义,第二第三典型相关系数没有统计学意义。
5.Standardized Canonical Coefficients for Set-1 Raw Canonical Coefficients for Set-1 各典型变量与变量组1中各变量间标化与未标化的系数列表,由此我们可以写出典型变量的转换公式(标化的):U1=0.775x1-1.579x2+0.059x3
6.各典型变量与变量组2中各变量间标化与未标化的系数列表,同理可以写出典型变量的转换公式:V1=0.349y1+1.054y2-0.716y3
7.各典型变量与原变量之间相关系数。
U与x之间相关系数
V与x之间相关系数
V与y之间相关系数
U与y之间相关系数