第一篇:典型相关分析习题1设标准化变量X=X1X2TY=Y1Y2T的相关
典型相关分析习题
TT1、设标准化变量X=(X1,X2),Y=(Y1,Y2)的相关系数矩阵为
11,||1,||1,011试计算X,Y的典型相关变量与典型相关系数。
2、设样本的相关系数矩阵为
0.5050.5690.60210.50510.4220.4670.5690.42210.9260.6020.4670.9261(1)、计算其典型相关系数与典型相关变量。(2)、检验其典型相关变量的相关性。
3、CRM(Customer Relationship Management)即客户关系管理案例,有三组变量,分别是公司规模变量两个(资本额,销售额),六个CRM实施程度变量(WEB网站,电子邮件,客服中心,DM 快讯广告Direct mail缩写,无线上网,简讯服务),三个CRM绩效维度(行销绩效,销售绩效,服务绩效)。试对三组变量做典型相关分析。
4、俱乐部分别对20名中年人测量了3个生理指标:体重x1,腰围x2,脉搏x3和3个训练指标:引体向上次数y1,起坐次数y2,跳跃次数y3。试分析生理指标与训练指标的相关性。具体数据见下表:
5、下表列举了25个家庭的成年长子和次子的头长和头宽。利用典型相关分析法分析长子和次子头型的典型相关性。
长子头长
191 195 181 183 176 208 189 197 188 192 179 183 X1 长子头宽155 149 148 153 144 157 150 159 152 150 158 147 X2 次子头长Y1 179 201 185 188 171 192 190 189 197 187 186 174 次子头宽Y2 145 152 149 149 143 152 149 152 159 151 148 147
6、测量15名受试者的身体形态以及健康情况指标,如下表。第一组是身体形态变量,有年龄、体重、胸围和日抽烟量;第二组是健康状况变量,有脉搏、收缩压和舒张压。要求测量身体形态以及健康状况这两组变量之间的关系。
年龄
X1 体重X2 抽烟量X3 胸围X4 脉搏Y1 收缩压Y2 舒张压Y3 25 26 28 29 27 32 年龄125 131 128 126 126 118 体重30 25 35 40 45 20 抽烟量83.5 82.9 88.1 88.4 80.6 88.4 70 72 75 78 73 70 脉搏Y1 130 135 140 140 138 130 收缩压Y2 85 80 90 92 85 80 舒张压Y3 X1 X2 X3 胸围X4 31 34 36 38 41 46 47 48 45 120 124 128 124 135 143 141 139 140 18 25 25 23 40 45 48 50 55 87.8 84.6 88.0 85.6 86.3 84.8 87.9 81.6 88.0 68 70 75 72 76 80 82 85 88 135 135 140 145 148 145 148 150 160 75 75 80 86 88 90 92 95 95
第二篇:多元变量典型相关分析的分类:最小二乘配方、扩展和分析.
多元变量典型相关分析的分类:最小二乘配方、扩展和分析
摘要——典型相关分析(CCA)是一种寻找两个多维变量之间相关性的著名的技术。它是一项把两组变量化到一个低维空间中并且使他们之间的相关性最大的工作。CCA通常在两组变量分别的是来源于数据和类标签上申请监督降维。众所周知,CCA可以制定作为在二进制类案件中的一个最小二乘问题。然而,扩展到更一般的变量尚不清楚。在本文中,我们表明,在倾向于保持高维数据的温和条件,CCA在多元变量的情况下可以制定作为一个最小二乘问题。在此基础上等价关系,高效的算法求解最小二乘问题可以应用于非常大的数据集规模CCA问题。此外,我们提出几个CCA扩展,包括基于1规范正规化的稀疏CCA方程式。我们进一步扩展最小二乘方程式为偏最小二乘法。此外,我们表明,投影,让一群CCA变量是独立的,正则化在另组多维变量,提供新的见解的影响CCA的正规化。我们使用基准数据集进行了实验。实验数据集确认建立了等价关系。结果也证明了CCA扩展的有效性和效率的提议。
关键字——典型相关分析、最小二乘法、多元变量学习,偏最小二乘法、正规化。引言
典型相关分析(CCA)[1]是一个众所周知的寻找两套多维变量之间的相关性的技术。它使用两个视图相同的组对象和项目到一个与他们最相关的低维空间中去。CCA已经成功应用在各种应用中[2]、[3]。一个流行的使用CCA是监督式学习,它其中一个观点是来源于数据并且其他的观点来源于类标签。在这种背景,数据可以用标签信息定向的被投影到一个低维空间。这样的一个方程式在对多元变量进行降维的情况下是非常的吸引人的。
多元线性回归(多元)即最小平方和成本函数是一种专门研究回归问题的技术。它还可以被应用于通过定义一个合适的类指标矩阵的分类问题[5],[6]。多元的解决方案基于最小二乘法通过求解一个线性方程组来获得。一个数量的算法包括共轭梯度算法,可以应用到它有效地解决[7]。此外,最小二乘方程式可以很容易使用正则化技术进行扩展。例如,1规范可以被纳入正规化最小二乘方程式来控制模型复杂性和提高稀疏[8]。稀疏常常会导致容易解释和良好的泛化能力。它已经被成功地应用在几个算法中,包括主成分分析[9]和支持向量机[10]。
与最小二乘法相比,CCA涉及广义特征值问题,它解决时,计算更加费时[11]。此外,它是具有挑战性的,因为它获得稀疏CCA时涉及到一个困难稀疏的广义特征值问题。凸松弛的稀疏CCA的研究[12]放在,确切的稀疏的CCA配方一直放松在几个步骤上。另一方面,最小二乘法和CCA已经建立在文学上建立起一个有趣的联系。特别是,CCA被证明是相当于Fisher线性判别分析(LDA)的二进制类问题[13]。与此同时,众所周知,在这种情况下LDA相当于最小二乘法[5],[6]。因此,CCA可以作为一个对于二进制类问题制定最小二乘问题。在实践中,多元变量问题非常普遍。因此研究它们在更一般的变量中的关系更具诱惑。
在本文中,我们研究 CCA和最小二乘在多元变量问题之间的关系。我们表明,在倾向于保持高维数据的温和条件下,CCA可以作为一个通过制定构造一个特殊类指标矩阵的最小二乘问题。在此等价关系的基础上,我们提出几个CCA扩展,包括使用1规范正规化的稀疏CCA。我们表明,最小二乘方程式及其扩展的CCA可以有效地解决。例如,相当于2规范的最小二乘配方和正规化的扩展可以通过计算迭代共轭梯度算法LSQR进行处理[14],这种算法可以处理非常大规模的问题。我们通过建立OPLS 和 CCA之间的等价关系使最小二乘方程式扩展到正交最小二乘(OPLS)和偏最小二乘法(PLS)。此外,我们分析正则化在CCA上的效果。特别是,我们表明,CCA投影,让一群变量是独立的正规化另组多维变量,阐明正规化在CCA上的影响。此外,它能显示出我们的分析可以扩展到内核诱导功能空间。提供更多细节的补充文件,可以发现在计算机协会数字图书馆在http://doi。ieeecomputersociety.org/10.1109/TPAMI.2010.160。
注释:训练样本的数量,数据维数,数量的标签分别用n、d、k。xiR表
kdnyRXx,,xRii1n示第个观察。并且表示编码对应的标签信息。让是knYy,,yR1n数据矩阵,是类标签矩阵。我们假设所有的xii1和
ndyiin1是集中的,i1xi0n和i1nyi0。
AF弗罗贝尼乌斯的规范表示矩阵A。I是单位矩阵和e是一个单位向量。背景和相关工作
在本节中,我们回顾CCA,最小二乘法,和一些相关的工作。2.1 典型相关分析
在CCA,两种不同造型的同一组对象,给出了一个投影计算了每个表示这样
dwRx的,他们是最大的维度降低空间相关。正式,CCA计算两个投影向量和wyRk这样的相关系数
TwTxXYwyTTT(wTxXXwx)(wyYYwy)
(1)
是最大化
因为是
wx,wywx和wy不变的缩放,CCA可以相等的变换为
(2)
TmaxwTxXYwy 2
Ts.twTxXXwx1,TwTyYYwy1.以下,我 们假设YY是满秩的。这表明
wxTwx以下问题的最优解来获得:,TT1TmaxwTxXY(YY)YXwx,TTs.t wxXXwx1。
(3)两种方法在(2)和(3)中试图找到所对应的特征向量与特征值的顶部以下广义特征值问题:
XYT(YYT)1YXTwxXXTwx,(4)
特征值与特征向量wx是相对应的。它也表明,多个投影向量在某些正规化约束由顶部的特征向量的广义特征值问题(4)[2]。
在正规化CCA(rCCA),两个正则化条件xI和
TTyI,并且
x0,y0被添加在(2)来防止过度拟合,避免奇点XX和YY的[2], [15]。具体来说,解决了以下商资归农广义特征值问题: XXT(YYTyI)1YXTwx(XXTxI)wx
(5)
2.2 最小二乘法的回归和分类 在回归,我们就有了一种训练集xi,tini1dkxRtRii,其中是观察数据,是相应的目标。我们假设两把观察结果和目标集中。结果,拦截在回归可以被消除。在这种情况下, 最小二乘方法可以用于计算投影 矩阵W通过最小化以下平方和成本 功能:
nminf(W)WxitiTWi122WXTT2F
(6)
knTt,tR1n其中。众所周知,最优投影矩阵给出了[5],[6]
WLS(XXT)XTT
(7)T(XX)代表雅可比矩阵XXT的伪伪逆。其中最小二乘公式也可应用于分类问题。在一般的多级情况下,我们是给定一个
ndxi,yii11,2,,k表示第i类标号的样xRin样品组成的数据集,其中,yi 3 本,k>2。应用最小二乘的多类配方情况下,1 k的二进制编码方案通常是把向量值类代码应用于每个数据点[5]。解决方案取决于选择类指标矩阵。几类指标矩阵的提出在文献[6]。
2.3 相关工作
最小二乘法的内在关系和其他几个模型在过去已经建立。特别是,它是一个经典的效果,最小二乘问题是等价的LDA对二进制类问题[5]。最近,这种等价关系是延伸到通过定义一个特定的类指标矩阵的多类案件[16]。CCA已被证明是相当于LDA对多类问题[13]。因此,CCA相当于最小二乘法在多类案件。我们显示在接下来的部分,在温和条件下,可作为制定CCA最小二乘问题的更一般的设置,即,多元变量问题当一个用来源于标签的CCA的视图。CCA和最小二乘对于MULTILABEL之间的关系分类
在本节中,我们的相关关系和最小二乘法的CCA multilabel案例,由于空间限制,所有的证据是提供在补充文件,可以在计算机协会数字图书馆中找到http://doi.ieeecomputersociety.org/10.1109/TPAMI.2010.160。
首先为我们的推导定义四个矩阵:
HY(YY)TT12Rnk,(8)
CXXXXTRdd,(9)CHHXHHTXTRdd,(10)CDDCXXCHHRdd,(11)
注意,我们假设nk并且rank(Y)k为多元变量的问题。这样(YY)T12就很明确了。遵循上面的定义,解决CCA可以表达为特征值所对应的特征向量与矩阵CXXCHH的顶部。
3.1 基本矩阵属性
在本节中,我们研究的基本性质的矩阵参与下面的讨论。以下定义在(8)中的H,我们有:
引理 3.1 让H被定义为在(8),并且让我们有:
(1)H已经正规化的列,T(2)He0。
yiin1集中的,i1yi0。这样,nHTHIK'。
鉴于HR言之 nk与列正交,存在DRn(nk)nnH,DR使得是正交矩阵,简而
InH,DH,DHHTDDTT
TTCCCXDDXDDXXHH于是就出现了的结果,让奇异值分解计算X且
XUVTU1,U2diag(r,0)V1,V2U1rV1TT
其中rrank(X),U,V是正交矩阵,Rdn,U1Rdr,U2Rd(dr),V1Rnr,V1Rn(nr),rRrrT很明显U2位于零空间X中,简而言之
XTU20
(12)
3.2 通过特征分解计算CCA
C回想一下,解决CCA由矩阵XXCHH的顶部特征向量.我们下一个展示如何计算这些特征向量。定义了矩阵ARrk且
(13)
rk1TTArU1XHV1H让奇异值分解A,使对角线的。这样 APAQTrrkkRPR,QR,其中是正交的,A是
TAATPATAP
(14)C矩阵XXCHH的特征分解总结了下面的定理:
C定理3.1 矩阵XXCHH有k个非零特征值。具体来说,CCA的解决办法是由与矩阵CXXCHH最顶端的特征值(k)相对应的特征向量组成的,可以得到:
1WCCAU1rP
(15)其中Pl在包含第一列的P。
3.3 和最小二乘法等价的CCA 考虑类指标矩阵T定义如下:
~ 5
T(YY)YHT
(16)
~T12它遵循从(7),解决最小二乘问题给定T
1TWLS(XXT)XHU1rPAQ~
(17)
T从(15)和(17)中可以很明显的看出之间(CCA)和最小二乘法的区别在于A和Q 我们下一个显示所有的对角元素A的在温和的条件下,即rank(X)n1,rank(Y)k.注意,第一个条件是相当于要求原始数据点是线性独立前定心,倾向于保持高维数据。出示之前主要结果总结在定理3.2下面,我们有以下引理: 引理 3.2 我们假设
rank(CXX)srank(CHH)rank(CDD),TrrAAAdiag(a1,a2,,ar)RS对于一些非负整数有。那么对于矩阵,^我们有
1afsafs1afaf10其中frank(A)。
定理 3.2 假设rank(X)n1,rank(Y)k为多元变量问题,这样我们有rank(CXX)n1,rank(CHH)k,rank(CDD)nk1,因此S在引理3.2中的定义相当于零,并且有
1a1akak1ar0。
这就意味着A的所有的对角元素是单位的。
既然rank(A)k,CXXCHH包含k个非零特征值。如果我们令k,则有
1WCCAU1rPk(18)
WLS和WCCA唯一的区别在于正交矩阵在QT和WLS。
在实践中,我们可以使用WCCA和WLS两个项目的原始数据到一个低维空间在分类之前。对于分类器基于欧几里得距离,正交变换QT不会影响分类性能,任何正交转换欧几里得距离是不变的。一些著名的算法满足这个属性包括k最近邻(k 最近邻)算法[6]基于欧氏距离和线性支持向量机(SVM)[17]。在下面,相当于最小二乘CCA配方被称为“IS-CCA。”
4.扩展最小二乘的CCA 基于等价关系建立在上一节中,古典CCA配方可以扩展使用正则化技术,它 常用于控制的复杂性和提高模型的泛化性能。类似于岭回归[6],我们得到2规范正则化最小二乘CCA配方(称为“LS-CCA2”),从而减少以下目标函数通过使用目标矩阵T(16):
L2(W,)((xwjTij)2wj)Tij1i12kn~2~
其中W[w1,wk],0是正则化参数。
众所周知,稀疏通常可以通过惩罚1规范变量的[8]得到。它已经被引入最小二乘配方,由此产生的模型被称为套索[8]。基于等价关系的建立(CCA)和最小二乘法,我们推导出1规范正则化最小二乘CCA配方(称为“LS-CCA1”),从而减少以下目标函数: L1(W,)((xwjTij)2wj)。
Tij1i11kn~LS-CCA1使用最先进的算法[18]、[19]可以有效地解决。此外,整个解决方案的路径用最小角回归算法[20]计算所有值。
5.高效实现的CCA 回想一下,我们处理问题的广义特征值在(4)来解决CCA,虽然,在我们的理 推导,等价特征值问题是代替。大规模的广义特征值问题是已知的比常规的特征值问题[11]、[21]来的更难。有两个选项转换中的问题(4)成一个标准的特征值问题[21]:1)因素XXT和2)使用标准的兰索斯算法矩阵(XXT)1XHHTXT使用XXT内积。在对于高维问题与一个小正则化这种情况下,第二个选择都有它自己的奇异矩阵的问题。因此,在本文中,我们XXT因素和解决对称特征值问题使用兰索斯算法。
相当于导致一个有效的最小二乘制定实施。该算法的伪代码,给出了算法1。复杂的第一步是O(nk2)。在第二步中,我们解决最小二乘问题的k。在我们的实现中,我们使用LSQR算法在[14],这是一个实现了共轭梯度式法求解稀疏最小二乘问题。注意,原始矩阵XRdn很稀少在应用在程序中,如文本文档建模。然而, 7 在中心,X不再是稀疏的。为了保持X稀疏的,向量xi是由一个额外的组件作为增强x[1,x]。这个新组件充当对最小二乘法的拦截。扩展X来标示XRTiTminWXT~W~~~2~(d1)k~Ti~(d1)k,修订后的最小二乘问题表示为dWRF,其中
。对于一个新的数据点xR,它的投影给出了
WT[1;x]~
算法1。高效的实现通过LSQR CCA 输入:X,Y 计算矩阵诊HY(YY)断基于奇异值分解的Y。用LSQR在THT上回归X。
对于一个密集的数据矩阵,计算成本参与每个迭代的是O(3n5d2dn)[14]。因为最小二乘问题解决了k次,总体成本是O(NK(3n5d2dn)),其中N是迭代的总数。当矩阵X是稀疏的,成本明显降低。
~~TT12假设非零元素的数量在 X中是z。总成本减少到O(NK(3n5d2z))。总之,总时间复杂度为解决最小二乘配方通过LSQR是O(nkNK(3n5d2z))当是X稀疏的。
6.扩展最小二乘的配方
回想一下,CCA寻求一对线性变换,一个用于每一组变量,这样数据最相关 转换空间。相比之下,偏最小二乘法(PLS)发现方向最大协方差。协方差和相关性是两种不同的统计措施为如何共变的量化的变量。CCA和PLS已被证明是有密切联系[22]。在[23]和[24],一个统一的框架,请和CCA的开发,并正交(CCA)和偏最小二乘法(OPLS)[25]的一个变体,可视为特殊情况的统一框架,通过选择不同的正则化参数值。然而,OPLS 和CCA内在的等价关系尚未研究过。在本节中,我们证明了OPLS 和CCA等价关系,从而扩展最小二乘OPLS配方。以下优化问题被认为是在OPLS: maxtr(WTXYTYXTW)W~2~
(20)
stWTXXTW1
给出了最优W以下的特征向量的广义特征值问题: 8
TTXHplsHTplsXwXXw(21)
矩阵Hpls被定义为
HplsYTRnk(22)
回想一下,在CCA,矩阵AV1TH定义在(13)中和奇异值分解给出了APAQ。同样的,我们定义TAplsV1THplspls,允许细微的Apls奇异分解值为
V1THplsAplsPplsplsQTpls,其中
PplsRrk,kkRkk,QTplsR。在范围的空间我们有下面的结果:
引理 6.1 让AVH定义在(13)中,T1AplsV1THplsRrk。这样R(A)R(Apls)PplspkR,其中R(A)和
R(Apls)是A和
Apls的列空间。此外,存在一种像这样的正交矩阵R,pk由p的第k列组成。
本节的主要结果总结了以下定理: 定理 6.1 让(18)。然后,Wpls是最优解的优化问题(20)和让WCCA是最佳CCA变换定义在为正交矩阵R。WplsWCCAR它遵循从定理6.1,OPLS可以很容易为一个等价的最小二乘问题的新配方使用相同的类指标矩阵定义在(16)。
7.分析正则化在CCA 在本节中,我们调查在CCA正规化的影响。最小二乘CCA制定建立在本文假设没有正则化应用。然而,正则化通常用于控制复杂性的学习模式,它已应用于各种机器学习算法。使用正则化在CCA自然统计解释[15],[26]。在实践中,正则化通常在CCA中执行两种多维变量,因为它一般认为的解决方案是依赖于CCA正规化两变量。从前面部分后的推导,我们表明,投影,让一群CCA变量是独立的正规化另组多维变量,提供新的影响CCA正规化的见解。7.1 正规化在Y 在CCA中对Y使用正则化导致下列广义特征值问题: XYT(YYTyI)1YXTw(XXT)w
(23)
y0是正则化参数。广义特征值问题在(23)可以表示为: XHrHrTXTw(XXT)w
(24)nkHRr矩阵为正规化CCA的定义是: HrY(YYyI)TT12
(25)主要结果概括如下定理: 定理7.1 让WrCCA是矩阵组成的主要特征向量的广义特征值问题在(24)的非零特征值对应。然后,WrCCAWCCA为正交矩阵R。它很容易检查在在(8)中H的和在(25)中的Hr的范围的空间一致。证明遵循相同的参数在引理6.1和定理6.1。
定理7.1表明CCA配方被认为是可以制定作为一个最小二乘问题相当于当Y正则化。注意,Y可以是任意矩阵(不一定是类标签矩阵)。一个重要的结果从等价关系的投影为一个视图是独立的CCA的正规化的其他视图。一个类似的结果能够获取内核CCA。
7.2 正规化在X 对Y自正则化不影响投影的X,我们接下来考虑正则化在X分开。由此产生的广义特征值问题在CCA可以制定如下:(XHHTXT)w(XXTxI)w
(26)
T1TTx0是参数X正则化。(XXI)(XHHX),x同样,我们可以推导出正交矩阵结果总结了以下引理: 引理 7.1 定义矩阵BR21rk为
12B(xI)TBPBBQBVH11H,(27)
rkrRrRRPRQR为他的奇异分解,B,B是正交的,B是对角
T1TT(XXI)(XHHX)的特征值最高所对应的特征向量给出x线的。然后,与矩阵了
WU1(xI)PB2112,(28)
PB由PB的第一列(rank(B))组成。
它可以观察到,B的空间范围与A不是同于一个;因此,CCA和最小二乘的等价关系被认为是不持有当正则化在X。然而,OPLS CCA的等价关系仍然持有当正则化在X是应用。主要结果总结在定理7.2以下(证明遵循类似的参数在引理 6.1): 定理 7.2 Bpls(xI)2112VH11Hpls,让B和
Bpls少量的奇异分解值为
BBTBPBB(QB)TBplsPplsBpls(Qpls),BPB,PplsRrk,rBrank(B)rank(Bpls)BPBPplsRB。然后,这个B和
Bpls范围的空间一致。此外,还存在一个像
rrB这样的正交矩阵RRBB。因此,CCA和OPLS是等价的任何x0.回想一下,制定可归纳为CCA广义特征值问题如(5),这就需要计算矩阵的逆YYTRkk。计算逆可能计算量大,当维数k的数据Y是很大的。这种情况在基于内容的图像检索[27],两个视图对应的文本和图像数据,都是高维度。一个重要的结果,建立了OPLS和 CCA的等价关系是逆的大型矩阵可以有效避免计算投影一个视图。
8.实验
我们在实验中使用三种类型的数据。基因表达模式图像data1描述果蝇的基因表达谱[28]。每个图像标注一个变量数量的文本术语(标签)从受控词汇表。我们应用伽柏过滤器中提取一个384维的特征向量从每个图像。我们用五个数据集和不同数量的术语(类标签)。我们也评估拟议的方法在现场数据集[29],这是常用的作为一个基准数据集对多元变量的学习。研究提出了最小二乘的可伸缩性配方,一个文本文档数据集与高维度从雅虎!使用[30]。这些数据集的统计归纳如表1。
表1
汇总统计的数据集
表2
比较不同的CCA配方 意思是中华民国方面得分
所有的数据集,报告10个随机数据的分区训练集和测试集生成和平均性能。对于高维文本文档的数据集,我们遵循特征选择方法研究[31]文本文档和提取不同数量的术语(特性)调查性能的算法。与算法5进行比较,包括在(5)中CCA和正规化的版本(指示为商资归农),提出了最小二乘CCA配方(指示为ls CCA)及其2规范和1规范正规化的版本(指示为LS-CCA2和LS-CCA1,分别)。所有的方法都是用于项目数据到一个低维空间中线性支持向量机进行分类为每个不同的标签。接受者操作特性(ROC)得分计算为每个不同的标签,在标签和平均性能报告所有剥片。
8.2 等价关系的评估和性能比较
我们首先对(CCA)和最小二乘法的等价关系进行评估。我们观察到,当数据维 数d远远大于样本大小n,在定理3.2的条件往往持有。它遵循从定理3.2,rank(CXX)等于rank(CHH)rank(CDD),A所有对角元素是单位的,这是符合观测的实验。
在表2中,我们报告的平均分数超过所有的标签和中华民国为每个数据集都剥片。主要的观察包括:1)CCA和ls CCA达到同样的性能,所有的数据集,这是符合我们的理论结果,2)正规化CCA扩展包括商资归农,LS-CCA2,LS-CCA1执行更好的比他们的同行CCA和ls CCA没有正规化,3)LS-CCA2比得上在所有的数据集商资归农,而LS-CCA1达到最好的性能对于所有基因图像数据集。这些观察结果证明用正则化最小二乘扩展技术的有效性使。
8.3 敏感性研究
在这个实验中,我们调查ls CCA的性能相比CCA当在定理3.2的条件中并不持有,这种情况存在许多真实世界的应用程序中。具体来说,我们使用一个基因数据集基因图像2维数固定在d=384和k= 15的标签,而训练集的大小变化从100年到900年与步长约100。
不同的线性算法的性能作为训练集规模的增加呈现在图a1。我们可以发现,总体而言,所有算法的性能增加的培训规模增加。当n是很小,条件在定理3.2成立,因此CCA和ls CCA是等价的,它们达到同样的性能。当n进一步增加,CCA和ls CCA实现不同的变动率指标数,虽然在我们的实验差异分数总是非常小的。类似于上次的实验,我们可以从图观察到,正则化方法能够比CCA和ls-CCA,LS-CCA2与rCCA更好地执行。这个数据集稀疏配方LS-CCA1执行的最好。
实验的灵敏度也表现在现场数据集。结果总结在图b1,可以类似的观察。
8.4 可扩展性研究
在这个实验中,我们研究相比最小二乘原CCA配方的可伸缩性配方。因为正规化算法是首选在实践中,我们比较正规化CCA配方(rCCA)和2规范正规化最小 13 二乘配方(LS-CCA2)。最小二乘问题是解决LSQR算法[14]。
图a2一个显示了计算时间的两个配方的高维文本文档数据集雅虎 Arts&Humanities作为数据维数随着训练集的大小固定为1000。它可以观察到两种算法随着数据维数不断增加,计算时间不断增加。然而,计算时间的最小二乘配方(LS-CCA2)是大大低于原来的配方(rCCA)。事实上,LS-CCA2所有测试数据维数计算时间小于5秒。我们也评估两个配方的可伸缩性方面的训练样本大小。图b2阴谋计算时间的两个公式在文本文件数据集当训练样本大小随数据维数固定为2000,可以类似的观察。训练集的大小由于高计算成本的原始特征值问题是没有进一步增加。从图2,我们得出了最小二乘配方是比原来CCA配方更加可伸缩。
8.5 正则化分析
在这个实验中,我们研究的影响为CCA正规化。此外,我们比较OPLS 和 CCA在不同正则化参数值下得性能。具体来说,我们随机选择700样本数据集进行训练的场景,不同的正则化参数值从1e-6到1e4。
首先,我们考虑只在X正规化。CCA的性能和OPLS现场数据设置为变量x总结了图3。我们可以观察到从图,在所有的x值,(CCA)和OPLS的性能是相同的。这证实了CCA 和OPLS的等价关系定理7.2成立。我们还观察到OPLS 和CCA的性能可以提高,通过使用一个适当的显著正则化参数,证明了利用正则化在X。
接下来,我们考虑正则化只在Y。CCA和OPLS的性能的不同值3 b。我们可以观察到CCA的表现依然是分析。
y总结了图
y变化,验证正则化在y不影响其性能。另外,我们观察到两种方法的性能在所有的情况下是相同的,这是符合我们的理论
9.总结
在本文中,我们在温和条件下为CCA建立一个等价的最小二乘配方,倾向于保持高维数据。在本文中基于等价关系建立,我们提出几个CCA扩展包括稀疏CCA。一个高效的算法扩展CCA配方非常大的数据集。我们进一步扩展的等价关系正交偏最小二乘法。此外,我们表明,投影一视图CCA独立的正规化的其他视图。我们进行了多元变量数据集的集合的实验。我们的实验表明,最小二乘法CCA配方和原始CCA配方的性能非常接近甚至当条件是违反的。
版权声明
这项研究是由美国国家科学基金会组织(NSF)iis0953662,NIH,hm1582 R01-HG002516 NGA1-0016。
参考文献:
[1] H.Hotelling, “Relations between Two Sets of Variables,” Biometrika, vol.28, pp.312-377, 1936.[2] D.Hardoon, S.Szedmak, and J.Shawe-Taylor, “Canonical Correlation Analysis: An Overview with Application to Learning Methods,” Neural Computation, vol.16, no.12, 2004.[3] J.-P.Vert and M.Kanehisa, “Graph-Driven Feature Extraction from Microarray Data Using Diffusion Kernels and Kernel CCA,” Proc.Ann.Conf.Neural Information Processing Systems, vol.15, pp.1425-1432, 2003.[4] S.Yu, K.Yu, V.Tresp, and H.-P.Kriegel, “Multi-Output Regularized Feature Projection,” IEEE Trans.Knowledge and Data Eng., vol.18, no.12, pp.1600-1613, Dec.2006.[5] C.Bishop, Pattern Recognition and Machine Learning.Springer, 2006.[6] T.Hastie, R.Tibshirani, and J.Friedman, The Elements of Statistical Learning: Data Mining, Inference, and Prediction.Springer, 2001.[7] G.Golub and C.V.Loan, Matrix Computations.Johns Hopkins Press, 1996.[8] R.Tibshirani, “Regression Shrinkage and Selection via the Lasso,” J.Royal Statistical Soc.: Series B, vol.58, no.1, pp.267-288, 1996.[9] A.d’Aspremont, L.Ghaoui, M.Jordan, and G.Lanckriet, “A Direct Formulation for Sparse PCA Using Semidefinite Programming,” Proc.Ann.Conf.Neural Information Processing Systems, vol.16, pp.41-48, 2004.[10] J.Zhu, S.Rosset, T.Hastie, and R.Tibshirani, “1-Norm Support Vector Machines,” Proc.Ann.Conf.Neural Information Processing Systems, vol.15, pp.49-56, 2003.[11] D.Watkins, Fundamentals of Matrix Computations.John Wiley & Sons, Inc., 1991.[12] B.Sriperumbudur, D.Torres, and G.Lanckriet, “Sparse Eigen Methods by D.C.Programming,” Proc.Int’l Conf.Machine Learning, pp.831-838, 2007.[13] T.Hastie, A.Buja, and R.Tibshirani, “Penalized Discriminant Analysis,”
Annals of Statistics, vol.23, pp.73-102, 1995.[14] C.Paige and M.Saunders, “LSQR: An Algorithm for Sparse Linear Equations and Sparse Least Squares,” ACM Trans.Math.Software, vol.8, no.1, pp.43-71, 1982.[15] F.Bach and M.Jordan, “Kernel Independent Component Analysis,” J.Machine Learning Research, vol.3, pp.1-48, 2003.[16] J.Ye, “Least Squares Linear Discriminant Analysis,” Proc.Int’l Conf.Machine Learning, pp.1087-1094, 2007.[17] B.Scho¨lkopf and A.J.Smola, Learning with Kernels: Support Vector Machines, Regularization, Optimization, and Beyond.MIT Press, 2002.16 [18] J.Liu, S.Ji, and J.Ye, SLEP: Sparse Learning with Efficient Projections.Arizona State Univ.,
第三篇:物流采购与供应管理典型习题分析与解答
物流采购与供应管理典型习题分析与解答 物流〒典型习题分析与解答〒 典型习题
一、选择题
1.采购与供应管理的利润杠杆效应指的是()A.利润的增加可以带来采购数量的增加 B.采购数量的增加可以带来利润率的提高
C.采购费用节省较少比例可以带来利润率更大比率的提高 D.利润率提高较小比例可以带来采购费用更大比率的节省
2.某公司的销售收入为1000万元,假设其税前利润率为5%,采购成本为销售收入的60%,假设采购成本减少1%,则利润杠杆效应使利润率增加了多少()A.1% B.10% C.12% D.20%
3.某公司销售收入为1000万元,税前利润为5%,采购成本为销售收入的60%,存货为150万元,它为公司总资产的30%,求此时的资产收益率()
A.5% B.10% C.15% D.20%
4.在上题中,如果采购成本降低了10%,此时的资产收益率为()A.24.4% B.23.4% C.22.8% D.25.2%
5.下面哪项不是采购与供应管理对于企业的作用:()A.利润杠杆效应
B.资产收益率效应
C.提高企业竞争地位和顾客满意度 D.牛鞭效应
6.在下列采购类别中,那一个不属于按采购制度进行分类的类别()A.政府采购
B.集中采购
C.分散采购 D.混合采购
7.为了做好采购工作,采购部门应该承担许多职责,其中有管理层面的,也有作业层面的。在下面各项职能描述中,哪一项是属于管理层面的职能()
A.协助供应商建立品质管理制度
B.提供长期的需求计划给供应商
C.编制采购计划与预算 D.提供技术及测试仪器,使供应商生产更佳的产品
8.全球化采购可以实施是由许多原因造成的,下列哪项不是原因()A.更低的价格 B.更高的质量 C.竞争的需要 D.没有风险
二、简答题
1.如何理解采购的信息源作用? 2.集中采购有哪些优点? 3.JIT采购的含义是什么?
三、论述题
1.试述采购与供应管理的目标。2.试述采购与供应管理的演变历程。
四、案例分析题
【案例1】很难想象1979年的某一天,克莱斯勒(现在的戴姆勒─克莱斯勒)会没有足够的现金支付他的雇员、供应商和金融债权人,而且几乎要宣告破产。使克莱斯勒能够继续营业需要汽车工会的让步,同时银行债务的重组则包括数以百家的社会机构和超过10亿美元的政府援助贷款。尽管20世纪70年代末的经济萧条是造成这一现象的原因之一,但克莱斯勒最大的问题在于它的运营管理。该公司组织内部有功能强大的信息库进行经营,但在跨部门或与供应链的其他成员相联系的功能方面却很差。资方与工会为敌,采购部门与供应商为敌,而产品开发以工程师为主,生产出客户并不想要得产品。这个信息系统甚至不能有效地帮助公司有效提高产品质量。
现在克莱斯勒公司与20年前相比已经大为不同。这该如何解释呢?为了更好地满足汽车购买者,公司采用了“大企业”策略,该策略将整个公司的采购供应链的活动进行了更好的整合——从原材料到零部件到各零部件供应商,从生产商到分销商,最后,将成品递送至客户。通过这种更为紧密的整合,克莱斯勒变得对市场需求的反应更迅速。它在产品设计与开发的革新上赢得了良好的声誉。
采购在克莱斯勒公司的变革中发挥了与众不同的重大作用。该公司被认为是北美与供应商关系最好的企业之一。较散乱的联系已经让位于更为紧密的供应商管理方式。供应商能够更早更积极地参与新产品的开发。实际上,主要供应商已经为克莱斯勒实际开发的每辆汽车和卡车提供设计与制造系统。采购部门已建立了一项极为成功的称之为SCORE的供应商建议项目,该项目每年能产生数以千条的供应商建议,从这些建议中节约的资金每年可达到数亿美元。
如果没有了解采购流程以及知道如何利用这些流程创造价值的人们,这些变化是不可能发生的。克莱斯勒意识到采购并不是仅供低素质的采购人员随意进行传统操作的地方,而应接近于供应链管理。公司招募高学历人士进入采购梯队,当这些人的职业道路从策略采购转变为战略资源时,他们必须对采购的基本原理有彻底的了解。为了帮助他们的发展,克莱斯勒使用了一种强调采购的训练项目。训练者通过在不同领域循环工作,取得丰富的经验知识。简而言之,管理层已经明白,采购部门未来的领导者必须在他们承担开 发战略的重任前拥有足够的采购运作经验。【问题】
1.你认为克莱斯勒在前期的采购方面出了哪些问题? ⒉结合案例谈谈你对采购工作重要性的认识。
【案例2】与我国大型国有企业相比,通用的采购体系可以说是含着银匙出世,它没有必要经历体制、机构改革后的阵痛,全球集团采购策略和市场竞标体系自公司诞生之日起,就自然而然地融入了世界上最大的汽车集团——通用汽车的全球采购联盟系统中。相对于尚在理论层次彷徨的众多国有企业和民营企业而言,通用的采购已经完全上升到企业经营策略的高度,并与企业的供应链管理密切结合在一起。
据统计,在美国的采购量每年为580亿美金,全球采购金额总共达到1400~1500亿美金。1993年,通用汽车提出了全球化采购的思想,并逐步将各分部的采购权集中到总部统一管理。目前,通用下设四个地区的采购部门:北美采购委员会、亚太采购委员会、非洲采购委员会、欧洲采购委员会,四个区域的采购部门定时召开电视会议,把采购信息放到全球化的平台上来共享,在采购行为中充分利用联合采购组织的优势,协同杀价,并及时通报各地供应商的情况,把某些供应商的不良行为在全球采购系统中备案。
在资源得到合理配置的基础上,通用开发了一整套供应商关系管理程序,对供应商进行评估。对好的供应商,采取持续发展的合作策略,并针对采购中出现的技术问题与供应商一起协商,寻找解决问题的最佳方案;而在评估中表现糟糕的供应商,则请其离开通用的业务体系。同时,通过对全球物流路线的整合,通用将各个公司原来自行拟定的繁杂的海运线路集成为简单的洲际物流线路。采购和海运路线经过整合后,不仅是总体采购成本大大降低,而且使各个公司与供应商的谈判能力也得到了质的提升。
【问题】
你认为上面的案例中涉及到了哪些采购的新趋势?结合中国实际谈谈你的看法。典型习题解答
一、选择题 1.【C】
分析:概念题根据利润杠杆效应的定义很容易就可以得到正确答案。2.【C】
分析:这是一道计算题,答题的关键也是要把握好基本概念。由题目可以知道,该公司的总利润为1000万×5%=50万,采购成本=1000万×60%=600万,采购成本节约1%,也就是节约了6万元,那么公司总利润相应将增加6万元。于是利润率增加了6/50=12%,C为正确的答案。3.【B】
分析:这道题主要是考察对资产收益率的掌握情况。根据题目中给出的数据容易计算出该公司的税前利润为50万元,采购成本为600万元,总资产为150万/(30%)=500万,那么资产收益率=税前利润/总资产=(50/500)×100%=10%。4.【A】
分析:如果采购成本降低10%,采购成本节约了60万元,同时,由于采购成本的下降,库存成本也降低10%,总资产变为(150万×90%)/(30%)=450万。此时资产收益率变为:(50+60)/450×100%=24.4%。5.【D】
分析:用排除法既可以得到正确答案,前三项教材上都叙述了,可选答案只有最后一项牛鞭效应。牛鞭效应指的是:当供应链的各节点企业只根据来自其相邻的下级需求信息进行生产或供应决策时,需求信息的不真实性会沿着供应链逆流而上,产生逐级放大的现象,达到最源头供应商时,其获得的需求信息和实际消费市场中的顾客需求信息发生了很大的偏差,需 求变异系数比分销商和零售商的需求变异系数大得多。由于这种需求放大效应的影响,上游供应商往往维持着比下游供应商更高的库存水平,这是企业要尽量抑制的一种效应,是一种负面影响。6.【A】 分析:略 7.【C】 分析:略 8.【D】
A.更低的价格 B.更高的质量 C.竞争的需要 D.没有风险 分析:全球化采购将面临更大的风险。
二、简答题
1.答:采购部门与市场的接触可以为企业内部各部门提供有用的信息。这主要包括价格、产品的可用性、新供应源、新产品及新技术信息。这些信息对企业中其他许多部门都具有重要的作用。供应商所采用的新的营销技术和配送体系可能对销售部门大有用处;而关于投资、合并、兼并对象、国际政治经济动态、即将来临的破产、提升和任命以及当前和潜在顾客等方面的信息,对销售、财务、研发和高层管理部门都有一定的意义。由于直接与市场接触,采购部门可以广泛地收听到各种信息。
2.答①可以使采购数量增加,提高与卖方的谈判力度,比较容易获得价格折扣和良好的服务。
②由于只有一个采购部门,采购方针比较容易统一实施,采购物料也可以统筹安排,也就是说可以协调企业内部的各种情况制定比较合理的采购方针,权力越分散,不一致发生的可能性就越大。
③采购功能集中,精简了人力,便于培养和训练,提高了工作的专业化程度,有利于提高采购绩效,降低采购成本。④可以综合利用各种信息,形成信息优势,为企业经营活动提供信息源。3.答:JIT采购又称为准时采购,是一种先进的采购模式,它的基本思想是:在恰当的时间、恰当的地点、以恰当的数量、恰当的质量提供恰当的物品。它是从准时生产发展而来的,是为了消除库存和不必要的浪费而进行持续性改进。要进行准时化生产必须有准时的供应,因此准时采购是准时化生产管理模式的必然要求。它与传统的采购方法在质量控制、供需关系、供应商的数目、交货期的管理等方面有许多的不同,其中关于供应商的选择、质量控制是其核心内容。
三、论述题
1.答案要点:对于采购职能总体目标的标准描述是:它要求在合适的时间、地点从合适的供应商那里以合理的价格获得满足质量和数量要求的物品。对采购与供应管理的具体目标表述如下: ①提供不间断的物料、供应和服务,以便使整个组织正常地运转。②使库存投资和损失保持最低限度
③保持并提高质量。为了生产所需要的产品或服务,每一项物料都要达到一定的质量要求,否则最终产品或服务将达不到期望的要求或者是达到期望的最终产品的生产成本远远超过可以接受的成本额。
④发现或发展有竞争力的供应商。一个采购部门必须有能力找到或发展供应商,分析供应商的能力,从中选择合适的供应商并且与其一起努力对流程进行持续的改进。
⑤当条件允许的时候,将所购物资标准化。在供应商保证服务水平的前提下,通过大批量采购的采购协议和低库存,标准化能够提供价格低又符合要求的物资。
⑥以最低的总成本获得所需的物资和服务。在企业中,企业采购部门的活动消耗的资金比例最大,采购成本的降低可以极大提高企业的利润率。
⑦在企业内部和其他职能部门之间建立和谐而富有效率的工作关系。在一个现代企业中,由于专业化程度的不断提高,如果没有其他部门和个人的合作,采购经理的工作就不可能圆满完成。
⑧以可能的最低水平的管理费用来实现采购目标。采购部门应该尽可能有效和节俭地完成采购目标,这就需要采购经理经常对部门的运作情况进行回顾,以确保所有的活动耗费都是有效的。
⑨提高公司的竞争地位。从长远来看,任何企业的成功都依赖于它与顾客建立和维护良好的关系的能力,而对供应的有效管理则会直接或间接地影响最终顾客。对于企业的全局战略和提升企业的竞争地位而制定的特别的内部供应战略来说,采购和供应管理都会有潜在的贡献。
2.答案要点:①在第一次世界大战之前,大多数企业主要把采购职能看作是一种文书工作。
②在第一次和第二次世界大战期间,由于巨大的市场需求,企业的成功不在于它能够销售什么,而是它取决于企业从供应商那里获得原材料、用品和服务的能力。这些保证工厂和矿山运营的必要条件成了决定企业成功的关键因素。从那时开始,人们开始关注采购职能的组织、政策和程序,采购职能开始作为一项独立的管理活动而出现。
③20世纪五六十年代,采购职能所应用的技术更加先进,受过专门训练的采购人员也越来越多,他们有能力做出合理的采购决策,采购职能在企业中的地位也越来越重要,许多企业把首席采购官提升到管理层,这也加强了采购部门的吸引力,促进了采购管理理念的进一步发展。
④进入二十世纪七十年代以来,企业面临着两个问题:一方面,支持运营的所有原材料几乎都出现了国际范围内的短缺;而另一方面,价格的增长幅度却远远超过了第二次世界大战结束时的水平。这一变化使得采购部门倍受关注,因为他们能否从供应商那里获得所需要的物品,将决定企业的命运。这样,采购部门被推上了战略地位,人们开始关注采购战略的制定。
⑤二十世纪九十年代后,企业已经清楚地认识到,企业要想成功地与国内外的企业竞争,就必须有一个颇具效益和效率的采购与供应管理部门。因为在大多数企业中,采购和服务的成本都大大超过劳动力和其他成本,所以,改进采购职能可以长久控制成本。许多企业正在尝试把采购战略与企业整体战略整合,应用先进的信息和网络技术,推进企业流程的重组,采购职能正在从以交易为基础的战术职能发展到以流程为导向的战略职能。从世界范围来看,采购与供应管理主要呈现出全球化采购、网上采购、JIT采购、供应商伙伴关系(双赢采购)等趋势,而且在发达国家,这些采购理念已经投入实施,取得了很好的效果。
四、案例分析
【案例1】分析思路:这道案例题主要考察采购在企业中的重要性这个知识点,在分析中要结合教材中的相关原理和克莱斯勒前后发生巨大转变的例子将采购在现代企业中的重要作用加以阐明。由于受到篇幅限制,对案例分析题目我们仅给出答题要点。答案要点:
1.①主要问题首先在于没有充分认识到采购的重要作用。没能利用好采购的信息源作用和利润杠杆作用来增进企业的经营绩效。
②没能和供应商建立良好的关系,与供应商具有良好的关键对于企业供应链的正常运作以及成本的节减非常重要。③公司没有将采购工作提升到战略的高度,缺乏专业的高素质的采购人员。
2.①采购与供应管理主要有利润杠杆作用、资产收益率作用、信息源作用、营运效率作用、对企业竞争优势作用五个方面的作用。
②从克莱斯莱在前一个时期中亏损的原因看,一个很重要的方面是采购工作没有做好,未能处理好与供应商的关系,导致采购成本过高,企业严重亏损。在实施改革后,采购流程得以理顺,采购成本大大下降,公司业绩显著,这充分体现了采购的利润杠杆和资产收益率作用。
③采购流程改进以后,使得企业内部的信息的流通的质量和数量大为改善,提高了产品质量,以及供应链各方的满意度,充分体现了采购的信息源作用,同时,企业业绩的好转和竞争力的上升也是采购的营运效率作用和对企业竞争优势作用的体现。
【案例2】 答案要点:
案例中涉及到了全球化采购、供应商关系管理等采购新趋势。
案例直接反映出在不同的市场机制和管理模式下,企业变革需要面对的一些现实问题。但从另一个角度看,我们就会发现采购在整个企业物流管理中的重要地位已经被绝大多数的企业所认可。更多的生产企业专注于自己的核心业务,把采购物流业务外包,建立在合作基础上的现代供应链管理,无疑是对传统的采购管理模式的一次革命性的挑战。
从不同“采购现象”背后,可以看到“采购理念”在中国发展遇到的现实问题,不仅在于企业对先进思维方式的消化能力,更重要的是在不同的体制和文化背景下的执行是否通畅。而在落实理念的过程中,必须革新中国的企业文化,要求高层决策人员和中层的管理人员应当应具备解决系统设计问题的能力,底层的运作人员应能解决系统操作的问题,同时必须有发现问题的能力和正确理解问题的能力。