第一篇:主成分分析与因子分析的优缺点
主成分分析就是将多项指标转化为少数几项综合指标,用综合指标来解释多变量的方差-协方差结构.综合指标即为主成分.所得出的少数几个主成分,要尽可能多地保留原始变量的信息,且彼此不相关.因子分析是研究如何以最少的信息丢失,将众多原始变量浓缩成少数几个因子变量,以及如何使因子变量具有较强的可解释性的一种多元统计分析方法.聚类分析是依据实验数据本身所具有的定性或定量的特征来对大量的数据进行分组归类以了解数据集的内在结构,并且对每一个数据集进行描述的过程.其主要依据是聚到同一个数据集中的样本应该彼此相似,而属于不同组的样本应该足够不相似.三种分析方法既有区别也有联系,本文力图将三者的异同进行比较,并举例说明三者在实际应用中的联系,以期为更好地利用这些高级统计方法为研究所用有所裨益.二、基本思想的异同(一)共同点
主成分分析法和因子分析法都是用少数的几个变量(因子)来综合反映原始变量(因子)的主要信息,变量虽然较原始变量少,但所包含的信息量却占原始信息的85 %以上,所以即使用少数的几个新变量,可信度也很高,也可以有效地解释问题.并且新的变量彼此间互不相关,消除了多重共线性.这两种分析法得出的新变量,并不是原始变量筛选后剩余的变量.在主成分分析中,最终确定的新变量是原始变量的线性组合,如原始变量为x1 ,x2 ,...,x3 ,经过坐标变换,将原有的p个相关变量xi 作线性变换,每个主成分都是由原有p 个变量线性组合得到.在诸多主成分Zi 中,Z1 在方差中占的比重最大,说明它综合原有变量的能力最强,越往后主成分在方差中的比重也小,综合原信息的能力越弱.因子分析是要利用少数几个公共因子去解释较多个要观测变量中存在的复杂关系,它不是对原始变量的重新组合,而是对原始变量进行分解,分解为公共因子与特殊因子两部分.公共因子是由所有变量共同具有的少数几个因子;特殊因子是每个原始变量独自具有的因子.对新产生的主成分变量及因子变量计算其得分,就可以将主成分得分或因子得分代替原始变量进行进一步的分析,因为主成分变量及因子变量比原始变量少了许多,所以起到了降维的作用,为我们处理数据降低了难度.聚类分析的基本思想是: 采用多变量的统计值,定量地确定相互之间的亲疏关系,考虑对象多因素的联系和主导作用,按它们亲疏差异程度,归入不同的分类中一元,使分类更具客观实际并能反映事物的内在必然联系.也就是说,聚类分析是把研究对象视作多维空间中的许多点,并合理地分成若干类,因此它是一种根据变量域之间的相似性而逐步归群成类的方法,它能客观地反映这些变量或区域之间的内在组合关系[3 ].聚类分析是通过一个大的对称矩阵来探索相关关系的一种数学分析方法,是多元统计分析方法,分析的结果为群集.对向量聚类后,我们对数据的处理难度也自然降低,所以从某种意义上说,聚类分析也起到了降维的作用.(二)不同之处
主成分分析是研究如何通过少数几个主成分来解释多变量的方差一协方差结构的分析方法,也就是求出少数几个主成分(变量),使它们尽可能多地保留原始变量的信息,且彼此不相关.它是一种数学变换方法,即把给定的一组变量通过线性变换,转换为一组不相关的变量(两两相关系数为0 ,或样本向量彼此相互垂直的随机变量),在这种变换中,保持变量的总方差(方差之和)不变,同时具有最大方差,称为第一主成分;具有次大方差,称为第二主成分.依次类推.若共有p 个变量,实际应用中一般不是找p 个主成分,而是找出m(m < p)个主成分就够了,只要这m 个主成分能反映原来所有变量的绝大部分的方差.主成分分析可以作为因子分析的一种方法出现.因子分析是寻找潜在的起支配作用的因子模型的方法.因子分析是根据相关性大小把变量分组,使得同组内的变量之间相关性较高,但不同的组的变量相关性较低,每组变量代表一个基本结构,这个基本结构称为公共因子.对于所研究的问题就可试图用最少个数的不可测的所谓公共因子的线性函数与特殊因子之和来描述原来观测的每一分量.通过因子分析得来的新变量是对每个原始变量进行内部剖析.因子分析不是对原始变量的重新组合,而是对原始变量进行分解,分解为公共因子和特殊因子两部分.具体地说,就是要找出某个问题中可直接测量的具有一定相关性的诸指标,如何受少数几个在专业中有意义、又不可直接测量到、且相对独立的因子支配的规律,从而可用各指标的测定来间接确定各因子的状态.因子分析只能解释部分变异,主成分分析能解释所有变异.聚类分析算法是给定m 维空间R 中的n 个向量,把每个向量归属到k 个聚类中的某一个,使得每一个向量与其聚类中心的距离最小.聚类可以理解为: 类内的相关性尽量大,类间相关性尽量小.聚类问题作为一种无指导的学习问题,目的在于通过把原来的对象集合分成相似的组或簇,来获得某种内在的数据规律.从三类分析的基本思想可以看出,聚类分析中并没于产生新变量,但是主成分分析和因子分析都产生了新变量.三、数据标准化的比较
主成分分析中为了消除量纲和数量级,通常需要将原始数据进行标准化,将其转化为均值为0方差为1 的无量纲数据.而因子分析在这方面要求不是太高,因为在因子分析中可以通过主因子法、加权最小二乘法、不加权最小二乘法、重心法等很多解法来求因子变量,并且因子变量是每一个变量的内部影响变量,它的求解与原始变量是否同量纲关系并不太大,当然在采用主成分法求因子变量时,仍需标准化.不过在实际应用的过程中,为了尽量避免量纲或数量级的影响,建议在使用因子分析前还是要进行数据标准化.在构造因子变量时采用的是主成分分析方法,主要将指标值先进行标准化处理得到协方差矩阵,即相关矩阵和对应的特征值与特征向量,然后构造综合评价函数进行评价.聚类分析中如果参与聚类的变量的量纲不同会导致错误的聚类结果.因此在聚类过程进行之前必须对变量值进行标准化,即消除量纲的影响.不同方法进行标准化,会导致不同的聚类结果要注意变量的分布.如果是正态分布应该采用z 分数法.四、应用中的优缺点比较(一)主成分分析
1、优点
首先它利用降维技术用少数几个综合变量来代替原始多个变量,这些综合变量集中了原始变量的大部分信息.其次它通过计算综合主成分函数得分,对客观经济现象进行科学评价.再次它在应用上侧重于信息贡献影响力综合评价.2、缺点
当主成分的因子负荷的符号有正有负时,综合评价函数意义就不明确.命名清晰性低.(二)因子分析
1、优点
第一它不是对原有变量的取舍,而是根据原始变量的信息进行重新组合,找出影响变量的共同因子,化简数据;第二,它通过旋转使得因子变量更具有可解释性,命名清晰性高.2、缺点
在计算因子得分时,采用的是最小二乘法,此法有时可能会失效.(三)聚类分析
1、优点
聚类分析模型的优点就是直观,结论形式简明.2、缺点
在样本量较大时,要获得聚类结论有一定困难.由于相似系数是根据被试的反映来建立反映被试间内在联系的指标,而实践中有时尽管从被试反映所得出的数据中发现他们之间有紧密的关系,但事物之间却无任何内在联系,此时,如果根据距离或相似系数得出聚类分析的结果,显然是不适当的,但是,聚类分析模型本身却无法识别这类错误.
第二篇:主成分分析与全成分分析区别
主成分分析与全成分分析的区别
主成分分析:是把几个综合变量来代替原来众多的变量,使这些综合变量能尽可能地代表原来变量的信息量,而且彼此之间互不相关的一种数学降维的方法。
全成分分析:是将送检样品中的原材料、填料、助剂等进行定性定量分析。塑料原材料种类,填料种类、粒径,助剂种类都能影响对产品的性能、寿命,通常是同一种原材料、同 一种填料,因为助剂种类的不同,造成产品性能大不相同。
主成分分析也称主分量分析,旨在利用降维的思想,把多指标转化为少数几个综合指标。在实际问题研究中,为了全面、系统地分析问题,我们必须考虑众多影响因素。这些涉及的因素一般称为指标,在多元统计分析中也称为变量。因为每个变量都在不同程度上反映了所研究问题的某些信息,并且指标之间彼此有一定的相关性,因而所得的统计数据反映的信息在一定程度上有重叠。在用统计方法研究多变量问题时,变量太 多会增加计算量和增加分析问题的复杂性,人们希望在进行定量分析的过程中,涉及的变量较少,得到的信息量较多。主要目的是希望用较少的变量去解释原来资料中的大部分变量,将我们手中许多相关性很高的变量转化成彼此相互独立或不相关的变量。通常是选出比原始变量个数少,能解释大部分资料中变量的几个新变量,即所谓主成分,并用以解释资料的综合性指标。由此可见,主成分分析实际上是一种降维方法。
分析步骤
数据标准化;
一、求相关系数矩阵;
二、一系列正交变换,使非对角线上的数置0,加到主对角上;
三、得特征根xi(即相应那个主成分引起变异的方差),并按照从大到小的顺序把特征根排列;
四、求各个特征根对应的特征向量;
五、用下式计算每个特征根的贡献率Vi;
Vi=xi/(x1+x2+........)
六、根据特征根及其特征向量解释主成分物理意义。
主成分分析的基本思想
主成分分析是设法将原来众多具有一定相关性(比如P个指标),重新组合成一组新的互相无关的综合指标来代替原来的指标。
主成分分析,是考察多个变量间相关性一种多元统计方法,研究如何通过少数几个主成分来揭示多个变量间的内部结构,即从原始变量中导出少数几个主成分,使它们尽可能多地保留原始变量的信息,且彼此间互不相关.通常数学上的处理就是将原来P个指标作线性组合,作为新的综合指标。
主成分分析是把几个综合变量来代替原来众多的变量,使这些综合变量能尽可能地代表原来变量的信息量,而且彼此之间互不相关的一种数学降维的方法。
第三篇:材料成分分析
材料成分分析
成分分析通过精密测试仪器,能提供材料全方位的质量表征、性能评价和机理分析。服务领域涉及电子、通讯、机械、化工、生物、钟表、五金、灯饰、家具、工艺礼品等行业、企业及相关产品、各类研发中心开展材料表面技术科研和产品开发提供分析检测服务。
信标检测分析技术服务中心承接各种材料和产品(金属、非金属、聚合物和生物材料)的性能检测,进行材料的定性定量分析、组织结构分析、化学成分分析、表面及微区的形貌、力学性质及物化性能等多项测试,综合利用化学分析、热分析、元素分析、光谱分析、色谱分析五大分析方法。可高效、准确还原材料组成、分析材料配方,大大缩短材料研发、上市周期,节省材料研发成本。
成分分析实验仪器
实验室配备对未知物进行剖析鉴定的国际先进仪器设备主要有:气相色谱/质谱联用仪(GC-MS)、液相色谱/质谱联用仪(LC-MS)、核磁共振波谱仪(NMR)、红外光谱仪(IR)、凝胶渗透色谱仪(GPC)等有机化学结构分析仪器,以及等离子发射光谱仪(ICP-AES)、等离子体质谱仪(ICP-MS)、原子吸收光谱仪、原子荧光光谱仪、离子色谱仪、X射线荧光光谱仪等无机分析仪器。
我中心投资购置了完整的成分分析试验数据库,配备专业的材料成分分析技术工程师。
成分分析服务
1、有机溶剂分析:油漆稀释剂,天那水,脱漆剂、电子、纺织、印刷行业用溶剂。
2、固体物质,粉末渣体等。
3、气雾剂、光亮剂、杀虫剂、脱模剂、润滑剂、制冷剂、空气清新剂。
4、各种助剂分析:电子行业(助焊剂)、纺织行业、涂料、塑料加工行业所用的助剂:乳化剂、润湿分散剂、消泡剂、阻燃剂等;电镀(锌、铜、铬、镍、贵重金属)助剂分析:前处理添加剂、光亮剂、辅助光亮剂等。
5、纺织、皮革助剂分析:柔软剂、匀染剂、整理剂等。
6、塑料和橡胶制品助剂分析:增塑剂、塑化剂、抗氧剂、阻燃剂、光和热稳定剂、发泡剂、填充剂、抗静电剂等。
7、化妆品分析:洗发、护发用品、护肤用品、美容用品、口腔卫生制品等。
8、油墨分析:墨水、感光油墨、印刷油墨等。
9、洗涤剂分析:民用和工业用清洗剂。
10、高分子材料:胶粘剂、纤维、涂料、橡胶、塑料。
11、石油化学品分析:润滑油、切削液等。
第四篇:主成分分析法的优点
主成分分析法的优点:
1、可消除评价指标之间的相关影响
因为主成分分析在对原指标变量进行变换后形成了彼此相互独立的主成分,而且实践证明指标之间相关程度越高,主成分分析效果越好。
2、可减少指标选择的工作量
对于其它评价方法,由于难以消除评价指标间的相关影响,所以选择指标时要花费不少精力,而主成分分析由于可以消除这种相关影响,所以在指标选择上相对容易些。
3、当评级指标较多时还可以在保留绝大部分信息的情况下用少数几个综合指标代替原指标进行分析
主成分分析中各主成分是按方差大小依次排列顺序的,在分析问题时,可以舍弃一部分主成分,只取前后方差较大的几个主成分来代表原变量,从而减少了计算工作量。
4、在综合评价函数中,各主成分的权数为其贡献率,它反映了该主成分包含原始数据的信息量占全部信息量的比重,这样确定权数是客观的、合理的,它克服了某些评价方法中认为确定权数的缺陷。
5、这种方法的计算比较规范,便于在计算机上实现,还可以利用专门的软件。主成分分析法的缺点:
1、在主成分分析中,我们首先应保证所提取的前几个主成分的累计贡献率达到一个较高的水平(即变量降维后的信息量须保持在一个较高水平上),其次对这些被提取的主成分必须都能够给出符合实际背景和意义的解释(否则主成分将空有信息量而无实际含义)。
2、主成分的解释其含义一般多少带有点模糊性,不像原始变量的含义那么清楚、确切,这是变量降维过程中不得不付出的代价。因此,提取的主成分个数m通常应明显小于原始变量个数p(除非p本身较小),否则维数降低的“利”可能抵不过主成分含义不如原始变量清楚的“弊”。
聚类分析法优点:
聚类分析模型的优点就是直观,结论形式简明
聚类分析法缺点:
在样本量较大时,要获得聚类结论有一定困难。由于相似系数是根据被试的反映来建立反映被试间内在联系的指标,而实践中有时尽管从被试反映所得出的数据中发现他们之间有紧密的关系,但事物之间却无任何内在联系,此时,如果根据距离或相似系数得出聚类分析的结果,显然是不适当的,但是,聚类分析模型本身却无法识别这类错误。
第五篇:手机材料成分分析
手机材料成分分析
手机型号:Nokia 5130XM
诺基亚在造型上并没有太大的突破,依旧是采用传统的直板设计,而传统的键盘和屏幕设计也没有太多的创意,加上机身三围尺寸达到了107.4×46.8×14.8mm,同样并不是很讨好,不过手机材质经过抛光处理,颇有时尚气息。在配置方面,手机内置一枚200万像素摄像头,屏幕则是2.0英寸QVGA分辨率,这样的配置只能算得上是入门级别。
手机外壳:使用的是ABS材料。ABS树脂是指 丙烯腈-苯乙烯-丁二烯共聚物,ABS是Acrylonitrile Butadiene Styrene的首字母缩写,其是一种强度高、韧性好、易于加工成型的热塑型高分子材料。
屏幕材质:使用的是TFT材质屏幕。TFT(Thin Film Transistor)即薄膜场效应晶体管,属于有源矩阵液晶显示器中的一种。它可以“主动地”对屏幕上的各个独立的像素进行控制,这样可以大大提高反应时间。一般TFT的反应时间比较快,约80毫秒,而且可视角度大,一般可达到130度左右,主要运用在高端产品。所谓薄膜场效应晶体管,是指液晶显示器上的每一液晶象素点都是由集成在其后的薄膜晶体管来驱动。从而可以做到高速度、高亮度、高对比度显示屏幕信息。TFT属于有源矩阵液晶显示器,在技术上采用了“主动式矩阵”的方式来驱动,方法是利用薄膜技术所作成的电晶体电极,利用扫描的方法“主动拉”控制任意一个显示点的开与关,光源照射时先通过下偏光板向上透出,借助液晶分子传导光线,通过遮光和透光来达到显示的目的。
电池:锂电池。锂电池是一类由锂金属或锂合金为负极材料、使用非水电解质溶液的电池。最早出现的锂电池来自于伟大的发明家爱迪生,使用以下反应:Li+MnO2=LiMnO2该反应为氧化还原反应,放电。由于锂金属的化学特性非常活泼,使得锂金属的加工、保存、使用,对环境要求非常高。现在锂电池已经成为了主流。
手机芯片材料:winmax芯片
手机芯片通常是指应用于手机通讯功能的芯片,包括基带、处理器、协处理器、RF、触摸屏控制器芯片、Memory、处理器、无线IC和电源管理IC等。目前主要手机芯片平台有MTK、ADI、TI、AGERE、ST-NXP Wireless、INFINEON、SKYWORKS、SPREADTRUM、Qualcomm等。