第一篇:基于BP神经网络的高光谱果树树种识别研究
基于BP神经网络的高光谱果树树种识别研究
摘要:高光谱具有波段窄、波段多的特点,能够提供比多光谱遥感更精细的地物光谱信息,为识别光谱性质相似的森林树种提供了有效途径。对南疆盆地4种主栽果树树种(苹果、香梨、核桃、红枣)的冠层光谱数据进行测量,用BP神经网络对原始光谱数据及其经一阶微分、对数一阶微分、归一化一阶微分变换后的光谱数据进行分类识别,结果表明:对数一阶微分和归一化一阶微分变换后树种识别精度分别为94%和88%以上;红边区的光谱波段包含了大量树种识别的信息;采用BP神经网络能够对南疆盆地主栽果树进行基于冠层光谱的分类,而且分类精度相对较高。
关键词:高光谱数据;波段选择;BP神经网络;树种识别;果树
中图分类号: S126;TP391.4文献标志码: A文章编号:1002-1302(2016)05-0410-04
在南疆特色林果产业化的进程中,其信息化建设明显滞后,传统调查方式以多光谱遥感和地面辅助调查为主,不仅分辨率具有局限性,而且费时、耗力、周期长[1]。自1980年以来,高光谱遥感冲破技术障碍,在对地观测方面获得了重大突破,相比多光谱遥感技术,它具有波段窄、数量多的特征,可以提供更详细的目标光谱信息,为研究地物的细微特征提供了快速、准确、有效的途径[2]。因此林果树种的高光谱遥感识别对新疆南疆盆地特色林果产业的可持续经营具有重要的现实意义[3-5]。目前,我国已有一些基于高光谱遥感技术进行森林树种识别的研究。宫鹏等通过对6种主栽针叶树种的高光谱实地测量,开展了不同季节(夏、秋季)针叶树种的高光谱数据分类研究[6]。王志辉等利用测量的4种树种叶片光谱数据,进行了可识别性波段的选择与光谱特征参量的分析[7]。于祥等对广西红树林进行高光谱实测,通过多种光谱分类方法对多个红树林树种进行了分类研究[8]。
高光谱遥感技术在为树种的精细识别带来可能性的同时,也带来了数据冗余度大的问题。怎样在高光谱数据信息利用最大化的基础上,高效处理高光谱数据成为高光谱研究领域的焦点和未来发展的重要方向[9-11]。刘秀英等利用分层聚类法和逐步判别分析进行波段选择,对桂花树、小叶樟树、雪松和杉木4个树种的识别进行了研究,取得了较好的效果[12]。藏卓等利用对雪松、黑松、马尾松、杉木等针叶树种的高光谱实测,通过主成分分析和遗传算法两种波段选择方法对树种识别进行比较研究,有一定的实用性[13]。此外,许多学者基于遥感影像对森林类型进行分类时,使用了最佳指数法、波段指数法、灰度值法等几种常用的高光谱遥感影像的波段选择方法,认为最佳指数法用于高光谱遥感的树种识别具有一定可行性和优越性[14-16]。因此,本研究采用最佳指数法对高光谱数据进行波段选择,并利用BP神经网络对波段选择数据进行分类,从而对新疆南疆盆地4种主栽果树树种进行分类识别,为探索星载高光谱遥感树种识别提供技术支持。
1材料与方法
1.1试验对象
试验时间为2014年6月,试验地点位于新疆阿克苏地区红旗坡农场(地理坐标41°14′39″~41°16′18″N、80°15′46″~80°18′51″E,海拔1 213 m),试验对象是处在相同立地条件、自然状态下生长的4种南疆塔里木盆地主栽果树树种:红富士苹果(Malus pumila Mill)、库尔勒香梨(Pyru bretschneideri Rehd)、核桃(Juglans regia Linn.)、红枣(Ziziphus zizyphus Mill)。选择冠型均匀的样本,苹果为大、中、小冠型,香梨、核桃为大冠型,红枣为小冠型,共选择样地21块,总样株252株,其中苹果样地6块,每块11~12株,香梨、核桃样地各5块,每块12~13株,红枣样地5块,每块12株,基本生长状况如表1所示。
1.2数据获取
光谱测量仪器采用美国ASD公司生产的手持式野外光谱辐射仪(FieldSpec HandHeld),该仪器能够在325~1 075 nm 的波长范围内进行连续的光谱测量,光谱分辨率和光谱采样间隔均为1 nm,视场角为25°,共751个波段。在天气晴朗、无风无云的条件下,选择正午太阳高度角变化不大的时间段(北京时间12:00―16:00)进行4种果树冠层光谱反射率数据测量。测量时,将光谱仪探头垂直向下置于冠层之上,并与冠幅保持约1 m高度,同时根据所选样株冠幅大小调整探头与冠幅的距离。将每个样株冠层分为阴面、阳面2个方向进行测量,每个方向重复测量5次,取平均值作为样株这一方向上的光谱反射率,之后在剔除异常反射率光谱曲线的基础上,对每种树该方向的所有样本的光谱反射率进行平均,得到每种树该方向的光谱值。为保证数据的有效性与准确性,每隔10 min进行1次标准白板矫正。
1.3高光谱数据转换
从光谱测量结果看,在400 nm以前和900 nm以后的光谱数据噪声比较大,因此,剔除了首尾两端噪音较大的数据,只对400~900 nm范围内的光谱数据进行处理[17]。光谱一阶微分是处理光谱数据常用的方法之一[18],它既可以有效地解决光谱数据间系统误差的问题、减少背景噪声(通常指大气辐射、散射和吸收)对目标光谱的干扰[7,19],又能够加强光谱曲线在坡度上的微小变化[20],从而辨认出重合的光谱,有利于将可识别地物的光谱吸收峰参数提取出来[2]。光谱反射值经过对数和归一化变换后,不仅有利于加强红光区与绿光的光谱差异,而且有利于削弱因光强变化而引起的乘性因素的影响[12]。但是,只对光谱数据作对数和归一化处理是不够的,还需进行微分转换,这样才能取得相对于原始光谱更好的效果,因为如此,即可在消除乘性因素的基础上降低附加低频噪声的影响[6]。因此本试验对原始光谱数据R进行如下3种变换:
(1)对R的一阶微分变换:
d(R)=[(r3-r1)/Δλ,(r4-r2)/Δλ,…,(rn-rn-2)/Δλ](Δλ为2倍波段宽)
(2)对R的对数一阶微分变换:
lg(R)=[lg(r1),lg(r2),lg(r3),…,lg(rn)]
d[lg(R)]
(3)对R的归一化一阶微分变换:
N(R)=[(r1-rmin)/(rmax-rmin),(r2-rmin)/(rmax-rmin),…,(rn-rmin)/(rmax-rmin)]
d[N(R)]
1.4波段选择方法
本试验采用最佳指数法对高光谱数据进行波段选择。最佳指数因子将标准差与相关系数有效地结合,其基本原理是光谱数据所包含的信息量与标准差成正比,标准差愈大,信息量愈多;光谱数据的独立性与波段间的相关系数成反比,波段间的相关系数愈低,独立性愈高且信息冗余度愈小[14]。其计算公式为:
OIF=∑3i=1Si/∑3i=1|Rij|
式中:OIF表示最佳指数因子,Si是第i个波段的标准差,Rij是第i、j 2个波段间的相关系数。
1.5人工神经网络的应用
神经网络(artificial neural network,ANN)是一种人脑的抽象计算模型,通过各个处理单元间的有机连接而形成网络,以此进行人脑神经网络结构与功能模拟的一种计算机建模方式[21]。目前,BP神经网络是运用最广的方法之一。BP(back-propagation)神经网络是一种多层前馈型神经网络,它不仅包含输入层和输出层,而且具有一层或多层隐藏层,但最常用的为单层结构[22]。BP神经网络算法需通过正、反向传播两个过程:正向传播过程就是样本信息最先从输入层开始,经过隐藏层的逐步计算,传送到输出层最后得到预测结果;得到预测误差后便进入反向传播过程,即误差逐层反方向传回输出层,期间所有权值得以修正[23]。如此反复迭代,直到满足用户要求为止,通过对BP神经网络输入-输出间映射能力的训练,便能够对其他待定信息进行自动分类和模式识别[24]。本次试验随机选取1/3样本作为训练样本,剩余的2/3样本作为测试样本,最终以测试样本的预测精度用作评价数据变换及波段选择方法优劣的指标。
2结果与分析
2.14种果树冠层光谱特征
植物的组织结构、生化成分、形态学特征等决定了其光谱反射特性[25]。在可见光波段,绿色植被的反射光谱主要受到冠层叶绿素含量和盖度的影响,反射率较低;近红外波段则受到冠层结构、叶面积指数和生物量的影响,反射率较高[26]。正是因为上述因素的影响,使得不同植被的光谱反射率存在一定的差异,而这些因素与植被的生长发育及环境等密切相关,同时又与岩石、土壤、水体等地物的光谱特征截然不同[27]。
根据苹果、香梨、核桃、红枣实测的冠层光谱数据,在剔除受首尾噪声影响的波段和奇异值后,分别进行均值处理,运用Origin软件绘制得南疆盆地4种主栽果树树种冠层阳面、冠层阴面的光谱曲线(图
1、图2)。由图
1、图2知,从总体上看,尽管4种果树的光谱曲线间都存在差异,但其整体走势基本一致,呈现出典型的绿色植被光谱曲线特征。在400~490 nm波段时,反射率曲线较为平缓,并且反射值低,均处于0.1以下;随波长增大,反射率开始缓慢上升,在550 nm附近呈现出一个反射峰,即“绿峰”,这是由于植被叶绿素的强烈反射造成,也是人肉眼看到植物呈绿色的原因[28];然后反射率值开始下降,在680 nm附近形成“红谷”,这和叶绿素a在680 nm与700 nm具有较强的吸收作用有关[29];“红谷”过后,反射率骤然上升,即为“红边效应”[30];在760~900 nm近红外波段范围内,反射率曲线在750 nm附近形成拐点后平滑上升,此处可以认为是植被防灼伤的自卫本能[27]。由此说明,在不同波段,南疆盆地4种主栽果树树种冠层光谱特征表现不同。
2.2最佳指数法的波段组合
以上文提取的501个波段为数据源,首先应用Excel软件对平均光谱每10个连续波段进行平均,并计算出各单波段的标准差,然后应用Matlab软件计算各波段间的相关系数矩阵,再分别求出所有可能3个波段组合对应的OIF,OIF越大,则信息量越大,独立性越高,反之,信息量越少,相关性越大,最后将OIF值进行排序,即可选出最佳波段组合[15]。由表2至表5知,原始光谱阳面最佳波段组合为波段32-49-50,即波段范围710~719、880~889、890~899 nm;阴面最佳波段组合为波段1-38-39,即波段范围400~409、770~779、780~789 nm;一阶微分光谱阳面最佳波段组合为波段31-42-49,即波段范围700~709、810~819、880~889 nm;阴面最佳波段组合为波段21-33-34,即波段范围600~609、720~729、730~739 nm;对数一阶微分光谱阳面最佳波段组合为波段29-35-50,即波段范围680~689、740~749、890~899 nm;阴面最佳波段组合为波段4-30-40,即波段范围430~439、690~699、790~799 nm;归一化一阶微分光谱阳面最佳波段组合为波段16-34-49,即波段范围550~559、730~739、880~889 nm;阴面最佳波段组合为波段6-34-39,即波段范围450~459、730~739、750~759 nm。
2.3应用BP神经网络的树种识别
将原始光谱数据、一阶微分、对数一阶微分和归一化一阶微分变换后的光谱数据运用Clementine 12.0中的Neural Net模型进行分类,通过调整网络参数得到最优的网络结构,从而得到最优的预测模型[31]。经过反复试验确定BP神经网络的最优结构为:将30个所选波段作为输入神经元,4个预先分类值作为输出神经元,隐藏层1层,隐藏单元5个,各层间采用Sigmoid激励函数,迭代次数100次,训练算法选择“快速训练法”,训练模式选择“专家”,冲量项设为0.9,初始学习率设为0.3。由表
6、表7可知,无论是果树冠层阳面还是阴面光谱数据,对数一阶微分变换均取得了最佳效果,前者测试精度为94.70%,后者测试精度为96.58%,均超过了90%,归一化一阶微分变换后的光谱数据识别效果次之,而原始光谱数据的树种识别精度最低,仅为60.93%和62.33%。3种经过微分转换处理后的光谱数据与原始数据相比,分类精度超过其30%左右,充分说明高光谱数据的微分处理能产生较高的分类精度。
2.4波段重要性
Neural Net模型在进行分类时可以计算出变量的贡献率,经对数一阶微分处理后的光谱数据识别精度最高,因此对对数一阶微分光谱数据对应的特征波段进行变量重要性计算,结果见图
3、图4。由图
3、图4可知,阳面波段组合中各个波段在树种分类时的贡献率依次为685 nm>684 nm>897 nm>689 nm>898 nm>746 nm>742 nm>747 nm>687 nm>686 nm,阴面波段组合中各个波段在树种分类时的贡献率依次为690 nm>693 nm>699 nm>697 nm>430 nm>796 nm>692 nm>691 nm>795 nm>695 nm,贡献率较大的波段均位于红边区(680~760 nm),这充分证明大量树种识别的信息包含在红边区的光谱波段中。
3讨论与结论
原始光谱数据经对数一阶微分、归一化一阶微分变换后可改善树种识别精度。对手持式野外光谱辐射仪测得的4种果树树种高光谱数据不作任何处理,直接进行波段选择,然后利用BP神经元网络来识别此4种树种,效果并不理想,识别精度仅为60.93%和62.33%。运用高光谱数据的转换方法能够提高树种的识别精度,2种最理想的转换方法是对数一阶微分和归一化一阶微分,分类精度分别在94%和88%以上。这与宫鹏等用神经元网络算法对6种主要针叶树种进行分类识别时得到的对数变换后一阶微分和归一化变换后一阶微分能够获得最好的识别精度的结果相一致[6]。另外,刘秀英等利用逐步判别分析法对杉木和马尾松进行分析时,同样得到了对数一阶微分的识别精度最高,精度为96.67%[19]。
大量树种识别的信息包含在红边区的光谱波段中。Neural Net模型在进行分类时对对数一阶微分光谱数据对应的特征波段进行了变量重要性计算,结果显示,贡献率较大的波段(阳面波段组合:685 nm、684 nm、689 nm、746 nm、742 nm、747 nm、687 nm、686 nm,阴面波段组合:690 nm、693 nm、699 nm、697 nm、692 nm、691 nm、695 nm)都在红边区范围(680 nm~760 nm)内。这与刘秀英等采用分层聚类法对杉木、雪松、小叶樟树和桂花进行分类识别获得的红边区的光谱波段包含了大量树种识别的信息结果相一致[12]。
BP神经网络进行南疆盆地主栽果树树种识别时取得了较好的分类效果。由于BP神经网络具有强有力的学习能力,可以实现输入与输出之间的高度非线性映射,因此被广泛的应用在各种品种识别领域中,并得到了十分理想的分类效果[32-34]。本研究通过BP神经网络算法对南疆盆地4种主栽果树树种进行分类,最高精度达到96.58%,说明采用BP神经网络算法能够对南疆盆地主栽果树树种进行基于冠层光谱的分类,并且达到了相对较高的识别精度。
参考文献:
[1]谭炳香,李增元,陈尔学,等.高光谱遥感森林信息提取研究进展[J].林业科学研究,2008,21(z1):105-111.[2] Salehia B,Zoej M J V.The delineation of tree crowns in Australian mixed species forests using hyperspectral compact air-borne spectrographic imager(CASI)data[J].Remote Sense Environ,2002,36:332.[3] 陈国芳,尼和迈提?霍嘉.新疆林果业产业化发展的对策建议[J].新疆农业科学,2005,42(增刊1):211-212.[4]李金叶,袁强,蒋慧.基于区域适应性的特色林果业发展探讨[J].新疆农业科学,2010,47(4):741-749.[5]孙兰凤.可持续视角下的新疆特色林果业发展研究[D].乌鲁木齐:新疆大学,2009.[6]宫鹏,浦瑞良,郁彬.不同季相针叶树种高光谱数据识别分析[J].遥感学报,1998,2(3):211-217.[7]王志辉,丁丽霞.基于叶片高光谱特性分析的树种识别[J].光谱学与光谱分析,2010,30(7):1825-1829.[8]于祥,赵冬至,张丰收,等.红树林高光谱分析技术研究[J].滨州学院学报,2006,22(6):53-56.[9]陈述澎,童庆喜,郭华东,等.遥感信息机理研究[M].北京:科学出版社,1998:139.[10]王志辉.高光谱遥感在森林树种识别中的应用[D].杭州:浙江农林大学,2011.[11]褚西鹏.基于叶片非成像高光谱数据树种分类[D].杭州:浙江农林大学,2012.[12]刘秀英,林辉,熊建利,等.森林树种高光谱波段的选择[J].遥感信息,2005(4):41-44,64.[13]臧卓,林辉,孙华,等.南方主要针叶树种高光谱数据降维分类研究[J].中南林业科技大学学报,2010,30(11):20-25.[14]李俊明.基于HJ-1A高光谱遥感树种识别的研究[D].哈尔滨:东北林业大学,2013.[15]严恩萍,林辉,莫登奎,等.基于光谱特征的森林类型识别研究[J].中南林业科技大学学报,2011,31(11):23-29.[16]柳萍萍.基于Hyperion数据的森林类型识别[D].长沙:中南林业科技大学,2012.[17]邢东兴,常庆瑞.基于花期果树冠层光谱反射率的果树树种辨识研究[J].红外与毫米波学报,2009,28(3):207-211.[18]李明州.光谱分析技术和应用[M].北京:科学出版社,2006:163.[19]刘秀英,臧卓,孙华,等.基于高光谱数据的杉木和马尾松识别研究[J].中南林业科技大学学报,2011,31(11):30-33.[20]童庆禧,张兵,郑兰芬.高光谱遥感的多学科应用[M].北京:电子工业出版社,2006:74-79.[21]薛薇,陈欢歌.Clementine数据挖掘方法及应用[M].北京:电子工业出版社,2010:181.[22]王志军,丛培盛,周佳璐,等.基于图像处理与人工神经网络的小麦颗粒外观品质评价方法[J].农业工程学报,2007,23(1):158-161.[23]张保生,姚瑞央.基于BP神经网络算法的红枣分级技术应用[J].广东农业科学,2010,37(11):282-283.[24]杨希,王鹏.基于BP神经网络的高分辨率遥感影像分类[J].测绘,2011,34(3):115-118.[25]李小梅.多角度高光谱遥感森林类型分类方法研究[D].呼和浩特:内蒙古农业大学,2010.[26]林文鹏,李厚增,黄敬峰,等.上海城市植被光谱反射特征分析[J].光谱学与光谱分析,2010,30(11):3111-3114.[27]谭炳香.高光谱遥感森林类型识别及其郁闭度定量估测研究[D].北京:中国林业科学研究院,2006.[28]邓良基.遥感基础与应用[M].北京:中国农业出版社,2009.[29]肖海燕,曾辉,昝启杰,等.基于高光谱数据和专家决策法提取红树林群落类型信息[J].遥感学报,2007,11(4):531-537.[30]何诗静.基于叶片和冠层级别的高光谱城市树种识别[D].武汉:华中农业大学,2011.[31]刘飞,王莉,何勇,等.应用可见/近红外光谱进行黄酒品种的判别[J].光谱学与光谱分析,2008,28(3):586-589.[32]吴桂芳,蒋益虹,王艳艳,等.基于独立主成分和BP神经网络的干红葡萄酒品种的鉴别[J].光谱学与光谱分析,2009,29(5):1268-1271.[33]王艳艳,何勇,邵咏妮,等.基于可见-近红外光谱的咖啡品牌鉴别研究[J].光谱学与光谱分析,2007,27(4):702-706.[34]邵咏妮,何勇,鲍一丹.基于独立组分分析和BP神经网络的可见/近红外光谱蜂蜜品牌的鉴别[J].光谱学与光谱分析,2008,28(3):602-605.范钊.黄河流域农田土壤有机氯农药残留污染特征研究[J].江苏农业科学,2016,44(5):414-419.