您的当前位置:首页正文

一种改进的多类支持向量机超光谱图像分类方法

2020-12-17 来源:尚车旅游网
维普资讯 http://www.cqvip.com 第3卷第1期 2008年2月 智能系统学报 V01.3 No.1 Feb.2008 CAAI Transactions on Intelligent Systems 一种改进的多类支持向量机超光谱图像分类方法 赵春晖,陈万海,万建 (哈尔滨工程大学信息与通信工程学院,黑龙江哈尔滨150001) 摘要:支持向量机(SVM)是建立在统计学理论基础上的一种机器学习方法,用于解决二类分类问题,如何有效地 将其推广到多类分类问题是一个正在研究的课题.总结了现有的主要的支持向量机多类分类算法,并在1一a一1 SVM 分类算法基础上提出一种二次分类的方法。改良了惩罚因子,提高了不易分的类别之间的可分程度.通过对超光谱 图像进行分类实验,结果表明该方法具有较高的分类精度. 关键词:支持向量机;二次分类;多类支持向量机 中图分类号:TN919.81文献标识码:A文章编号:1673—4785(2008)O1—0077—06 An improved hyperspectrai image classification method for a muiticlass support vector machine ZHAO Chun-hui,CHEN Wan-hai,WAN j ian (College of Information and Communication Engineering,Harbin Engineering University,Harbin 1 5000 1,China) Abstract:SVM is a machine learning method developed on the basis of statistics theory and originally de— signed for binary classification problems.The most effective way to extend it for multiclass classification is still an area of considerable discussion.This paper presental a secondary classification method based on l— a-1 SVM classification algorithm after a general overview of typical methods for a multiclass SVM.Our method improves the penalty factors,SO it enhances the divisibility of classes that were difficult to classify. Experimental results of hyperspectral image classification showed that the suggested multiclass SVM has higher classification precision. Keywords:support vector machine;secondary classification;multiclass SVM 支持向量机(support vector machine,SVM)是 的分类效果.但当其应用到数据量大、维数高的超光 Vapnik等在统计学习理论的基础上发展的一种新 谱图像时,就会遇到如何选择最佳惩罚因子和最优 权向量系数的问题.由于目前尚无具体理论来指导 最佳惩罚因子的选择,因此需要依赖大量的试验和 研究者的经验,这对于高维的超光谱图像来说是很 不现实的.文中针对这种情况提出了一种改进的多 类支持向量机分类方法,即在1-a~l SVM分类结果 的基础上进行二次分类,以改善错分样本较多的类 别之间的混淆程度. 的模式识别方法,在解决小样本、非线性及高维模式 识别问题中表现出许多特有的优势.最初支持向量 机是用以解决两类分类问题,不能直接用于多类分 类,而实际应用中遇到的多是多类分类问题.目前已 经有许多算法将SVM推广到多类分类问题,这些 算法统称为多类支持向量机. 1-a—l SVM分类方法是一个具有代表性的多类 支持向量机算法,它在一定程度上改善了传统的多 类支持向量机存在的错分、拒分区域,可以获得较好 1 支持向量机的分类原理 支持向量机的分类原理可概括为:寻找一个最 优分类超平面,使得训练样本中的两类样本点能被 无错误的分开,并且要使两类的分类间隔最大;而对 线性不可分问题,通过核函数将低维输入空间的数 收稿日期:2007—06—06. 基金项目:高等学校博士学科点基金资助项目(20060217021);黑龙 江省自然科学基金资助项目(ZJ(30606一O1). 通讯作者:赵春晖.E-mail:zhaochunhui@hrbeu.edu,cn. 维普资讯 http://www.cqvip.com

・ 78・ 智能系统学报 第3卷 据映射到高维空间,从而将原低维空间的线性不可 分问题转化为高维空间上的线性可分问题,然后在 这个新空间中求取最优分类面. 支持向量机分类的目标就是根据结构风险最小 化原则,构造一个目标函数,寻找一个满足分类要求 的最优超平面,即寻找最优线性判别函数.设{墨)E RD为两类的样本数据, E{+1,一1)为相应的类 别标号,i一1,2,…, .如果X 属于第1类,则Y 一 1;如果z 属于第2类,则Y 一一1.线性判别函数的 一般形式为g( )一w・X+b,相应的分类面为X・ +b=0.为了使待分样本尽可能好地分开,要求分 类间隔(可表示为2/I1 w lI)最大,这相当于使l 1w l I最小.寻找最优分类面可转化为求解数学形式的优 化问题,通常可分为3种情况[ . 1)线性可分问题. 针对线性可分情况,问题的目标函数的数学形 式为 (1) 2)线性不可分问题. 在处理线性不可分问题时,引人松弛变量e。, 一1,2,…, 和惩罚因子C,对错分样本进行条件控 制.这样,式(1)可重新描述为 m,inJ(w,s)一 1 l1w lI +C∑e , ’ ’£ I一1 S.t. Y E(w・X )+ 一1+e ≥0, e ≥0,i一1,2,…, ,C>0. (2) 3)非线性可分问题. 对于非线性情况,引人核函数 (z)将原数据空 间的非线性问题转化为高维特征空间的线性问题, 即把X 替换为币(薯),其相应的内积Xi・Xi替换为 K(墨・X )一 (墨) (墨),式(2)变为 minJ(w,s)一 1 lI +C∑e , ,’ i一1 S.t. Y E(w・ (墨)+ 一1+e ≥0, e ≥0,i一1,2,…, ,C>0. (3) 对于上述凸优化问题,可引入拉格朗日乘子∞ ( 一1,2,…, ),根据目标函数及约束条件建立La— grange函数并将其转化为下面的对偶问题,即满足 约束条件: ∑yiai一0,0≤m≤C,i一1,2,…, . 对a 求解下列函数的最大值: Q( )一∑∞一 ∑ Y K(x ・xj).(4) 一1 i,j=l 式中: 一[a a …a ] .设此矩阵方程的解为a .这 是一个不等式约束下二次函数极值问题,存在唯一 解.且根据KKT条件,这个优化问题的解必须满 足: ∞(ylE(w・ (墨))+ 一1+e )一0, i一1,2,…, . 因此,对多数样本的a 将为0,对分类问题不 起什么作用,只有取值不为0的a 对应的样本才 决定最终分类结果,这样的样本称之为支持向量,它 们通常只是全体样本中的很少一部分. 求解上述问题后得到最终的判别函数为 ( )一sign{ 口 yiK(xi, )+b }. (5) i一1 根据 ( )的结果来确定x属于哪一类. 2 现有的多类支持向量机算法 目前对于多类分类问题,支持向量机的解决途 径有2种L2 ]:一种是通过构造多个两类SVM分类 器并将它们组合起来实现多类分类,将多类问题转 化为两类分类问题;第2种是一次性解决多类分类 问题,即把所有子分类器的参数直接放在一个最优 化方程里同时优化,这种思想尽管看起来简洁,但在 最优化问题求解过程中的变量远远多于第1种,训 练速度及分类精度也不占优势,因此目前多采用第 1种方法,文中介绍的这几种多类支持向量机都属 于第1种方法. 2.1 1一a-r SVM算法 1一a-r(one-against-rest)SVM算法是解决多类 分类问题的最早的方法,对于k(k≥2)类SVM分类 问题,把其中一类作为第1类,其余类视为另一类, 自然地将k分类问题转化为k个两类分类问题,得 到志个两类分类器,分类时未知样本最后的输出是 两类分类器输出为最大的那一类. 2.2 1一a-1 SVM算法 1一a-1(one-against—one)SVM算法是在每两类 之间训练一个分类器,因此对于一个k类问题,训练 阶段共构造 个两类分类器,每个分类器是取任意 2个类别的数据进行训练.在测试阶段可以采用不 同的方式测试样本属于哪一类,最常用的一种方法 是“最大投票法”,即每个两类分类器都对样本的类 别进行判断,采用投票机制为其相应的类别“投上一 票”,最后得票最多的类别即是该未知样本的所属 类.因此,文中在此算法的基础上,提出了一种改进 的多类支持向量机分类方法. 3 二次分类的多类支持向量机 支持向量机应用于实际植被的模式识别时,常 维普资讯 http://www.cqvip.com 第1期 赵春晖,等:一种改进的多类支持向量机超光谱图像分类方法 .79. 会出现某两类或某几类植被的光谱特性极为相似的 情况,它们在分类时往往会产生严重混淆的现象,导 致整体分类效果不够理想.这种现象产生的原因是 由于植物种类的分类精度很大程度上取决于植物长 势和叶面叶绿素含量,当不同物种叶面叶绿素的含 量相近时,容易错分,这就取决于实际拍摄图片的时 间和地点等各种因素.针对此现象文中提出了一种 二次分类的多类支持向量机,它是在1一a-1 SVM算 法的基础上改进的多类支持向量机分类方法. 采用1一a-1 SVM进行分类时,训练阶段需要在 每两类之间训练一个分类器,对于一个k类问题需 要构造C1个两类分类器.对于第i类和第 类之间 的训练,需要解决下列两类分类问题: 1 一 arin去(z  ) +C> e—t  ( ) , , , ( ) ( )+ ≥1~e ,If —i, ( ) ( )+bo≤~1+e ,If y : , e ≥0. (6) 在测试时采用最大投票法,判断符号函数: 厂( )一sign((wo) ( )+b ). (7) 若未知样本X属于第i类则第i类的票数加一, 反之第 类加一,X属于最后票数最多的那一类. 两类分类的支持向量机在训练阶段需要寻找最 佳惩罚因子C.如果惩罚因子选择的不恰当,分类精 度将会受到不良影响.采用1一a-1 SVM算法进行分 类时,若类别数k较大时,需要构造大量的两类分类 器.在实际应用中不可能做到把每个两类分类问题 都做多次实验来寻找最佳惩罚因子,因此提出了二 次分类的方法,分析采用1一a-1 SVM进行第1次分 类的结果,找出混淆最严重的组合,对它们进行二次 分类,寻找最佳惩罚因子重新分类,这样就可以减小 这些类别之间的混淆程度.二次分类算法在训练阶 段的模型如图1所示. II练样本 最终判决 函数 图1二次分类的训练阶段模型 Fig.1 Training stage model of secondary classification 进行二次分类时需要单独解决这个组合的两类 分类问题.对于k类问题,假设有一对混淆严重的组 合为第i类和第 类,其相应的对偶问题为 1TIaX∑口 一告∑ K(墨・xj), =1 ‘一i,j一1 0≤Oli≤C,∑yiOti一0,i一1,2,…,,z.(8) 式中:C为惩罚因子,用来对错分样本进行条件控 制,根据经验和多次实验得到最佳惩罚因子C ,设 此时的拉格朗日乘子a 为不等式约束的最优解,由 此得到权向量系数为 W 一∑口 ~X (9) 一1 把这个最佳惩罚因子C 和最优的权系数向量 X 反馈到l-a-1 SVM算法中重新分类. 4 实验结果与分析 光谱遥感图像进行实验.该图像取自1992年6月拍 摄的美国印第安纳州西北部印第安遥感试验区的一 部分[4],它包含了农作物和森林植被的混合区. 文中采用混淆矩阵和总体分类精度来分析分类 M— ::: ㈣ … j 第 类中去的样本总数,,z为类别数.如果混淆矩阵 中对角线上的元素值愈大,则表示分类结果的可靠 性愈高,如果混淆矩阵中非对角线上的元素值愈大, 则表示错误分类的现象愈严重,文中实验结果的混 淆矩阵采用表格的形式进行描述.像素的总体分类 ∑ OA一上 ・ (11) 式中:N为参与分类的总样本数, 为第i类正确 维普资讯 http://www.cqvip.com ・80・ 智能系统学报 第3卷 (a)真实地物灰度图 (b)9波段分类灰度图 图2基于1一a-1 SVM的分类灰度图 Fig.2 Grey image by 1-a-1 SVM classification 表1 9波段的混淆矩阵 1'abk l Mixture matrix of 9-waveband 总体分类精度:74.30 9/6. 从混淆矩阵中可以看出玉米和大豆这两类混淆 最严重,因此采用文中提出的二次分类方法,训练出 玉米和大豆两类别之间的最佳惩罚因子,并重新对 地物图像进行分类. 经过多次实验,得到玉米和大豆的惩罚因子c 和分类精度之问的关系如表2所示. 表2 9波段的惩罚因子和分类精度关系 Table 2 Rdati0fI between penalty factor and ela ̄'ification precision for 9-waveband 从表5中选取精度最大时对应的C为200. 二次分类的分类灰度图和混淆矩阵如图3、表3 所示. 图3基于二次分类的9波段分类灰度图 Fig.3 9-waveband greyimage by secondary classiifcation 表3 9波段的混淆矩阵 Table 3 Mixture matrix of 9一waveband 总体分类精度:74.9 9/5. 2)18波段的地物分类. 基于1一a-1 SVM的分类灰度图和混淆矩阵如 图4、表4所示. 图4基于1一a-1 SVM的18波段分类灰度图 Fig 4 18-waveband grey image by 1-a-1 SVM classiifaction 表4 18波段的混淆矩阵 Table 4 Mixture matrix of 18-waveband 总体分类精度:74.44 . 18波段的玉米和大豆的惩罚因子C和分类精 维普资讯 http://www.cqvip.com 第1期 赵春晖,等:一种改进的多类支持向量机超光谱图像分类方法 .81. 度之间的关系如表5所示. 表5 18波段的惩罚因子和分类精度关系 IbIe 5 Relation between penalty factor and dassiifcation precision for 18一waveband 从表5中选取18波段的最佳C为90. 二次分类的分类灰度图和混淆矩阵如图5、表6 所示. 图5基于二次分类的18波段分类灰度图 Fig.5 18-waveband grey image by secor1daIy classiifcation 表6 18波段的混淆矩阵 Tahle 6 Mixture matrix of 18-waveband 总体分类精度:75.67 . 3)5O波段的地物分类. 基于1一a一1 SVM的分类灰度图和混淆矩阵如 图6、表7所示. 图6基于1一a-1 SVM的50波段分类灰度图 Fig.6 50-waveband greyiHIage by1-a-1 SVM classiifcation 表7 50波段的混淆矩阵 Tabk 7 Mixture matrix of 50-waveband 总体分类精度:74・89 ・ 5O波段的玉米和大豆的惩罚因子C和分类精 度之间的关系如表8所示. . 表8 50波段的惩罚因子和分类精度关系 IbIe 8 I/elation bI 旧m Oenalty factor and damit' ̄ation precision for 50-waveband 从表中选取5O波段的最佳C是5O. 二次分类的分类灰度图和混淆矩阵如图7、表9 所示. 图7基于二次分类的50波段分类灰度图 Fig 7 50-waveband grey image by secondary classiifcation 表9 50波段的混淆矩阵 Table 9 Mixture matrix of 50-waveband 总体分类精度:78.12 . 表3、6、9所示的是利用文中提出的改进的二次 分类方法的结果,将其与1-a一1 SVM分类方法的混 维普资讯 http://www.cqvip.com ・82・ 智能系统学报 第3卷 淆矩阵表1、4、7相比较会发现,之前混淆较严重的 玉米一大豆这两类在新方法的分类结果中混淆样本 有了很大的改观.从分类的总体精度上还可以看出, 选取的波段数与分类精度也有很大的关系,波段数 目越多,所包含的光谱特性就越丰富,得到的分类结 果就越好. 分类总体精度提高不上去的主要原因是原始图 像的精度不高,由于使用的AVIRIS图像是从高空 拍摄,其分辨率仅为20 In×20 In,像元混合的概率 很大,而且图片拍摄于6月,玉米和大豆正处于生长 的早期,它们所反应的光谱特性极其相似,在这些客 观原因的影响下,这两类的分类精度不可能大幅度 的提高,仍存在一定的分类误差. 5 结束语 该文提出的二次分类方法保留了1一a-1 SVM 分类的优点,改善了超光谱图像分类中某些植被由 于光谱特性相似而产生严重混淆的问题.利用二次 分类方法可以在短时间内取得混淆最严重的类别的 最佳惩罚因子,将其应用到1一a-1 SVM的训练过程 中,得到最优的权系数向量和支持向量,改善了分类 精度.它弥补了1一a一1 SVM算法不能确定最佳惩罚 因子的缺陷,提高了支持向量机应用到超光谱图像 中的分类效果. 在许多的实际应用中都需要解决多类别的分类 问题,如何有效地将支持向量机推广到多类分类问 题仍有广阔的研究空间. 参考文献: [1]任建峰,郭 雷.多类支持向量机的自然图像分类I-j]. 西北工业大学学报,2005,23(3):295—298. REN Jianfeng,GUO Lei.Improving scene in ̄ge classifica— tion with multi-class SVMs I-J3.Journal of Northwestern Polytechnical University,2005,23(3):295—298. [2 ̄HSU C W,LIN C J.A comparison of methods for mul— ticlass support vector machines[-J3.IEEE Transactions on Neura】Networks,2002,13(2):415—425. [31刘志刚,李德仁,秦前清,等.支持向量机在多类分类问题 中的推广I-J3.计算机工程与应用,2004(7):10—13. LIU Zhigang,LI Deren,QIN Qianqing,et a1.An analyt— ical overview of methods for multi-category support vec— tor machines I-J3.Computer Engineering and Applica— tions,2004(7):10—13. [41 LANDGREBE D.Multispectral data analysis:a signal theory perspective[R].West Lafayette,USA:Universi— ty,1998. [53刘春红,赵春晖,张凌雁.一种新的高光谱遥感图像降维 方法I-J3.中国图像图形学报,2005,10(3):218—222. I IU Chunhong,ZHAO Chunhui,ZHANG Lingyan.A new method of hyperspectral remote sensing image di— mensional reduction[J3.Journal of Image and Graphic, 2005,10(3):218—222. [63赵英时.遥感应用分析原理与方法[M].北京:科学出版 社,2003. 作者简介: 赵春晖,男,1965年生,教授,博士 目目目生导师.获省部级科技奖5项.主要研 究方向为智能信息处理技术、图像处 理.出版著作3部,发表论文200余篇. 陈万海,男,1963年生,副教授,博 士研究生.主要研究方向为超光谱遥感 图像处理技术,发表论文18篇. 万建,男,1980年生,博士研究 生.主要研究方向为信号与图像处理, 发表论文5篇. 

因篇幅问题不能全部显示,请点此查看更多更全内容