・ 78・ 智能系统学报 第3卷 据映射到高维空间,从而将原低维空间的线性不可 分问题转化为高维空间上的线性可分问题,然后在 这个新空间中求取最优分类面. 支持向量机分类的目标就是根据结构风险最小 化原则,构造一个目标函数,寻找一个满足分类要求 的最优超平面,即寻找最优线性判别函数.设{墨)E RD为两类的样本数据, E{+1,一1)为相应的类 别标号,i一1,2,…, .如果X 属于第1类,则Y 一 1;如果z 属于第2类,则Y 一一1.线性判别函数的 一般形式为g( )一w・X+b,相应的分类面为X・ +b=0.为了使待分样本尽可能好地分开,要求分 类间隔(可表示为2/I1 w lI)最大,这相当于使l 1w l I最小.寻找最优分类面可转化为求解数学形式的优 化问题,通常可分为3种情况[ . 1)线性可分问题. 针对线性可分情况,问题的目标函数的数学形 式为 (1) 2)线性不可分问题. 在处理线性不可分问题时,引人松弛变量e。, 一1,2,…, 和惩罚因子C,对错分样本进行条件控 制.这样,式(1)可重新描述为 m,inJ(w,s)一 1 l1w lI +C∑e , ’ ’£ I一1 S.t. Y E(w・X )+ 一1+e ≥0, e ≥0,i一1,2,…, ,C>0. (2) 3)非线性可分问题. 对于非线性情况,引人核函数 (z)将原数据空 间的非线性问题转化为高维特征空间的线性问题, 即把X 替换为币(薯),其相应的内积Xi・Xi替换为 K(墨・X )一 (墨) (墨),式(2)变为 minJ(w,s)一 1 lI +C∑e , ,’ i一1 S.t. Y E(w・ (墨)+ 一1+e ≥0, e ≥0,i一1,2,…, ,C>0. (3) 对于上述凸优化问题,可引入拉格朗日乘子∞ ( 一1,2,…, ),根据目标函数及约束条件建立La— grange函数并将其转化为下面的对偶问题,即满足 约束条件: ∑yiai一0,0≤m≤C,i一1,2,…, . 对a 求解下列函数的最大值: Q( )一∑∞一 ∑ Y K(x ・xj).(4) 一1 i,j=l 式中: 一[a a …a ] .设此矩阵方程的解为a .这 是一个不等式约束下二次函数极值问题,存在唯一 解.且根据KKT条件,这个优化问题的解必须满 足: ∞(ylE(w・ (墨))+ 一1+e )一0, i一1,2,…, . 因此,对多数样本的a 将为0,对分类问题不 起什么作用,只有取值不为0的a 对应的样本才 决定最终分类结果,这样的样本称之为支持向量,它 们通常只是全体样本中的很少一部分. 求解上述问题后得到最终的判别函数为 ( )一sign{ 口 yiK(xi, )+b }. (5) i一1 根据 ( )的结果来确定x属于哪一类. 2 现有的多类支持向量机算法 目前对于多类分类问题,支持向量机的解决途 径有2种L2 ]:一种是通过构造多个两类SVM分类 器并将它们组合起来实现多类分类,将多类问题转 化为两类分类问题;第2种是一次性解决多类分类 问题,即把所有子分类器的参数直接放在一个最优 化方程里同时优化,这种思想尽管看起来简洁,但在 最优化问题求解过程中的变量远远多于第1种,训 练速度及分类精度也不占优势,因此目前多采用第 1种方法,文中介绍的这几种多类支持向量机都属 于第1种方法. 2.1 1一a-r SVM算法 1一a-r(one-against-rest)SVM算法是解决多类 分类问题的最早的方法,对于k(k≥2)类SVM分类 问题,把其中一类作为第1类,其余类视为另一类, 自然地将k分类问题转化为k个两类分类问题,得 到志个两类分类器,分类时未知样本最后的输出是 两类分类器输出为最大的那一类. 2.2 1一a-1 SVM算法 1一a-1(one-against—one)SVM算法是在每两类 之间训练一个分类器,因此对于一个k类问题,训练 阶段共构造 个两类分类器,每个分类器是取任意 2个类别的数据进行训练.在测试阶段可以采用不 同的方式测试样本属于哪一类,最常用的一种方法 是“最大投票法”,即每个两类分类器都对样本的类 别进行判断,采用投票机制为其相应的类别“投上一 票”,最后得票最多的类别即是该未知样本的所属 类.因此,文中在此算法的基础上,提出了一种改进 的多类支持向量机分类方法. 3 二次分类的多类支持向量机 支持向量机应用于实际植被的模式识别时,常 维普资讯 http://www.cqvip.com 第1期 赵春晖,等:一种改进的多类支持向量机超光谱图像分类方法 .79. 会出现某两类或某几类植被的光谱特性极为相似的 情况,它们在分类时往往会产生严重混淆的现象,导 致整体分类效果不够理想.这种现象产生的原因是 由于植物种类的分类精度很大程度上取决于植物长 势和叶面叶绿素含量,当不同物种叶面叶绿素的含 量相近时,容易错分,这就取决于实际拍摄图片的时 间和地点等各种因素.针对此现象文中提出了一种 二次分类的多类支持向量机,它是在1一a-1 SVM算 法的基础上改进的多类支持向量机分类方法. 采用1一a-1 SVM进行分类时,训练阶段需要在 每两类之间训练一个分类器,对于一个k类问题需 要构造C1个两类分类器.对于第i类和第 类之间 的训练,需要解决下列两类分类问题: 1 一 arin去(z ) +C> e—t ( ) , , , ( ) ( )+ ≥1~e ,If —i, ( ) ( )+bo≤~1+e ,If y : , e ≥0. (6) 在测试时采用最大投票法,判断符号函数: 厂( )一sign((wo) ( )+b ). (7) 若未知样本X属于第i类则第i类的票数加一, 反之第 类加一,X属于最后票数最多的那一类. 两类分类的支持向量机在训练阶段需要寻找最 佳惩罚因子C.如果惩罚因子选择的不恰当,分类精 度将会受到不良影响.采用1一a-1 SVM算法进行分 类时,若类别数k较大时,需要构造大量的两类分类 器.在实际应用中不可能做到把每个两类分类问题 都做多次实验来寻找最佳惩罚因子,因此提出了二 次分类的方法,分析采用1一a-1 SVM进行第1次分 类的结果,找出混淆最严重的组合,对它们进行二次 分类,寻找最佳惩罚因子重新分类,这样就可以减小 这些类别之间的混淆程度.二次分类算法在训练阶 段的模型如图1所示. II练样本 最终判决 函数 图1二次分类的训练阶段模型 Fig.1 Training stage model of secondary classification 进行二次分类时需要单独解决这个组合的两类 分类问题.对于k类问题,假设有一对混淆严重的组 合为第i类和第 类,其相应的对偶问题为 1TIaX∑口 一告∑ K(墨・xj), =1 ‘一i,j一1 0≤Oli≤C,∑yiOti一0,i一1,2,…,,z.(8) 式中:C为惩罚因子,用来对错分样本进行条件控 制,根据经验和多次实验得到最佳惩罚因子C ,设 此时的拉格朗日乘子a 为不等式约束的最优解,由 此得到权向量系数为 W 一∑口 ~X (9) 一1 把这个最佳惩罚因子C 和最优的权系数向量 X 反馈到l-a-1 SVM算法中重新分类. 4 实验结果与分析 光谱遥感图像进行实验.该图像取自1992年6月拍 摄的美国印第安纳州西北部印第安遥感试验区的一 部分[4],它包含了农作物和森林植被的混合区. 文中采用混淆矩阵和总体分类精度来分析分类 M— ::: ㈣ … j 第 类中去的样本总数,,z为类别数.如果混淆矩阵 中对角线上的元素值愈大,则表示分类结果的可靠 性愈高,如果混淆矩阵中非对角线上的元素值愈大, 则表示错误分类的现象愈严重,文中实验结果的混 淆矩阵采用表格的形式进行描述.像素的总体分类 ∑ OA一上 ・ (11) 式中:N为参与分类的总样本数, 为第i类正确 维普资讯 http://www.cqvip.com ・80・ 智能系统学报 第3卷 (a)真实地物灰度图 (b)9波段分类灰度图 图2基于1一a-1 SVM的分类灰度图 Fig.2 Grey image by 1-a-1 SVM classification 表1 9波段的混淆矩阵 1'abk l Mixture matrix of 9-waveband 总体分类精度:74.30 9/6. 从混淆矩阵中可以看出玉米和大豆这两类混淆 最严重,因此采用文中提出的二次分类方法,训练出 玉米和大豆两类别之间的最佳惩罚因子,并重新对 地物图像进行分类. 经过多次实验,得到玉米和大豆的惩罚因子c 和分类精度之问的关系如表2所示. 表2 9波段的惩罚因子和分类精度关系 Table 2 Rdati0fI between penalty factor and ela ̄'ification precision for 9-waveband 从表5中选取精度最大时对应的C为200. 二次分类的分类灰度图和混淆矩阵如图3、表3 所示. 图3基于二次分类的9波段分类灰度图 Fig.3 9-waveband greyimage by secondary classiifcation 表3 9波段的混淆矩阵 Table 3 Mixture matrix of 9一waveband 总体分类精度:74.9 9/5. 2)18波段的地物分类. 基于1一a-1 SVM的分类灰度图和混淆矩阵如 图4、表4所示. 图4基于1一a-1 SVM的18波段分类灰度图 Fig 4 18-waveband grey image by 1-a-1 SVM classiifaction 表4 18波段的混淆矩阵 Table 4 Mixture matrix of 18-waveband 总体分类精度:74.44 . 18波段的玉米和大豆的惩罚因子C和分类精 维普资讯 http://www.cqvip.com 第1期 赵春晖,等:一种改进的多类支持向量机超光谱图像分类方法 .81. 度之间的关系如表5所示. 表5 18波段的惩罚因子和分类精度关系 IbIe 5 Relation between penalty factor and dassiifcation precision for 18一waveband 从表5中选取18波段的最佳C为90. 二次分类的分类灰度图和混淆矩阵如图5、表6 所示. 图5基于二次分类的18波段分类灰度图 Fig.5 18-waveband grey image by secor1daIy classiifcation 表6 18波段的混淆矩阵 Tahle 6 Mixture matrix of 18-waveband 总体分类精度:75.67 . 3)5O波段的地物分类. 基于1一a一1 SVM的分类灰度图和混淆矩阵如 图6、表7所示. 图6基于1一a-1 SVM的50波段分类灰度图 Fig.6 50-waveband greyiHIage by1-a-1 SVM classiifcation 表7 50波段的混淆矩阵 Tabk 7 Mixture matrix of 50-waveband 总体分类精度:74・89 ・ 5O波段的玉米和大豆的惩罚因子C和分类精 度之间的关系如表8所示. . 表8 50波段的惩罚因子和分类精度关系 IbIe 8 I/elation bI 旧m Oenalty factor and damit' ̄ation precision for 50-waveband 从表中选取5O波段的最佳C是5O. 二次分类的分类灰度图和混淆矩阵如图7、表9 所示. 图7基于二次分类的50波段分类灰度图 Fig 7 50-waveband grey image by secondary classiifcation 表9 50波段的混淆矩阵 Table 9 Mixture matrix of 50-waveband 总体分类精度:78.12 . 表3、6、9所示的是利用文中提出的改进的二次 分类方法的结果,将其与1-a一1 SVM分类方法的混 维普资讯 http://www.cqvip.com ・82・ 智能系统学报 第3卷 淆矩阵表1、4、7相比较会发现,之前混淆较严重的 玉米一大豆这两类在新方法的分类结果中混淆样本 有了很大的改观.从分类的总体精度上还可以看出, 选取的波段数与分类精度也有很大的关系,波段数 目越多,所包含的光谱特性就越丰富,得到的分类结 果就越好. 分类总体精度提高不上去的主要原因是原始图 像的精度不高,由于使用的AVIRIS图像是从高空 拍摄,其分辨率仅为20 In×20 In,像元混合的概率 很大,而且图片拍摄于6月,玉米和大豆正处于生长 的早期,它们所反应的光谱特性极其相似,在这些客 观原因的影响下,这两类的分类精度不可能大幅度 的提高,仍存在一定的分类误差. 5 结束语 该文提出的二次分类方法保留了1一a-1 SVM 分类的优点,改善了超光谱图像分类中某些植被由 于光谱特性相似而产生严重混淆的问题.利用二次 分类方法可以在短时间内取得混淆最严重的类别的 最佳惩罚因子,将其应用到1一a-1 SVM的训练过程 中,得到最优的权系数向量和支持向量,改善了分类 精度.它弥补了1一a一1 SVM算法不能确定最佳惩罚 因子的缺陷,提高了支持向量机应用到超光谱图像 中的分类效果. 在许多的实际应用中都需要解决多类别的分类 问题,如何有效地将支持向量机推广到多类分类问 题仍有广阔的研究空间. 参考文献: [1]任建峰,郭 雷.多类支持向量机的自然图像分类I-j]. 西北工业大学学报,2005,23(3):295—298. REN Jianfeng,GUO Lei.Improving scene in ̄ge classifica— tion with multi-class SVMs I-J3.Journal of Northwestern Polytechnical University,2005,23(3):295—298. [2 ̄HSU C W,LIN C J.A comparison of methods for mul— ticlass support vector machines[-J3.IEEE Transactions on Neura】Networks,2002,13(2):415—425. [31刘志刚,李德仁,秦前清,等.支持向量机在多类分类问题 中的推广I-J3.计算机工程与应用,2004(7):10—13. LIU Zhigang,LI Deren,QIN Qianqing,et a1.An analyt— ical overview of methods for multi-category support vec— tor machines I-J3.Computer Engineering and Applica— tions,2004(7):10—13. [41 LANDGREBE D.Multispectral data analysis:a signal theory perspective[R].West Lafayette,USA:Universi— ty,1998. [53刘春红,赵春晖,张凌雁.一种新的高光谱遥感图像降维 方法I-J3.中国图像图形学报,2005,10(3):218—222. I IU Chunhong,ZHAO Chunhui,ZHANG Lingyan.A new method of hyperspectral remote sensing image di— mensional reduction[J3.Journal of Image and Graphic, 2005,10(3):218—222. [63赵英时.遥感应用分析原理与方法[M].北京:科学出版 社,2003. 作者简介: 赵春晖,男,1965年生,教授,博士 目目目生导师.获省部级科技奖5项.主要研 究方向为智能信息处理技术、图像处 理.出版著作3部,发表论文200余篇. 陈万海,男,1963年生,副教授,博 士研究生.主要研究方向为超光谱遥感 图像处理技术,发表论文18篇. 万建,男,1980年生,博士研究 生.主要研究方向为信号与图像处理, 发表论文5篇.
因篇幅问题不能全部显示,请点此查看更多更全内容