時間:2023-08-01 16:55:48
序論:在您撰寫光譜學(xué)與光譜學(xué)分析時,參考他人的優(yōu)秀作品可以開闊視野,小編為您整理的7篇范文,希望這些建議能夠激發(fā)您的創(chuàng)作熱情,引導(dǎo)您走向新的創(chuàng)作高度。
英文名稱:Spectroscopy and Spectral Analysis
主管單位:中國科學(xué)技術(shù)協(xié)會
主辦單位:中國光學(xué)學(xué)會
出版周期:月刊
出版地址:北京市
語
種:中文
開
本:大16開
國際刊號:1000-0593
國內(nèi)刊號:11-2200/O4
郵發(fā)代號:82-68
發(fā)行范圍:國內(nèi)外統(tǒng)一發(fā)行
創(chuàng)刊時間:1981
期刊收錄:
CA 化學(xué)文摘(美)(2009)
SA 科學(xué)文摘(英)(2009)
SCI 科學(xué)引文索引(美)(2009)
CBST 科學(xué)技術(shù)文獻速報(日)(2009)
Pж(AJ) 文摘雜志(俄)(2009)
EI 工程索引(美)(2009)
中國科學(xué)引文數(shù)據(jù)庫(CSCD―2008)
核心期刊:
中文核心期刊(2008)
中文核心期刊(2004)
中文核心期刊(2000)
中文核心期刊(1996)
中文核心期刊(1992)
期刊榮譽:
聯(lián)系方式
期刊簡介
關(guān)鍵詞:關(guān)注度; 支持向量機; 期望最大化; 主動學(xué)習(xí); 高光譜遙感圖像
中圖分類號:TP391.41 文獻標志碼:A
0引言
遙感圖像分類在現(xiàn)實生活中有著非常廣泛的應(yīng)用,如地質(zhì)勘探與地球資源調(diào)查、城市遙感與規(guī)劃管理、環(huán)境與災(zāi)害監(jiān)測、現(xiàn)代精細農(nóng)業(yè)、測繪以及考古等遙感圖像精準分類是諸多應(yīng)用的基礎(chǔ)問題,同時也是熱點問題近十幾年,衛(wèi)星傳感器技術(shù)得到了不斷發(fā)展,遙感圖像的光譜和空間分辨率不斷提高,目前較為流行的高光譜成像系統(tǒng)包括AVIRIS、HYDICE、ARCHER、HYMAP和HYPERION通過這些成像系統(tǒng)獲取的遙感圖像所蘊含的信息得到了極大豐富,這為高光譜圖像分類和聚類分析提供了新的契機,目前國內(nèi)外學(xué)者提出了很多相關(guān)算法和方法,幾乎所有經(jīng)典的機器學(xué)習(xí)方法都被應(yīng)用到圖像分類和聚類分析中分類方面諸如基于最大似然和貝葉斯估計的方法[1]、基于核和決策樹的方法[2]、基于圖的方法[3],而在基于核的方法[4]中,支持向量機(Support Vector Machine,SVM)在分類中的表現(xiàn)較為突出;聚類方面的大多數(shù)方法都是通過像元之間的相似性,利用統(tǒng)計學(xué)方法對圖像進行聚合[5]但是,單一使用分類或者聚類方法無法充分利用圖像中所包含的光譜和空間信息,所以在文獻[6]中使用監(jiān)督分類方法初始化聚類分割區(qū)域的標簽,再通過流域變換獲取最優(yōu)的分割圖像,最終在分割區(qū)域內(nèi)對分類圖像的結(jié)果標簽進行投票,分割區(qū)域?qū)擞洖橥镀弊罡叩念悇e,其分類的最終結(jié)果優(yōu)于單一的分類或聚類方法文獻[7]用投票的方式對聚類結(jié)果和分類結(jié)果進行整合,最終使用分類所得的標簽投票決定分割區(qū)域的類別,然后再對結(jié)果進行降噪處理,其最終精確度也比傳統(tǒng)方法高但是,這兩種方法都需要使用大量的訓(xùn)練樣本來構(gòu)造分類器,分類成本都比較高為了減少分類器對訓(xùn)練樣本數(shù)量的需求,提高訓(xùn)練樣本質(zhì)量成為首要問題近幾年,主動學(xué)習(xí)方法在尋找包含信息量較大、質(zhì)量較高的訓(xùn)練樣本時表現(xiàn)突出[8]
本文提出一種基于主動學(xué)習(xí)的高光譜圖像分類(Hyperspectral Image Classification based on Active Learning, HICAL)方法,關(guān)注如何在減少訓(xùn)練集數(shù)量的同時提高分類精確度,結(jié)合了分類和聚類方法,充分利用高光譜圖像的光譜和原始空間特征,找到信息量較大的分割區(qū)域,進而獲取信息價值較高的訓(xùn)練樣本,最終有效提高分類器的分類效果
1基于主動學(xué)習(xí)的高光譜圖像分類方法
1.1問題描述
為了盡可能地降低高光譜圖像分類精確度和所需的訓(xùn)練樣本數(shù)量的比例,一方面需要充分利用高光譜圖像所蘊含的信息,另一方面需要提高訓(xùn)練樣本的質(zhì)量
HICAL方法是以分類和聚類結(jié)果結(jié)合后所構(gòu)建的框架為基礎(chǔ),使用本文提出的關(guān)注度計算方法對結(jié)合后的區(qū)域進行統(tǒng)計,以找到信息量較高的區(qū)域新的訓(xùn)練樣本將在關(guān)注度較大的區(qū)域中產(chǎn)生,以此來提高訓(xùn)練集的質(zhì)量
1.2HICAL方法
1.2.1聚類分析
本文使用期望最大化(ExpectationMaximization,EM)算法對高光譜圖像進行聚類分析在統(tǒng)計計算中,EM是在概率模型中尋找參數(shù)最大似然估計的算法,其中概率模型依賴于無法觀測的隱藏變量在使用EM算法過程中,可以假設(shè)所有的樣本都是符合高斯分布
EM算法對圖像進行聚類過程中,為了使算法盡快收斂,將高光譜圖像的光譜波段進行分組求均值,以此來減少參與計算的光譜波段數(shù)量聚類所得到的分割圖像通過四聯(lián)通的方式進行區(qū)域劃分,并且給這些區(qū)域唯一標號得到的帶有標號的區(qū)域分割圖將作為模板,在后續(xù)迭代過程中與分類結(jié)果進行整合
1.2.2監(jiān)督分類
獲取聚類結(jié)果之后,需要對圖像進行監(jiān)督分類本文在分類過程中使用支持向量機(SVM)方法SVM是目前監(jiān)督分類使用較多的分類算法,是建立在統(tǒng)計學(xué)習(xí)理論的VC維理論和結(jié)構(gòu)風險最小原理基礎(chǔ)上的,具有較好的泛化能力和學(xué)習(xí)能力
二分的支持向量機最終目標是找到一個(d-1) 維的決策面,將測試樣本分成兩類在使用SVM進行圖像分類時,總是將像元的特征通過一個核函數(shù)映射到一個較高維度的空間,這樣使樣本的區(qū)分度更大,通常使用高斯核函數(shù)(Radial Basis Function,RBF)
在二分問題中,通常將決策函數(shù)表示如下:
其中:SV表示得到的支持向量集合,對應(yīng)的αi不等于0
使用SVM對多類問題進行分類時,通常采取兩種策略一種是一對一(OneAgainstOne,OAO)的方式,另一種是一對多的方式(OneAgainstAll,OAA),本文采用OAO的方式
HICAL方法在第一次監(jiān)督分類過程中,需要少許的訓(xùn)練樣本,通過SVM構(gòu)造分類器,且監(jiān)督分類的步驟在整個分類過程中是迭代進行的,每當新的訓(xùn)練樣本被增加到訓(xùn)練集時,都會重新構(gòu)造分類器,對圖像進行新一輪分類
1.2.3整合聚類和分類結(jié)果
在獲取聚類和監(jiān)督分類結(jié)果后,借鑒文獻[7]中方法對兩個結(jié)果進行整合,以聚類連通區(qū)域為模型對監(jiān)督分類結(jié)果進行區(qū)域劃分,并給出標號最終在整合結(jié)果中的每一個區(qū)域內(nèi),都包含一個或一個以上的像元,這些像元分類標記的類別可能比較集中,也可能比較分散,這些分類標記主要取決于監(jiān)督分類器的預(yù)測
1.2.4獲取新樣本來源區(qū)域
獲取整合結(jié)果之后,需要在結(jié)果所包含的區(qū)域中找到包含信息量較大的區(qū)域?qū)嶒炛锌偸歉鼮殛P(guān)注那些含有較多像元,且分類標簽比較分散的區(qū)域這樣的區(qū)域如果分類準確度較高,將會很大程度地提高總體分類精確度因此,對區(qū)域的關(guān)注度給出如下公式定義:
其中:b為區(qū)域i包含像元個數(shù)ni的權(quán)重基數(shù),用戶可根據(jù)情況自己選擇;t為迭代抽樣的次數(shù),其意義是,隨著迭代的進行,在較大區(qū)域已經(jīng)得到關(guān)注和抽樣之后,對于這些區(qū)域的關(guān)注度將會不斷下降,這樣在防止大區(qū)域過分取樣的同時,可以很好地兼顧到小樣本區(qū)域,所以,可以很好地解決以往算法對小樣本區(qū)域分類精確度不高的難題
獲取不同區(qū)域的關(guān)注度值之后,為了更集中、更有效地提高請求詢問的訓(xùn)練樣本的質(zhì)量,將通過設(shè)定閾值來選取需要取樣的區(qū)域最終在t次迭代中將選取滿足如下條件的區(qū)域作為新訓(xùn)練樣本的來源區(qū)域:
1.2.5新樣本選擇
獲取樣本來源區(qū)域后,可以定義迭代中所需新樣本的數(shù)量Ut對來源區(qū)域j∈Γt的取樣數(shù)量可以表示為μj,且滿足μj≥0在來源區(qū)域取樣的方式有兩種:S0和S1,其中S0是按照隨機方式在來源區(qū)域中選擇,而S1是根據(jù)來源區(qū)域中找到上一次監(jiān)督分類器標記的最多標簽類和次多標簽類的子區(qū)域,按照兩個子區(qū)域的樣本比例進行抽取
1.2.6主動學(xué)習(xí)過程
本文的HICAL方法迭代過程通過主動學(xué)習(xí)方式來實現(xiàn)整個過程分為兩個階段:1)初始化分類器階段,即初始監(jiān)督分類階段,在此階段首先需要提供少量的訓(xùn)練集,訓(xùn)練初始分類器;2)循環(huán)取樣階段,也是主動學(xué)習(xí)的主要階段,這個階段在未標記樣本中使用關(guān)注度進行查詢,獲取信息量較大的整合區(qū)域,從而進一步找到需要標注的樣本,標注之后追加到原有的訓(xùn)練集中,重新對分類器進行訓(xùn)練,這個過程不斷循環(huán),直到達到停止條件這個停止條件可以有多種,比如新訓(xùn)練樣本數(shù)量達到上限,或者是已經(jīng)達到迭代取樣的次數(shù)等
迭代結(jié)束后,將最后一次迭代所產(chǎn)生的分類結(jié)果和初始的聚類結(jié)果,按照聚類區(qū)域為模板,對所有分類產(chǎn)生的標簽進行投票,區(qū)域內(nèi)所有的像元將歸屬到得票最高的標簽類最后進行降噪處理
2實驗及分析
2.1實驗環(huán)境
本文實驗環(huán)境:中央處理器Intel Core Duo P7350 2.00GHz,內(nèi)存2GB,32位Windows 7操作系統(tǒng);軟件平臺為Matlab R2012a
2.2實驗數(shù)據(jù)集
高光譜圖像分類實驗使用的是印第安納州農(nóng)林區(qū)域圖像數(shù)據(jù)集(Indian Pines)
印第安納州農(nóng)林區(qū)域圖像拍攝于1992年,使用紅外成像光譜儀(AVIRIS)獲取,其內(nèi)容是印第安納州西北區(qū)域的某一農(nóng)業(yè)森林區(qū)的地表信息整幅圖像包含145×145像元,空間分辨率為20m,有220個波段,其中20個水吸收波段將在實驗前被除去圖像反映了16種不同的地物信息圖1(a)顯示這個高光譜數(shù)據(jù)的假彩色圖像;圖1(b)顯示了其真實的地物信息,不同的顏色代表不同的類別本次實驗針對的感興趣區(qū)域總共有10366個樣本,過去相關(guān)文獻中多數(shù)是在每一類別中隨機抽取10%的樣本作為訓(xùn)練樣本,這樣的抽樣方式對樣本比較少的類別來說是非常不利的為了和傳統(tǒng)的分類方式對比,在實驗中也將采取這樣的抽樣方式,但抽樣的百分比會降低
2.3實驗過程和結(jié)果分析
2.3.1HICAL方法與傳統(tǒng)隨機取樣方法比較
本實驗將本文的HICAL方法與傳統(tǒng)隨機取樣方法進行對比表1中顯示了各個算法的整體分類精確度(Overall Accuracy,OA)、平均分類精確度(Average Accuracy,AA)、Kappa系數(shù)以及每種地物的分類精確度SVM和SVM+EM算法[7]是在每一個類別中隨機抽取10%的樣本(1029個)作為訓(xùn)練集,其中SVM+EM也是結(jié)合光譜和空間特征的分類方法作為對比,本文算法將在每類隨機抽取4%的訓(xùn)練樣本(407個)上進行
通過式(2)計算出每一個分割區(qū)域的關(guān)注度值,這樣就可以選出一些關(guān)注度較高的區(qū)域作為新訓(xùn)練樣本來源區(qū)域?qū)嶒炛腥ˇ胻=0.15,每一次迭代對樣本的抽取數(shù)量做出限定,為了和傳統(tǒng)的方法比較,實驗中只進行4次迭代,每次迭代取樣本數(shù)Ut=50分別使用S0和S1方法對新樣本來源區(qū)域進行取樣(如表1所示)
迭代起始階段,大樣本區(qū)域的關(guān)注度值會比較高,這樣在開始的迭代過程中可以有部分提高分類器的分類準確度,迭代后期,關(guān)注的重心轉(zhuǎn)向區(qū)域較小的分割區(qū)從表1中可以看到,在迭代4次后,訓(xùn)練樣本總數(shù)為607,遠小于隨機抽取10%的1029,但Alfalfa、Grass/pasturemowed和Oats三個小樣本區(qū)域的分類精確度已經(jīng)得到了非常顯著的提高這說明HICAL方法可以有效地解決這種小樣本區(qū)域的分類難題,最終獲取的分類結(jié)果無論是整體分類精確度還是平均分類精確度都得到了明顯提高(如表1)
2.3.2HICAL方法和相關(guān)主動學(xué)習(xí)方法比較
本實驗將HICAL方法和目前較新的且表現(xiàn)優(yōu)秀的主動學(xué)習(xí)方法進行比較[9]實驗中,初始化分類器時需要80個訓(xùn)練樣本(每一類別5個),每一次迭代都將獲取50個新樣本標注為訓(xùn)練集,同時設(shè)定每一次迭代的閾值都為γt=015在初始取樣方法和所獲得的訓(xùn)練樣本總數(shù)都相等的情況下,LORSALALMLL、MPMLBPAL兩種算法使用四種不同的方式迭代獲取訓(xùn)練樣本:RS(Random Selection)、MI(Mutual Information)、BT(Breaking Ties)、MBT(Modified Breaking Ties)表2中給出了這些不同方法獲取的分類結(jié)果可以看出,本文提出的方法在總體分類精度上更為出色
3結(jié)語
本文提出了一種基于主動學(xué)習(xí)的高光譜圖像分類方法HICAL,能夠充分利用圖像的光譜特征和原始空間特征,同時使用一種新的高效的區(qū)域關(guān)注度計算方法對結(jié)合區(qū)進行統(tǒng)計,根據(jù)統(tǒng)計后的數(shù)值能夠非常精確地找到信息量價值較高的區(qū)域,進而獲取質(zhì)量較高的未標記樣本以此提高整體訓(xùn)練集的質(zhì)量,在訓(xùn)練樣本較少的情況下能夠有效提高整體分類精確度和平均分類精確度,從而降低分類精確度和訓(xùn)練樣本數(shù)量的比值
本文方法在分類過程中較之傳統(tǒng)的分類方法更能解決樣本失衡的問題,能夠有效地解決小樣本區(qū)域的分類難題;同時文中所提出的分類方法擴展性較強,在分類和聚類算法的選擇上比較寬松,可以使用諸如K均值、自組織迭代技術(shù)等算法進行替代在HICAL方法迭代過程中,關(guān)注度閾值的選取和樣本數(shù)量的設(shè)置,以及對區(qū)域樣本的選擇方法將是我們進一步研究的內(nèi)容;同時我們也將關(guān)注其他分類和聚類算法,以期減少算法的時間復(fù)雜度
參考文獻:
[1]LANDGREBE D A. Signal theory methods in multispectral remote sensing [M] . New York: Wiley, 2003.
[2]MOUSTAKIDIS S, MALLINIS G, KOUTSIAS N, et al. SVMbased fuzzy decision trees for classification of high spatial resolution remote sensing images [J]. IEEE Transactions on Geoscience and Remote Sensing, 2012,50(1):149-169.
[3]BAI J, XIANG S M, PAN C H. A graphbased classification method for hyperspectral images [J]. IEEE Transactions on Geoscience and Remote Sensing, 2013,51(2):803-817.
[4]LI CH, KUO BC, LIN CT, et al. A spatial contextual support vector machine for remotely sensed image classification [J]. IEEE Transactions on Geoscience and Remote Sensing, 2012,50(3):784-799.
[5]MAULIK U, SAHA I. Modified differential evolution based fuzzy clustering for pixel classification in remote sensing imagery [J]. Pattern Recognition, 2009,42(9):2135-2149.
[6]TARABALKA Y, CHANUSSOT J, BENEDIKTSSON J A. Segmentation and classification of hyperspectral images using watershed transformation [J]. Pattern Recognition, 2010,43(7):2367-2379.
[7]TARABALKA Y, BENEDIKTSSON J A, CHANUSSOT J. Spectralspatial classification of hyperspectral imagery based on partitional clustering techniques [J]. IEEE Transactions on Geoscience and Remote Sensing, 2009,47(8):2973-2987.
1.1樣品收集及制備
收集不同種植區(qū)域、不同品種、不同部位的單料煙樣品共110個。將樣品放入烘箱內(nèi),40℃排氣烘烤2h,然后磨碎過40目篩,控制含水率在6%~10%之間。
1.2試驗儀器及軟件
儀器:Antaris傅里葉變換近紅外光譜儀(美國ThermoNicolet公司);Agilent7890-5975氣相色譜質(zhì)譜儀(美國Agi-lent公司);AG204型電子天平(感量0.1mg,瑞士梅特勒-托利多公司);GFL3020震蕩器(德國GFL公司);電熱恒溫水浴鍋(德國GFL公司);VELPDK20消化器(意大利VELP公司);連續(xù)流動分析儀(美國Astoria-Pacific公司);旋轉(zhuǎn)粉碎機(北京高科公司);恒溫箱(日本ESPEC);SDE蒸餾器(鄭州玻璃儀器廠);可控溫度電熱套及恒溫水浴鍋。軟件:TQAnalyst8數(shù)據(jù)分析軟件(美國ThermoNicolet公司);SPSS13.0統(tǒng)計產(chǎn)品與服務(wù)解決方案(美國IBM公司)。
1.3近紅外光譜掃描
取適量煙末裝入石英杯中,用500g的壓樣器壓平杯中樣品后,放到光譜儀器臺上掃描。儀器的工作參數(shù):光譜范圍3800~10000cm-1,間隔4cm-1,分辨率8cm-1,掃描次數(shù)69次。
1.4常規(guī)化學(xué)成分的測定
參照煙草行業(yè)標準規(guī)定的方法應(yīng)用連續(xù)流動分析儀測定樣品的總糖、還原糖、煙堿、總氮、氯、鉀含量,并計算出相應(yīng)的糖堿比和鉀氯比[11]。
1.5揮發(fā)性香味成分分析
采用同時蒸餾萃取的方式提取樣品中的揮發(fā)性香味成分,具體操作如下:樣品稱質(zhì)量25g,加水300mL、二氯甲烷60mL,同時蒸餾萃取2.5h,濃縮后加內(nèi)標乙酸苯乙酯(12.553g/L)10μL后待測。采用安捷倫7890-5975NGC-MS分析,色譜柱HP-5(30m×250μm×0.25μm),進樣口溫度250℃,流速1mL/min,分流比10∶1。起始溫度60℃,以5℃/min升溫到80℃,保持5min;以2℃/min升溫到150℃,保持10min;以2℃/min升溫到200℃,保持20min;以2℃/min升溫到280℃,保持10min,總運行時間149min。共檢測到揮發(fā)性香味成分33種。
1.6逐步判別分析
逐步判別分析是一種多元統(tǒng)計方法。整個變量篩選過程實質(zhì)就是作假設(shè)檢驗,通過檢驗引入顯著性變量,剔除不顯著變量。反映在輸出結(jié)果上,通常可以用F值的大小作為變量引入模型的標準,即一個變量是否能進入模型主要取決于協(xié)方差分析的F檢驗的顯著水平。逐步判別過程本身并不建立判別函數(shù),篩選出重要變量后,采用Bayes判別方法建立判別函數(shù)和判別準則,對新樣品進行判別歸類。
2結(jié)果與分析
2.1近紅外譜圖的處理
2.1.1譜圖的預(yù)處理
煙草樣品的近紅外譜圖會受到樣品顏色及儀器穩(wěn)定性的影響而出現(xiàn)噪音及基線漂移,所以必須對樣品的近紅外譜圖進行前處理[6]。利用TQAnalyst8分析軟件包中的優(yōu)化功能,采用如下方法可獲得理想的結(jié)果:多元散射校正消除樣品不均勻帶來的差異;采用段長為9、間隔為5的NorrisDerivative濾波平滑光譜,消除高頻噪音,保留有用的低頻信息;采用二介微分處理,消除基線漂移的影響,獲得比原光譜更高分辨率和更清晰的光譜輪廓變化。
2.1.2譜圖的主成分分析
選擇4000~8000cm-1波數(shù)為分析區(qū)域,由主成分分析獲得樣品的10個主成分,前5個主成分的貢獻率達到96.97%,即5個主成分就能夠代表96.97%的近紅外譜圖信息,所以以5個主成分得分為分析對象,采用逐步判別分析進行模式識別。
2.2煙葉種植區(qū)域模式識別結(jié)果的比較
收集的樣品由福建、云南、安徽、江西、貴州4個地區(qū)的煙葉樣品組成,依據(jù)《中國煙草種植區(qū)劃》[13]110個樣品屬于5個產(chǎn)區(qū),從每個產(chǎn)區(qū)隨機抽取5個作為外部驗證樣品,其余作為建模樣品。通過逐步判別分析,篩選出對于種植區(qū)域判別有主要影響作用的6種化學(xué)成分,即糠醛、吲哚、香葉基丙酮、柏木醇、新植二烯和氯,并獲得其Bayes判別函數(shù),同樣由逐步判別分析獲得近紅外光譜5個主成分得分煙葉種植區(qū)域的Bayes判別函數(shù)。將篩選出的變量代入Bayes判別函數(shù)計算得到判別值,比較各判別值大小,其中最大值所對應(yīng)的分組便是判別分組。表2表明,化學(xué)成分建模85個樣品種植區(qū)域交叉驗證模式識別的準確率為91.76%,外部驗證25個樣品種植區(qū)域模式識別的準確率為80.00%;近紅外光譜建模85個樣品種植區(qū)域交叉驗證模式識別的準確率為89.41%,外部驗證25個樣品種植區(qū)域模式識別的準確率為80.00%。種植區(qū)域化學(xué)成分模式識別的準確率略高于近紅外譜圖模式識別的結(jié)果。滇南桂西山地丘陵烤煙區(qū)及滇西高原山地烤煙煙區(qū)都屬于云南地區(qū),地理位置較近,且種植水平及習(xí)慣接近,因此2個地區(qū)的樣品發(fā)生部分誤判,閩西贛南粵東丘陵煙區(qū)、皖南贛北丘陵烤煙區(qū)、黔中高原山地烤煙區(qū)樣品識別正確率較高(表2)。
2.3煙葉品種模式識別結(jié)果的比較
收集的110個煙葉樣品共有云煙87、翠碧1號、K326、紅花大金元等4個品種,從每個品種中隨機抽取5個作為外部驗證樣品,其余的樣品作為建模樣品。通過判別分析,篩選出對于品種模式識別有主要影響的4種化學(xué)成分,即4-環(huán)戊烯-1,3-二酮、茶香酮、香葉基丙酮、氯,并獲得了其Bayes判別函數(shù),同樣由逐步判別分析獲得近紅外光譜5個主成分得分煙葉品種的Bayes判別函數(shù)。目前我國主栽烤煙品種均直接或間接來自于相同的親本,甚至有些品種間親緣關(guān)系極近,致使品種鑒別時容易發(fā)生錯判。表4結(jié)果表明,化學(xué)成分建模90個樣品品種交叉驗證模式識別的準確率為77.78%,外部驗證20個樣品品種模式識別的準確率為70.00%;近紅外光譜建模90個樣品品種交叉驗證模式識別的準確率為82.22%,外部驗證20個樣品品種模式識別的準確率為75.00%。煙草品種的近紅外譜圖模式識別結(jié)果優(yōu)于化學(xué)成分模式識別的結(jié)果。
2.4煙葉部位模式識別結(jié)果的比較
收集的110個煙葉樣品中上部煙36個、中部煙38個、下部煙36個,從不同部位的煙葉樣品中隨機抽取8個樣品外部驗證樣品,其余的樣品作為建模樣品。通過判別分析,篩選出對于煙葉部位模式識別有主要影響的化學(xué)成分為三環(huán)萜、柏木醇、總煙堿,并獲得了其Bayes判別函數(shù),同樣由逐步判別分析獲得近紅外光譜5個主成分得分煙葉部位的Bayes判別函數(shù)。表6結(jié)果表明,化學(xué)成分建模86個煙葉樣品部位交叉驗證模式識別的準確率為86.05%,外部驗證24個煙葉樣品的準確率為75.00%,近紅外光譜建模86個煙葉樣品部位交叉驗證模式識別的準確率為94.19%,外部驗證24個煙葉樣品的準確率為91.67%。煙葉部位的近紅外譜圖模式識別結(jié)果優(yōu)于化學(xué)成分模式識別的結(jié)果。
2.5模式識別結(jié)果比較
以化學(xué)成分、近紅外光譜建模樣品及外部驗證樣品模式識別正確識別的個數(shù)為變量進行相關(guān)性分析及配對t檢驗。相關(guān)性分析結(jié)果表明,2種方式獲得的結(jié)果都存在顯著的相關(guān)性(P<0.05);配對t檢驗結(jié)果表明所獲得的結(jié)果差異不顯著(P>0.05)(表7)。
3結(jié)論
【摘要】 目的采用氣相色譜-質(zhì)譜聯(lián)用(GC-MS)分析廣西余甘子葉揮發(fā)油的成分。方法采用維普(HP-5MS)彈性石英毛細管柱,程序升溫,以EI離子源和四極桿質(zhì)量分析器進行分析,質(zhì)譜圖用NIST98譜庫檢索,結(jié)合人工譜圖解析,鑒定各種成分,并用色譜峰面積歸一法測定其相對百分含量。結(jié)果分離出29個色譜峰,鑒定出26種成分,占已分離組分總含量的90%以上。其中葉綠醇(19.00% ) 、2,4-二叔丁基苯酚 (18.79% )和異植物醇 (10.54% ) 為所含的相對含量較高的成分。結(jié)論該法簡便、快速、靈敏度高。
【關(guān)鍵詞】 余甘子葉 氣相色譜-質(zhì)譜聯(lián)用 成分分析
余甘子葉,來源于大戟科葉下珠屬植物余甘子Phyllanthus emblical L.的葉子,收載于1974年出版的《云南省藥品標準》、1978年版《藏藥標準》、1977~2005年版《中華人民共和國藥典》。別名橄欖、滇橄欖 、油甘子、山油甘、庵摩勒、牛甘子、喉甘子、楊甘等,為多個民族習(xí)用藥[1],廣泛分布于世界上許多國家。我國對余甘子的栽培利用有1800年以上的悠久歷史,該植物主要分布于我國的云南、四川、福建、廣東、廣西等地,是一種具有較高的食用和藥用價值的植物果實,被聯(lián)合國衛(wèi)生組織指定為在全世界推廣種植的3種保健植物之一。主治血病、赤巴病、培根病、肝病、心臟病和高血壓病,以治療血熱血瘀引起的血病為長。近年研究表明余甘子具有抗菌[2]、抗腫瘤[3]、抗氧化[4]、抗動脈粥樣硬化[5,6]、抗乙肝病毒[7]、保肝[8]等作用。國內(nèi)學(xué)者對余甘子果實的化學(xué)成分進行了較多的報道,但余甘子葉的化學(xué)成分研究未見報道,而余甘子葉含有較濃的芳香氣,本實驗提取了揮發(fā)油,進行了定性定量分析。
1 儀器與材料
美國 HP 6890/5973N氣相色譜質(zhì)譜聯(lián)用儀(美國安捷倫),HP-5MS彈性石英毛細管柱 (30 mm ×0. 25 mm,0. 25 μm);G1701DA MSD化學(xué)工作站。相關(guān)試劑為分析純;余甘子葉采自廣西地區(qū),經(jīng)廣西中醫(yī)學(xué)院劉壽養(yǎng)副教授鑒定為廣西產(chǎn)的大戟科葉下珠屬植物余甘子Phyllanthusemblica L.的全草。標本存于廣西中醫(yī)學(xué)院藥學(xué)中心實驗室。
2 方法
2.1 余甘子葉揮發(fā)油的提取取60 g新鮮余甘子葉,搗碎,放進1 000 ml圓底燒瓶中,用揮發(fā)油提取器按常規(guī)水蒸氣蒸餾法提取揮發(fā)油,經(jīng)無水Na2SO4 干燥后得淡黃綠色揮發(fā)油,收油率為0.2%。
2.2 氣相-質(zhì)譜分析條件氣相色譜條件:進樣口溫度250℃,載氣:氦氣,流速1 ml·min- 1。柱溫:程序升溫70~280℃,初始溫度 70℃,保留3min,升溫速率10℃/min,終止溫度 100 ℃,以5. 0℃/min升溫至120℃后,再以30℃/min,升溫至220℃后,以20 ℃/min升溫至280℃,溶劑延遲1. 0 min;進樣量1.0 μl,不分流。
質(zhì)譜條件:EI電離方式,離子源溫度 230℃;四極桿溫度:150℃;倍增電壓:1 247 V;發(fā)射電流:34.6μA;接口溫度:250 ℃;質(zhì)量范圍:35~500 amu;電子能量70 Ev。3 結(jié)果與討論
用GC-MS分析法從余甘子葉揮發(fā)油共分離出29個峰(見圖1)。用氣相色譜數(shù)據(jù)處理系統(tǒng),以峰面積歸一法測得其中各組分的相對百分含量,對總離子流圖中的各峰經(jīng)質(zhì)譜掃描后得到質(zhì)譜圖,經(jīng)過NIST98質(zhì)譜計算機數(shù)據(jù)系統(tǒng)檢索,結(jié)合人工譜圖解析,按各色譜峰的質(zhì)譜裂片圖與文獻核對,對基峰、質(zhì)荷比和相對豐度等方面進行直觀比較,鑒定了其中26個峰,占總揮發(fā)油成分的90%以上,結(jié)果見表1。 表1 余甘子葉揮發(fā)油的化學(xué)成分由表1 可知,已鑒定的化合物占色譜流出組分峰面積的90%以上,主要為醇類、苯酚類及烷烴化合物。在已鑒定的組分中,相對含量較高的主要幾種組分有葉綠醇(19.00% ) 、2,4-二叔丁基苯酚 (18.79% )和異植物醇 (10.54% )。這些化合物形成了余甘子葉的特有氣味。另外還有3種組分的含量相對較少,未能鑒定,有待進一步研究。
有關(guān)余甘子葉揮發(fā)油的化學(xué)成分研究,目前國內(nèi)外尚未見報道,本文采用GC-MS方法,對余甘子葉揮發(fā)油的化學(xué)成分進行了研究,鑒定了其中的26種成分。該法簡便、快速、靈敏度高。本研究為余甘子葉揮發(fā)油的應(yīng)用拓開了廣闊的前景。
【參考文獻】
[1] 張?zhí)m珍,趙文華,郭亞健,等.藏藥余甘子化學(xué)成分研究[J].中國中藥雜志,2003,28(10):940.
[2] 鐘振國,曾春蘭.余甘子葉提取物體外抗菌實驗研究[J].中藥材,2008,31(3):428.
[3] 曾春蘭,鐘振國.余甘子葉提取物體外抗腫瘤作用研究[J].時珍國醫(yī)國藥,2008,19(3):580.
[4] 潘國慶,趙旭升,蔣炘治.余甘子抗氧化作用的研究[J].青??萍?,2007,12(6):33.
[5] 劉麗梅,高 政,李寶文. 余甘子對實驗性頸動脈粥樣硬化家兔的影響[J]. 中國臨床康復(fù), 2003,7 (5) : 766.
[6] 王綠婭,王大全,秦彥文,等. 余甘子抗脂質(zhì)過氧化和保護血管內(nèi)皮的實驗研究[J]. 中國藥學(xué)雜志, 2003, 38 (10) : 505.
[關(guān)鍵詞] 拉曼光譜;定量分析;實驗教學(xué)
[中圖分類號] G642
[文獻標識碼] A
[文章編號] 2095-3712(2014)22-0058-03[ZW(N]
[作者簡介]張煥君(1982―),女,河南許昌人,碩士,鄭州輕工業(yè)學(xué)院教師;程學(xué)瑞(1982―),男,河南安陽人,博士,鄭州輕工業(yè)學(xué)院副教授,研究方向:材料物理。
拉曼光譜的強度、頻移、線寬、特征峰數(shù)目以及退偏度與分子的振動能態(tài)、轉(zhuǎn)動能態(tài)、對稱性等特性有緊密的聯(lián)系,即與分子的結(jié)構(gòu)緊密相關(guān)。而且拉曼光譜具有制樣簡單,分析快速、無損,所檢測的樣品僅需微量即可滿足測量要求等諸多優(yōu)點,因而成為研究分子結(jié)構(gòu)的強有力工具,廣泛地應(yīng)用于分子的鑒別、分子結(jié)構(gòu)的研究、分析化學(xué)、石油化工催化和環(huán)境科學(xué)等各個領(lǐng)域[1-2]。然而,相對于氣相、液相色譜法的較高精度而言,較大的分析誤差率限制了拉曼光譜定量分析的應(yīng)用。在實際應(yīng)用中,拉曼光譜分析技術(shù)多用于樣品的定性分析,尤其是在實驗教學(xué)當中,更多的是強調(diào)其定性分析的作用,而忽略其定量分析的功能[3-4]。尤其是對具有強熒光背景物質(zhì),如乙醇及其混合溶液的定量分析,更是拉曼光譜定量分析中的難點問題。
為幫助學(xué)生克服這樣單一的認識,我們在教學(xué)實驗環(huán)節(jié)增加了相關(guān)實驗內(nèi)容,采用拉曼光譜對乙醇溶液的濃度進行定量分析。在教學(xué)過程中,我們向?qū)W生介紹了拉曼光譜定量分析的理論依據(jù)、分析過程,并著重分析了誤差來源,以加深學(xué)生對拉曼光譜的認識,尤其是讓學(xué)生對其定量分析功能有了進一步的了解。
一、理論依據(jù)
拉曼光譜定量分析的理論依據(jù)為:
I=KΦC∫b[]0e([WTBZ]ln[WTBX]10)(k+k)zh(z)dz
在上式中,I為光學(xué)系統(tǒng)所收集到的樣品表面拉曼信號強度;K為分子的拉曼散射截面積;Φ為樣品表面的激光入射功率;k、k′分別是入射光和散射光的吸收系數(shù);Z為入射光和散射光通過的距離;h(z)為光學(xué)系統(tǒng)的傳輸函數(shù);b為樣品池的厚度。由上式可以看出,在一定條件下,拉曼信號強度與產(chǎn)生拉曼散射的待測物濃度成正比,即I∝C。
二、實驗過程
實驗樣品材料為國藥集團化學(xué)試劑有限公司生產(chǎn)的濃度不低于99.7%的分析純乙醇、四氯化碳和去離子水。把不同體積的去離子水加入乙醇樣品中,配制成不同濃度的乙醇-水二元體系溶液;用激光功率為50mW(100%)的拉曼光譜儀采集純乙醇溶液、水、四氯化碳溶液的拉曼光譜圖;用拉曼光譜儀采集不同濃度的乙醇溶液的拉曼光譜圖,對每種濃度的樣品重復(fù)掃描3次,試驗結(jié)果取三次掃描的平均值。
三、結(jié)果討論
把配制好的不同濃度的乙醇溶液加入未受污染的樣品池,把不同濃度的樣品分別放在拉曼光譜儀上測出其拉曼光譜。熒光背底扣除后不同濃度的乙醇-水溶液的拉曼光譜圖如圖1所示。
圖1熒光背底扣除后不同濃度的乙醇-水溶液的拉曼光譜圖
表1中的數(shù)據(jù)進一步顯示出,隨著乙醇濃度的增加,特征峰強度的比值在不斷增加。純水的3200cm-1峰的強度I2與不同濃度乙醇的884cm-1峰的強度I1之比R1和面積比R2與乙醇濃度的關(guān)系見表1。擬合圖如圖2所示,R1和R2與乙醇濃度有較好的線性關(guān)系,其線性相關(guān)系數(shù)分別為0.98554和0.97558。
四、誤差分析
激光功率、樣品池、聚焦位置等因素會對定量分析結(jié)構(gòu)有重要影響。
(一)激光功率的影響
不改變聚焦樣品的位置,激光功率分別選取100%、50%、10%、5%、1%和0.5%(100%為50mW),對50%的乙醇-四氯化碳溶液進行測試,結(jié)果如表2所示。
由表2可以看出,隨著激光功率的改變,兩個特征峰(峰459cm-1和884cm-1)的強度比值基本上在2.3左右,面積比值基本上在3.0左右。然而可以看出,當激光功率很小時(1%或0.5%),由于激發(fā)光源本身很弱,導(dǎo)致散射的拉曼信號強度本身也非常弱,而且信噪比很大,所以相對誤差比較大。而且當激光功率很強(100%功率)時,兩個特征峰的強度比值和面積比值都稍微偏離2.3和3.0,其原因可能是,激光功率很強時,其信號強度和熒光信號也比較強,而熒光對拉曼散射的干擾非常大,導(dǎo)致在扣除熒光背底過程中出現(xiàn)較大的偏差。
(二)樣品池的影響
如圖4是毛細管樣品池的拉曼光譜圖,實驗過程中用毛細管吸取待測溶液。毛細管作為樣品容器,在激光激發(fā)下也存在拉曼光譜和熒光背底,在基線處理和背底扣除過程中難以完全消除其影響,進而產(chǎn)生誤差。
圖4毛細管樣品池的拉曼光譜圖
(三)聚焦位置的影響
在同一樣品不同點進行多次測量,分析結(jié)果發(fā)現(xiàn),混合溶液的特征峰強度的比值存在較大的偏差,主要原因可能是本次試驗使用的是顯微共聚焦激光拉曼光譜儀,3次測量的聚焦位置不同,以及數(shù)據(jù)處理過程當中熒光背底的扣除都會引起較大的誤差。對同一濃度的溶液測量3次,所得強度之比的不確定度為0.117,相對強度之比與乙醇濃度擬合直線的不確定度為0.024,相對面積比與乙醇濃度擬合直線的不確定度為0.858。
綜上所述,激光功率、樣品池、聚焦位置等因素會對拉曼光譜定量分析結(jié)構(gòu)產(chǎn)生一定的影響。另外,乙醇的揮發(fā)、激光功率的穩(wěn)定性、實驗儀器的固有誤差等因素也會對測試結(jié)果帶來影響。然而,拉曼光譜定量分析的結(jié)果仍然有較大的可信度,可以作為一種有效的定量分析方法。
參考文獻:
[1]譚紅琳,李智東,張鵬翔,等.乙醇、甲醇、食用酒及工業(yè)酒精的拉曼光譜測定[J].云南工業(yè)大學(xué)學(xué)報,1999(2).
[2]楊丹,徐文藝.CuCl2-H2O體系和FeCl3-H2O體系絡(luò)合物拉曼光譜研究與溶液拉曼定量分析探索[J].光譜學(xué)與光譜分析,2011(10).
關(guān)鍵詞:吉首市 陽光體育 現(xiàn)狀 建議
1.1 研究對象
以吉首市普通中學(xué)陽光體育運動開展現(xiàn)狀為研究對象,結(jié)合隨機與整群抽樣的方法抽取吉首市一中,四中,雅思中學(xué)三所學(xué)校中的學(xué)生共600人為調(diào)查對象,其中男生315人,女生285人,體育教師共28人。
1.2 研究方法
文獻資料法;訪談法;問卷調(diào)查法;數(shù)理統(tǒng)計法;邏輯分析法
2.研究結(jié)果與分析
2.1吉首市普通中學(xué)開展陽光體育運動現(xiàn)狀調(diào)查
2.1.1吉首市普通中學(xué)師資力量現(xiàn)狀調(diào)查
體育教師是學(xué)校體育活動的主導(dǎo)者,是“陽光體育”運動運行好壞的“指揮棒”,因此學(xué)校體育的師資情況直接關(guān)系到學(xué)生“陽光體育”的落實情況,教師學(xué)歷的高低、體育教師的數(shù)量從一定程度上影響著教學(xué)質(zhì)量的提高,從調(diào)查來看吉首市普通中學(xué)教師學(xué)歷有待提高, 96%的體育教師均為大學(xué)本科,而碩士研究生僅占一小部分,其中大部分學(xué)校體育老師兼雙職。此外由于體育教師的結(jié)構(gòu)性缺編,體育教師和在校學(xué)生比例嚴重失調(diào)。這給陽光體育的開展造成一定影響。
2.1.2吉首市普通中學(xué)師生對陽光體育運動的了解程度調(diào)查
從調(diào)查得知,大部分體育教師對陽光體育這一概念還是比較了解,但學(xué)生對陽光體育的了解卻不容樂觀。在調(diào)查中有36% 的學(xué)生完全不了解這個概念;46% 的中學(xué)生只是基本了解;真正比較了解“陽光體育運動”的僅有18%。由此可知學(xué)生對陽光體育這一概念不清晰,學(xué)校和體育教師應(yīng)加大宣傳力度,使學(xué)生理解陽光體育的真正含義,自愿參與陽光體育運動,把身體鍛煉得更好。
2.1.3吉首市普通中學(xué)學(xué)生參加體育鍛煉時間的情況
從表1可以知,大部分學(xué)生不同程度地參加了體育活動,只是每周運動的次數(shù)偏低,每次活動的時間大部分都在三十分鐘以下。其中每周活動五次以上的僅占一小部分。離我們“每天活動1 h”的要求還有一定的差距。
2.1.4 吉首市普通中學(xué)有無陽光體育運動專項撥款的調(diào)查
據(jù)調(diào)查得知,沒有專項撥款的學(xué)校達到64%,而有專項撥款的為35%。在資金方面,大部分學(xué)校還不到位,這直接影響到學(xué)校陽光運動的開展。通過訪談得知,小部分學(xué)校有一定的體育活動經(jīng)費,可資金很少。這是導(dǎo)致陽光體育未能很好實施的一個重要原因,原因主要是學(xué)校領(lǐng)導(dǎo)對陽光體育運動的不重視,把大量的人力,物力和財力用在其他科目上。
2.1.5吉首市普通中學(xué)場地器材現(xiàn)狀情況調(diào)查
據(jù)調(diào)查可知,學(xué)生進行體育活動的主要場所與器材的配備明顯不足,這與教育部規(guī)定的每生活動場地面積為3平方米相比,明顯不成比例,通過我們對老師和學(xué)生的交談得知學(xué)校的體育器材比較缺乏,并且有些體育器材已經(jīng)比較陳舊,學(xué)校沒有進行及時的更新體育設(shè)備。學(xué)校應(yīng)在體育的硬件和軟件上進行改善。使學(xué)校體育能更好的發(fā)展。讓學(xué)生能有更加寬敞的活動環(huán)境和更加標準的體育場地。
2.2 影響吉首市普通中學(xué)陽光體育運動開展的原因分析
2.2.1 吉首市普通中學(xué)學(xué)校領(lǐng)導(dǎo)對開展“陽光體育”運動的態(tài)度
學(xué)校領(lǐng)導(dǎo)對“陽光體育”運動的重視程度,直接影響到學(xué)校體育活動的組織和開展,因此學(xué)校領(lǐng)導(dǎo)對開展“陽光體育”運動的態(tài)度是影響吉首市普通中學(xué)陽光體育運動開展的一個直接原因。
2.2.2 吉首市普通中學(xué)體育教師師資力量狀況
目前吉首市普通中學(xué)體育教師存在結(jié)構(gòu)性失調(diào),體育教師的數(shù)量無法滿足學(xué)生的需要;因此,吉首市政府要加大教師人事改革,增大體育教師數(shù)量,注入年輕新力量,改革管理機制,以便更好的開展陽光體育運動。
2.2.3 吉首市普通中學(xué)學(xué)校場地器材配備及資金情況
陽光體育運動的開展必須依賴于體育場地和器材,而體育器材的使用頻率高,需要投入大量的資金作為購買器材和維修,通過訪談與調(diào)查發(fā)現(xiàn)吉首市普通中學(xué)缺乏資金保障,體育器材得不到更新.因而使陽光體育運動沒有收到預(yù)期的效果.
3.結(jié)果與建議
3.1 結(jié)果
3.1.1吉首市普通中學(xué)的體育師資力量不足,體育教師和學(xué)生對陽光體育運動了解不透徹。每天的體育活動時間達不到一小時。
3.1.2學(xué)校領(lǐng)導(dǎo)對陽光體育運動在校園的開展,還沒有形成足夠的重視,學(xué)校的場地器材條件有限。
3.1.3學(xué)校對開展陽光體育運動的經(jīng)費缺乏;沒有充足的資金保障,另外,體育教師工作量大,新生力量補充不足。
3.2 建議
3.2.1學(xué)校領(lǐng)導(dǎo)重視關(guān)心陽光體育運動,各級部門加強宣傳,制定詳細和長遠的實施方案,設(shè)立專項資金,為陽光體育運動進一步開展提供條件保障。
3.2.2教育部門重視,建立和完善學(xué)校體育的管理制度,將學(xué)生每天一小時體育活動納入學(xué)校督導(dǎo)內(nèi)容及評估體系,把學(xué)生體質(zhì)健康狀況作為評價教育工作的重要指標。
3.2.3繼續(xù)升化學(xué)校體育改革,加大課程資源開發(fā)與利用,把課外體育活動開展得豐富多彩,使之成為全體學(xué)生參與實踐陽光體育運動的主要形式。(作者單位:1.上海體育學(xué)院,體育教育訓(xùn)練學(xué)院;2.上海體育學(xué)院,中國乒乓球?qū)W院)
參考文獻
[1] 教育部、國家體育總局、.關(guān)于全面啟動全國億萬學(xué)生陽光體育運動的通知[Z].教體藝[2006]6 號,2006-12-20.
[2] 苗秀麗.開展億萬學(xué)生陽光體育運動的認識與思考[J].哈爾濱體育學(xué)院學(xué)報,2002(2):43-44.
[3] 朱志軍.陽光體育”伴新世紀青少年健康成長[J].管理論壇,2007(8):47-48.
關(guān)鍵詞關(guān)鍵詞:極限學(xué)習(xí)機;模式識別;高光譜遙感圖像;判別信息
DOIDOI:10.11907/rjdk.162600
中圖分類號:TP317.4文獻標識碼:A文章編號文章編號:16727800(2017)001016105
對于連續(xù)狹窄的光譜帶,高光譜成像傳感器能夠捕獲詳細和豐富的光譜信息。近年來,隨著圖像處理技術(shù)的發(fā)展,高光譜圖像得到廣泛應(yīng)用,在高光譜圖像應(yīng)用中最重要的任務(wù)是對圖像進行分類。然而,在高光譜遙感圖像分類問題中存在一些挑戰(zhàn)。例如有限訓(xùn)練樣本之間的不平衡和高維度,高光譜遙感圖像幾何形狀復(fù)雜,高光譜遙感圖像分類計算復(fù)雜度高。為使高光譜遙感圖像分類取得良好效果,近年來,機器學(xué)習(xí)方法在高光譜圖像分類中得到廣泛應(yīng)用,例如人工神經(jīng)網(wǎng)絡(luò)(Artificial neural networks,ANNs)[1]、支持向量機(Support vector machine,SVM)[2]、多項邏輯回歸(Multinomial logistic regression,MLR)[3]、主動學(xué)習(xí)(Active learning,AL)[4]等,其它方法如利用稀疏表示[5]以及譜聚類[6]對高光譜進行分離也得到廣泛應(yīng)用。然而,由于高光譜遙感圖像具有{維度以及復(fù)雜性,通過機器學(xué)習(xí)算法尋找最優(yōu)的參數(shù)來進行分類通常非常困難,并且耗時,實現(xiàn)高光譜遙感圖像高效快速分類已成為遙感圖像領(lǐng)域的重要問題。
近年來,Huang等[7]基于單隱層前饋神經(jīng)網(wǎng)絡(luò)(Single-hidden layer feedforward networks,SLFNs)結(jié)構(gòu)提出了極限學(xué)習(xí)機(Extreme learning machine,ELM)。ELM隨機產(chǎn)生隱層節(jié)點的輸入權(quán)值和偏置值,所有參數(shù)中僅有輸出權(quán)值經(jīng)過分析確定。ELM將傳統(tǒng)神經(jīng)網(wǎng)絡(luò)的求解過程轉(zhuǎn)化為一個線性模型,ELM隨機選擇輸入權(quán)值和分析確定SLFNs的輸出權(quán)值,避免了傳統(tǒng)神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)方法收斂速度慢及陷入局部極小解的可能,具有更好的泛化能力和更快的學(xué)習(xí)速度。文獻[7]指出ELM通過隨機產(chǎn)生隱層節(jié)點的輸入權(quán)值和偏置值分析確定輸出權(quán)值,保持了SLFNs的通用逼近能力,同時能夠得到一個全局最優(yōu)解。由于ELM良好的泛化能力,使得ELM應(yīng)用在不同的領(lǐng)域中。在高光譜遙感圖像領(lǐng)域,Pal等[8]將ELM應(yīng)用到土地覆蓋分類中,與BP[9]神經(jīng)網(wǎng)絡(luò)和支持向量機相比,ELM取得了更好的分類效果,并且ELM算法的計算復(fù)雜度遠遠小于BP和支持向量機。Bazi等[10]利用差分進化方法優(yōu)化核ELM算法的參數(shù),提高了高光譜遙感圖像的分類效果。為了提高ELM算法在高光譜遙感圖像分類中的穩(wěn)定性,Samat等[11]基于Bagging 和 AdaBoost算法提出了集成的極限學(xué)習(xí)機算法(Ensemble extreme learning machine,E2LM)。
雖然針對高光譜遙感圖像分類問題,研究人員在ELM算法的基礎(chǔ)上提出了改進,然而 ELM及其改進算法并未充分考慮數(shù)據(jù)樣本間的幾何特征和數(shù)據(jù)蘊含的判別信息。知道樣本之間具有某些相似的屬性和分布特征,樣本之間的相似屬性和分布特征能夠彌補ELM學(xué)習(xí)不夠充分的問題,進而可以提高ELM的泛化能力,因而數(shù)據(jù)樣本的幾何特征和數(shù)據(jù)蘊含的判別信息對ELM的分類性能具有重要作用。
基于以上分析,本文提出一種基于判別信息極端學(xué)習(xí)機(Discriminative information regularized extreme learning machine,IELM),對于分類問題,IELM同時考慮到數(shù)據(jù)樣本的幾何特征和數(shù)據(jù)蘊含的判別信息,通過最大化異類離散度和最小化同類離散度,優(yōu)化極端學(xué)習(xí)機的輸出權(quán)值,從而在一定程度上提高ELM的分類性能和泛化能力。IELM方法的優(yōu)勢在于:①繼承了ELM的優(yōu)點,在一定程度上避免了ELM學(xué)習(xí)不充分的問題;②將異類離散度和同類離散度引入到ELM中,充分利用數(shù)據(jù)樣本的判別信息;③利用MMC[12]方法有效解決最大化異類離散度和最小化同類離散度矩陣奇異問題。
為評價和驗證本文提出的基于判別信息極端學(xué)習(xí)機的高光譜遙感圖像分類方法,實驗使用Indian Pines,Salinas scene兩個高光譜遙感圖像數(shù)據(jù),將本文所提出的方法與ELM、支持向量機(Support vector machine,SVM)、最近鄰分類器協(xié)作表示(Collaborative representation nearest neighbor classifier,CRNN)[13]進行對比,實驗結(jié)果表明本文提出的算法能夠取得較好的分類效果。
實驗環(huán)境為惠普工作站處理器:Intel(R)Xeon(R) CPU E5-1603 0 @2.80 GHz,安裝內(nèi)存:8.00GB ,系統(tǒng)類型:64位操作系統(tǒng),版本:win7,語言開發(fā)環(huán)境采用 Matlab 2010b。
第一組實驗數(shù)據(jù)為Indian Pines遙感圖像數(shù)據(jù),Indian Pines數(shù)據(jù)是AVIRIS傳感器在薩利納斯山谷收集的數(shù)據(jù),該圖像包含200個波段,圖像大小為145×145,地表真實分類如圖1所示,Indian Pines數(shù)據(jù)集屬性設(shè)置如表1所示。
第二組實驗數(shù)據(jù)為Salinas scene遙感圖像數(shù)據(jù),Salinas scene數(shù)據(jù)是AVIRIS傳感器在薩利納斯山谷收集的數(shù)據(jù),該圖像包含204個波段,圖像大小為512×217,地表真實分類如圖2所示, Salinas scene數(shù)據(jù)集屬性設(shè)置如表2所示。
實驗中,對于Indian Pines和Salinas scene圖像數(shù)據(jù),隨機選取1%的數(shù)據(jù)樣本作為訓(xùn)練集,剩下部分為測試集,使用總體精度(OA),Kappa系數(shù),平均準確率(AA)衡量不同算法的性能。
(1)體精度??傮w精度(overall accuracy,OA)是對分類結(jié)果質(zhì)量的總體評價,等于被正確分類的像素總和除 以總的像素個數(shù)。被正確分類的像素沿著混淆矩陣的對角線分布,它顯示了被正確分類到真實分類中的像元數(shù)。根據(jù)混淆矩陣可得OA的計算式為:p=∑ci=1miiN(21)其中,c表示類別數(shù)目,mii表示混淆矩陣對角線上的元素,N=∑ci=1∑cj=1mij表示測試樣本的總數(shù)。
(2)Kappa系數(shù)。Kappa系數(shù)采用一種多元離散分析技術(shù),反映分類結(jié)果與參考數(shù)據(jù)之間的吻合程度,它考慮了混淆矩陣的所有因子,是一種更為客觀的評價指標,其定義為:k=N∑ci=1mii-∑ci=1(mi+m+i)N2-∑ci=1(mi+m+i)(22)其中,mi+,m+i分別表示混淆矩陣第i行的總和、第i列的總和,c表示類別數(shù)目,N為測試樣本總數(shù),mii表示混淆矩陣對角線上的元素,Kappa系數(shù)越大分類精度越高。
(3)平均精度。平均精度(average accuracy,AA)定義為每類分類準確率相加除以類別總數(shù)。AA=∑ci=1accic(23)其中,c表示類別數(shù)目,acci表示每類的分類準確率。
4.2實驗結(jié)果及分析
將IELM與ELM,SVM,CRNN進行對比,SVM采用libsvm工具箱,核函數(shù)采用徑向基核函數(shù)(Radial basis function,RBF),懲罰參數(shù)c=0.02,核函數(shù)參數(shù)g=0.02,IELM與ELM均采用Sigmoid函數(shù)作為激活函數(shù),隱層節(jié)點個數(shù)設(shè)置為500,懲罰參數(shù)c=20。
5結(jié)語
本文提出了一種基于判別信息極端學(xué)習(xí)機的高光譜遙感圖像分類方法,創(chuàng)新之外在于考慮到光譜遙感圖像數(shù)據(jù)的聯(lián)系和差異信息。IELM引入同類離散度和異類離散度的概念,體現(xiàn)了輸入空間數(shù)據(jù)的判別信息,通過最大化異類離散度和最小化同類離散度,優(yōu)化極端學(xué)習(xí)機的輸出權(quán)值。與NN,SVM, ELM算法的對比實驗表明,本文所提出方法的分類效果優(yōu)于NN,SVM,ELM算法。
參考文獻:
[1]Q SAMI UL HAQ,L TAO.Neural network based adaboosting approach for hyperspectral data classication[J].International Conference on Computer Science and Network Technology(ICCSNT),2011:241245.
[2]J A GUALTI,R F CROMP.Support vector machines for hyperspectral remote sensing classification[J].in Proc.SPIE 27th AIPR Workshop:put.Assisted Recognit.Int.Soc.Opt.Photonics,Washington,DC,USA,1999:221232.
[3]J Li,J BIOUCASDIAS,A.PLAZA.Semisupervised hyperspectral image classification using soft sparse multinomial logistic regression[J].IEEE Geosci.Remote Sens.Lett,2013,10(2):318322.
[4]W DI,MM CRAWFORD.Active learning via multiview and local proximity coregularization for hyperspectral image classification[J].IEEE Journal of Selected Topics in Signal Processing,2011,5(3):618628.
[5]J BIOUCASDIAS,M A T.FIGUEIREDO.Alternating direction algorithms for constrained sparse regression:application to hyperspectral unmixing[J].Hyperspectral Image and Signal Processing:Evolution in Remote Sensing (WHISPERS),2010:14.
[6]Y TARABALKA,J A BENEDIKTSSON,J CHANUSSOT.Spectralspatial classification of hyperspectral imagery based on partitional clustering techniques[J].IEEE Transactions on Geoscience and Remote Sensing,2009,47(8):29732987.
[7]GB HUANG,H ZHOU,X DING,et al.Extreme learning machine for regression and multiclass classification[J].IEEE Trans.Syst Man Cybern B,2012,42(2):51329.
[8]M PAL,A E MAXWELL,T A WARNER.Kernelbased extreme learning machine for remotesensing image classification[J].Remote Sens.Lett,2013,4(9):853862.
[9]D RUMELHART,G HINTON,R WILLIAMS.Learning by backpropagating errors[J].Nature,1986,323(6088):533536.
[10]Y BAZI.Differential evolution extreme learning machine for the classification of hyperspectral images[J].IEEE Geosci.Remote Sens.Lett,2014,11(6):10661070.
[11]A SAMAT,P DU,S LIU,et al.E2LMs:ensemble extreme learning machines for hyperspectral image classification[J].IEEE J.Sel.Topics Appl.Earth Observ.Remote Sens,2014,7(4):10601069.
[12]H LI,T JIANG,K ZHANG.Efficient robust feature extraction by maximum margin criterion[J].IEEE Transactions on Neural Networks ,2006,17(1):157165.