摘要:在非平衡數(shù)據(jù)分類問(wèn)題中,為了合成有價(jià)值的新樣本和刪除無(wú)影響的原樣本,提出一種基于邊界混合重采樣的非平衡數(shù)據(jù)分類算法。該算法首先引入支持k-離群度概念,找出數(shù)據(jù)集中的邊界點(diǎn)集和非邊界點(diǎn)集;利用改進(jìn)的SMOTE算法將少數(shù)類中的邊界點(diǎn)作為目標(biāo)樣本合成新的點(diǎn)集,同時(shí)對(duì)多數(shù)類中的非邊界點(diǎn)采用基于距離的欠采樣算法,以此達(dá)到類之間的平衡。通過(guò)實(shí)驗(yàn)結(jié)果對(duì)比表明了該算法在保證G-mean值較優(yōu)的前提下,一定程度上提高了少數(shù)類的分類精度。
注:因版權(quán)方要求,不能公開全文,如需全文,請(qǐng)咨詢雜志社
國(guó)際刊號(hào):2096-7586
國(guó)內(nèi)刊號(hào):42-1907/C