摘要:譜聚類算法是一種可有效學(xué)習(xí)數(shù)據(jù)流形分布和非凸?fàn)罘植嫉木垲愃惴?但其過程涉及構(gòu)建相似圖、特征分解等高計算復(fù)雜度步驟,難以直接用于大規(guī)模聚類.提出一種基于二部圖的快速聚類算法(fast clustering based on bipartite graph,FCBG),通過對數(shù)據(jù)采樣降低原有數(shù)據(jù)結(jié)構(gòu)規(guī)模,然后基于二部圖學(xué)習(xí)采樣數(shù)據(jù)和原有數(shù)據(jù)關(guān)系.通過對二部圖對應(yīng)的拉普拉斯矩陣施加秩約束,FCBG算法可在優(yōu)化二部圖的邊的權(quán)重的同時,保持二部圖的類簇結(jié)構(gòu),最終直接給出聚類結(jié)果,不依賴構(gòu)圖時每條邊的初始權(quán)重分配.算法計算復(fù)雜度與數(shù)據(jù)大小呈線性關(guān)系.實(shí)驗(yàn)表明,FCBG算法可有效學(xué)部圖的權(quán)重,并在較少的時間消耗下獲得高質(zhì)量的聚類結(jié)果.
注:因版權(quán)方要求,不能公開全文,如需全文,請咨詢雜志社