摘要:孤立點檢測是數(shù)據(jù)挖掘的重要分支之一,旨在發(fā)現(xiàn)一個數(shù)據(jù)集中與多數(shù)對象行為明顯不同的一些對象.針對分類型矩陣數(shù)據(jù),通過給出一種矩陣對象自身的內(nèi)聚度和該矩陣對象與其他矩陣對象之間的耦合度,定義了矩陣對象的孤立因子,提出一種面向分類型矩陣數(shù)據(jù)的孤立點檢測算法.在Marketbasket、Microsoft web和MovieLens真實數(shù)據(jù)集上的實驗結(jié)果表明,與基于共同近鄰(common-neighbor-based,CNB)算法、局部異常因子(local outlierfactor,LOF)算法和基于信息熵(information entropy-based,IE-based)的算法相比,本算法能有效檢測分類型矩陣數(shù)據(jù)中的孤立點.
注:因版權(quán)方要求,不能公開全文,如需全文,請咨詢雜志社