摘要:針對在蛋白質相互作用網(wǎng)絡上的關鍵蛋白質識別只關注拓撲特性,蛋白質相互作用數(shù)據(jù)中存在較高比例的假陽性數(shù)據(jù)以及基于復合物信息的關鍵蛋白質識別算法對節(jié)點的鄰域信息和復合物的挖掘對關鍵蛋白質的識別影響效果考慮不夠全面等導致的識別準確率和特異性不高的問題,提出一種基于復合物參與度和密度的關鍵蛋白質預測算法PEC。首先融合GO注釋信息和邊聚集系數(shù)構造加權PPI網(wǎng)絡,克服假陽性對實驗結果的影響;基于蛋白質相互作用的邊權重,構造相似度矩陣,設計特征值間的最大本征差值來自動確定劃分數(shù)目K,同時根據(jù)加權網(wǎng)絡中的蛋白質節(jié)點度來選取K個初始聚類中心,進而利用譜聚類結合模糊C-means聚類算法實現(xiàn)復合物的挖掘,提高聚類的準確率,降低數(shù)據(jù)的維數(shù);其次基于蛋白質節(jié)點的復合物參與度以及節(jié)點鄰域子圖密度,設計出關鍵節(jié)點的關鍵性得分。在DIP和Krogan 2個數(shù)據(jù)集上,將PEC與DC、BC、CC、SC、IC、PeC、WDC、LIDC、LBCC和UC 10種經(jīng)典算法相比,實驗結果表明,PEC算法能夠識別出更多的關鍵蛋白質,且聚類結果的準確率和特異性較高。
注:因版權方要求,不能公開全文,如需全文,請咨詢雜志社