摘要:目的應(yīng)用不同機器學習算法預(yù)測男男性行為(MSM)人群HIV感染狀況的比較。方法將四種機器學習算法(logistic回歸、神經(jīng)網(wǎng)絡(luò)、隨機森林和支持向量機)的預(yù)測結(jié)果和實驗室的檢測結(jié)果相比較,分類性能的評價指標采用ROC曲線下面積(AUC)、靈敏度、特異度和準確度(PRE)。結(jié)果四種算法在訓練集和測試集上均具有較理想的分類效能,訓練集的結(jié)果略好于測試集。和logistic回歸分析相比較,其他幾種算法均提高了分類預(yù)測效能:神經(jīng)網(wǎng)絡(luò)提高18.4%(AUC:0.909,95%CI:0.903~0.915),隨機森林提高19.7%(AUC:0.922,95%CI:0.920~0.924),支持向量機提高22.3%(AUC:0.948,95%CI:0.947~0.949)。其中支持向量機的分類性能最好,分類的靈敏度為97.5%,特異度為99.1%,準確度(PRE)為98.9%。結(jié)論機器學習算法顯著地提高了MSM人群中HIV感染的預(yù)測效能,可以較準確地識別MSM人群中HIV感染者與未感染者,為及時地提供預(yù)防與治療服務(wù)提供了依據(jù),同時避免了醫(yī)療資源的浪費。
注:因版權(quán)方要求,不能公開全文,如需全文,請咨詢雜志社