摘要:社交網(wǎng)絡(luò)中識別用戶身份具有重要價值,它對社交網(wǎng)絡(luò)的分析與監(jiān)管、用戶行為的預(yù)測以及用戶之間交互過程的研究具有重要意義.該文針對社交網(wǎng)絡(luò)中的用戶身份進行研究,將用戶身份分為組織用戶和個人用戶,并對這兩種用戶身份進行具體定義和識別.該文研究問題屬于社交網(wǎng)絡(luò)用戶分析研究中的子研究問題,主要通過用戶在社交網(wǎng)絡(luò)中發(fā)表的文本內(nèi)容、多媒體內(nèi)容以及用戶時間序列內(nèi)容識別出該用戶的組織-個人身份,為社交網(wǎng)絡(luò)用戶身份的識別及進一步研究提供借鑒和幫助.在識別過程中,通過對文本內(nèi)容中用戶的口語化水平、內(nèi)容(主題)復(fù)雜化水平、內(nèi)容規(guī)范化水平的度量以及多媒體內(nèi)容中用戶圖片特性和用戶時間序列內(nèi)容的分析,從不同角度提出5種機器可操作的用戶組織-個人身份識別方法,進而識別出社交網(wǎng)絡(luò)中用戶是組織用戶還是個人用戶.最后,為了驗證該文所提識別方法的可行性和有效性,該文選擇新浪微博數(shù)據(jù)進行實驗,并通過概率模型識別方法進行了對比分析.同時,在驗證過程中,使用多種指標對實驗結(jié)果進行評價.實驗結(jié)果表明,該文識別方法能夠有效識別出用戶的組織-個人身份,其中內(nèi)容復(fù)雜特性識別方法、內(nèi)容規(guī)范化識別方法以及時間序列內(nèi)容識別方法的用戶身份識別準確率超過80%.
注:因版權(quán)方要求,不能公開全文,如需全文,請咨詢雜志社