摘要:特征詞提取算法大多以選取單個關(guān)鍵詞為主,存在詞與詞關(guān)聯(lián)度缺失,文本主題表達(dá)不準(zhǔn)確的問題,為此提出一種基于詞共現(xiàn)的文本分類算法.通過計(jì)算詞間共現(xiàn)率,利用TextRank算法構(gòu)建共現(xiàn)圖得到共現(xiàn)詞組,建立文本向量表示模型,并利用SVM算法實(shí)現(xiàn)文本分類.實(shí)驗(yàn)證明,共現(xiàn)詞作為文本特征項(xiàng)相對于傳統(tǒng)單個特征詞有更好的分類效果.
注:因版權(quán)方要求,不能公開全文,如需全文,請咨詢雜志社