首頁 > 期刊 > 河北省科學(xué)院學(xué)報(bào) > 基于詞共現(xiàn)的文本分類算法【正文】

基于詞共現(xiàn)的文本分類算法

作者：和志強(qiáng); 楊建; 王麗鵬河北經(jīng)貿(mào)大學(xué)信息技術(shù)學(xué)院; 河北石家莊050061

摘要：特征詞提取算法大多以選取單個關(guān)鍵詞為主,存在詞與詞關(guān)聯(lián)度缺失,文本主題表達(dá)不準(zhǔn)確的問題,為此提出一種基于詞共現(xiàn)的文本分類算法.通過計(jì)算詞間共現(xiàn)率,利用TextRank算法構(gòu)建共現(xiàn)圖得到共現(xiàn)詞組,建立文本向量表示模型,并利用SVM算法實(shí)現(xiàn)文本分類.實(shí)驗(yàn)證明,共現(xiàn)詞作為文本特征項(xiàng)相對于傳統(tǒng)單個特征詞有更好的分類效果.

注：因版權(quán)方要求，不能公開全文，如需全文，請咨詢雜志社

期刊咨詢免費(fèi)咨詢雜志訂閱

河北省科學(xué)院學(xué)報(bào)

省級期刊下單

國際刊號：1001-9383

國內(nèi)刊號：13-1081/N

雜志詳情

相關(guān)熱門期刊

湖北民族大學(xué)學(xué)報(bào)·哲學(xué)社會科學(xué)版

省級期刊下單

國際刊號：2096-7586

國內(nèi)刊號：42-1907/C
電腦迷

省級期刊下單

國際刊號：1672-528X

國內(nèi)刊號：50-1163/TP
馬克思主義與中華文化研究

省級期刊下單
讀寫算

省級期刊下單

國際刊號：1002-7661

國內(nèi)刊號：42-1078/G4