摘要:【目的】自動(dòng)甄別科技論文中描述研究主題的關(guān)鍵語句?!痉椒ā恳哉撐男」?jié)為單位組織句子集,通過訓(xùn)練領(lǐng)域詞向量計(jì)算句子間WMD距離得到相應(yīng)語義相似度,優(yōu)化TextRank算法迭代過程,利用外部特征對(duì)所得權(quán)值進(jìn)行調(diào)整,按句子權(quán)值降序選取關(guān)鍵主題句?!窘Y(jié)果】以氣候變化領(lǐng)域科技論文作為實(shí)驗(yàn)數(shù)據(jù),以人工標(biāo)注的結(jié)果為基準(zhǔn)對(duì)本文的算法和傳統(tǒng)的TextRank算法進(jìn)行對(duì)比實(shí)驗(yàn),初步結(jié)果表明該方法的識(shí)別效果(F值)比傳統(tǒng)TextRank算法提升約5%?!揪窒蕖烤渥犹卣魈崛∮写岣?,詞向量訓(xùn)練及方法中的相關(guān)參數(shù)需要做進(jìn)一步優(yōu)化?!窘Y(jié)論】基于領(lǐng)域詞向量,融合WMD語義相似度的TextRank改進(jìn)算法,能夠較好地甄別科技論文小節(jié)內(nèi)部中心句,輔以外部特征的權(quán)值調(diào)整后可以較好地識(shí)別出一篇論文的核心主題句。
注:因版權(quán)方要求,不能公開全文,如需全文,請咨詢雜志社
國際刊號(hào):2096-7586
國內(nèi)刊號(hào):42-1907/C