摘要:【目的】通過多視圖協(xié)同可視化的方式對(duì)時(shí)序文本挖掘過程進(jìn)行可視化,以實(shí)現(xiàn)多角度多層面洞察文本數(shù)據(jù)背后隱藏的規(guī)律和信息?!痉椒ā炕谖谋驹~向量矩陣,對(duì)多政策主體的政策時(shí)序文本,通過數(shù)據(jù)清洗、計(jì)算TF-IDF值、構(gòu)建向量空間模型、奇異值分解等文本挖掘技術(shù)進(jìn)行信息提取和可交互的可視化探索分析?!窘Y(jié)果】選取2016年1月–2017年8月北京市中關(guān)村示范區(qū)下屬子園區(qū)的相關(guān)委內(nèi)信息文本為樣本,采用文本挖掘技術(shù)和多視圖協(xié)同可視化方法,探索政策文本背后的規(guī)律,驗(yàn)證了本文方法和框架的有效性。【局限】針對(duì)大規(guī)模文本具體細(xì)節(jié)單數(shù)據(jù)點(diǎn)的展示效果不佳,文本挖掘技術(shù)有待進(jìn)一步提升,模型數(shù)據(jù)吞吐量有待基于大數(shù)據(jù)架構(gòu)進(jìn)一步增強(qiáng)?!窘Y(jié)論】本文方法和框架能夠?qū)r(shí)序文本類數(shù)據(jù)做到充分的挖掘展示,更好地把握數(shù)據(jù)背后的信息,增強(qiáng)政策主體的決策依據(jù)。
注:因版權(quán)方要求,不能公開全文,如需全文,請(qǐng)咨詢雜志社
CSSCI南大期刊 下單
國(guó)際刊號(hào):2096-3467
國(guó)內(nèi)刊號(hào):10-1478/G2
雜志詳情國(guó)際刊號(hào):2096-7586
國(guó)內(nèi)刊號(hào):42-1907/C