摘要:隨著信息化建設(shè)的快速發(fā)展,數(shù)據(jù)產(chǎn)生了爆炸式的增長(zhǎng),醫(yī)院每天也同樣產(chǎn)生大量的醫(yī)療記錄與數(shù)據(jù)。其中大部分內(nèi)容是非結(jié)構(gòu)化數(shù)據(jù),具有真實(shí)性、主觀性和不規(guī)范性,不利于解讀和處理。由于醫(yī)療數(shù)據(jù)是以非結(jié)構(gòu)化的文本形式存儲(chǔ)的,因此無(wú)法直接通過(guò)計(jì)算機(jī)直接處理和分析,不僅效率低下,分析質(zhì)量也無(wú)法保證。目前的信息抽取研究中使用的方法的可擴(kuò)展性都較差,具有一些局限性,故自動(dòng)化程度不高。文中通過(guò)自然語(yǔ)言處理中的規(guī)則描述語(yǔ)言方法,對(duì)數(shù)據(jù)中非結(jié)構(gòu)化的醫(yī)學(xué)命名實(shí)體進(jìn)行識(shí)別,并通過(guò)語(yǔ)義分析進(jìn)行標(biāo)簽提取,使非結(jié)構(gòu)化的數(shù)據(jù)結(jié)構(gòu)化,讓數(shù)據(jù)中的描述更為準(zhǔn)確、統(tǒng)一。優(yōu)化了目前信息抽取方法中存在的可擴(kuò)展性差的缺點(diǎn),能夠根據(jù)情況適應(yīng)不同的情景。
注:因版權(quán)方要求,不能公開(kāi)全文,如需全文,請(qǐng)咨詢雜志社
統(tǒng)計(jì)源期刊 下單
國(guó)際刊號(hào):1673-629X
國(guó)內(nèi)刊號(hào):61-1450/TP
雜志詳情國(guó)際刊號(hào):2096-7586
國(guó)內(nèi)刊號(hào):42-1907/C