摘要:近年來,隨著XML數(shù)據(jù)的爆炸式增長,對XML關(guān)鍵字查詢技術(shù)的研究日益受到關(guān)注。數(shù)據(jù)編碼是關(guān)鍵字查詢的基礎(chǔ),目前主要有2種方式--基于路徑的編碼及區(qū)間編碼。區(qū)間編碼可更好地適應(yīng)對查詢中的XML數(shù)據(jù)進行動態(tài)的更新,因而具有更多的優(yōu)勢。本文研究基于區(qū)間編碼的關(guān)鍵字查詢問題,提出一種新的查詢算法。該算法首先根據(jù)預(yù)留的區(qū)間值建立索引,再根據(jù)最小范圍值對索引進行選擇遍歷,減少了不必要的比較,達到了提高查詢效率的目的。研究發(fā)現(xiàn),預(yù)留空間的選擇對查詢效率有一定的影響。為此,本文設(shè)計一種基于節(jié)點自身進行區(qū)間預(yù)留的編碼方式(Interval Reservation Based on Node, IRBN),為節(jié)點設(shè)置權(quán)值,并根據(jù)權(quán)值進行區(qū)間值的設(shè)定,形成根據(jù)節(jié)點自身分配區(qū)間的較為均衡的編碼。實驗表明,IRBN編碼是合理的,有較高的查詢效率。
注:因版權(quán)方要求,不能公開全文,如需全文,請咨詢雜志社