摘要:數(shù)據(jù)庫系統(tǒng)經過近50年的發(fā)展,雖然已經普遍商用,但隨著大數(shù)據(jù)時代的到來,數(shù)據(jù)庫系統(tǒng)在2個方面面臨挑戰(zhàn).首先數(shù)據(jù)量持續(xù)增大期望單個查詢任務具有更快的處理速度;其次查詢負載的快速變化及其多樣性使得基于DBA經驗的數(shù)據(jù)庫配置和查詢優(yōu)化偏好不能實時地調整為最佳運行時狀態(tài).而數(shù)據(jù)庫系統(tǒng)的性能優(yōu)化進入瓶頸期,優(yōu)化空間收窄,進一步優(yōu)化只能依托新的硬件加速器來實現(xiàn),傳統(tǒng)的數(shù)據(jù)庫系統(tǒng)不能夠有效利用現(xiàn)代的硬件加速器;數(shù)據(jù)庫系統(tǒng)具有成百個可調參數(shù),面對工作負載頻繁變化,大量繁瑣的參數(shù)配置已經超出DBA的能力,這使得數(shù)據(jù)庫系統(tǒng)面對快速而又多樣性的變化缺乏實時響應能力.當下機器學習技術恰好同時符合這2個條件:應用現(xiàn)代加速器以及從眾多參數(shù)調節(jié)經驗中學習.機器學習化數(shù)據(jù)庫系統(tǒng)將機器學習技術引入到數(shù)據(jù)庫系統(tǒng)設計中.一方面將順序掃描轉化為計算模型,從而能夠利用現(xiàn)代硬件加速平臺;另一方面將DBA的經驗轉化為預測模型,從而使得數(shù)據(jù)庫系統(tǒng)更加智能地動態(tài)適應工作負載的快速多樣性變化.將對機器學習化數(shù)據(jù)庫系統(tǒng)當前的研究工作進行總結與歸納,主要包括存儲管理、查詢優(yōu)化的機器學習化研究以及自動化的數(shù)據(jù)庫管理系統(tǒng).在對已有技術分析的基礎上,指出了機器學習化數(shù)據(jù)庫系統(tǒng)的未來研究方向及可能面臨的問題與挑戰(zhàn).
注:因版權方要求,不能公開全文,如需全文,請咨詢雜志社