摘要:決策樹是從一組數(shù)據(jù)中生成分類器的一個行之有效的方法。其中ID3算法是目前引用率較高的算法。ID3算法是以信息熵為核心的分類預(yù)測算法。然而ID3算法存在多值偏向問題,可能使得出的決策樹并不是最優(yōu)的。文章將信息增益與關(guān)聯(lián)函數(shù)生活經(jīng)驗和相結(jié)合,改進ID3算法,克服ID3算法偏向于選擇取值多的屬性的缺點,提高ID3算法準確率。并將改進后的ID3算法與原算法比較,證明改進后的ID3算法準確有效。
注:因版權(quán)方要求,不能公開全文,如需全文,請咨詢雜志社