摘要:針對前饋神經(jīng)網(wǎng)絡難以處理時序數(shù)據(jù)的問題,提出將雙向循環(huán)神經(jīng)網(wǎng)絡(BiRNN)應用在自動語音識別聲學建模中。首先,應用梅爾頻率倒譜系數(shù)進行特征提取;其次,采用雙向循環(huán)神經(jīng)網(wǎng)絡作為聲學模型;最后,測試不同參數(shù)對系統(tǒng)性能的影響。在TIMIT數(shù)據(jù)集上的實驗結(jié)果表明,與基于卷積神經(jīng)網(wǎng)絡和深度神經(jīng)網(wǎng)絡的聲學模型相比,識別率分別提升了1.3%和4.0%,說明基于雙向循環(huán)神經(jīng)網(wǎng)絡的聲學模型具有更好的性能。
注:因版權(quán)方要求,不能公開全文,如需全文,請咨詢雜志社