摘要:注意力機(jī)制逐漸成為目前深度學(xué)習(xí)領(lǐng)域的主流方法和研究熱點(diǎn)之一,它通過(guò)改進(jìn)源語(yǔ)言表達(dá)方式,在解碼中動(dòng)態(tài)選擇源語(yǔ)言相關(guān)信息,從而極大改善了經(jīng)典Encoder-Decoder框架的不足。該文在提出傳統(tǒng)基于Encoder-Decoder框架中存在的長(zhǎng)程記憶能力有限、序列轉(zhuǎn)化過(guò)程中的相互關(guān)系、模型動(dòng)態(tài)結(jié)構(gòu)輸出質(zhì)量等問(wèn)題的基礎(chǔ)上,描述了注意力機(jī)制的定義和原理,介紹了多種不同的分類(lèi)方式,分析了目前的研究現(xiàn)狀,并敘述了目前注意力機(jī)制在圖像識(shí)別、語(yǔ)音識(shí)別和自然語(yǔ)言處理等重要領(lǐng)域的應(yīng)用情況。同時(shí),進(jìn)一步從多模態(tài)注意力機(jī)制、注意力的評(píng)價(jià)機(jī)制、模型的可解釋性及注意力與新模型的融合等方面進(jìn)行了探討,從而為注意力機(jī)制在深度學(xué)習(xí)中的應(yīng)用提供新的研究線索與方向。
注:因版權(quán)方要求,不能公開(kāi)全文,如需全文,請(qǐng)咨詢(xún)雜志社