99热精品69堂国产-97超级碰在线精品视频-日韩欧美中文字幕在线视频-欧美日韩大尺码免费专区-最新国产三级在线不卡视频-在线观看成人免费视频-亚洲欧美国产精品完整版-色综久久天天综合绕视看-中文字幕免费在线看线人-久久国产精品99精品国产

期刊大全雜志訂閱 SCI期刊期刊投稿出版社公文范文精品范文

首頁 > 期刊 > 自動(dòng)化與儀表 > 結(jié)合神經(jīng)網(wǎng)絡(luò)和Q(λ)-learning的路徑規(guī)劃方法【正文】

結(jié)合神經(jīng)網(wǎng)絡(luò)和Q(λ)-learning的路徑規(guī)劃方法

路徑規(guī)劃神經(jīng)網(wǎng)絡(luò) 強(qiáng)化學(xué)習(xí) 移動(dòng)機(jī)器人獎(jiǎng)勵(lì)函數(shù)

作者：王健; 張平陸; 趙忠英; 程曉鵬沈陽新松機(jī)器人自動(dòng)化股份有限公司特種機(jī)器人BG; 沈陽110169; 沈陽科技學(xué)院機(jī)械與交通工程系; 沈陽110167

摘要：Q-learning是一種經(jīng)典的增強(qiáng)學(xué)習(xí)算法,簡(jiǎn)單易用且不需要環(huán)境模型;廣泛應(yīng)用于移動(dòng)機(jī)器人路徑規(guī)劃。但在狀態(tài)空間和動(dòng)作空間較大時(shí),經(jīng)典的Q-learning算法存在學(xué)習(xí)效率低、收斂速度慢,容易陷入局部最優(yōu)解等問題。通過引入神經(jīng)網(wǎng)絡(luò)模型,利用地圖信息計(jì)算狀態(tài)勢(shì)值,從而優(yōu)化了設(shè)計(jì)獎(jiǎng)勵(lì)函數(shù)。合理獎(jiǎng)勵(lì)函數(shù)為Q(λ)-learning算法提供了先驗(yàn)知識(shí),避免訓(xùn)練中的盲目搜索,同時(shí)獎(jiǎng)勵(lì)函數(shù)激勵(lì)避免了陷入局部最優(yōu)解。仿真試驗(yàn)表明,改進(jìn)的路徑規(guī)劃方法在收斂速度方面有很大的提升,訓(xùn)練得到的路徑為全局最優(yōu)。

注：因版權(quán)方要求，不能公開全文，如需全文，請(qǐng)咨詢雜志社

期刊咨詢免費(fèi)咨詢雜志訂閱

自動(dòng)化與儀表

統(tǒng)計(jì)源期刊下單

國際刊號(hào)：1001-9944

國內(nèi)刊號(hào)：12-1148/TP

相關(guān)熱門期刊

中西醫(yī)結(jié)合研究

統(tǒng)計(jì)源期刊下單

國際刊號(hào)：1674-4616

國內(nèi)刊號(hào)：42-1789/R
中西醫(yī)結(jié)合肝病

統(tǒng)計(jì)源期刊下單

國際刊號(hào)：1005-0264

國內(nèi)刊號(hào)：42-1322/R
深圳中西醫(yī)結(jié)合

統(tǒng)計(jì)源期刊下單

國際刊號(hào)：1007-0893

國內(nèi)刊號(hào)：44-1419/R
中西醫(yī)結(jié)合

統(tǒng)計(jì)源期刊下單

國際刊號(hào)：0254-9034

國內(nèi)刊號(hào)：11-2219/R

期刊咨詢服務(wù)，助力升職加薪

服務(wù)介紹LITERATURE

正規(guī)發(fā)表流程全程指導(dǎo)

多年專注期刊服務(wù)，熟悉發(fā)表政策，投稿全程指導(dǎo)。因?yàn)閷Ｗ⑺詫I(yè)。

保障正刊雙刊號(hào)

推薦期刊保障正刊，評(píng)職認(rèn)可，企業(yè)資質(zhì)合規(guī)可查。

用戶信息嚴(yán)格保密

誠信服務(wù)，簽訂協(xié)議，嚴(yán)格保密用戶信息，提供正規(guī)票據(jù)。

不成功可退款

如果發(fā)表不成功可退款或轉(zhuǎn)刊。資金受第三方支付寶監(jiān)管，安全放心。