99热精品69堂国产-97超级碰在线精品视频-日韩欧美中文字幕在线视频-欧美日韩大尺码免费专区-最新国产三级在线不卡视频-在线观看成人免费视频-亚洲欧美国产精品完整版-色综久久天天综合绕视看-中文字幕免费在线看线人-久久国产精品99精品国产

結(jié)合神經(jīng)網(wǎng)絡(luò)和Q(λ)-learning的路徑規(guī)劃方法

作者:王健; 張平陸; 趙忠英; 程曉鵬 沈陽新松機(jī)器人自動(dòng)化股份有限公司特種機(jī)器人BG; 沈陽110169; 沈陽科技學(xué)院機(jī)械與交通工程系; 沈陽110167

摘要:Q-learning是一種經(jīng)典的增強(qiáng)學(xué)習(xí)算法,簡(jiǎn)單易用且不需要環(huán)境模型;廣泛應(yīng)用于移動(dòng)機(jī)器人路徑規(guī)劃。但在狀態(tài)空間和動(dòng)作空間較大時(shí),經(jīng)典的Q-learning算法存在學(xué)習(xí)效率低、收斂速度慢,容易陷入局部最優(yōu)解等問題。通過引入神經(jīng)網(wǎng)絡(luò)模型,利用地圖信息計(jì)算狀態(tài)勢(shì)值,從而優(yōu)化了設(shè)計(jì)獎(jiǎng)勵(lì)函數(shù)。合理獎(jiǎng)勵(lì)函數(shù)為Q(λ)-learning算法提供了先驗(yàn)知識(shí),避免訓(xùn)練中的盲目搜索,同時(shí)獎(jiǎng)勵(lì)函數(shù)激勵(lì)避免了陷入局部最優(yōu)解。仿真試驗(yàn)表明,改進(jìn)的路徑規(guī)劃方法在收斂速度方面有很大的提升,訓(xùn)練得到的路徑為全局最優(yōu)。

注:因版權(quán)方要求,不能公開全文,如需全文,請(qǐng)咨詢雜志社

自動(dòng)化與儀表

統(tǒng)計(jì)源期刊 下單

國際刊號(hào):1001-9944

國內(nèi)刊號(hào):12-1148/TP

雜志詳情
相關(guān)熱門期刊

服務(wù)介紹LITERATURE

正規(guī)發(fā)表流程 全程指導(dǎo)

多年專注期刊服務(wù),熟悉發(fā)表政策,投稿全程指導(dǎo)。因?yàn)閷W⑺詫I(yè)。

保障正刊 雙刊號(hào)

推薦期刊保障正刊,評(píng)職認(rèn)可,企業(yè)資質(zhì)合規(guī)可查。

用戶信息嚴(yán)格保密

誠信服務(wù),簽訂協(xié)議,嚴(yán)格保密用戶信息,提供正規(guī)票據(jù)。

不成功可退款

如果發(fā)表不成功可退款或轉(zhuǎn)刊。資金受第三方支付寶監(jiān)管,安全放心。