摘要:隨著我國航天技術的快速發(fā)展,包括導航、遙感和通信在內的航天資源越來越豐富,同時,國民經濟和國防建設對航天信息的需求迫切,如何充分地應用航天信息和航天資源,成為一個新的研究內容。分析了航天信息應用的具體模式,采用深度強化學習的建模和優(yōu)化方法,探索和研究了具體應用場景下的深度強化學習對應用需求的籌劃和決策安排,從而在理論上驗證了將人工智能方法應用于航天信息綜合應用決策的可行性,為航天信息應用的大眾化、平民化提供了支撐。通過仿真環(huán)境,測試在有限迭代范圍內多個模型的優(yōu)化速度。實驗證明,在價值模型中選擇DoubleDQN網絡,其優(yōu)化決策的收斂性能更好。
注:因版權方要求,不能公開全文,如需全文,請咨詢雜志社