基于MAPPO的无人机双方对抗打击策略研究

张开发
2026/4/8 12:05:31 15 分钟阅读

分享文章

基于MAPPO的无人机双方对抗打击策略研究
基于MAPPO的无人机双方对抗打击策略研究摘要随着无人机技术的飞速发展和作战概念的不断演进,无人机协同作战将成为未来空中对抗的主要形式。如何利用智能方法实现无人机协同空战决策已成为当前研究的热点和重要现实课题。本文针对无人机双方对抗场景中的打击策略学习问题,提出了一种基于多智能体近端策略优化(Multi-Agent Proximal Policy Optimization,MAPPO)的解决方案。首先阐述了多智能体强化学习面临的核心挑战及MAPPO算法的理论基础;然后针对无人机对抗场景,详细设计了无人机运动模型、机动动作空间、态势观测空间以及多目标融合奖励函数;最后给出了完整的MAPPO算法代码实现、训练流程和实验结果分析。仿真实验表明,采用所提方法的无人机编队能够在对抗场景中有效学习协同打击策略,实现对敌方目标的优势压制。关键词:多智能体强化学习;MAPPO;无人机对抗;协同打击;集中式训练分布式执行一、引言1.1 研究背景近年来,无人机(Unmanned Aerial Vehicle,UAV)制造技术的快速发展和工作环境的日益复杂化,使得无人机集群在未来军事和民用任务中必将蓬勃发展。在无人机集群对抗博弈中,无人机之间的有效内部协同对于成功完成任务至关重要。如何利用智能方法实现无人机协同空战决策已成为当前的研究热点,并具有重要的实际意义。传统的空战决策方法主要依赖专家系统和预定义规则,难以应对复杂动态环境下的实时决策需求。随着深度强化学习技术的成熟,智能体可

更多文章