摘 要:利用深度强化学习方法对威胁区域环境下多无人机(UAV) 自主路径规划问题进行研究。为了解决强化学习算法中普遍存在难以收敛的问题,提出了一种改进的Actor-Attention-Critic for (试读)...