留言板

尊敬的读者、作者、审稿人, 关于本刊的投稿、审稿、编辑和出版的任何问题, 您可以本页添加留言。我们将尽快给您答复。谢谢您的支持!

姓名
邮箱
手机号码
标题
留言内容
验证码

基于改进DDPG算法的无人艇自适应控制研究

宋利飞 许传毅 郝乐 郭荣 柴威

宋利飞, 许传毅, 郝乐, 郭荣, 柴威. 基于改进DDPG算法的无人艇自适应控制研究[J]. 中国舰船研究. doi: 10.19693/j.issn.1673-3185.03122
引用本文: 宋利飞, 许传毅, 郝乐, 郭荣, 柴威. 基于改进DDPG算法的无人艇自适应控制研究[J]. 中国舰船研究. doi: 10.19693/j.issn.1673-3185.03122
Research on Adaptive Control of Unmanned Surface Vehicle Based on Improved DDPG Algorithm[J]. Chinese Journal of Ship Research. doi: 10.19693/j.issn.1673-3185.03122
Citation: Research on Adaptive Control of Unmanned Surface Vehicle Based on Improved DDPG Algorithm[J]. Chinese Journal of Ship Research. doi: 10.19693/j.issn.1673-3185.03122

基于改进DDPG算法的无人艇自适应控制研究

doi: 10.19693/j.issn.1673-3185.03122
基金项目: 院校级-中央高校基本科研业务费专项资金资助项目(3120622898)

Research on Adaptive Control of Unmanned Surface Vehicle Based on Improved DDPG Algorithm

知识共享许可协议
基于改进DDPG算法的无人艇自适应控制研究宋利飞,等创作,采用知识共享署名4.0国际许可协议进行许可。
  • 摘要: 【目的】针对水面无人艇(USV)在干扰条件下航行稳定性差的问题,提出了一种基于深度强化学习算法的智能参数整定方法,实现了无人艇在干扰下的有效控制。【方法】建立无人艇动力学模型,结合视线法和PID控制器进行无人艇的航向控制。引入深度强化学习理论,设计智能体环境状态、动作和奖励函数在线调整PID参数。针对DDPG(Deep Deterministic Policy Gradient)算法收敛速度慢和训练时容易出现局部最优情况,提出了改进DDPG算法,将原经验池分离为成功和失败经验池,并设计自适应批次采样函数,优化经验池回放结构。【结果】仿真实验表明,所改进算法迅速收敛,同时在训练后期条件下,基于改进DDPG算法控制器的横向误差和航向角偏差均显著减小,更快贴合期望路径后保持更稳定的路径跟踪。【结论】改进算法显著降低了训练时间成本,增强了智能体训练后期的稳态性能,提高了路径跟踪精度。
  • 加载中
计量
  • 文章访问数:  233
  • 被引次数: 0
出版历程
  • 收稿日期:  2022-10-11
  • 网络出版日期:  2022-11-21

目录

    /

    返回文章
    返回