Ship motion identification model based on enhanced Bi-LSTM
-
摘要:目的
针对基于数据驱动的船舶建模策略获得的模型预测精度低、适应性差等特点,提出一种增强的双向长短期记忆(Bi-LSTM)神经网络用于船舶的高精度非参数化建模。
方法首先,利用Bi-LSTM神经网络的特点,实现对序列双向时间维度的特征提取。基于此,设计一维卷积神经网络(1D-CNN)提取序列的空间维度特征。然后,采用多头自注意力机制(MHSA)多角度对序列进行自适应加权处理。利用KVLCC2船舶航行数据,将所提增强Bi-LSTM模型与支持向量机(SVM)、门控循环单元(GRU)、长短期记忆神经网络(LSTM)模型的预测效果进行对比。
结果所提增强Bi-LSTM模型在测试集中均方根误差(RMSE)、平均绝对误差(MAE)性能指标分别低于0.015和0.011,决定系数(R2)高于0.999 13,预测精度显著高于SVM,GRU,LSTM模型。
结论增强Bi-LSTM模型泛化性能优异,预测稳定性及预测精度高,有效实现了船舶的运动模型辨识。
-
关键词:
- 系统辨识 /
- 非参数化建模 /
- 一维卷积神经网络 /
- 双向长短期记忆神经网络 /
- 多头自注意力机制
Abstract:ObjectiveAiming at the low prediction precision and poor adaptability of ship models based on the data-driven modeling strategy, an enhanced bi-directional long short-term memory (Bi-LSTM) model is proposed for the high-precision non-parametric modeling of ships.
MethodsFirst, the feature extraction of the bi-directional time dimension is realized using bi-directional long short-term memory (Bi-LSTM) neural networks. On this basis, the spatial dimension features of the one-dimensional convolutional neural network (1D-CNN) extraction sequence are designed. Then, a multi-head self-attention (MHSA) mechanism is used to deal with the sequence from multiple angles. Finally, using the navigation data of KLVCC2 ships, the prediction effects of the enhanced Bi-LSTM model are compared with those of the Support Vector Machine (SVM), Gate Recurrent Unit (GRU), and long short-term memory (LSTM) models.
ResultsThe Root Mean Square Error (RMSE) and Mean Absolute Error (MAE) performance indicators of the enhanced Bi-LSTM model in the test set are lower than 0.015 and 0.011 respectively, and the coefficient of determination(R2)is higher than
0.99913 , demonstrating prediction accuracy significantly higher than that of the SVM, GRU, and LSTM models.ConclusionThe proposed enhanced Bi-model has excellent generalization performance and excellent prediction stability and precision, and effectively realizes ship motion identification.
-
0. 引 言
随着国际海上贸易的日益发展及人工智能技术的不断革新,智能船舶俨然成为了船舶发展的全球趋势[1]。精确的运动数学模型是智能船舶进行姿态预测、轨迹规划和运动控制的重要基础。然而,海洋环境的复杂性以及船舶本身所具有的强非线性特点,为建立准确的船舶运动模型带来了巨大挑战。
目前,主流的船舶建模策略为参数化建模,例如考虑作用在船体上的流体动力、控制力、扰动力而获得的Abkowitz整体型模型、分离型模型(mathematical modeling group,MMG)等。然而,参数化建模需预先使用计算流体力学(CFD)、经验法、试验法等方法确定船舶的各项水动力参数。冯大奎等[2]将水池与船舶视为个体分别进行网格划分,并利用CFD求解器对船舶的水动力参数进行辨识。Skjetne等[3]通过对实验室的模型船进行拖曳试验和自适应操纵试验,实现了对船舶模型参数的确定和验证。但上述参数化建模过程不但对研究人员有较高的先验知识要求,而且还会产生巨大的时间及金钱成本。
受益于近年来人工智能领域的发展,基于数据驱动的非参数化建模凭借其优秀的适应性和泛化能力,逐渐引起研究人员的重视[4]。机器学习利用数据多维度的特征实现模型辨识[5],被视为船舶非参数化建模的理想工具。Chen等[6]利用稀疏高斯过程回归实现了船舶的模型辨识及预测,通过实验证明了该算法在降低大数据模型计算复杂度的同时,保证了预测精度。Chen等[7]利用最小二乘法与支持向量机(support vector machine,SVM)相结合的思想辨识灰箱模型的未知参数,通过人为添加噪声的实验,证明了该算法的鲁棒性。面对机器学习超参数的调整和优化,Ouyang等[8]提出一种引入遗传算法优化高斯过程回归超参数的思想,实现了船舶模型的高精度预测。然而,上述传统的机器学习算法在面对大模型、高维度的数据时表现乏力。
深度神经网络是人工智能领域的核心之一[9],其对非线性模型优秀的拟合能力常被用于船舶的非参数化建模。He等[10]利用贝叶斯优化算法调整反向传播神经网络(BPNN)超参数的思想,提高模型预测精度,利用真实的船舶实验数据,验证了所提出算法的可行性。楼梦瑶等[11]提出了一种非线性自回归( NARX)神经网络,相较于BPNN神经网络,其在处理船舶实时运动预测上有着更优秀的表现及更强的适应性。船舶的模型识别及预测是典型的时间序列预测问题,因此循环神经网络(RNN)有着先天性的优势[12]。Han等[13]提出一种变步长采样频率的长短期记忆(long short-term memory,LSTM)神经网络用于船舶运动预测,Zhang等[14]在LSTM神经网络的基础上加入了多尺度注意力机制以提高船舶运动预测的准确性,Suo等[15]利用时间效率更高的门控循环单元(gate recurrent unit,GRU)神经网络实现了船舶轨迹的预测。但上述研究忽略了序列的反向时间关联性及空间维度下的隐藏特征。
为更全面地获取序列的双向时间关联及空间维度隐藏特征,Wang等[16]利用双向长短期记忆(bi-directional long short-term memory,Bi-LSTM)网络结合卷积神经网络(CNN)对海面上受强风、海浪等复杂环境因素影响的船舶进行运动姿态预测,并利用真实船舶数据证实了该算法的可行性。Zhou等[17]将Bi-LSTM网络与残差网络和注意力机制相结合,开发了一种新颖的船舶非参数建模方法,在静水域环境下验证了其建模精度。
受上述研究启发,本文将提出一种增强双向长短时记忆(bi-directional long short-term memory,Bi-LSTM)神经网络模型用于船舶的运动模型辨识。首先,利用滑动时间窗算法截取原始时间序列片段,先后使用一维卷积神经网络(one dimension convolutional neural network,1D-CNN)及Bi-LSTM网络提取序列在空间维度及双向时间维度下的隐藏特征。然后,利用多头自注意力机制降低Bi-LSTM网络在信息长期传递过程中的特征损耗。最后,将LSTM网络与全连接层组成解码层,实现预测结果的输出。通过实船航行数据实验,验证了所提模型的有效性和准确性。
1. 增强Bi-LSTM模型概述
与传统的参数化建模策略不同,本文增强Bi-LSTM模型直接通过船舶的输入输出数据拟合神经网络来实现建模,而无需过多的船舶相关先验知识。图1展示了基于神经网络对船舶非参数化建模的整体流程。首先,在进行船舶非参数化建模前,需进行船舶航行试验以采集数据,并对这些数据进行归一化、异常值清洗等预处理,再将其划分为训练集和测试集。接着,设计神经网络模型以拟合船舶的非线性运动学模型,并选择适当的网络结构及训练超参数。然后,训练神经网络模型,包括正向传播、损失函数计算、反向传播,直至达到设定的训练批次。最后,根据测试集的拟合效果评估所得非参数化模型是否满足精度要求,若满足,则获得船舶的辨识模型,若不满足,则需继续调整神经网络模型的结构及其超参数。
1.1 问题描述
受文献[18]启发,船舶模型可表示为4个状态量(航向角ψ、偏航角速度ω、横摇角ϕ、总速度ν和单输入量舵角δ)的多入多出(MIMO)高维系统。
{{\boldsymbol{x}}_{t + 1}} = \varGamma ({{\boldsymbol{x}}_t},{{\boldsymbol{u}}_t}) (1) 式中: {{\boldsymbol{x}}_t} = {\left[ {{\psi _t}}\;\;\;{{\omega _t}} \;\;\;{{\phi _t}}\;\;\;{{\nu _t}} \right]^{\rm T}} 和{{\boldsymbol{u}}_t} = {[{\delta _t}]^{\rm T}}分别表示t时刻下的船舶状态及控制输入;\varGamma 为其非线性离散系统的映射函数。
考虑{{\boldsymbol{x}}_t}具有明显的时间周期性,利用图2所示滑动时间窗算法截取原始序列。其中,l表示滑动窗口宽度,n+l+3代表原始序列的总长度。滑动窗口算法截取后的t时刻状态输入序列片段及控制输入序列片段{{\boldsymbol{X}}_t}和{{\boldsymbol{U}}_t}如式(2)所示:
\left\{ \begin{aligned} & {{\boldsymbol{X}}_t} = [ {{{\boldsymbol{x}}_{t - l + 1}}},\; \ldots ,\;{{{\boldsymbol{x}}_{t - 1}}},\;{{{\boldsymbol{x}}_t}} ] \\ & {{\boldsymbol{U}}_t} = [ {{{\boldsymbol{u}}_{t - l + 1}}},\; \ldots,\;{{{\boldsymbol{u}}_{t - 1}}},\;{{{\boldsymbol{u}}_t}} ] \end{aligned} \right. (2) 即船舶模型识别及预测问题由式(1)改写为
{{\boldsymbol{Y}}_t} = {\varGamma ^ * }({{\boldsymbol{X}}_t},{{\boldsymbol{U}}_t}) (3) 式中:{{\boldsymbol{Y}}_t} = {{\boldsymbol{x}}_{t + 1}},为t + 1时刻船舶的状态量; {\varGamma ^ * } 为船舶预测模型。通过式(3)及滑动窗口循环,可实现连续的单步预测,进而实现船舶模型的辨识。
1.2 一维卷积神经网络
船舶运动模型为典型的高维系统,1D-CNN利用卷积运算能够有效提取序列在空间维度下的特征。相较于线性层,卷积层中的多个卷积核间通过权重共享机制,在显著提高运算效率的同时,可有效实现对序列空间特征的提取和重建[19]。
本文使用如图3所示的1D-CNN,利用多组卷积核沿着时间轴遍历提取多维特征,卷积运算后的序列维度与卷积核的数量f相同,设第i个卷积核w_i对t时刻的序列输入{\left[ {{{\boldsymbol{x}}_t}}\;\;\;{{{\boldsymbol{u}}_t}} \right]^{\rm T}}进行一维卷积运算,其结果 {\boldsymbol{x}}_t^ + \in {{\bf{{R}}}^{f \times 1}} 计算如下:
{\boldsymbol{x}}_t^ + = \left[ {\begin{array}{*{20}{c}} {{\boldsymbol{x}}_{1,t}^ + } \\ {{\boldsymbol{x}}_{2,t}^ + } \\ \vdots \\ {{\boldsymbol{x}}_{f,t}^ + } \end{array}} \right] = \left[ {\begin{array}{*{20}{c}} {{{\boldsymbol{w}}_{1,a}}^{\rm T}} \\ {\begin{array}{*{20}{c}} {{{\boldsymbol{w}}_{2,a}}^{\rm T}} \\ \vdots \end{array}} \\ {{{\boldsymbol{w}}_{f,a}}^{\rm T}} \end{array}} \right] * \left[ {\begin{array}{*{20}{c}} {{{\boldsymbol{x}}_t}} \\ {{{\boldsymbol{u}}_t}} \end{array}} \right] + \left[ {\begin{array}{*{20}{c}} {{{\boldsymbol{w}}_{1,b}}} \\ {{{\boldsymbol{w}}_{2,b}}} \\ \vdots \\ {{{\boldsymbol{w}}_{f,b}}} \end{array}} \right] (4) 式中, {{\boldsymbol{w}}_{i,a}} 与 {{\boldsymbol{w}}_{i,b}} 分别为第i个卷积核的权重矩阵和偏置矩阵。对t时刻下滑动窗口处理后的时间序列片段 {\left[ {{{\boldsymbol{X}}_t}}\;\;\;{{{\boldsymbol{U}}_t}} \right]^{\rm T}} 进行卷积神经网络运算后的结果表示为
{\boldsymbol{X}}_t^ + = [ {{\boldsymbol{x}}_{t - l + 1}^ + },\;\ldots \;,{{\boldsymbol{x}}_{t - 1}^ + },\;{{\boldsymbol{x}}_t^ + } ] (5) 1.3 Bi-LSTM神经网络
LSTM单元通过输入门、遗忘门、输出门实现信息传递过程中的筛选、过滤,在处理时间序列数据时,擅长捕获序列中的时间关联性[20]。LSTM单元结构如图4所示,其中遗忘门 {\boldsymbol{f}_t} 、输入门 {\boldsymbol{i}_t} 、输出门 {\boldsymbol{O}_t} 、候选状态 \tilde {\boldsymbol{C}_t} 、存储状态 {\boldsymbol{C}_t} ,输出状态 {\boldsymbol{h}_t} 的计算如式(6)~式(11)所示。
{\boldsymbol{f}_t} = \sigma ({{\boldsymbol{W}}_f} \cdot [\begin{array}{*{20}{c}} {{{\boldsymbol{h}}_{t - 1}}}&{{\boldsymbol{x}}_t^ + } \end{array}] + {{\boldsymbol{b}}_f}) (6) {\boldsymbol{i}_t} = \sigma ({{\boldsymbol{W}}_i} \cdot [\begin{array}{*{20}{c}} {{{\boldsymbol{h}}_{t - 1}}}&{{\boldsymbol{x}}_t^ + } \end{array}] + {{\boldsymbol{b}}_i}) (7) \tilde {\boldsymbol{C}_t} = \tanh ({{\boldsymbol{W}}_C} \cdot [\begin{array}{*{20}{c}} {{{\boldsymbol{h}}_{t - 1}}}&{{\boldsymbol{x}}_t^ + } \end{array}] + {{\boldsymbol{b}}_C}) (8) {\boldsymbol{C}_t} = {{\boldsymbol{f}}_t} \cdot {{\boldsymbol{C}}_{t - 1}} + {{\boldsymbol{i}}_t} \cdot {\tilde {\boldsymbol{C}}_t} (9) {\boldsymbol{O}_t} = \sigma ({{\boldsymbol{W}}_O} \cdot [\begin{array}{*{20}{c}} {{{\boldsymbol{h}}_{t - 1}}}&{{{\boldsymbol{x}}_t}} \end{array}] + {{\boldsymbol{b}}_O}) (10) {{\boldsymbol{h}}_t} = {{\boldsymbol{O}}_t} \cdot \tanh {{\boldsymbol{C}}_t} (11) 式中:\sigma 表示sigmoid激活函数;{{\boldsymbol{W}}_f},{{\boldsymbol{W}}_i},{{\boldsymbol{W}}_C},{{\boldsymbol{W}}_O}分别为各门的权重矩阵; {{\boldsymbol{b}}_f} , {{\boldsymbol{b}}_i} , {{\boldsymbol{b}}_C} , {{\boldsymbol{b}}_O} 分别为各门的偏置矩阵。
如图5所示,Bi-LSTM网络作为LSTM网络的一种变体,Bi-LSTM网络在LSTM网络前向传播的基础上,加入了后向传播层与组合层,针对序列间的隐藏信息实现了双向传递,能够更全面地提取序列的时间维度特征,从而提高模型的预测精度。组合层将前后向LSTM单元的输出状态进行如下的向量叠加运算:
\boldsymbol{h}_t=f_{\text{concat}}\left( \boldsymbol{h}_{t,{\mathrm{F}}},\boldsymbol{h}_{t,{\mathrm{B}}} \right) =\left[ \begin{array}{c} \boldsymbol{h}_{t,{\mathrm{F}}}\\ \boldsymbol{h}_{t,{\mathrm{B}}}\\ \end{array} \right] (12) 式中:{{\boldsymbol{h}}_t}表示t时刻Bi-LSTM层的输出; {\boldsymbol{h}_{t,{\mathrm{F}}}} 和 {\boldsymbol{h}_{t,{\mathrm{B}}}} 分别为t时刻前后向LSTM单元的运算结果。
1.4 多头自注意力机制
多头自注意力(multi-head self-attention,MHSA)机制由自注意力机制改进而来,其利用多组独立的注意力权重获得序列的相关性,有效捕获序列在不同范围间的依赖性,从而增强模型的表达力、泛化力。本文利用MHSA对Bi-LSTM层的运算结果进行自适应加权,以减少序列在长期传递中的时间关联性损耗,提高了模型对多范围信息的感知力。
MHSA原理如图6所示,每个独立的缩放点积注意力(scaled dot-product attention)将查询矩阵Q与键矩阵K进行矩阵点积计算,并将计算结果送入Softmax层进行归一化后获取注意力分布,将注意力分布与值矩阵V进行加权求和获得单头注意力结果,公式如下[21]:
{\text{Attention}}({\boldsymbol{Q}},{\boldsymbol{K}},{\boldsymbol{V}}) = {\text{Softmax}}\left( {\frac{{{\boldsymbol{Q}}{{\boldsymbol{K}}^{\rm T}}}}{{\sqrt {{d_k}} }}} \right){\boldsymbol{V}} (13) 其中:
{\boldsymbol{Q}} = {{\boldsymbol{H}}_t}{{\boldsymbol{W}}^Q} {\boldsymbol{K}} = {{\boldsymbol{H}}_t}{{\boldsymbol{W}}^K} {\boldsymbol{V}} = {{\boldsymbol{H}}_t}{{\boldsymbol{W}}^V} {{\boldsymbol{H}}_t} = [ {{{\boldsymbol{h}}_{t - l + 1}}},\ldots,{{{\boldsymbol{h}}_{t - 1}}},{{{\boldsymbol{h}}_t}} ] 上式中:{{\boldsymbol{H}}_t}为t时刻Bi-LSTM层的计算结果;{{\boldsymbol{W}}^Q},{{\boldsymbol{W}}^K},{{\boldsymbol{W}}^V}分别为Q,K,V的投影矩阵;{d_k}代表Q及K的维度。MHSA同时对每个独立的注意力头进行计算,并将n个注意力头的计算结果进行拼接加权后获得总注意力结果Z,计算如下:
{\boldsymbol{Z}_i} = {\text{Attention}}({\boldsymbol{Q}}{\boldsymbol{W}}_i^Q,{\boldsymbol{K}}{\boldsymbol{W}}_i^K,{\boldsymbol{V}}{\boldsymbol{W}}_i^V) (14) \boldsymbol{Z} = {f_{{\text{concat}}}}({\boldsymbol{Z}_1},{\boldsymbol{Z}_2}, \ldots ,{\boldsymbol{Z}_n}){\boldsymbol{W}} (15) 式中:{\boldsymbol{W}}_i^Q,{\boldsymbol{W}}_i^K,{\boldsymbol{W}}_i^V分别表示第i个注意力头Q,K,V的权重矩阵; {\boldsymbol{Z}_i} 表示第i个注意力头的计算结果,W为MHSA的权重矩阵。
1.5 整体网络架构
本文所提增强Bi-LSTM模型结构(图7)由输入层、1D-CNN层、Bi-LSTM层、MHSA层和解码层组成。每层的结构及具体参数如下:
1) 输入层。输入层首先使用如式(14)所示的z-score算法归一化原始数据集。为了平衡预测精度及模型的复杂性,根据经验及预实验,将滑动时间窗口的宽度l设置为15。因增强Bi-LSTM模型为单步预测,故滑动窗口步长设置为1。将滑动窗口采集到的数据作为1D-CNN层的输入。
x = \frac{{\hat x - \mu }}{\sigma } (16) 式中:\hat x为原始序列; \mu 及\sigma 分别为原始序列的均值和标准差。
2) 1D-CNN层。使用64个步长1、宽度1的卷积核提取序列在空间维度下的隐藏特征,并对提取到的隐藏特征进行重构、组合运算,再输入Bi-LSTM层中。
3) Bi-LSTM层。Bi-LSTM层通过两层含有64隐藏单元的LSTM层,双向提取序列在时间维度下的隐藏特征,并将运算结果送入MHSA层中。
4) MHSA层。MHSA层通过多组注意力权重的加持,解决Bi-LSTM层的长距离时间依赖问题。本文采用注意力头数为16的MHSA层,同时对16组不同的序列关注点进行自适应加权运算,并将计算结果送入解码层中。
5) 解码层。解码层通过含有128个隐藏单元的LSTM网络传递特征,并将末尾LSTM单元的计算结果输出到全连接层,全连接层对序列空间维度调整后,输出最终预测结果。
2. 数据实验及分析
2.1 数据集
KVLCC2船[22]是国际上对船舶模型验证的基准船型。为验证本文所提增强Bi-LSTM模型(以下简称“本文模型”)的有效性,选用2008年SIMMAN研讨会提供的KVLCC2船在德国汉堡水池(HSVA)中的机动测试结果作为数据集。其中:10°/5°,15°/5°,20°/5°,25°/5°,35°/5°的Z形机动数据共1870组作为训练集,30°/5°的Z形机动数据共3 986组作为测试集。
2.2 评价指标
船舶的模型识别及预测可视为序列回归问题,在每一个采样点根据当前状态来预测下一时刻的状态。为评价回归模型的预测精度,选用评价模型拟合程度的决定系数({R^2})以及评价模型实际预测误差的平均绝对值误差(eMAE)作为参考性能评价指标,其计算分别如下:
{R^2} = 1 - \frac{{\displaystyle\sum\limits_{i = 1}^N {{{({y_i} - {{\hat y}_i})}^2}} }}{{\displaystyle\sum\limits_{i = 1}^N {{{({y_i} - \bar y)}^2}} }} (17) {e_{{\text{MAE}}}}{\text{ = }}\frac{1}{N}\sum\limits_{i = 1}^N {\left| {{y_i} - {{\hat y}_i}} \right|} (18) 选用对数据异常值更敏感的均方根误差(eRMSE)作为核心性能评价指标,其计算如下:
{e_{{\text{RMSE}}}}{\text{ = }}\sqrt {\frac{1}{N}\sum\limits_{i = 1}^N ( {y_i} - {{\hat y}_i}{)^2}} (19) 式中:{\hat y_i}和{y_i}分别为数据集中第i个样本的预测值和实际值;\bar y为样本均值;N为样本数量。
2.3 训练结果及对比
使用Adam优化算法训练增强Bi-LSTM模型。其中,初始学习率0.001,小批量大小128,最大学习批次300,学习率衰减0.15,衰减周期10,指数衰减{\rho _1} = 0.9和{\rho _2} = 0.999,设置{d_k}= 256。
为更好地证明所提增强Bi-LSTM模型的辨识精度优势,本文使用了与文献[23]相同的线性核SVM 回归模型结构作为对比组1。其中,正则化因子\gamma = {10^4},惩罚参数 \varepsilon =0 。使用与文献[24]相同网络架构的GRU预测模型作为对比组2,其包含1层拥有有100个神经元的GRU网络层、2层全连接层、2层丢弃概率为0.2的随机丢弃层,并使用tanh函数作为隐藏层和输出层的激活函数。使用与文献[25]相同网络结构的LSTM预测模型作为对比组3,其包含3层拥有100个神经元的LSTM网络层作为输入层及隐藏层、4个神经元的LSTM的网络层作为输出层,并使用LeakyReLU函数作为输出层的激活函数。为确保对比的公平性,4组预测模型均使用相同的训练集和测试集,GRU和LSTM模型使用与增强Bi-LSTM模型相同的优化算法和超参数进行模型训练。
图8所示为各模型对KVLCC2航向角的预测结果及预测误差的对比。由图可知,当船舶航向角到达拐点时,除本文所提增强Bi-LSTM模型(以下简称“本文模型”)外,其他预测模型的预测误差明显增大。其中,SVM模型的预测误差明显大于其他预测模型,LSTM模型与GRU模型的预测性能接近。本文模型对KVLCC2航向角的预测精度令人满意,预测稳定性优于其他模型。
图9所示为各模型对KVLCC2偏航角速度的预测结果及预测误差的对比。由图可见,偏航角速度与航向角的变化有明显的周期性。当偏航角速度到达峰值拐点时,GRU,LSTM模型均出现最高0.5 (°)/s的预测误差,SVM模型预测误差在±0.2 (°)/s间呈周期性变化,本文模型预测误差绝对值始终保持在0.04 (°)/s以内。在KVLCC2的偏航角速度预测中,本文模型预测精度最佳。
图10所示为各模型对KVLCC2横摇角的预测及预测误差的对比。由图可见,在处理这种具有高频率周期性变化特点的数据时,本文所提模型因利用了Bi-LSTM层及MHSA层捕获序列不同范围间的时序关联,因此相较于其他预测模型,预测精度仍然最高。而SVM模型相较于GRU模型和LSTM模型呈现出了更高的预测精度。
图11所示为各模型对KVLCC2的总船速预测结果及预测误差的对比。由图可见,本文模型有效地捕捉了船速序列的周期性特征,实现了船速的高精度预测,且预测误差始终保持在±0.01 m/s的范围内。SVM模型预测效果仅次于本文模型,洞察了序列的持续变化趋势,LSTM模型及GRU模型的预测效果不佳,50 s之后的预测误差始终保持在0.1 m/s上下。
利用eRMSE, eMAE和{R^2}这3种性能指标分别对各预测模型进行对比分析,结果如表1所示。在对KLVCC2船舶的4个状态的预测结果对比中,本文所提模型相较于其他预测模型具有更优异的性能指标,预测稳定性最高,泛化性能出色,拟合程度高,未出现极端异常值,实现了船舶模型的高精度预测,体现了辨识模型的准确性。
表 1 不同模型性能指标对比Table 1. Performance indicators of different models预测状态 预测模型 {R^2} eMAE eRMSE 航向角/(°) 本文模型 0.999 99 0.009 8 0.013 SVM 0.996 04 0.772 4 0.877 GRU 0.999 88 0.117 1 0.148 LSTM 0.999 63 0.222 7 0.266 偏航角速度/((°)·s−1) 本文模型 0.999 96 0.009 5 0.012 SVM 0.995 65 0.130 7 0.145 GRU 0.996 79 0.096 2 0.124 LSTM 0.994 25 0.121 1 0.166 横摇角/(°) 本文模型 0.995 59 0.010 6 0.013 SVM 0.987 99 0.019 9 0.022 GRU 0.742 60 0.082 2 0.102 LSTM 0.822 87 0.070 2 0.084 总速度/(m·s−1) 本文模型 0.999 13 0.002 6 0.003 SVM 0.987 33 0.011 7 0.012 GRU 0 0.108 4 0.118 LSTM 0.062 67 0.097 6 0.106 3. 结 论
本文在Bi-LSTM网络结构的基础上,提出了一种基于深度神经网络的增强Bi-LSTM模型用于船舶的非参数化建模。通过KVLCC2船舶的真实航行数据,将本文模型与SVM、GRU、LSTM这几个预测模型进行预测性能对比。相较于GRU,LSTM预测模型,本文模型在利用Bi-LSTM网络对序列正反向时序特征提取的基础上,首先利用1D-CNN提取了序列的空间特征,其次利用MHSA自适应加权,可更大范围地捕获时间维度下的关联性,以及挖掘数据的隐藏特征。相较于SVM模型,本文所提模型能更有效地处理大模型、高维度数据。通过对实验数据的对比分析,得出如下结论:
1) 由于数据分布的差异和模型特征敏感度的不同,不同的对比模型在建模和预测船舶各类运动量时,展现出了显著的性能差异。具体而言,船舶的航向角和偏航角速度因其明显的规律性和周期性变化,使得在预测这两项指标时,SVM模型的准确性不及GRU和LSTM模型。然而,在预测数值较小且周期性规律更难捕捉的横摇角和总速度时,SVM模型却展现出优于LSTM和GRU模型的预测效果。值得注意的是,本文所提模型,在预测船舶各类运动量方面均表现出卓越的性能,充分证明了其显著的优越性。
2) 相较于SVM,LSTM和GRU模型,本文所提模型的优越性主要体现在预测精度和预测稳定性方面。这种优越性将对模型的实际应用效果产生了深远的影响。特别是在船舶姿态预测领域,本文所提模型能够更准确地预测船舶未来的姿态,从而有效降低侧翻等风险,显著提升航行安全性。此外,与其他模型相比,本文所提模型在描绘船舶运动状态方面的精确性更高,为模型预测控制算法提供了更可靠的数据基础,进而带来更出色的控制效果,并有助于提升船舶轨迹规划的精准度。
3) 本文模型通过数据驱动实现船舶的非参数化建模,将新兴的深度学习理论与船舶非参数化建模方法关联,对船舶的建模研究具有一定参考意义,但仍然存在数据质量差、样本少等问题,未来仍需进一步优化改进。
-
表 1 不同模型性能指标对比
Table 1 Performance indicators of different models
预测状态 预测模型 {R^2} eMAE eRMSE 航向角/(°) 本文模型 0.999 99 0.009 8 0.013 SVM 0.996 04 0.772 4 0.877 GRU 0.999 88 0.117 1 0.148 LSTM 0.999 63 0.222 7 0.266 偏航角速度/((°)·s−1) 本文模型 0.999 96 0.009 5 0.012 SVM 0.995 65 0.130 7 0.145 GRU 0.996 79 0.096 2 0.124 LSTM 0.994 25 0.121 1 0.166 横摇角/(°) 本文模型 0.995 59 0.010 6 0.013 SVM 0.987 99 0.019 9 0.022 GRU 0.742 60 0.082 2 0.102 LSTM 0.822 87 0.070 2 0.084 总速度/(m·s−1) 本文模型 0.999 13 0.002 6 0.003 SVM 0.987 33 0.011 7 0.012 GRU 0 0.108 4 0.118 LSTM 0.062 67 0.097 6 0.106 -
[1] 李国帅, 张显库, 张安超. 智能船舶靠泊技术研究热点与趋势[J]. 中国舰船研究, 2024, 19(1): 3–14. doi: 10.19693/j.issn.1673-3185.03199 LI G S, ZHANG X K, ZHANG A C. Research hotspots and tendency of intelligent ship berthing technology[J]. Chinese Journal of Ship Research, 2024, 19(1): 3–14 (in Chinese). doi: 10.19693/j.issn.1673-3185.03199
[2] 冯大奎, 余嘉威, 张志国, 等. 基于HUST-Ship的船舶操纵数值水池参数建模[J]. 华中科技大学学报(自然科学版), 2020, 48(10): 69–74. FENG D K, YU J W, ZHANG Z G, et al. Parametric modeling of ship maneuverable numerical tank based on HUST-Ship[J]. Journal of Huazhong University of Science & Technology (Natural Science Edition), 48(10): 69–74 (in Chinese).
[3] SKJETNE R, SMOGELI Ø, FOSSEN I T. Modeling, identification, and adaptive maneuvering of CyberShip II: a complete design with experiments[J]. IFAC Proceedings Volumes, 2004, 37(10): 203–208. doi: 10.1016/S1474-6670(17)31732-9
[4] 朱曼, 文元桥, 孙吴强, 等. 船舶运动模型参数辨识研究综述[J]. 交通信息与安全, 2022, 40(5): 1–11, 155. doi: 10.3963/j.jssn.1674-4861.2022.05.001 ZHU M, WEN Y Q, SUN W Q, et al. A review of parameter identification methods for ship dynamic models[J]. Journal of Transport Information and Safety, 2022, 40(5): 1–11, 155 (in Chinese). doi: 10.3963/j.jssn.1674-4861.2022.05.001
[5] 崔鸿雁, 徐帅, 张利锋, 等. 机器学习中的特征选择方法研究及展望[J]. 北京邮电大学学报, 2018, 41(1): 1–12. CUI H Y, XU S, ZHANG L F, et al. The key techniques and future vision of feature selection in machine learning[J]. Journal of Beijing University of Posts and Telecommunications, 2018, 41(1): 1–12 (in Chinese).
[6] CHEN G, WANG W, XUE Y F. Identification of ship dynamics model based on sparse Gaussian process regression with similarity[J]. Symmetry, 2021, 13(10): 1956. doi: 10.3390/sym13101956
[7] CHEN L J, YANG P Y, LI S W, et al. Grey-box identification modeling of ship maneuvering motion based on LS-SVM[J]. Ocean Engineering, 2022, 266: 112957. doi: 10.1016/j.oceaneng.2022.112957
[8] OUYANG Z L, ZOU Z J. Nonparametric modeling of ship maneuvering motion based on Gaussian process regression optimized by genetic algorithm[J]. Ocean Engineering, 2021, 238: 109699. doi: 10.1016/j.oceaneng.2021.109699
[9] 纪荣嵘, 林绍辉, 晁飞, 等. 深度神经网络压缩与加速综述[J]. 计算机研究与发展, 2018, 55(9): 1871–1888. doi: 10.7544/issn1000-1239.2018.20180129 JI RO R, LIN S H, CHAO F, et al. Deep neural network compression and acceleration: a review[J]. Journal of Computer Research and Development, 2018, 55(9): 1871–1888 (in Chinese). doi: 10.7544/issn1000-1239.2018.20180129
[10] HE H W, WANG Z H, ZOU Z J, et al. Nonparametric modeling of ship maneuvering motion based on self-designed fully connected neural network[J]. Ocean Engineering, 2022, 251: 111113. doi: 10.1016/j.oceaneng.2022.111113
[11] 楼梦瑶, 王旭阳, 陈瑞, 等. 基于NARX神经网络的船舶升沉运动实时预测方法[J]. 中国舰船研究, 2020, 15(1): 48–55, 67. doi: 10.19693/j.issn.1673-3185.01717 LOU M Y, WANG X Y, CHEN R, et al. A real-time prediction method for ship heave motion using NARX neural network[J]. Chinese Journal of Ship Research, 2020, 15(1): 48–55, 67 (in Chinese). doi: 10.19693/j.issn.1673-3185.01717
[12] 刘建伟, 宋志妍. 循环神经网络研究综述[J]. 控制与决策, 2022, 37(11): 2753–2768. LIU J W, SONG Z Y. Overview of recurrent neural networks[J]. Control and Decision, 2022, 37(11): 2753–2768 (in Chinese).
[13] HAN C Y, HU X. A prediction method of ship motion based on LSTM neural network with variable step-variable sampling frequency characteristics[J]. Journal of Marine Science and Engineering, 2023, 11(5): 919. doi: 10.3390/jmse11050919
[14] ZHANG T, ZHENG X Q, LIU M X. Multiscale attention-based LSTM for ship motion prediction[J]. Ocean Engineering, 2021, 230: 109066. doi: 10.1016/j.oceaneng.2021.109066
[15] SUO Y F, CHEN W K, CLARAMUNT C, et al. A ship trajectory prediction framework based on a recurrent neural network[J]. Sensors, 2020, 20(18): 5133. doi: 10.3390/s20185133
[16] WANG Y C, WANG H, ZHOU B, et al. Multi-dimensional prediction method based on Bi-LSTMC for ship roll[J]. Ocean Engineering, 2021, 242: 110106. doi: 10.1016/j.oceaneng.2021.110106
[17] ZHOU X, ZOU L, OUYANG Z L, et al. Nonparametric modeling of ship maneuvering motions in calm water and regular waves based on R-LSTM hybrid method[J]. Ocean Engineering, 2023, 285: 115259. doi: 10.1016/j.oceaneng.2023.115259
[18] WANG N, KONG K J, REN B Y, et al. SeaBil: self-attention-weighted ultrashort-term deep learning prediction of ship maneuvering motion[J]. Ocean Engineering, 2023, 287: 115890. doi: 10.1016/j.oceaneng.2023.115890
[19] 苏健, 宋汉江, 宋福元, 等. 基于卷积神经网络的蒸汽动力系统故障诊断[J]. 中国舰船研究, 2022, 17(6): 96–102. doi: 10.19693/j.issn.1673-3185.02616 SU J, SONG H J, SONG F Y, et al. Fault diagnosis of steam power system based on convolutional neural network[J]. Chinese Journal of Ship Research, 2022, 17(6): 96–102 (in Chinese). doi: 10.19693/j.issn.1673-3185.02616
[20] 孙守泰, 薛亚丽, 王明春, 等. 基于混合深度学习的燃气轮机动态过程关键参数在线辨识[J]. 中国舰船研究, 2023, 18(3): 222–230. doi: 10.19693/j.issn.1673-3185.02914 SUN S T, XUE Y L, WANG M C, et al. Hybrid deep learning-based online identification method for key parameters of gas turbine dynamic process[J]. Chinese Journal of Ship Research, 2023, 18(3): 222–230 (in Chinese). doi: 10.19693/j.issn.1673-3185.02914
[21] 周哲韬, 刘路, 宋晓, 等. 基于Transformer模型的滚动轴承剩余使用寿命预测方法[J]. 北京航空航天大学学报, 2023, 49(2): 430–443. ZHOU Z T, LIU L, SONG X, et al. Remaining useful life prediction method of rolling bearing based on Transformer model[J]. Journal of Beijing University of Aeronautics and Astronautics, 2023, 49(2): 430–443 (in Chinese).
[22] STERN F, AGDRAUP K, KIM S Y, et al. Experience from SIMMAN 2008—the first workshop on verification and validation of ship maneuvering simulation methods[J]. Journal of Ship Research, 2011, 55(2): 135–147. doi: 10.5957/jsr.2011.55.2.135
[23] WANG T T, LI G Y, WU B H, et al. Parameter identification of ship manoeuvring model under disturbance using support vector machine method[J]. Ships and Offshore Structures, 2021, 16(Supp1): 13–21.
[24] 胡玉可, 夏维, 胡笑旋, 等. 基于循环神经网络的船舶航迹预测[J]. 系统工程与电子技术, 2020, 42(4): 871–877. doi: 10.3969/j.issn.1001-506X.2020.04.18 HU Y K, XIA W, HU X X, et al. Vessel trajectory prediction based on recurrent neural network[J]. Systems Engineering and Electronics, 2020, 42(4): 871–877 (in Chinese). doi: 10.3969/j.issn.1001-506X.2020.04.18
[25] JIANG Y, HOU X R, WANG X G, et al. Identification modeling and prediction of ship maneuvering motion based on LSTM deep neural network[J]. Journal of Marine Science and Technology, 2022, 27(1): 125–137. doi: 10.1007/s00773-021-00819-9