一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种基于CNN-GRU模型的实时策略游戏中稀疏指令的预测方法与流程

2021-11-05 23:23:00 来源:中国专利 TAG:

技术特征:
1.一种基于cnn

gru模型的实时策略游戏中稀疏指令的预测方法,其特征在于,它包括以下步骤:步骤1:收集游戏平台产生的对战数据;步骤2:对收集到的对战数据进行清理,剔除冗余数据;步骤3:提取出数据中己方、敌方信息相关特征因素,并对获取到的数据进行数据处理;步骤4:进行cnn

gru网络模型的构建,并采用所构建的网络模型进行指令类型的预测。2.根据权利要求1所述的方法,其特征在于,在步骤2中,具体包括以下步骤:1)将从步骤1获取到的对战数据中进行状态信息的提取,同时提取标签信息,其中标签分为两大类一类是空白指令,一类是有效指令;2)剔除掉不符合规范的推演数据;3)删除掉不必要的特征。3.根据权利要求1所述的方法,其特征在于,在步骤3中,对获取到的数据进行min

max归一化,然后采用pca主成分分析法对输入的特征向量进行降维处理;具体的,包括以下步骤:步骤1)构建每一个时间步的输入,所有的时间步组成一个完整的时间序列也就是一场游戏对战的过程;步骤2)把按时间顺序提取到的信息进行补齐操作,使用手工的方式将每一个时间点的向量维度补成相同的长度;步骤3)进行数据的归一化处理,归一化的公式如下:x'
ij
为x
ij
归一化之后的数值,x
ij
是第i列第j维特征,x
i
是第i列特征,min(x
i
)是第i列的所有维度中的数值的最小值,max(x
i
)是第i列所有维度中的数值最大值;步骤4)对上述数据使用pca主成分分析法对数据进行降维处理。4.根据权利要求1所述的方法,其特征在于,在步骤4中,具体包括以下步骤:1)构建卷积神经网络,提取游戏状态特征,生成特征矩阵,卷积神经网络模型的更新公式如下:x
t
=σ
cnn
(w
cnn

x
t
b
cnn
)x
t
表示当前状态和动作特征,w
cnn
表示过滤器的权重,b
cnn
表示偏差参数,σ
cnn
是激活函数;2)使用门控循环网络(gru)提取时间序列的依赖特征:gru重置门:r
t
=σ(w
r
x
t
u
r
h
t
‑1 b
r
)gru更新门:z
t
=σ(w
z
x
t
u
z
h
t
‑1 b
z
)σ为sigmoid函数,w、u和b为权重和偏置项,x
t
即为卷积神经网络的输出,h
t
‑1为上一个状态所传递下来的信息;更新门和重置门确定历史节点信息对当前节点信息的贡献程度;上一状态信息经过重置后,通过权重和偏置项与当前输入进行聚合更新以形成当前时
刻状态:刻状态:为当前时刻t的候选隐藏状态;w、u和b为权重和偏置项,x
t
为卷积神经网络的输出,r
t
为重置门,h
t
‑1为上一状态的信息;tanh激活函数将数据缩放至

1到1的范围内;最后计算出当前时刻的隐藏状态:h
t
为当前隐藏状态信息,z
t
为更新门,h
t
‑1为上一个状态所传递下来的信息;3)使用dropout对隐藏层节点进行随机丢弃,从而防止过拟合,其计算公式如下:3)使用dropout对隐藏层节点进行随机丢弃,从而防止过拟合,其计算公式如下:bernoulli函数是随机生成一个概率的向量,也就是以一个概率为p的伯努利分布随机地生成与节点数相同的0、1值;4)将经过dropout层之后的gru网络的输出映射到线性空间时,采用以下公式:f1为多层感知机(mlp)5)将多层感知机的输出作为softmax函数的输入来进行标签预测;w为权重,b为偏置项,h
v
为多层感知机的输出,为预测的标签;6)使用带权重的交叉熵函数最小化损失;计算公式如下:计算公式如下:w
j
是权重;m为类别的数量,y
ij
为指示变量,取值为0或1,如果样本i的真实类别与j相同,此时y
ij
取值为1,否则取值为0;为样本i属于类别j的预测概率;是第j类样本类型的样本数量;其中w
j
的计算公式如下:w
j
为第j类类别的权重,n
classes
是数据集中所有类型种类数量,n
samples
是数据集中的样本总数;由以上步骤建立cnn

gru网络模型。5.根据权利要求1所述的方法,其特征在于,它还包括步骤5:将数据分成多份进行交叉
验证,从而选择出更好的超参数。6.一种cnn

gru网络模型的构建方法,其特征在于,它包括以下步骤:步骤一:构建卷积神经网络,提取游戏状态特征,生成特征矩阵,这里卷积神经网络使用多个卷积核,不同的卷积核关注不同的特征;步骤二:使用门控循环网络(gru)提取时间序列的依赖特征;步骤三:使用dropout技术防止过拟合现象;步骤四:使用多层感知器将门控循环神经网络的输出映射到线性空间;步骤五:使用softmax函数进行标签的预测;步骤六:使用带权重的交叉熵函数最小化损失;采用以上步骤建立cnn

gru网络模型。7.根据权利要求6所述的方法,其特征在于,在步骤一中,构建卷积神经网络,提取游戏状态特征,生成特征矩阵,其计算公式如下:x
t
=σ
cnn
(w
cnn

x
t
b
cnn
);x
t
表示当前状态和动作特征,w
cnn
表示过滤器的权重,b
cnn
表示偏差参数,σ
cnn
是激活函数;在步骤二中,使用门控循环网络(6ru)提取时间序列的依赖特征:gru重置门:r
t
=σ(w
r
x
t
u
r
h
t
‑1 b
r
)gru更新门:z
t
=σ(w
z
x
t
u
z
h
t
‑1 b
z
)σ为sigmoid函数,w、u和b为权重和偏置项,x
t
即为卷积神经网络的输出,h
t
‑1为上一个状态所传递下来的信息;更新门和重置门确定历史节点信息对当前节点信息的贡献程度;上一状态信息经过重置后,通过权重和偏置项与当前输入进行聚合更新以形成当前时刻状态:刻状态:为当前时刻t的候选隐藏状态;w、u和b为权重和偏置项,x
t
为卷积神经网络的输出,r
t
为重置门,h
t
‑1为上一状态的信息;tanh激活函数将数据缩放至

1到1的范围内;h
t
为当前隐藏状态信息,z
t
为更新门,h
t
‑1为上一个状态所传递下来的信息。8.根据权利要求6所述的方法,其特征在于,在步骤三中,使用dropout对隐藏层节点进行随机丢弃,从而防止过拟合时,采用以下步骤:使用dropout防止过拟合:使用dropout防止过拟合:bernoulli函数是随机生成一个概率的向量,也就是以一个概率为p的伯努利分布随机地生成与节点数相同的0、1值。9.根据权利要求6至8其中之一所述的方法,其特征在于,在步骤四中,将经过dropout
层之后的gru网络的输出映射到线性空间时,采用以下公式:f1为多层感知机(mlp)。10.根据权利要求9所述的方法,其特征在于,在步骤五中,将多层感知机的输出作为softmax函数的输入来进行标签预测时,采用以下方式:w为权重,b为偏置项,h
v
为多层感知机的输出,为预测的标签;在步骤六中,在使用带权重的交叉熵函数最小化损失时;计算公式如下:计算公式如下:w
j
是权重;m为类别的数量,y
ij
为指示变量,取值为0或1,如果样本i的真实类别与j相同,此时y
ij
取值为1,否则取值为0;为样本i属于类别j的预测概率;是第j类样本类型的样本数量;其中w
j
的计算公式如下:w
j
为第j类类别的权重,n
classes
是数据集中所有类型种类数量,n
samples
是数据集中的样本总数。

技术总结
一种基于CNN


技术研发人员:郭鸿村 臧兆祥
受保护的技术使用者:三峡大学
技术研发日:2021.07.05
技术公布日:2021/11/4
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献