一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

基于N-gram预测工控网漏洞的系统的制作方法

2022-02-22 19:06:51 来源:中国专利 TAG:

技术特征:
1.一种基于n-gram预测工控网漏洞的系统,其特征在于,包括处理器、数据库和存储有计算机程序的存储介质,处理器与数据库通信连接,所述数据库中存储有预设的工业互联网停用词库和所有互联网漏洞id对应的summary的文本序列,每一样本漏洞id对应的summary的文本序列为{str1,str2,

},str
e
为第e个更新周期对应的summary的文本,e的取值范围为1到无穷大;所述存储介质中存储的计算机程序包括第六计算机程序,所述处理器实行所述第六计算机程序时,实现以下步骤:步骤s601、基于所述工业互联网停用词库将str
e
中的工业互联网停用词去除,并在工业互联网停用词的位置对str
e
进行分割,生成对应的文本片段序列{fr
e1
, fr
e2
,

fr
ei
}, fr
ei
为str
e
的第i个文本片段,i的取值范围为1到i,i为str
e
的文本片段总数;步骤s602、对每一str
e
的每一fr
ei
执行预设的n-gram分词处理,n为正整数,取值范围为[kn1, kn2],每一str
e
的所有fr
ei
的分词合并去重,得到对应的分词向量fb
e
;步骤s603、将所有的fb
e
中的分词合并去重,得到分词集合fc,将fc的分词数量确定为one-hot编码的维度;步骤s604、基于one-hot编码的维度对分词向量fb
e
进行one-hot编码,得到每一str
e
的原始特征参数值;步骤s605、基于样本漏洞id对应的str
e
的原始特征参数值建模型输入向量,训练得到工控网漏洞预测模型,基于所述工控网漏洞预测模型预测工控网漏洞爆发概率。2.根据权利要求1所述的系统,其特征在于,所述处理器实行所述第六计算机程序时,还实现工业互联网停用词库更新流程,包括以下步骤:步骤s600、初始化n-gram中的n=kn2,步骤s610、对所有漏洞id对应的summary文本基于所述工业互联网停用词库分割成文本片段,并去除工业互联网停用词,再对每一文本片段作n-gram分词处理,获取n-gram分词数量列表;步骤s620、将n-gram分词数量大于预设的分词数量阈值d3的n-gram分词加入所述工业互联网停用词库中,判断kn是否大于kn1,若是,则设置kn=kn-1,返回执行步骤s610,若kn等于kn1,则结束所述工业互联网停用词库更新流程。3.根据权利要求2所述的系统,其特征在于,d3=f[,sn,avg(kn)],其中,d3与和sn呈正相关,d3与avg(kn) 呈负相关,sn为所有漏洞的所有summary总数量,l
j
为第j个summary的长度,avg(n)为n-gram中n的所有取值的均值。4.根据权利要求1所述的系统,其特征在于,kn1取值为3,kn2取值为6。5.根据权利要求1所述的系统,其特征在于,所述步骤s605中,基于样本漏洞id对应的str
e
的原始特征参数值建模型输入向量,包括:步骤s615、基于样本漏洞id对应的str
e
的原始特征参数值g(str
e
)和对应的特征权重w
e
,确定每一str
e
对应的summary特征参数值pcs
e
=w
e
*g(str
e
),基于样本漏洞id对应的
summary特征参数值构建模型输入向量。6.根据权利要求5所述的系统,其特征在于,str
e
对应的特征权重w
e
基于str
e
,以及当前summary文本基于历史summary文本的变化确定。7.一种服务器,其特征在于,包括权利要求1到6中任意一项所述的系统。

技术总结
本发明涉及一种基于N-gram预测工控网漏洞的系统,实现步骤S601、基于工业互联网停用词库将Str


技术研发人员:李峰 李艳虎 程学志 姜明 时伟强 张洪铭
受保护的技术使用者:山东云天安全技术有限公司
技术研发日:2021.11.17
技术公布日:2022/2/8
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献