一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种基于神经化正则表达式的电网故障处置预案解析方法与流程

2022-09-03 21:27:43 来源:中国专利 TAG:

技术特征:
1.一种基于神经化正则表达式的电网故障处置预案解析方法,其特征在于:包括以下步骤:编写每个电网故障处置预案文本实体成分识别的正则表达式;其中所述正则表达式用于从预先构建的电网故障处置预案语料库的电网故障处置预案文本中识别出实体成分;将所述正则表达式转换为电网故障处置预案成分识别的有限状态自动机,使正则表达式的规则文本表示转变为矩阵形式表示;将所述有限状态自动机转换为具有独立表示能力的有限状态自动机,并通过矩阵秩分解和加入词向量,构建有限状态自动机双向循环神经网络;使用电网故障处置预案语料库数据对有限状态自动机双向循环神经网络进行训练;采用训练后的有限状态自动机双向循环神经网络识别输入的电网故障处置预案文本的实体成分,并提取识别结果。2.根据权利要求1所述的一种方法,其特征在于:所述电网故障处置预案语料库的构建过程包括:整理电网故障处置预案中全部文本的实体成分信息,所述实体成分包含设备类、动作类、区域类、限值类4个类型;基于电网故障处置预案中动作类词语,将电网故障处置预案中的长文本分割为多个短句,每个短句中包含一个动作类词语,在进行文本分割时,以文本中的标点符号为划分点,判断每个划分的短句中是否包含动作类词语,如果包含,则确定为一个短句,如果不包含,则将当前短句与前一个短句进行合并处理,将一个短句作为一个电网故障处置预案文本;将电网故障处置预案中全部文本分割成多个电网故障处置预案文本后,形成电网故障处置预案语料库。3.根据权利要求1所述的一种方法,其特征在于:编写每个电网故障处置预案文本实体成分识别的正则表达式的过程包括:将电网故障处置预案语料库中的电网故障处置预案文本按照句式结构进行归类,相同的句式结构表示电网故障处置预案文本表述形式及操作意图相同;总结每种句式结构涉及的关键词、实体成分及其所属类型;通过关键词定位捕获组,通过捕获组表示实体成分及其所属类型;编写正则表达式,所述正则表达式通过特定字符、关键词和捕获组的组合,表达从电网故障处置预案文本中提取其对应的实体成分的过滤逻辑。4.根据权利要求3所述的方法,其特征在于:电网故障处置预案成分识别的有限状态自动机包括输入字符表、输出标签、有限状态集,起始状态集、终止状态集以及有限状态自动机状态转移矩阵;所述输入字符表由电网故障处置预案语料中包含的不重复的字符构成;所述输入字符表通过对电网故障处置预案语料库的遍历,筛选出的不重复的字符形成;所述输出标签由自定义的不重复的标签组成,采用不同符号作为捕获组内起始字符标签、捕获组内剩余内容标签和非捕获组内容的通配符标签;并按照区域、设备、限值、动作对不同的捕获组内起始字符标签、捕获组内剩余内容标签进行分类标记;所述有限状态集的状态数由电网故障处置预案正则表达式中关键词及捕获组的数量决定;所述起始状态集表示对于不同的输入语料,电网故障处置预案有限状态自动机的起始状态;所述终止状态集表示对于不同的输入语料,电网故障处置预案有限状态自动机的终止
状态;所述有限状态自动机状态转移矩阵用于判断有限状态自动机针对每个输入的电网故障处置预案文本产生的状态转移情况;有限状态自动机状态转移矩阵包含四个维度,其中,一个维度表示输入字符表大小,两个维度表示有限状态集的状态数大小,一个维度表示输出标签大小。5.根据权利要求4所述的一种方法,其特征在于:将电网故障处置预案文本实体成分识别的正则表达式转换为电网故障处置预案成分识别的有限状态自动机的过程包括:有限状态自动机首先进入起始状态,输入多个电网故障处置预案文本实体成分识别的正则表达式;有限状态自动机依次读取每个正则表达式;有限状态自动机每次读取完单个正则表达式均回到起始状态;有限状态自动机读取单个正则表达式的过程包括:有限状态自动机每个时刻读取正则表达式中的一个字符,当读取到关键词或捕获组内容时,有限状态自动机状态发生改变,读取到其它内容时,有限状态自动机的状态不发生改变,当读取完正则表达中所有字符,有限状态自动机到达终止状态;对于每个读入的字符,有限状态自动机对应关联一个输出标签;有限状态自动机读取所有的正则表达式后生成有限状态自动机状态转移矩阵;有限状态自动机状态转移矩阵结合输入字符表和输出标签,生成电网故障处置预案成分识别的有限状态自动机。6.根据权利要求4所述的一种方法,其特征在于:所述具有独立表示能力的有限状态自动机用于减小电网故障处置预案成分识别的有限状态自动机状态转移矩阵的维度,通过引入格外的状态数,使得电网故障处置成分识别的有限状态自动机识别捕获组内容时,从捕获组内首个字符到捕获组内其它字符之间,发生一个状态转移;在任一时刻通过状态转移矩阵的到达状态确定其输出标签。7.根据权利要求4所述的一种方法,其特征在于:通过矩阵秩分解和加入词向量,构建有限状态自动机双向循环神经网络的过程包括:将具有独立表示能力的有限状态自动机使用一个状态转移三维矩阵和一个表示到达状态到输出状态的二维矩阵表示电网故障处置预案成分识别的有限状态自动机中状态转移矩阵;用张量秩分解技术将状态转移三维矩阵分解为三个二维矩阵,分别为输入字符表的词向量矩阵、当前状态矩阵d1和到达状态矩阵d2;将带有词信息的预训练词向量与输入字符表的词向量矩阵进行拼接处理,使输入字符表的词向量矩阵获得词的语义信息;所述带有词信息的预训练词向量使用电网故障处置预案语料库对word2vec语言模型训练后获得的word2vec语言模型权重参数作为输入字符表中字符的向量化表示;令预训练词向量矩阵为w,设置超参数θ,用超参数来决定预训练词向量w和经矩阵秩分解后得到的词向量矩阵e拼接时所占权重大小;每个时刻t输入字符对应的输出标签的得分的计算公式为:v
t
=θ
·
e[x
t
] (1-θ)w[x
t
]]
β
t-1
=(f
t-1
·
d1)其中,x
t
表示t时刻输入字符表中的字符,e[x
t
]表示x
t
在词向量矩阵e中对应的词向量,w[x
t
]表示x
t
在预训练词向量矩阵w中对应的词向量,v
t
表示拼接后的词向量,g
t
记录t时刻前向计算状态转移信息,g
t-1
记录t-1时刻前向计算状态转移信息,h
t
表示t时刻输入变量前向计算得到对应输出标签的得分向量,f
t
记录t时刻后向计算状态转移信息,β
t
表示t时刻输入变量后向计算得到对应输出标签的得分向量,f
t-1
记录t-1时刻后向计算状态转移信息,β
t-1
表示t-1时刻输入变量后向计算得到对应输出标签的得分向量,c
t
表示t时刻每个输出标签对应的得分;o’表示到达状态与输出标签对应关系矩阵,表示矩阵元素对应位置相乘;每一次前向计算和每一次后向计算完成后分别加入非线性tanh激活函数,作为前向传播计算过程;在前向传播计算完成后接入softmax函数;将输出的每个输出标签对应的得分转换为概率大小,选取概率最大值对应的输出标签作为电网故障处置预案文本的实体成分。8.根据权利要求4所述的一种方法,其特征在于:使用电网故障处置预案语料库数据对有限状态自动机双向循环神经网络进行训练的过程包括:采用输出标签的定义方式对电网故障处置预案语料库中语料进行标记,生成电网故障处置预案文本中每个字符及所属标签对,构成训练数据集;训练数据集中的字符使用输入字符表的词向量矩阵进行转换,得到字符向量;然后将每个字符向量及所属标签对输入至有限状态自动机双向循环神经网络进行训练。9.根据权利要求4所述的一种方法,其特征在于:提取识别结果的过程包括:将输入的电网故障处置预案文本内容与有限状态自动机双向循环神经网络模型的输出结果进行比对,根据输出标签结果将电网故障处置预案文本中对应位置的实体成分及其所属类型提取出来。10.一种计算机可读存储介质,所述计算机可读存储介质上存储有基于神经化正则表达式的电网故障处置预案解析方法程序,所述基于神经化正则表达式的电网故障处置预案解析方法程序被处理器执行时实现如权利要求1至9任一项所述的方法的步骤。

技术总结
本发明提供了一种基于神经化正则表达式的电网故障处置预案解析方法,包括以下步骤:编写每个电网故障处置预案文本实体成分识别的正则表达式;将所述正则表达式转换为电网故障处置预案成分识别的有限状态自动机,使正则表达式的规则文本表示转变为矩阵形式表示;将所述有限状态自动机转换为具有独立表示能力的有限状态自动机,并通过矩阵秩分解和加入词向量表示,构建有限状态自动机双向循环神经网络;使用电网故障处置预案语料库数据对有限状态自动机双向循环神经网络进行训练;采用训练后的有限状态自动机双向循环神经网络识别并提取输入的电网故障处置预案文本的实体成分。本发明有效提升电网故障处置预案解析效率。本发明有效提升电网故障处置预案解析效率。本发明有效提升电网故障处置预案解析效率。


技术研发人员:汪旸 孙望良 程迪 徐浩 刘志成 窦建中 张梦雅 姜涛 张越 单连飞 乔咏田 王宇
受保护的技术使用者:北京科东电力控制系统有限责任公司
技术研发日:2022.05.27
技术公布日:2022/9/2
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献