一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

知识图谱构建方法、装置及电子设备与流程

2022-07-02 09:46:06 来源:中国专利 TAG:

技术特征:
1.一种知识图谱构建方法,其特征在于,包括:获取电力运维的多源异构数据集,所述多源异构数据集包含多种数据类型的电力运维数据;基于训练好的文本序列的标签标注模型对所述多源异构数据集进行实体识别和关系抽取,得到由实体与实体关系组成的多个三元组;其中,每个所述三元组中包括两个实体和所述两个实体之间的关系;采用所述序列标注模型对所述三元组标注标签,并根据预设规则进行调整,得到电力运维的实体表和实体关系表;其中,所述实体表和实体关系表中的标签的置信度均大于或等于预设阈值;基于所述实体表和实体关系表构建电力运维的知识图谱。2.根据权利要求1所述的方法,其特征在于,所述并根据预设规则进行调整,得到电力运维的实体表和实体关系表,包括:对置信度低于预设阈值的所有参考标签进行逐步调整,直至调整后的每个参考标签的置信度大于或等于所述预设阈值;基于置信度大于或等于预设阈值的标签,确定电力运维的实体表和实体关系表。3.根据权利要求1所述的方法,其特征在于,所述采用所述序列标注模型对所述三元组中进行标注,包括:通过所述标签标注模型依次遍历每个三元组中的每个词组,分别执行以下操作:当确定出所述词组指示为实体的情况下,为所述词组标注位置标签,其中,所述位置标签的类型包括:起始标签、中部标签和结尾标签;当确定出所述词组只有一个字符的情况下,为所述词组标注第一分类标签;当确定出所述词组没有标注标签或者不属于实体的情况下,为所述词组标注第二分类标签,所述第二分类标签用于指示所述词组为无关文本信息。4.根据权利要求3所述的方法,其特征在于,所述采用所述序列标注模型对所述三元组中进行标注,还包括以下至少之一:采用所述序列标注模型对所述三元组中的两个实体标注关系类型标签;采用所述序列标注模型对所述三元组中两个实体分别标注关系角色标签。5.根据权利要求1所述的方法,其特征在于,所述方法还包括:基于主动学习模型从未标注样本集中获取电力运维的扩充训练样本;在所述扩充训练样本未标注标签的情况下,对所述扩充训练样本进行实体标签的标注和关系标签的标注;将标注有实体标签和关系标签的所述扩充训练样本加入所述标签标注模型。6.根据权利要求1所述的方法,其特征在于,所述序列标注模型包括:基于flat模型的实体识别和关系抽取的联合模型。7.根据权利要求1所述的方法,其特征在于,所述多源异构数据集包括以下至少之一:结构化数据、半结构化数据以及非结构化数据。8.一种知识图谱构建装置,其特征在于,包括:获取单元,获取电力运维的多源异构数据集,所述多源异构数据集包含多种数据类型的电力运维数据;
第一确定单元,用于基于训练好的文本序列的标签标注模型对所述多源异构数据集进行实体识别和关系抽取,得到由实体与实体关系组成的多个三元组;其中,每个所述三元组中包括两个实体和所述两个实体之间的关系;第一标注单元,用于采用所述序列标注模型对所述三元组进行标注标签,并根据预设规则进行调整,得到电力运维的实体表和实体关系表;其中,所述实体表和实体关系表中的标签的置信度均大于或等于预设阈值;构建单元,用于基于所述实体表和实体关系表构建电力运维的知识图谱。9.一种计算机可读的存储介质,其特征在于,所述计算机可读的存储介质包括存储的程序,其中,所述程序运行时执行所述权利要求1至7任一项中所述的方法。10.一种电子设备,包括存储器和处理器,其特征在于,所述存储器中存储有计算机程序,所述处理器被设置为通过所述计算机程序执行所述权利要求1至7中任一项所述的方法。

技术总结
本申请公开了一种知识图谱构建方法、装置及电子设备。其中,该方法包括:获取电力运维的多源异构数据集,所述多源异构数据集包含多种数据类型的电力运维数据;基于训练好的文本序列的标签标注模型对所述多源异构数据集进行实体识别和关系抽取,得到由实体与实体关系组成的多个三元组;其中,每个所述三元组中包括两个实体和所述两个实体之间的关系;采用所述序列标注模型对所述三元组中标注标签,并根据预设规则进行调整,得到电力运维的实体表和实体关系表;基于所述实体表和实体关系表构建电力运维的知识图谱。本申请解决了相关技术中电力运维知识领域的知识图谱构建准确率较低的技术问题。技术问题。技术问题。


技术研发人员:刘芳 孙林檀 吕静贤 陈勇达 李子乾 崔晟豪 朱青 张烁 刘一凡
受保护的技术使用者:浙江省北大信息技术高等研究院
技术研发日:2022.02.25
技术公布日:2022/7/1
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献