一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

数据处理方法以及装置与流程

2022-12-09 21:37:42 来源:中国专利 TAG:

技术特征:
1.一种数据处理方法,包括:获取至少两个业务数据表,并基于所述至少两个业务数据表中包含的字段构建初始知识图谱,其中,所述至少两个业务数据表分别对应目标业务的不同业务类型;根据与所述至少两个业务数据表相关的历史操作数据,确定所述至少两个业务数据表中不同字段间的关联关系;根据所述关联关系对所述初始知识图谱进行更新,生成目标知识图谱;基于所述目标知识图谱构建所述目标业务的业务宽表。2.根据权利要求1所述的数据处理方法,所述基于所述至少两个业务数据表中包含的字段构建初始知识图谱,包括:将目标业务数据表的表标识作为第一节点,将所述目标业务数据表中不同字段对应的字段标识作为第二节点,并将所述目标业务数据表与所述不同字段间的包含关系,作为所述第一节点与所述第二节点间的边,构建所述目标业务数据表对应的初始子知识图谱,其中,所述目标业务数据表为所述至少两个业务数据表之一,所述至少两个业务数据表分别对应的初始子知识图谱共同组成初始知识图谱。3.根据权利要求2所述的数据处理方法,所述根据所述关联关系对所述初始知识图谱进行更新,生成目标知识图谱,包括:在确定第一业务数据表中的第一字段和第二业务数据表中的第二字段存在关联关系的情况下,基于所述关联关系在所述初始知识图谱中、所述第一字段对应的第二节点及所述第二字段对应的第二节点间构建边,并在所述第一业务数据表的第一节点及所述第二业务数据表的第一节点间构建边,以对所述初始知识图谱进行更新,生成目标知识图谱。4.根据权利要求2所述的数据处理方法,所述根据与所述至少两个业务数据表相关的历史操作数据,确定所述至少两个业务数据表中不同字段间的关联关系,包括:根据与所述至少两个业务数据表相关的历史操作数据,确定所述至少两个业务数据表间的第一关联关系,以及所述至少两个业务数据表中不同字段间的第二关联关系。5.根据权利要求4所述的数据处理方法,所述根据所述关联关系对所述初始知识图谱进行更新,生成目标知识图谱,包括:在确定第一业务数据表与第二业务数据表存在第一关联关系的情况下,基于所述第一关联关系在所述初始知识图谱中、所述第一业务数据表的第一节点及所述第二业务数据表的第一节点间构建边;在确定所述第一业务数据表中的第一字段和所述第二业务数据表中的第二字段存在第二关联关系的情况下,基于所述第二关联关系在所述初始知识图谱中、所述第一字段对应的第二节点及所述第二字段对应的第二节点间构建边,以对所述初始知识图谱进行更新,生成目标知识图谱。6.根据权利要求1至5任意一项所述的数据处理方法,所述业务宽表包括数据仓库表;相应地,所述基于所述目标知识图谱构建所述目标业务的业务宽表,包括:将目标知识图谱中各节点对应的字段标识作为字段构建初始数据仓库表;根据所述目标知识图谱中各节点间的关联关系,对所述初始数据仓库表中的字段位置进行调整,生成中间数据仓库表;将所述至少两个业务数据表中的业务数据,添加至所述中间数据仓库表中对应字段的
数据单元,生成目标数据仓库表。7.根据权利要求1所述的数据处理方法,所述基于所述目标知识图谱构建所述目标业务的业务宽表,包括:基于所述目标知识图谱构建增强实体关系图,并根据所述增强实体关系图中不同实体间的关联关系,构建所述目标业务的业务宽表。8.根据权利要求7所述的数据处理方法,所述基于所述目标知识图谱构建增强实体关系图,包括:确定所述至少两个业务数据表中存在关联关系的第一字段及第二字段;对所述第一字段及所述第二字段包含的业务数据进行去重处理;根据去重处理结果确定所述第一字段及所述第二字段包含的业务数据的数据量,并根据所述数据量,将所述至少两个业务数据表划分为主表和从表;根据所述目标知识图谱中各节点间的关联关系,确定所述主表与所述从表间的关联关系;基于所述主表与所述从表间的关联关系,构建增强实体关系图。9.根据权利要求8所述的数据处理方法,所述根据所述数据量,将所述至少两个业务数据表划分为主表和从表,包括:将所述第一字段和所述第二字段中,包含的数据量大于预设数据量阈值的目标字段所属的业务数据表划分为主表,将所述至少两个业务数据表中所述主表外的业务数据表划分为从表;相应的,所述根据所述目标知识图谱中各节点间的关联关系,确定所述主表与所述从表间的关联关系,包括:根据所述目标知识图谱中各节点间的关联关系,确定所述主表与各从表间的关联关系。10.根据权利要求6所述的数据处理方法,所述将所述至少两个业务数据表中的业务数据,添加至所述中间数据仓库表中对应字段的数据单元,生成目标数据仓库表,包括:确定所述至少两个业务数据表中的目标业务数据表与所述中间数据仓库表中各字段的映射关系,其中,所述目标业务数据表为所述至少两个业务数据表之一;基于所述中间数据仓库表的表结构,将所述目标业务数据表中的业务数据按照所述映射关系,添加至所述中间数据仓库表中对应字段的数据单元,生成所述目标数据仓库表。11.根据权利要求1所述的数据处理方法,还包括:将所述至少两个业务数据表中包含的字段信息,输入文本处理模型进行相似度计算,并根据相似度计算结果确定所述至少两个业务数据表中不同字段间的关联关系。12.一种数据处理装置,包括:获取模块,被配置为获取至少两个业务数据表,并基于所述至少两个业务数据表中包含的字段构建初始知识图谱,其中,所述至少两个业务数据表分别对应目标业务的不同业务类型;确定模块,被配置为根据与所述至少两个业务数据表相关的历史操作数据,确定所述至少两个业务数据表中不同字段间的关联关系;生成模块,被配置为根据所述关联关系对所述初始知识图谱进行更新,生成目标知识
图谱;构建模块,被配置为基于所述目标知识图谱构建所述目标业务的业务宽表。13.一种计算设备,包括:存储器和处理器;所述存储器用于存储计算机可执行指令,所述处理器用于执行所述计算机可执行指令,该计算机可执行指令被处理器执行时实现权利要求1至11任意一项所述数据处理方法的步骤。14.一种计算机可读存储介质,其存储有计算机可执行指令,该计算机可执行指令被处理器执行时实现权利要求1至11任意一项所述数据处理方法的步骤。

技术总结
本说明书实施例提供数据处理方法以及装置,其中所述数据处理方法包括:获取至少两个业务数据表,并基于所述至少两个业务数据表中包含的字段构建初始知识图谱,其中,所述至少两个业务数据表分别对应目标业务的不同业务类型,根据与所述至少两个业务数据表相关的历史操作数据,确定所述至少两个业务数据表中不同字段间的关联关系,根据所述关联关系对所述初始知识图谱进行更新,生成目标知识图谱,基于所述目标知识图谱构建所述目标业务的业务宽表。宽表。宽表。


技术研发人员:王明 王天振 陈建欣 李印 庞艳蓓 付大超 李飞飞
受保护的技术使用者:阿里云计算有限公司
技术研发日:2022.07.13
技术公布日:2022/11/22
再多了解一些

本文用于创业者技术爱好者查询,仅供学习研究,如用于商业用途,请联系技术所有人。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献