一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

通用数据关系结构生成方法、装置、设备及可读存储介质与流程

2022-07-14 00:35:27 来源:中国专利 TAG:
1.本技术属于通用数据关系结构生成
技术领域
:,尤其涉及一种通用数据关系结构生成方法、装置、设备及计算机可读存储介质。
背景技术
::2.随着互联网的快速发展,大量数据被挖掘出来,数据分析就是为了从这些数据中获取有效信息,方便人们利用这些有效信息辅助判断、决策。3.数据关系是数据分析中的重要基础,它用来连接数据,让数据不再孤立起来,增加数据分析的准确度,目前主流的关系数据库mysql、oracle等都是用来存储这些带有关系的数据。4.目前的大多数数据分析的数据关系结构都是存储在扁平的二维表里面,而这种二维表的数据关系结构是缺乏表达数据关系能力的,因为在日常实际应用中有关联的数据有可能是存储在多张二维表中的,在这种情况下分析数据关系就很困难,这种二维表的数据关系结构并不适合如今的数据分析场景。技术实现要素:5.本技术实施例提供一种通用数据关系结构生成方法、装置、设备及计算机可读存储介质,能够处理目标数据的关系数据存储在多张二维表的情况,为数据分析增加了更多可分析的场景,并且该结构支持下钻操作,通过目标数据的关系可以查找其有关联的数据,并可以根据有关联的数据进行下一步的关联数据查询,使关系数据连接起来,形成有效的数据网状结构。6.第一方面,本技术实施例提供一种通用数据关系结构生成方法,包括:7.自动抽取数据表的实体信息;8.利用模型算法,对实体信息进行实体归一,以消除矛盾和歧义;9.针对实体归一后的实体信息,提取共性打上语意标签;10.基于打上语意标签后的实体信息,提取实体之间的实体关系;11.存储数据表与实体之间的映射关系、实体与语意标签之间的映射关系及实体关系,以用于后台维护管理;12.根据实体关系,生成实体关系图;13.基于实体关系图,生成数据表关系图。14.可选的,方法还包括:15.基于语意标签,拆分目标数据,确定目标数据所关联的实体;16.基于数据表与实体之间的映射关系、实体关系图,确定目标数据所关联的实体所在的表信息;17.根据表信息及实体关系图,形成目标数据的查询路径。18.可选的,实体信息至少包括人名信息,组织机构名信息,时间信息及状态信息。19.可选的,基于打上语意标签后的实体信息,提取实体之间的实体关系,包括:20.基于打上语意标签后的实体信息,利用监督学习算法自动提取实体之间的实体关系。21.第二方面,本技术实施例提供了一种通用数据关系结构生成装置,包括:22.实体信息抽取模块,用于自动抽取数据表的实体信息;23.实体归一模块,用于利用模型算法,对实体信息进行实体归一,以消除矛盾和歧义;24.语意标签添加模块,用于针对实体归一后的实体信息,提取共性打上语意标签;25.实体关系提取模块,用于基于打上语意标签后的实体信息,提取实体之间的实体关系;26.关系存储模块,用于存储数据表与实体之间的映射关系、实体与语意标签之间的映射关系及实体关系,以用于后台维护管理;27.实体关系图生成模块,用于根据实体关系,生成实体关系图;28.数据表关系图生成模块,用于基于实体关系图,生成数据表关系图。29.可选的,装置还包括:30.目标数据拆分模块,用于基于语意标签,拆分目标数据,确定目标数据所关联的实体;31.表信息确定模块,用于基于数据表与实体之间的映射关系、实体关系图,确定目标数据所关联的实体所在的表信息;32.查询路径形成模块,用于根据表信息及实体关系图,形成目标数据的查询路径。33.可选的,实体信息至少包括人名信息,组织机构名信息,时间信息及状态信息。34.可选的,实体关系提取模块,用于基于打上语意标签后的实体信息,利用监督学习算法自动提取实体之间的实体关系。35.第三方面,本技术实施例提供了一种电子设备,电子设备包括:处理器以及存储有计算机程序指令的存储器;36.处理器执行计算机程序指令时实现如第一方面所示的通用数据关系结构生成方法。37.第四方面,本技术实施例提供了一种计算机可读存储介质,计算机可读存储介质上存储有计算机程序指令,计算机程序指令被处理器执行时实现如第一方面所示的通用数据关系结构生成方法。38.本技术实施例的通用数据关系结构生成方法、装置、设备及计算机可读存储介质,能够处理目标数据的关系数据存储在多张二维表的情况,为数据分析增加了更多可分析的场景,并且该结构支持下钻操作,通过目标数据的关系可以查找其有关联的数据,并可以根据有关联的数据进行下一步的关联数据查询,使关系数据连接起来,形成有效的数据网状结构。39.该通用数据关系结构生成方法,包括:自动抽取数据表的实体信息;利用模型算法,对实体信息进行实体归一,以消除矛盾和歧义;针对实体归一后的实体信息,提取共性打上语意标签;基于打上语意标签后的实体信息,提取实体之间的实体关系;存储数据表与实体之间的映射关系、实体与语意标签之间的映射关系及实体关系,以用于后台维护管理;根据实体关系,生成实体关系图;基于实体关系图,生成数据表关系图。40.可见,该方法能够处理目标数据的关系数据存储在多张二维表的情况,为数据分析增加了更多可分析的场景,并且该结构支持下钻操作,通过目标数据的关系可以查找其有关联的数据,并可以根据有关联的数据进行下一步的关联数据查询,使关系数据连接起来,形成有效的数据网状结构。附图说明41.为了更清楚地说明本发明具体实施方式或现有技术中的技术方案,下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本技术的一些实施方式,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。42.图1是本技术一个实施例提供的通用数据关系结构生成方法的流程示意图;43.图2是本技术一个实施例提供的实体关系图;44.图3是本技术一个实施例提供的查询路径示意图;45.图4是本技术一个实施例提供的通用关系结构生成的示意图;46.图5是本技术一个实施例提供的通用数据关系结构生成装置的结构示意图;47.图6是本技术一个实施例提供的电子设备的结构示意图。具体实施方式48.下面将详细描述本技术的各个方面的特征和示例性实施例,为了使本技术的目的、技术方案及优点更加清楚明白,以下结合附图及具体实施例,对本技术进行进一步详细描述。应理解,此处所描述的具体实施例仅意在解释本技术,而不是限定本技术。对于本领域技术人员来说,本技术可以在不需要这些具体细节中的一些细节的情况下实施。下面对实施例的描述仅仅是为了通过示出本技术的示例来提供对本技术更好的理解。49.需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。50.随着互联网的快速发展,大量数据被挖掘出来,数据分析就是为了从这些数据中获取有效信息,方便人们利用这些有效信息辅助判断、决策。51.数据关系是数据分析中的重要基础,它用来连接数据,让数据不再孤立起来,增加数据分析的准确度,目前主流的关系数据库mysql、oracle等都是用来存储这些带有关系的数据。52.目前的大多数数据分析的数据关系结构都是存储在扁平的二维表里面,而这种二维表的数据关系结构是缺乏表达数据关系能力的,因为在日常实际应用中有关联的数据有可能是存储在多张二维表中的,在这种情况下分析数据关系就很困难,这种二维表的数据关系结构并不适合如今的数据分析场景。53.为了解决现有技术问题,本技术实施例提供了一种通用数据关系结构生成方法、装置、设备及计算机可读存储介质。下面首先对本技术实施例所提供的通用数据关系结构生成方法进行介绍。54.图1示出了本技术一个实施例提供的通用数据关系结构生成方法的流程示意图。如图1所示,该通用数据关系结构生成方法,包括:55.s101、自动抽取数据表的实体信息;56.在一个实施例中,实体信息至少包括人名信息,组织机构名信息,时间信息及状态信息。57.s102、利用模型算法,对实体信息进行实体归一,以消除矛盾和歧义;58.s103、针对实体归一后的实体信息,提取共性打上语意标签;59.s104、基于打上语意标签后的实体信息,提取实体之间的实体关系;60.在一个实施例中,基于打上语意标签后的实体信息,提取实体之间的实体关系,包括:61.基于打上语意标签后的实体信息,利用监督学习算法自动提取实体之间的实体关系。62.s105、存储数据表与实体之间的映射关系、实体与语意标签之间的映射关系及实体关系,以用于后台维护管理;63.s106、根据实体关系,生成实体关系图;64.s107、基于实体关系图,生成数据表关系图。65.在一个实施例中,方法还包括:66.基于语意标签,拆分目标数据,确定目标数据所关联的实体;67.基于数据表与实体之间的映射关系、实体关系图,确定目标数据所关联的实体所在的表信息;68.根据表信息及实体关系图,形成目标数据的查询路径。69.为了对本技术提供的通用数据关系结构生成方法进行详细说明,下面以一个具体实施例进行说明,包括以下步骤:70.(1)数据抽取,自动抽取数据表实体信息元素,包括人名,组织机构名,时间,状态等实体信息,支持多种关系库。71.(2)根据(1)中数据抽取出的实体信息,利用模型算法,消除矛盾和歧义,将提取出来的实体信息进行实体归一,比如某些实体可能有多种表达,某个特定称谓也许对应于多个不同的实体等。72.(3)将(2)中实体归一后的实体,提取他们的共性打上语意标签。73.(4)根据(3)中抽取出来的实体信息,基于模板抽取出实体之间的关系,后台维护实体关系模板。后期可以在标注大量的数据的基础上引入算法,利用监督学习算法自动抽取实体关系。74.(5)针对(1)中抽取的关系表与实体对应关系、(3)中实体与语意标签映射关系、(4)中实体间的关系设计底层存储方式,存储方式将直接影响查询效率和应用效果。75.(6)存储这些关系后,添加后台方便维护管理这些关系。76.(7)数据拆分,根据(3)中语意标签拆分目标数据,确定目标数据所关联的实体。例如:制冷收入,将拆分为制冷,收人两个实体。77.(8)根据(4)中实体关系生成实体关系图。例如:制冷(属于组织维度下的数据)跟tablea,tableb,tablec,tabled相关,收入跟广告投入,订单执行率,退货率相关,具体可参见图2。78.其中,tablea:期间、组织、区域、收入、退货率;79.tableb:期间、组织、区域、渠道、收入、广告投入;80.tablec:期间、组织、产品、收入、订单执行率;81.tabled:期间、组织、收入....82.(9)根据(6)中后台维护的关系表和实体对应关系,以及(8)中生成的实体关系图,找到目标数据实体所在的表信息,根据表信息以及实体关系图,形成目标数据的查询路径。例如:寻找制冷(属于组织维度下的数据)收入的查询路径,具体可参见图3。83.(10)通用数据关系结构如下表1所示:84.表185.属性名称类型描述targetdimenlist<string>目标维度targetlndicatorstring目标指标indicatorrelationhashmap<string,lndicatorlnfo>指标关联关系querypathlist<tabnlelnfo>查询路径86.tablelnfo(二维表信息)如下表2所示:87.表288.属性名称类型描述dimlnfolist<dimlnfo>二维表的维度信息indicatorlnfolndicatorlnfo二维表的指标信息tablenamestring二维表的表名89.(11)通用关系结构生成,具体可参见图4。90.该通用关系结构,扩展了关系型数据库表达数据关系的能力,可在各种关系型数据库通用。91.该实施例,能够处理目标数据的关系数据存储在多张二维表的情况,为数据分析增加了更多可分析的场景,并且该结构支持下钻操作,通过目标数据的关系可以查找其有关联的数据,并可以根据有关联的数据进行下一步的关联数据查询,使关系数据连接起来,形成有效的数据网状结构。92.如图5所示,本技术提供一种通用数据关系结构生成装置,包括:93.实体信息抽取模块501,用于自动抽取数据表的实体信息;94.实体归一模块502,用于利用模型算法,对实体信息进行实体归一,以消除矛盾和歧义;95.语意标签添加模块503,用于针对实体归一后的实体信息,提取共性打上语意标签;96.实体关系提取模块504,用于基于打上语意标签后的实体信息,提取实体之间的实体关系;97.关系存储模块505,用于存储数据表与实体之间的映射关系、实体与语意标签之间的映射关系及实体关系,以用于后台维护管理;98.实体关系图生成模块506,用于根据实体关系,生成实体关系图;99.数据表关系图生成模块507,用于基于实体关系图,生成数据表关系图。100.在一个实施例中,装置还包括:101.目标数据拆分模块,用于基于语意标签,拆分目标数据,确定目标数据所关联的实体;102.表信息确定模块,用于基于数据表与实体之间的映射关系、实体关系图,确定目标数据所关联的实体所在的表信息;103.查询路径形成模块,用于根据表信息及实体关系图,形成目标数据的查询路径。104.在一个实施例中,实体信息至少包括人名信息,组织机构名信息,时间信息及状态信息。105.在一个实施例中,实体关系提取模块504,用于基于打上语意标签后的实体信息,利用监督学习算法自动提取实体之间的实体关系。106.图5所示装置中的各个模块/单元具有实现图1中各个步骤的功能,并能达到其相应的技术效果,为简洁描述,在此不再赘述。107.图6示出了本技术实施例提供的电子设备的结构示意图。108.电子设备可以包括处理器601以及存储有计算机程序指令的存储器602。109.具体地,上述处理器601可以包括中央处理器(cpu),或者特定集成电路(applicationspecificintegratedcircuit,asic),或者可以被配置成实施本技术实施例的一个或多个集成电路。110.存储器602可以包括用于数据或指令的大容量存储器。举例来说而非限制,存储器602可包括硬盘驱动器(harddiskdrive,hdd)、软盘驱动器、闪存、光盘、磁光盘、磁带或通用串行总线(universalserialbus,usb)驱动器或者两个或更多个以上这些的组合。在合适的情况下,存储器602可包括可移除或不可移除(或固定)的介质。在合适的情况下,存储器602可在电子设备的内部或外部。在特定实施例中,存储器602可以是非易失性固态存储器。111.在一个实施例中,存储器602可以是只读存储器(readonlymemory,rom)。在一个实施例中,该rom可以是掩模编程的rom、可编程rom(prom)、可擦除prom(eprom)、电可擦除prom(eeprom)、电可改写rom(earom)或闪存或者两个或更多个以上这些的组合。112.处理器601通过读取并执行存储器602中存储的计算机程序指令,以实现上述实施例中的任意一种通用数据关系结构生成方法。113.在一个示例中,电子设备还可包括通信接口603和总线610。其中,如图6所示,处理器601、存储器602、通信接口603通过总线610连接并完成相互间的通信。114.通信接口603,主要用于实现本技术实施例中各模块、装置、单元和/或设备之间的通信。115.总线610包括硬件、软件或两者,将电子设备的部件彼此耦接在一起。举例来说而非限制,总线可包括加速图形端口(agp)或其他图形总线、增强工业标准架构(eisa)总线、前端总线(fsb)、超传输(ht)互连、工业标准架构(isa)总线、无限带宽互连、低引脚数(lpc)总线、存储器总线、微信道架构(mca)总线、外围组件互连(pci)总线、pci-express(pci-x)总线、串行高级技术附件(sata)总线、视频电子标准协会局部(vlb)总线或其他合适的总线或者两个或更多个以上这些的组合。在合适的情况下,总线610可包括一个或多个总线。尽管本技术实施例描述和示出了特定的总线,但本技术考虑任何合适的总线或互连。116.另外,结合上述实施例中的通用数据关系结构生成方法,本技术实施例可提供一种计算机可读存储介质来实现。该计算机可读存储介质上存储有计算机程序指令;该计算机程序指令被处理器执行时实现上述实施例中的任意一种通用数据关系结构生成方法。117.需要明确的是,本技术并不局限于上文所描述并在图中示出的特定配置和处理。为了简明起见,这里省略了对已知方法的详细描述。在上述实施例中,描述和示出了若干具体的步骤作为示例。但是,本技术的方法过程并不限于所描述和示出的具体步骤,本领域的技术人员可以在领会本技术的精神后,作出各种改变、修改和添加,或者改变步骤之间的顺序。118.以上所述的结构框图中所示的功能模块可以实现为硬件、软件、固件或者它们的组合。当以硬件方式实现时,其可以例如是电子电路、专用集成电路(asic)、适当的固件、插件、功能卡等等。当以软件方式实现时,本技术的元素是被用于执行所需任务的程序或者代码段。程序或者代码段可以存储在机器可读介质中,或者通过载波中携带的数据信号在传输介质或者通信链路上传送。“机器可读介质”可以包括能够存储或传输信息的任何介质。机器可读介质的例子包括电子电路、半导体存储器设备、rom、闪存、可擦除rom(erom)、软盘、cd-rom、光盘、硬盘、光纤介质、射频(rf)链路,等等。代码段可以经由诸如因特网、内联网等的计算机网络被下载。119.还需要说明的是,本技术中提及的示例性实施例,基于一系列的步骤或者装置描述一些方法或系统。但是,本技术不局限于上述步骤的顺序,也就是说,可以按照实施例中提及的顺序执行步骤,也可以不同于实施例中的顺序,或者若干步骤同时执行。120.上面参考根据本技术的实施例的方法、装置(系统)和计算机程序产品的流程图和/或框图描述了本技术的各方面。应当理解,流程图和/或框图中的每个方框以及流程图和/或框图中各方框的组合可以由计算机程序指令实现。这些计算机程序指令可被提供给通用计算机、专用计算机、或其它可编程数据处理装置的处理器,以产生一种机器,使得经由计算机或其它可编程数据处理装置的处理器执行的这些指令使能对流程图和/或框图的一个或多个方框中指定的功能/动作的实现。这种处理器可以是但不限于是通用处理器、专用处理器、特殊应用处理器或者现场可编程逻辑电路。还可理解,框图和/或流程图中的每个方框以及框图和/或流程图中的方框的组合,也可以由执行指定的功能或动作的专用硬件来实现,或可由专用硬件和计算机指令的组合来实现。121.以上所述,仅为本技术的具体实施方式,所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,上述描述的系统、模块和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。应理解,本技术的保护范围并不局限于此,任何熟悉本
技术领域
:的技术人员在本技术揭露的技术范围内,可轻易想到各种等效的修改或替换,这些修改或替换都应涵盖在本技术的保护范围之内。当前第1页12当前第1页12
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献