一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

知识图谱的更新方法和装置、存储介质及电子装置与流程

2022-11-19 08:52:42 来源:中国专利 TAG:


1.本技术涉及智慧家庭技术领域,具体而言,涉及一种知识图谱的更新方法和装置、存储介质及电子装置。


背景技术:

2.相关技术中的,在领域知识图谱支撑的问答系统中,无法通过单一的知识图谱实现整个问答系统对现有领域全部知识的问答反馈,比如,在智能家居设备问答场景中,用户无法将设备如何使用、注意事项、各项参数、保养方法等各类信息都记忆下来,或者从纸质说明书一条一条寻找,未来家庭里面每台设备均联网,说明书问答系统能够解决上述应用难题,但是随着设备不断增加,设备说明书文件也会随之增长,对应的知识图谱的构建成本、迭代更新成本也不断增加。因此,传统的基于人工设计领域知识图谱库的智能问答系统,已无法满足日益增长的用户需求,特别是在面对高频的设备迭代升级和新品推出场景中,其知识图谱库的上线周期长,需实时维护,维护成本高,并且出现新知识时将会启动领域知识图谱消耗大量资源进行实时更新,更新效率低下,并且在更新期间无法对用户进行问答支持,影响用户对于图谱的正常使用。
3.因此,针对相关技术中,知识图谱更新效率低下,知识图谱在更新过程中无法及时反馈目标对象的问答进行有效响应等问题,尚未提出有效的解决方案。


技术实现要素:

4.本技术实施例提供了一种知识图谱的更新方法和装置、存储介质及电子装置,以至少解决相关技术中,知识图谱更新效率低下,知识图谱在更新过程中无法及时反馈目标对象的问答进行有效响应等问题。
5.根据本技术实施例的一个实施例,提供了一种知识图谱的更新方法,包括:在第一知识图谱无法对目标对象对应的第一问答文本进行响应的情况下,获取外部领域知识文档;将所述第一问答文本与所述外部领域知识文档输入到机器阅读理解模型中,以得到所述第一问答文本对应的目标回答文本,其中,所述机器阅读理解模型为使用多组数据通过机器学习训练出的,所述多组数据中的每组数据均包括:问答文本,预设的外部领域知识文档,以及所述问答文本和预设的外部领域知识文档对应的回答文本;根据所述目标回答文本向所述目标对象进行问答反馈,并基于所述目标回答文本和所述第一问答文本对所述第一知识图谱进行内容更新,得到第二知识图谱。
6.在一个示例性实施例中,基于所述目标回答文本和所述第一问答文本对所述第一知识图谱进行内容更新之前,上述方法还包括:统计所述第一问答文本的出现次数;在所述出现次数大于或者等于第一预设阈值的情况下,确定对所述第一知识图谱进行在线更新;在所述出现次数小于第一预设阈值的情况下,确定对所述第一知识图谱进行离线更新。
7.在一个示例性实施例中,基于所述目标回答文本和所述第一问答文本对所述第一知识图谱进行内容更新,上述方法还包括:确定所述第一知识图谱用于进行图谱更新的存
储空间对应的可用空间资源;在所述可用空间资源小于或者等于第一预设资源阈值,且所述第一问答文本对应的数据流量大于预设流量阈值的情况下,确定在所述可用空间资源仅存储所述第一问答文本对应的目标回答文本,使用所述目标回答文本对所述第一知识图谱进行内容更新;在所述可用空间资源大于第一预设资源阈值,且所述第一问答文本对应的数据流量小于或者等于预设流量阈值的情况下,确定在所述可用空间资源中将所述第一问答文本、所述目标回答文本以及所述外部领域知识文档进行对应存储,并使用所述第一问答文本、所述目标回答文本以及所述外部领域知识文档对所述第一知识图谱进行内容更新。
8.在一个示例性实施例中,基于所述目标回答文本和所述第一问答文本对所述第一知识图谱进行内容更新,上述方法还包括:获取预设的问题类别规则;通过所述问题类别规则确定利用所述机器阅读理解模型输出的所述第一问答文本的问题类别,以及所述第一问答文本在每一种问题类别中对应的频率;将所述频率作为权重,计算所述第一问答文本对应的更新值;在所述第一问答文本同时存在多个的情况下,确定使用所述更新值最大的目标第一问答文本以及所述目标第一问答文本对应的目标回答文本对所述第一知识图谱进行内容更新。
9.在一个示例性实施例中,将所述频率作为权重,计算所述第一问答文本对应的更新值,包括:基于所述第一知识图谱中的不同问题类别分别对应的热度值,确定所述第一问答文本对应问题类别的目标热度值;将所述目标热度值与所述频率相乘,将乘积结果对应的值作为所述第一问答文本对应的更新值。
10.在一个示例性实施例中,将所述第一问答文本与所述外部领域知识文档输入到机器阅读理解模型中,以得到所述第一问答文本对应的目标回答文本之前,上述方法还包括:在所述第一知识图谱中需要增加新的设备知识的情况下,获取所述新的设备知识对应的第三知识图谱;将所述第三知识图谱添加至所述外部领域知识文档。
11.在一个示例性实施例中,根据所述目标回答文本向所述目标对象进行问答反馈,并基于所述目标回答文本和所述第一问答文本对所述第一知识图谱进行内容更新,得到第二知识图谱之后,上述方法还包括:使用所述第二知识图谱替换无法对目标对象对应的第一问答文本进行响应的第一知识图谱作为当前知识图谱;对所述第一问答文本进行识别处理,得到用于在图谱中进行查询的查询文本,其中,所述识别处理用于指示确定所述第一问答文本的意图实体以及所述第一问答文本对应的属性信息;将所述查询文本输入到所述当前知识图谱中,确定出查询结果,其中,所述查询结果用于指示更新后的图谱是否有效支持对所述第一问答文本的响应。
12.根据本技术实施例的另一个实施例,还提供了一种知识图谱的更新装置,包括:获取模块,用于在第一知识图谱无法对目标对象对应的第一问答文本进行响应的情况下,获取外部领域知识文档;回答模块,用于将所述第一问答文本与所述外部领域知识文档输入到机器阅读理解模型中,以得到所述第一问答文本对应的目标回答文本,其中,所述机器阅读理解模型为使用多组数据通过机器学习训练出的,所述多组数据中的每组数据均包括:问答文本,预设的外部领域知识文档,以及所述问答文本和预设的外部领域知识文档对应的回答文本;更新模块,用于根据所述目标回答文本向所述目标对象进行问答反馈,并基于所述目标回答文本和所述第一问答文本对所述第一知识图谱进行内容更新,得到第二知识
图谱。
13.在一个示例性实施例中,上述装置还包括:统计模块,用于统计所述第一问答文本的出现次数;在所述出现次数大于或者等于第一预设阈值的情况下,确定对所述第一知识图谱进行在线更新;在所述出现次数小于第一预设阈值的情况下,确定对所述第一知识图谱进行离线更新。
14.在一个示例性实施例中,上述装置还包括:存储模块,用于确定所述第一知识图谱用于进行图谱更新的存储空间对应的可用空间资源;在所述可用空间资源小于或者等于第一预设资源阈值,且所述第一问答文本对应的数据流量大于预设流量阈值的情况下,确定在所述可用空间资源仅存储所述第一问答文本对应的目标回答文本,使用所述目标回答文本对所述第一知识图谱进行内容更新;在所述可用空间资源大于第一预设资源阈值,且所述第一问答文本对应的数据流量小于或者等于预设流量阈值的情况下,确定在所述可用空间资源中将所述第一问答文本、所述目标回答文本以及所述外部领域知识文档进行对应存储,并使用所述第一问答文本、所述目标回答文本以及所述外部领域知识文档对所述第一知识图谱进行内容更新。
15.在一个示例性实施例中,上述装置还包括:类别模块,用于获取预设的问题类别规则;通过所述问题类别规则确定利用所述机器阅读理解模型输出的所述第一问答文本的问题类别,以及所述第一问答文本在每一种问题类别中对应的频率;将所述频率作为权重,计算所述第一问答文本对应的更新值;在所述第一问答文本同时存在多个的情况下,确定使用所述更新值最大的目标第一问答文本以及所述目标第一问答文本对应的目标回答文本对所述第一知识图谱进行内容更新。
16.在一个示例性实施例中,上述类别模块,还用于基于所述第一知识图谱中的不同问题类别分别对应的热度值,确定所述第一问答文本对应问题类别的目标热度值;将所述目标热度值与所述频率相乘,将乘积结果对应的值作为所述第一问答文本对应的更新值。
17.在一个示例性实施例中,上述装置还包括:图谱模块,用于在所述第一知识图谱中需要增加新的设备知识的情况下,获取所述新的设备知识对应的第三知识图谱;将所述第三知识图谱添加至所述外部领域知识文档。
18.在一个示例性实施例中,上述装置还包括:确定模块,用于使用所述第二知识图谱替换无法对目标对象对应的第一问答文本进行响应的第一知识图谱作为当前知识图谱;对所述第一问答文本进行识别处理,得到用于在图谱中进行查询的查询文本,其中,所述识别处理用于指示确定所述第一问答文本的意图实体以及所述第一问答文本对应的属性信息;将所述查询文本输入到所述当前知识图谱中,确定出查询结果,其中,所述查询结果用于指示更新后的图谱是否有效支持对所述第一问答文本的响应。
19.根据本技术实施例的又一方面,还提供了一种计算机可读的存储介质,该计算机可读的存储介质中存储有计算机程序,其中,该计算机程序被设置为运行时执行上述知识图谱的更新方法。
20.根据本技术实施例的又一方面,还提供了一种电子装置,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其中,上述处理器通过计算机程序执行上述的知识图谱的更新方法。
21.在本技术实施例中,在第一知识图谱无法对目标对象对应的第一问答文本进行响
应的情况下,获取外部领域知识文档;将第一问答文本与外部领域知识文档输入到机器阅读理解模型中,以得到第一问答文本对应的目标回答文本,其中,机器阅读理解模型为使用多组数据通过机器学习训练出的,多组数据中的每组数据均包括:问答文本,预设的外部领域知识文档,以及问答文本和预设的外部领域知识文档对应的回答文本;根据目标回答文本向目标对象进行问答反馈,并基于目标回答文本和第一问答文本对第一知识图谱进行内容更新,得到第二知识图谱;采用上述技术方案,解决了相关技术中,知识图谱更新效率低下,知识图谱在更新过程中无法及时反馈目标对象的问答进行有效响应等问题,通过第一知识图谱对目标对象的第一问答文本进行处理响应,并在第一知识图谱无法支撑响应第一问答文本的情况下,利用训练好的机器阅读理解模型对第一问答文本和外部领域知识文档进行处理,得出该第一问答文本对应的目标回答文本,使用该目标回答文本向目标对象进行问答反馈,并将第一知识图谱更新为包含新知识的第二知识图谱,保证了知识图谱更新与目标对象的使用不冲突,提升了知识图谱的更新效率。
附图说明
22.此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本技术的实施例,并与说明书一起用于解释本技术的原理。
23.为了更清楚地说明本技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,对于本领域普通技术人员而言,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
24.图1是本技术实施例的一种知识图谱的更新方法的硬件环境示意图;
25.图2是根据本技术实施例的知识图谱的更新方法的流程图;
26.图3是根据本技术实施例的问答系统架构的结构框图;
27.图4是根据本技术实施例的一种知识图谱的更新装置的结构框图;
28.图5是根据本技术实施例的一种电子装置的结构框图。
具体实施方式
29.为了使本技术领域的人员更好地理解本技术方案,下面将结合本技术实施例中的附图,对本技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本技术一部分的实施例,而不是全部的实施例。基于本技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本技术保护的范围。
30.需要说明的是,本技术的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本技术的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
31.根据本技术实施例的一个方面,提供了一种知识图谱的更新方法。该知识图谱的
更新方法广泛应用于智慧家庭(smart home)、智能家居、智能家用设备生态、智慧住宅(intelligencehouse)生态等全屋智能数字化控制应用场景。可选地,在本实施例中,上述知识图谱的更新方法可以应用于如图1所示的由终端设备102和服务器104所构成的硬件环境中。如图1所示,服务器104通过网络与终端设备102进行连接,可用于为终端或终端上安装的客户端提供服务(如应用服务等),可在服务器上或独立于服务器设置数据库,用于为服务器104提供数据存储服务,可在服务器上或独立于服务器配置云计算和/或边缘计算服务,用于为服务器104提供数据运算服务。
32.上述网络可以包括但不限于以下至少之一:有线网络,无线网络。上述有线网络可以包括但不限于以下至少之一:广域网,城域网,局域网,上述无线网络可以包括但不限于以下至少之一:wifi(wireless fidelity,无线保真),蓝牙。终端设备102可以并不限定于为pc、手机、平板电脑、智能空调、智能烟机、智能冰箱、智能烤箱、智能炉灶、智能洗衣机、智能热水器、智能洗涤设备、智能洗碗机、智能投影设备、智能电视、智能晾衣架、智能窗帘、智能影音、智能插座、智能音响、智能音箱、智能新风设备、智能厨卫设备、智能卫浴设备、智能扫地机器人、智能擦窗机器人、智能拖地机器人、智能空气净化设备、智能蒸箱、智能微波炉、智能厨宝、智能净化器、智能饮水机、智能门锁等。
33.在本实施例中提供了一种知识图谱的更新方法,应用于上述计算机终端,图2是根据本技术实施例的知识图谱的更新方法的流程图,该流程包括如下步骤:
34.步骤s202,在第一知识图谱无法对目标对象对应的第一问答文本进行响应的情况下,获取外部领域知识文档;
35.可选的,当第一知识图谱为与设备功能说明有关的图谱时,对应的外部领域知识文档为说明书领域为各种设备的说明书文档。即上述外部领域知识文档可以理解为是知识图谱对应领域内的各类文档,该文档的获取方式可以是目标对象主动输入,或者是根据当前第一知识图谱对应的知识领域从网络中主动收集的文档,对此本技术不作过多限定。
36.步骤s204,将所述第一问答文本与所述外部领域知识文档输入到机器阅读理解模型中,以得到所述第一问答文本对应的目标回答文本,其中,所述机器阅读理解模型为使用多组数据通过机器学习训练出的,所述多组数据中的每组数据均包括:问答文本,预设的外部领域知识文档,以及所述问答文本和预设的外部领域知识文档对应的回答文本;
37.步骤s206,根据所述目标回答文本向所述目标对象进行问答反馈,并基于所述目标回答文本和所述第一问答文本对所述第一知识图谱进行内容更新,得到第二知识图谱。
38.通过上述步骤,在第一知识图谱无法对目标对象对应的第一问答文本进行响应的情况下,获取外部领域知识文档;将第一问答文本与外部领域知识文档输入到机器阅读理解模型中,以得到第一问答文本对应的目标回答文本,其中,机器阅读理解模型为使用多组数据通过机器学习训练出的,多组数据中的每组数据均包括:问答文本,预设的外部领域知识文档,以及问答文本和预设的外部领域知识文档对应的回答文本;根据目标回答文本向目标对象进行问答反馈,并基于目标回答文本和第一问答文本对第一知识图谱进行内容更新,得到第二知识图谱;采用上述技术方案,解决了相关技术中,知识图谱更新效率低下,知识图谱在更新过程中无法及时反馈目标对象的问答进行有效响应等问题,通过第一知识图谱对目标对象的第一问答文本进行处理响应,并在第一知识图谱无法支撑响应第一问答文本的情况下,利用训练好的机器阅读理解模型对第一问答文本和外部领域知识文档进行处
理,得出该第一问答文本对应的目标回答文本,使用该目标回答文本向目标对象进行问答反馈,并将第一知识图谱更新为包含新知识的第二知识图谱,保证了知识图谱更新与目标对象的使用不冲突,提升了知识图谱的更新效率。
39.在一个示例性实施例中,基于所述目标回答文本和所述第一问答文本对所述第一知识图谱进行内容更新之前,上述方法还包括:统计所述第一问答文本的出现次数;在所述出现次数大于或者等于第一预设阈值的情况下,确定对所述第一知识图谱进行在线更新;在所述出现次数小于第一预设阈值的情况下,确定对所述第一知识图谱进行离线更新。
40.换句话说,在对第一知识图谱更新时,还可以根据需求取舍、联合使用或有条件进行更新,例如,对于高频用户问题(相当于上述第一问答文本)进行在线更新,将知识(相当于上述目标回答文本)更新到知识图谱,问答效率会更高一些,而对于低频用户问题,可能仅出现一两次,那可以仅使用离线更新。此外,当在线更新对问答系统效果有影响,可以舍去,或者采取折中的策略。
41.通过上述实施方式可以基于第一问答文本的出现情况,识别目标对象对于该第一问答文本对应回答文本的需求频率,从而可以基于需求频率确定回答周期的时间长短,将需求频率高的第一问答文本对应回答文本实时在知识图谱中更新,保证知识图谱可以在较短的时间内实现对目标对象的快速响应,当需求频率低时,则可以暂时将对应的第一问答文本对应回答文本进行缓存或者存储,选择目标对象未使用知识图谱进行信息查询时,对知识图谱利用存储的回答文本进行更新,进而在保证目标对象使用体验的同时,提升空闲时间对应知识图谱的更新效率,使得知识图谱在目标对象使用时可以尽可能多的覆盖更大的信息范围。
42.在一个示例性实施例中,基于所述目标回答文本和所述第一问答文本对所述第一知识图谱进行内容更新,上述方法还包括:确定所述第一知识图谱用于进行图谱更新的存储空间对应的可用空间资源;在所述可用空间资源小于或者等于第一预设资源阈值,且所述第一问答文本对应的数据流量大于预设流量阈值的情况下,确定在所述可用空间资源仅存储所述第一问答文本对应的目标回答文本,使用所述目标回答文本对所述第一知识图谱进行内容更新;在所述可用空间资源大于第一预设资源阈值,且所述第一问答文本对应的数据流量小于或者等于预设流量阈值的情况下,确定在所述可用空间资源中将所述第一问答文本、所述目标回答文本以及所述外部领域知识文档进行对应存储,并使用所述第一问答文本、所述目标回答文本以及所述外部领域知识文档对所述第一知识图谱进行内容更新。
43.通过上述实施例,在将上述知识图谱的更新方法应用到对应的设备或者应用平台中时,还可以通过确定设备或者应用平台所能支持的数据流量大小以及相应的空间资源来确定对知识图谱的更新方法中产生的数据如何进行更新使用,进而在保证更新效果的同时,使得设备或者应用平台对应的正常运行功能不受影响,利用数据的辅助实现对设备或者应用平台对应问答功能的准确率的提升。
44.在一个示例性实施例中,基于所述目标回答文本和所述第一问答文本对所述第一知识图谱进行内容更新,上述方法还包括:获取预设的问题类别规则;通过所述问题类别规则确定利用所述机器阅读理解模型输出的所述第一问答文本的问题类别,以及所述第一问答文本在每一种问题类别中对应的频率;将所述频率作为权重,计算所述第一问答文本对
应的更新值;在所述第一问答文本同时存在多个的情况下,确定使用所述更新值最大的目标第一问答文本以及所述目标第一问答文本对应的目标回答文本对所述第一知识图谱进行内容更新。
45.可以理解的是,当上述方法应用于相关问答系统时,可以根据问答系统的流量进行更新的进一步设置,可选的,从存储策略上来说,可以看作三种方法:第一种,全部存储策略,该策略适用于流量较小、存储资源充足的情况,将用户所有输入、输出均做存储,在离线更新知识图谱时,充分利用这些信息;第二种,仅存储需要机器阅读理解回答的问题,即知识图谱无法覆盖的知识,在离线更新时仅考虑这些未知或未匹配的知识,该方法适用于流量较大、存储资源不太充足的情况;第三种,不仅存储机器阅读理解回答的问题,还存储所有类别的问题的频率,前者用于,后者作为辅助信息,如:可以视为重要性的表征,作为权重,有重点的更新检测知识图谱。
46.在一个示例性实施例中,将所述频率作为权重,计算所述第一问答文本对应的更新值,包括:基于所述第一知识图谱中的不同问题类别分别对应的热度值,确定所述第一问答文本对应问题类别的目标热度值;将所述目标热度值与所述频率相乘,将乘积结果对应的值作为所述第一问答文本对应的更新值。
47.可以理解的是,由于第一知识图谱中包含的问题类别多种多样,有些问题通过知识图谱自身的数据便可以初步支撑问答,当详细问答时才需要通过对知识图谱进行更新后才能支持,因此,为了避免频繁的更新导致知识图谱中的数据异常或者使用异常,还可以通过确定第一问答文本对应的更新值,使用更新值对待更新的问答文本对应的数据集合进行排列,从更新值最大、需求最高的第一问答文本对应数据依次更新,完成当知识图谱的全面更新。
48.在一个示例性实施例中,将所述第一问答文本与所述外部领域知识文档输入到机器阅读理解模型中,以得到所述第一问答文本对应的目标回答文本之前,上述方法还包括:在所述第一知识图谱中需要增加新的设备知识的情况下,获取所述新的设备知识对应的第三知识图谱;将所述第三知识图谱添加至所述外部领域知识文档。
49.可以理解的是,当存在待将内容更新至第一知识图谱的第三知识图谱时,说明第一知识图谱扩大的设备支撑范围,此时为了提升更新效率,将第三知识图谱添加至外部领域知识文档,当目标对象使用到第三知识图谱对应的数据时,再进行第一知识图谱的更新,或者在目标对象未使用第一知识图谱时,利用第三知识图谱对第一知识图谱进行离线更新。
50.在一个示例性实施例中,根据所述目标回答文本向所述目标对象进行问答反馈,并基于所述目标回答文本和所述第一问答文本对所述第一知识图谱进行内容更新,得到第二知识图谱之后,上述方法还包括:使用所述第二知识图谱替换无法对目标对象对应的第一问答文本进行响应的第一知识图谱作为当前知识图谱;对所述第一问答文本进行识别处理,得到用于在图谱中进行查询的查询文本,其中,所述识别处理用于指示确定所述第一问答文本的意图实体以及所述第一问答文本对应的属性信息;将所述查询文本输入到所述当前知识图谱中,确定出查询结果,其中,所述查询结果用于指示更新后的图谱是否有效支持对所述第一问答文本的响应。
51.由于知识图谱在使用时,需要确定目标对象的意图以及实体属性要求,因此,在完
成知识图谱的更新之后,通过问答测试确定当前更新后的知识图谱对应之前的问答能否有效的支持,进一步验证知识图谱的准确性,保证知识图谱使用后可以精准的反馈目标对象的问答。
52.为了更好的理解上述知识图谱的更新方法的过程,以下再结合可选实施例对上述知识图谱的更新的实现方法流程进行说明,但不用于限定本技术实施例的技术方案。
53.机器问答的常见实现方法是知识库问答(kbqa),基于知识库(kb)或知识图谱(kg)的问答,其原理是构建机器可理解的人类知识体系,然后通过自然语言理解(nlu)和知识库对齐从而找到相关答案。但要构建一个复杂领域的知识库(图谱)需要大规模的领域数据和多个细分步骤,从知识获取、知识挖掘、知识存储到知识推理,而该链路上需要耗费大量的资源成本,包括但不限于数据和模型制作的大量人工成本,知识存储的硬件成本以及链路上训练各类模型和推理使用的计算资源成本等。另外,在基于传统kbqa的智能硬件说明书场景下,每一台设备的升级,每一类设备的新品发布等,都需要将最新的设备知识融合到kb或kg中,带来了kbqa系统的频繁更新上线操作。
54.基于上述分析,现有两类方法,一种从知识图谱构建角度采取提前构建较完备知识图谱,按需更新的方法,一种通过一些技术从提升用户输入和知识图谱的匹配度角度。前者,存在构建和更新周期长的问题,导致拉长系统上线周期,构建与维护成本高、时效低等缺点。后者并未解决前者的问题,但是也能在一定程度上提高问答准确率,但是该类方法并未引入可获取到的大量知识图谱外的领域知识。
55.作为一种可选的实施例,本发明设计了通过机器阅读理解技术辅助基于知识图谱的问答系统架构,该架构不仅通过机器阅读理解技术实现知识图谱中没有覆盖的知识的问答,还基于机器阅读理解的结果将新知识融入知识图谱中,实现知识图谱的在线更新。该架构解决了对知识图谱不做离线更新的前提下,仍能保证问答效果,而知识图谱的离线更新可以按需选择合适的时机,且可以将用户问答时的输入和机器阅读理解回答作为额外的辅助信息。
56.可选的,图3是根据本技术实施例的问答系统架构的结构框图,上述问答系统架构包括:输入模块32、机器阅读理解模块34、知识图谱模块36、更新模块38、存储反馈模块40;
57.可选的,输入模块32,包括用户输入和外部领域知识,其中,用户输入为用户问答输入的文本,外部领域知识为领域内的各类文档,如说明书领域为各种设备的说明书文档。需要说明的是,当用户输入到知识图谱模块36进行问答查询或推理时,需要通过意图和实体属性识别技术,对用户意图和关注的信息做精细化的分析与提取。输入以及对输入的处理,都会通过存储模块进行记录,作为系统反馈信息,未来能够辅助知识图谱的更新升级等。
58.可选的,机器阅读理解模块34,该模块可能引入各类基于深度学习、强化学习等的机器阅读理解技术,如图神经网络、交互式机器阅读理解等。模块的输入是用户问题文本和外部领域知识文档,输出为对应用户输入问题的答案a,则该模块可用公式表示为:a=mrc(i,d);其中,i=w1,w2,

,wm,d={d1,d2,

,dn}分别为用户输入和文档集合,mrc表示一类机器阅读理解模型能够通过输入用户问题i和外部领域知识文档集合d,给出用户需要的回答文本。
59.可选的,更新模块38包括两部分,即在线更新和离线更新,该功能模块可以根据需
求取舍、联合使用或有条件使用。比如,若在线更新对系统效果有影响,可以舍去,或者采取折中的策略,对于高频用户问题进行在线更新,将知识更新到知识图谱,问答效率会更高一些,而对于低频的问题,可能仅出现一两次,那可以仅使用离线更新。知识图谱在线更新可以采用各类现有的方法,但是需要保证的原则是,不影响系统应用,因此,子图更新或分布式更新是可行的两个方向。
60.可选的,存储反馈模块40,该模块可以根据问答系统的流量进行细节设计,如存储方案,存储设备选择等。从存储策略上来说,可以看三种方法。第一种,全部存储策略,该策略适用于流量较小、存储资源充足的情况,将用户所有输入均做存储,在离线更新知识图谱时,充分利用这些信息;第二种,仅存储需要机器阅读理解回答的问题,即知识图谱无法覆盖的知识,在离线更新时仅考虑这些未知或未匹配的知识,该方法适用于流量较大、存储资源不太充足的情况;第三种,不仅存储机器阅读理解回答的问题,还存储所有类别的问题的频率,前者用于,后者作为辅助信息,如可以视为重要性的表征,作为权重,有重点的更新检测知识图谱。
61.综上,本发明可选示例,通过使用mrc技术,能够在不更新知识图谱的情况下,向系统引入该领域的外部知识或无监督知识,提升用户问答的体验,满足知识图谱无法覆盖场景下的用户问答。同时,这类外部知识经过机器阅读理解和相关技术能够在线更新到知识图谱中,且通过存储策略,知识图谱离线更新时,也可作为辅助信息。
62.作为一种可选示例,在实际应用中,当新的设备投放到市场,进入用户家庭,知识图谱就需要进行一次全链路的更新,即使是在知识图谱自动化生产平台的辅助下,如此长的构建或更新链路会导致资源、时间成本的累加,以及性能的逐级衰减。在设备说明书问答系统这种较高频次的迭代更新场景下,这种现象尤为严重。而mrc技术可以将新设备知识作为领域外部知识,无需提取结构化信息,导入知识图谱即可支撑用户问答需求。而在线和离线分支更新,能够保证知识图谱本身知识覆盖率的不断提升,满足相同用户输入下的高效率问答。
63.本实施例能够通过机器阅读理解(mrc)技术,在知识图谱无法获取用户问答的情况下,获取外部知识满足用户问答需求,同时,利用获取的外部知识对知识图谱进行在线更新,另外,新知识也可以记录下来,当知识图谱离线更新时作为辅助信息。因此,领域知识图谱不再需要在一开始就耗费大量资源去构建一个超级完备的,相对完备,甚至能够支持基础服务即可,而是通过上述过程不断迭代最终实现一个较为完备的领域知识图谱。
64.通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到根据上述实施例的方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本技术的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如rom/ram、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,或者网络设备等)执行本技术各个实施例的方法。
65.图4是根据本技术实施例的一种知识图谱的更新装置的结构框图。如图4所示,包括:
66.获取模块42,用于在第一知识图谱无法对目标对象对应的第一问答文本进行响应的情况下,获取外部领域知识文档;
67.回答模块44,用于将所述第一问答文本与所述外部领域知识文档输入到机器阅读理解模型中,以得到所述第一问答文本对应的目标回答文本,其中,所述机器阅读理解模型为使用多组数据通过机器学习训练出的,所述多组数据中的每组数据均包括:问答文本,预设的外部领域知识文档,以及所述问答文本和预设的外部领域知识文档对应的回答文本;
68.更新模块46,用于根据所述目标回答文本向所述目标对象进行问答反馈,并基于所述目标回答文本和所述第一问答文本对所述第一知识图谱进行内容更新,得到第二知识图谱。
69.通过上述装置,在第一知识图谱无法对目标对象对应的第一问答文本进行响应的情况下,获取外部领域知识文档;将第一问答文本与外部领域知识文档输入到机器阅读理解模型中,以得到第一问答文本对应的目标回答文本,其中,机器阅读理解模型为使用多组数据通过机器学习训练出的,多组数据中的每组数据均包括:问答文本,预设的外部领域知识文档,以及问答文本和预设的外部领域知识文档对应的回答文本;根据目标回答文本向目标对象进行问答反馈,并基于目标回答文本和第一问答文本对第一知识图谱进行内容更新,得到第二知识图谱;采用上述技术方案,解决了相关技术中,知识图谱更新效率低下,知识图谱在更新过程中无法及时反馈目标对象的问答进行有效响应等问题,通过第一知识图谱对目标对象的第一问答文本进行处理响应,并在第一知识图谱无法支撑响应第一问答文本的情况下,利用训练好的机器阅读理解模型对第一问答文本和外部领域知识文档进行处理,得出该第一问答文本对应的目标回答文本,使用该目标回答文本向目标对象进行问答反馈,并将第一知识图谱更新为包含新知识的第二知识图谱,保证了知识图谱更新与目标对象的使用不冲突,提升了知识图谱的更新效率。
70.在一个示例性实施例中,上述装置还包括:统计模块,用于统计所述第一问答文本的出现次数;在所述出现次数大于或者等于第一预设阈值的情况下,确定对所述第一知识图谱进行在线更新;在所述出现次数小于第一预设阈值的情况下,确定对所述第一知识图谱进行离线更新。
71.在一个示例性实施例中,上述装置还包括:存储模块,用于确定所述第一知识图谱用于进行图谱更新的存储空间对应的可用空间资源;在所述可用空间资源小于或者等于第一预设资源阈值,且所述第一问答文本对应的数据流量大于预设流量阈值的情况下,确定在所述可用空间资源仅存储所述第一问答文本对应的目标回答文本,使用所述目标回答文本对所述第一知识图谱进行内容更新;在所述可用空间资源大于第一预设资源阈值,且所述第一问答文本对应的数据流量小于或者等于预设流量阈值的情况下,确定在所述可用空间资源中将所述第一问答文本、所述目标回答文本以及所述外部领域知识文档进行对应存储,并使用所述第一问答文本、所述目标回答文本以及所述外部领域知识文档对所述第一知识图谱进行内容更新。
72.在一个示例性实施例中,上述装置还包括:类别模块,用于获取预设的问题类别规则;通过所述问题类别规则确定利用所述机器阅读理解模型输出的所述第一问答文本的问题类别,以及所述第一问答文本在每一种问题类别中对应的频率;将所述频率作为权重,计算所述第一问答文本对应的更新值;在所述第一问答文本同时存在多个的情况下,确定使用所述更新值最大的目标第一问答文本以及所述目标第一问答文本对应的目标回答文本对所述第一知识图谱进行内容更新。
73.在一个示例性实施例中,上述类别模块,还用于基于所述第一知识图谱中的不同问题类别分别对应的热度值,确定所述第一问答文本对应问题类别的目标热度值;将所述目标热度值与所述频率相乘,将乘积结果对应的值作为所述第一问答文本对应的更新值。
74.在一个示例性实施例中,上述装置还包括:图谱模块,用于在所述第一知识图谱中需要增加新的设备知识的情况下,获取所述新的设备知识对应的第三知识图谱;将所述第三知识图谱添加至所述外部领域知识文档。
75.在一个示例性实施例中,上述装置还包括:确定模块,用于使用所述第二知识图谱替换无法对目标对象对应的第一问答文本进行响应的第一知识图谱作为当前知识图谱;对所述第一问答文本进行识别处理,得到用于在图谱中进行查询的查询文本,其中,所述识别处理用于指示确定所述第一问答文本的意图实体以及所述第一问答文本对应的属性信息;将所述查询文本输入到所述当前知识图谱中,确定出查询结果,其中,所述查询结果用于指示更新后的图谱是否有效支持对所述第一问答文本的响应。
76.本技术的实施例还提供了一种存储介质,该存储介质包括存储的程序,其中,上述程序运行时执行上述任一项的方法。
77.可选地,在本实施例中,上述存储介质可以被设置为存储用于执行以下步骤的程序代码:
78.s1,在第一知识图谱无法对目标对象对应的第一问答文本进行响应的情况下,获取外部领域知识文档;
79.s2,将所述第一问答文本与所述外部领域知识文档输入到机器阅读理解模型中,以得到所述第一问答文本对应的目标回答文本,其中,所述机器阅读理解模型为使用多组数据通过机器学习训练出的,所述多组数据中的每组数据均包括:问答文本,预设的外部领域知识文档,以及所述问答文本和预设的外部领域知识文档对应的回答文本;
80.s3,根据所述目标回答文本向所述目标对象进行问答反馈,并基于所述目标回答文本和所述第一问答文本对所述第一知识图谱进行内容更新,得到第二知识图谱。
81.本技术的实施例还提供了一种电子装置,包括存储器和处理器,该存储器中存储有计算机程序,该处理器被设置为运行计算机程序以执行上述任一项方法实施例中的步骤。
82.可选地,上述电子装置还可以包括传输设备以及输入输出设备,其中,该传输设备和上述处理器连接,该输入输出设备和上述处理器连接。
83.可选的,如图5所示,该电子装置包括存储器702和处理器704,该存储器702中存储有计算机程序,该处理器704被设置为通过计算机程序执行上述任一项方法实施例中的步骤。
84.可选地,在本实施例中,上述电子装置可以位于计算机网络的多个网络设备中的至少一个网络设备。
85.可选地,在本实施例中,上述处理器可以被设置为通过计算机程序执行以下步骤:
86.s1,在第一知识图谱无法对目标对象对应的第一问答文本进行响应的情况下,获取外部领域知识文档;
87.s2,将所述第一问答文本与所述外部领域知识文档输入到机器阅读理解模型中,以得到所述第一问答文本对应的目标回答文本,其中,所述机器阅读理解模型为使用多组
数据通过机器学习训练出的,所述多组数据中的每组数据均包括:问答文本,预设的外部领域知识文档,以及所述问答文本和预设的外部领域知识文档对应的回答文本;
88.s3,根据所述目标回答文本向所述目标对象进行问答反馈,并基于所述目标回答文本和所述第一问答文本对所述第一知识图谱进行内容更新,得到第二知识图谱。
89.可选地,本领域普通技术人员可以理解,图5所示的结构仅为示意,电子装置也可以是智能手机(如android手机、ios手机等)、平板电脑、掌上电脑以及移动互联网设备(mobile internet devices,mid)、pad等终端设备。图5其并不对上述电子装置的结构造成限定。例如,电子装置还可包括比图5中所示更多或者更少的组件(如网络接口等),或者具有与图5所示不同的配置。
90.其中,存储器702可用于存储软件程序以及模块,如本公开实施例中的通信连接方法和装置对应的程序指令/模块,处理器704通过运行存储在存储器702内的软件程序以及模块,从而执行各种功能应用以及数据处理,即实现上述的通信连接方法。存储器702可包括高速随机存储器,还可以包括非易失性存储器,如一个或者多个磁性存储装置、闪存、或者其他非易失性固态存储器。在一些实例中,存储器702可进一步包括相对于处理器704远程设置的存储器,这些远程存储器可以通过网络连接至终端。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。作为一种示例,如图5所示,上述存储器702中可以但不限于包括上述通信连接装置中的获取模块42、回答模块44、更新模块46。此外,还可以包括但不限于上述通信连接装置中的其他模块单元,本示例中不再赘述。
91.可选地,上述的传输装置706用于经由一个网络接收或者发送数据。上述的网络具体实例可包括有线网络及无线网络。在一个实例中,传输装置706包括一个网络适配器(network interface controller,nic),其可通过网线与其他网络设备与路由器相连从而可与互联网或局域网进行通讯。在一个实例中,传输装置1106为射频(radio frequency,rf)模块,其用于通过无线方式与互联网进行通讯。
92.此外,上述电子装置还包括:显示器708,用于显示上述知识图谱;和连接总线710,用于连接上述电子装置中的各个模块部件。
93.可选地,在本实施例中,上述存储介质可以包括但不限于:u盘、只读存储器(read-only memory,简称为rom)、随机存取存储器(random access memory,简称为ram)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。
94.可选地,本实施例中的具体示例可以参考上述实施例及可选实施方式中所描述的示例,本实施例在此不再赘述。
95.显然,本领域的技术人员应该明白,上述的本技术的各模块或各步骤可以用通用的计算装置来实现,它们可以集中在单个的计算装置上,或者分布在多个计算装置所组成的网络上,可选地,它们可以用计算装置可执行的程序代码来实现,从而,可以将它们存储在存储装置中由计算装置来执行,并且在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤,或者将它们分别制作成各个集成电路模块,或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。这样,本技术不限制于任何特定的硬件和软件结合。
96.以上所述仅是本技术的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本技术原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本技术的保护范围。
再多了解一些

本文用于创业者技术爱好者查询,仅供学习研究,如用于商业用途,请联系技术所有人。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献