一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

运维知识在线问答方法、装置、电子设备及存储介质与流程

2022-04-25 01:06:53 来源:中国专利 TAG:


1.本技术涉及计算机技术领域,尤其涉及一种运维知识在线问答方法、装置、电子设备及存储介质。


背景技术:

2.搜索问答系统,是指系统接收到用户问题,在问答知识库中进行相似问题搜索并排序,向用户展示一个相似问题列表,用户通过查看相似问题列表获取相关知识。在实际运维知识在线问答系统中,考虑到运维操作会直接影响到系统是否可以正常运行,针对某一场景的用户运维问题,需要提供详细运维知识答案,因此对运维知识答案的正确性要求极高。
3.现有技术中的搜索问答系统,通常需要预先匹配大量的问答模板,采用倒排索引的方式,对用户提问的问题进行关键词匹配,然后在系统数据库中查询该关键词匹配的词条,推送给用户。
4.然而,现有技术中通过问答知识库进行检索问答信息方式,检索效率比较低。


技术实现要素:

5.本技术提供一种运维知识在线问答方法、装置、电子设备及存储介质,用以解决现有技术中通过问答知识库进行检索问答信息方式,检索效率比较低的技术问题。
6.第一方面,本技术提供一种运维知识在线问答方法,应用搜索问答系统,搜索问答系统用于针对用户运维问题向用户推送运维知识答案,包括:
7.获取用户运维问题;对用户运维问题基于人工神经网络(approximate nearest neighbor;ann)模型或者嵌套pattern进行问题泛化,并分别在运维知识图谱数据库中进行模板匹配生成第一运维知识答案,在分布式搜索(elastic search,es)数据库中进行搜索生成多个第二运维知识答案;按照第一运维知识答案在第二运维知识之前的第一排序策略,以及多个第二运维答案的点击调权排序策略,对多个运维知识答案进行排序,并推送多个运维知识答案中的目标运维知识答案,多个运维知识答案包括第一运维知识答案和第二运维知识答案,点击调权排序策略用于根据多个第二运维知识答案的点击量对多个第二运维知识答案进行排序。
8.本技术实施例中,通过对用户运维问题基于ann模型或者嵌套pattern进行问题泛化,并分别在运维知识图谱数据库和es数据库中进行检索,生成多个运维知识答案,并按照预设排序规则对多个运维知识答案进行排序,将知识图谱数据库检索到的运维知识答案排在es数据库中检索到的运维知识答案之前,并筛选出目标运维知识答案推送给用户,相比于现有技术中通过问答知识库进行检索问答信息方式,不仅可以提高运维知识在线问答的效率、检索准确率,可以精准触达结果,还可以实现从传统知识库到智能知识库的跃升。
9.在一种可能的实施方式中,本技术实施例提供的运维知识在线问答方法,在获取用户运维问题之前,还包括:
10.获取运维知识数据集合,运维知识数据集合包括结构化数据和非结构化数据;根据运维知识数据的多级主题对运维知识数据集合进行场景归类,并对运维知识数据集合进行标注;分别对标注后的结构化数据进行知识引入、属性映射、数据清洗和数据融合,对标注后的非结构化数据进行知识抽取、属性映射、数据清洗和数据融合,生成运维知识图谱数据库。
11.本技术实施例中,通过对运维知识数据集合进行数据处理和数据融合,生成了运维知识图谱数据库,可以保证运维知识问答系统的可靠性和运维知识答案的准确性。
12.在一种可能的实施方式中,本技术实施例提供的运维知识在线问答方法,运维知识图谱数据库包括运维知识图谱实体库和运维知识图谱属性库,方法还包括:
13.对运维知识图谱实体库和运维知识图谱属性库进行别名配置,确定运维知识图谱数据库的同义词表。
14.本技术实施例中,通过对运维知识图谱实体库和运维知识图谱属性库进行别名配置,确定运维知识图谱数据库的同义词表,可以通过提高用户运维问题的匹配率,进而提高运维知识在线问答的效率。
15.在一种可能的实施方式中,本技术实施例提供的运维知识在线问答方法,还包括:
16.对用户运维问题进行统计分析;将超过第一预设数量的用户运维问题标记为热点知识,并将热点知识存储在运维知识图谱数据库的热门运维知识库中。
17.本技术实施例中,通过搜集用户提问的热门用户运维问题,建立运维知识图谱数据库的热门运维知识库,进而提高运维知识在线问答的效率。
18.在一种可能的实施方式中,本技术实施例提供的运维知识在线问答方法,非结构化数据包括excel数据表,对标注后的非结构化数据进行知识抽取,包括:
19.按照excel数据表的行头或列头的顺序遍历excel数据表;确定excel数据表各行之间或各列之间的内容重复度;按照内容重复度,确定excel数据表的主谓宾(subject-predicate-object,spo)三元组,以进行知识抽取。
20.本技术实施例中,通过按照excel数据表的行头或列头的顺序遍历excel数据表,并按照excel数据表各行之间或各列之间的内容重复度,对excel数据表进行知识抽取,提高了对excel数据表进行知识抽取的效率和准确度。
21.在一种可能的实施方式中,本技术实施例提供的运维知识在线问答方法,点击调权排序策略,包括:
22.确定在用户运维问题下,不同用户对多个第二运维知识答案的点击量;利用各第二运维知识答案的点击量确定各第二运维知识答案的权重;按照各第二运维知识答案的权重大小,对多个第二运维知识答案进行排序。
23.本技术实施例中,通过按照不同用户对第二运维知识答案的点击量确定各第二运维知识答案的权重,并按照各第二运维知识答案的权重大小,对多个第二运维知识答案进行排序,不仅可以提高第二运维知识答案的可靠性,还可以提高用户的检索效率。
24.在一种可能的实施方式中,本技术实施例提供的运维知识在线问答方法,还包括:
25.若多个第二运维知识答案中存在新的运维知识答案,则将新的运维知识答案的权重设置为预设值,新的运维知识答案加入es数据库的时间小于预设时间。
26.本技术实施例中,通过对新的运维知识答案的权重设置预设值,避免了新的运维
知识答案由于被用户点击数量过低而被埋没,进一步保证了第二运维知识答案的可靠性。
27.下面介绍本技术实施例提供的运维知识在线问答装置、电子设备、计算机可读存储介质以及计算机程序产品,其内容和效果可参考本技术实施例提供的运维知识在线问答方法,不再赘述。
28.第二方面,本技术提供一种运维知识在线问答装置,包括:
29.获取模块,用于获取用户运维问题。
30.生成模块,用于对用户运维问题基于人工神经网络ann模型或者嵌套pattern进行问题泛化,并分别在运维知识图谱数据库中进行模板匹配生成第一运维知识答案,在分布式搜索es数据库中进行搜索生成多个第二运维知识答案。
31.推送模块,用于按照第一运维知识答案在第二运维知识之前的第一排序策略,以及多个第二运维答案的点击调权排序策略,对多个运维知识答案进行排序,并推送多个运维知识答案中的目标运维知识答案,多个运维知识答案包括第一运维知识答案和第二运维知识答案,点击调权排序策略用于根据多个第二运维知识答案的点击量对多个第二运维知识答案进行排序。
32.在一种可能的实施方式中,本技术实施例提供的运维知识在线问答装置,还包括第一处理模块。
33.获取模块,还用于获取运维知识数据集合,运维知识数据集合包括结构化数据和非结构化数据。
34.第一处理模块,用于根据运维知识数据的多级主题对运维知识数据集合进行场景归类,并对运维知识数据集合进行标注。
35.第一处理模块,还用于分别对标注后的结构化数据进行知识引入、属性映射、数据清洗和数据融合,对标注后的非结构化数据进行知识抽取、属性映射、数据清洗和数据融合,生成运维知识图谱数据库。
36.在一种可能的实施方式中,本技术实施例提供的运维知识在线问答装置,非结构化数据包括excel数据表,第一处理模块具体用于:
37.按照excel数据表的行头或列头的顺序遍历excel数据表;确定excel数据表各行之间或各列之间的内容重复度;按照内容重复度,确定excel数据表的主谓宾spo三元组,以进行知识抽取。
38.在一种可能的实施方式中,本技术实施例提供的运维知识在线问答装置,运维知识图谱数据库包括运维知识图谱实体库和运维知识图谱属性库,第一处理模块,还用于:
39.对运维知识图谱实体库和运维知识图谱属性库进行别名配置,确定运维知识图谱数据库的同义词表。
40.在一种可能的实施方式中,本技术实施例提供的运维知识在线问答装置,推送模块,还用于:
41.确定在用户运维问题下,不同用户对多个第二运维知识答案的点击量;利用各第二运维知识答案的点击量确定各第二运维知识答案的权重;按照各第二运维知识答案的权重大小,对多个第二运维知识答案进行排序。
42.在一种可能的实施方式中,本技术实施例提供的运维知识在线问答装置,推送模块还用于:
43.若多个第二运维知识答案中存在新的运维知识答案,则将新的运维知识答案的权重设置为预设值,新的运维知识答案加入es数据库的时间小于预设时间。
44.在一种可能的实施方式中,本技术实施例提供的运维知识在线问答装置,还包括:
45.第二处理模块,用于对用户运维问题进行统计分析;将超过第一预设数量的用户运维问题标记为热点知识,并将热点知识存储在运维知识图谱数据库的热门运维知识库中。
46.第三方面,本技术实施例提供一种电子设备,包括:
47.处理器,以及与处理器通信连接的存储器;
48.存储器存储计算机执行指令;
49.处理器执行存储器存储的计算机执行指令,以实现第一方面或第一方面可实现方式提供运维知识在线问答方法。
50.第四方面,本技术实施例提供一种计算机可读存储介质,计算机可读存储介质中存储有计算机执行指令,计算机执行指令被处理器执行时用于实现如第一方面或第一方面可实现方式提供的运维知识在线问答方法。
51.第五方面,本技术实施例提供一种计算机程序产品,包括计算机执行指令,该计算机执行指令被处理器执行时用于实现如第一方面或第一方面可实现方式提供的运维知识在线问答方法。
52.本技术提供的运维知识在线问答方法、装置、电子设备及存储介质,通过获取用户运维问题;对用户运维问题基于ann模型或者嵌套pattern进行问题泛化,并分别在运维知识图谱数据库中进行模板匹配生成第一运维知识答案,在es数据库中进行搜索生成多个第二运维知识答案;按照第一运维知识答案在第二运维知识之前的第一排序策略,以及多个第二运维答案的点击调权排序策略,对多个运维知识答案进行排序,并推送多个运维知识答案中的目标运维知识答案,多个运维知识答案包括第一运维知识答案和第二运维知识答案,点击调权排序策略用于根据多个第二运维知识答案的点击量对多个第二运维知识答案进行排序。由于通过对用户运维问题基于ann模型或者嵌套pattern进行问题泛化,并分别在运维知识图谱数据库和es数据库中进行检索,生成多个运维知识答案,并按照预设排序规则对多个运维知识答案进行排序,将知识图谱数据库检索到的运维知识答案排在es数据库中检索到的运维知识答案之前,并筛选出目标运维知识答案推送给用户,相比于现有技术中通过问答知识库进行检索问答信息方式,不仅可以提高运维知识在线问答的效率、检索准确率,可以精准触达结果,还可以实现从传统知识库到智能知识库的跃升。
附图说明
53.此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本技术的实施例,并与说明书一起用于解释本技术的原理。
54.图1是本技术实施例提供的一示例性应用场景架构图;
55.图2是本技术一实施例提供的运维知识在线问答方法的流程示意图;
56.图3是本技术一实施例提供的终端设备的界面示意图;
57.图4是本技术另一实施例提供的运维知识在线问答方法的流程示意图;
58.图5是本技术一实施例提供的运维知识问答方法的架构示意图;
59.图6是本技术一实施例提供的运维知识在线问答装置的结构示意图;
60.图7是本技术另一实施例提供的运维知识在线问答装置的结构示意图;
61.图8是本技术实施例提供的电子设备的结构示意图。
62.通过上述附图,已示出本技术明确的实施例,后文中将有更详细的描述。这些附图和文字描述并不是为了通过任何方式限制本技术构思的范围,而是通过参考特定实施例为本领域技术人员说明本技术的概念。
具体实施方式
63.这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本技术相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本技术的一些方面相一致的装置和方法的例子。
64.本技术的说明书和权利要求书及上述附图中的术语“第一”、“第二”是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本技术的实施例例如能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
65.搜索问答系统,是指系统接收到用户问题,在问答知识库中进行相似问题搜索并排序,向用户展示一个相似问题列表,用户通过查看相似问题列表获取相关知识。在实际运维知识在线问答系统中,考虑到运维操作会直接影响到系统是否可以正常运行,针对某一场景的用户运维问题,需要提供详细运维知识答案,因此对运维知识答案的正确性要求极高。现有技术中的搜索问答系统,通常需要预先匹配大量的问答模板,采用倒排索引的方式,对用户提问的问题进行关键词匹配,然后在系统数据库中查询该关键词匹配的词条,推送给用户,检索效率比较低。
66.为了解决上述技术问题,本技术提供的运维知识在线问答方法、装置、电子设备及存储介质的发明构思在于,通过建立运维知识图谱数据库,并根据用户运维问题分别在运维知识图谱数据库和es数据库中进行检索,生成多个运维知识答案,并按照预设排序规则对多个运维知识答案进行排序,将知识图谱数据库检索到的运维知识答案排在es数据库中检索到的运维知识答案之前,相比于现有技术中通过问答知识库进行检索问答信息方式,不仅提高了运维知识在线问答的准确性,还进一步提高了运维知识在线问答的效率。
67.以下,对本技术实施例的示例性应用场景进行介绍。
68.本技术实施例提供的运维知识在线问答方法可以通过本技术实施例提供的运维知识在线问答装置执行,本技术实施例提供的运维知识在线问答装置可以集成在服务器上,或者该运维知识在线问答装置可以为服务器本身。本技术实施例对服务器的具体类型不做限制。
69.在日常工作过程中,用户可能会遇到运维类的问题,通常用户会选择在网页上进行提问的方式,获取运维知识答案。在实际运维知识在线问答系统中,由于运维操作会直接
影响到系统是否可以正常运行,因此针对用户提出的各类运维类问题,需要针对具体场景提供详细运维方式。图1是本技术实施例提供的一示例性应用场景架构图,如图1所示,该架构主要包括:终端设备11(个人电脑)和服务器12。示例性的,服务器12通过终端设备11的网页或客户端获取用户运维问题,然后根据用户运维问题生成目标运维知识答案,并推送至终端设备11中,终端设备11接收并显示目标运维知识答案,实现了运维知识在线问答。本技术实施例仅以此为例,并不限于此。例如,终端设备还可以是平板电脑、智能手机、车载终端等。
70.下面以具体地实施例对本技术的技术方案以及本技术的技术方案如何解决上述技术问题进行详细说明。下面这几个具体的实施例可以相互结合,对于相同或相似的概念或过程可能在某些实施例中不再赘述。下面将结合附图,对本技术的实施例进行描述。
71.图2是本技术一实施例提供的运维知识在线问答方法的流程示意图,该方法可以由运维知识在线问答装置执行,该装置可以通过软件和/或硬件的方式实现,下面以服务器为执行主体对运维知识在线问答方法进行说明。如图2所示,本技术实施例提供的运维知识在线问答方法可以包括:
72.步骤s101:获取用户运维问题。
73.用户通过终端设备的显示界面输入用户运维问题,例如,可以通过终端设备中的网页、app、小程序等界面,输入用户运维问题,终端设备在接收到用户输入的用户运维问题之后,将用户运维问题发送至服务器,实现了服务器获取用户运维问题。
74.本技术实施例对具体的用户运维问题不做限制,例如,可以是在运维过程中不同场景下的具体操作流程、管理方法等等。
75.步骤s102:对用户运维问题基于ann模型或者嵌套pattern进行问题泛化,并分别在运维知识图谱数据库中进行模板匹配生成第一运维知识答案,在es数据库中进行搜索生成多个第二运维知识答案。
76.服务器在获取到用户运维问题之后,对用户运维问题进行语义分析,在字面检索不能满足召回需求时,不能一味靠添加同义词完成泛化,需要真正从语义层面构建向量,然后进行语义索引的构建,用高效的向量检索引擎进行检索,作为召回的补充。ann的定义为近似最近邻,就是从多维稠密向量中,迅速找到某个点的临近点,这个临近点称为近似最近邻。在检索场景下,寻找近似最近邻的算法可以在多维向量空间中找到和query语义向量最相近的点。具体实现主要是基于局部敏感哈希。最终解决从query到文本段落的问题泛化能力建设。
77.本技术实施例还可以通过嵌套pattern对用户运维问题进行问题泛化,嵌套pattern主要针对于图谱类检索数据,相较于传统的query遍历方式,采用pattern 槽位增加问题泛化能力。同时支持嵌套能力,pattern允许嵌套,即高级pattern可以包含低级pattern。高级pattern指的比较类或最值类问法,低级pattern主要值简单的spo类问法。通过嵌套pattern解析满足从query到图谱检索语句的映射。
78.在对用户运维问题基于ann模型或者嵌套pattern进行问题泛化之后,分别在运维知识图谱数据库中进行模板匹配生成第一运维知识答案。其中,第一运维知识答案可以为1个或多个。再例如,还可以通过对用户运维问题进行问题泛化、语义分析、关键词提取等方式,在es数据库中进行匹配,检索多个第二运维知识答案。
79.本技术实施例对如何根据用户运维问题在运维知识图谱数据库以及es数据库中进行检索的方式,不做限制,在一种可能的实施方式中,可以通过对用户运维问题进行分词、多轮、语义分析、提取关键词、长句理解等操作,对用户运维问题进行处理,在知识图谱数据库和es数据库中分别基于语义分析、图分析和文本特征属性进行检索,生成多个运维知识答案。
80.本技术实施例中可以通过对用户运维问题进行语义分析及关键词提取,在知识图谱数据库中基于语义分析进行检索,在es数据库中基于图分析进行检索以及基于文本特征属性进行检索,生成多个运维知识答案,其中,基于文本特征属性进行检索例如可以是基于excel表的表名、内容位置信息以及单元格进行检索等,通过不同的检索方式,在知识图谱数据库和es数据库中进行检索,可以检索到多个运维知识答案,保证了运维知识答案的全面性和可靠性。
81.步骤s103:按照第一运维知识答案在第二运维知识之前的第一排序策略,以及多个第二运维答案的点击调权排序策略,对多个运维知识答案进行排序,并推送多个运维知识答案中的目标运维知识答案。
82.多个运维知识答案包括第一运维知识答案和第二运维知识答案,点击调权排序策略用于根据多个第二运维知识答案的点击量对多个第二运维知识答案进行排序。
83.其中,多个运维知识答案包括第一运维知识答案和多个第二运维知识答案,预设排序规则包括第一排序策略和点击调权排序策略,第一排序策略为第一运维知识答案在前,第二运维知识答案在后。
84.服务器在生成多个运维知识答案之后,可能存在一些运维知识答案与用户运维问题之间的相关性并不是很高,为了便于用户的查看,提高运维知识在线问答的效率,本技术实施例中,通过根据预设排序规则对多个运维知识答案进行排序,并推送多个运维知识答案中的目标运维知识答案,实现对多个运维知识答案的筛选。本技术实施例对目标运维知识答案的数量不做限制,据可以根据页面可显示数量、用户设置等方式确定。
85.本技术实施例中,通过将第一运维知识答案在前,第二运维知识答案在后,方便用户优先选择运维知识图谱中检索到的运维知识答案,可以提高用户的检索效率。
86.在第一运维知识答案在前,第二运维知识答案在后的整体顺序下,还可以通过预设排序规则,对分别对第一运维知识答案和第二运维知识答案进行排序。
87.本技术实施例对如何根据预设排序规则对多个运维知识答案进行排序的具体实现方式不做限制,例如,预设排序规则还可以是根据运维知识答案的热门程度、对运维知识答案的检索方式、对运维知识答案的点赞或采纳次数等进行排序,然后将排序靠前的目标运维知识答案推送至用户。本技术实施例对目标运维知识答案的数量不做限制,具体例如可以根据终端设备界面可显示的数量、检索到的多个运维知识答案的数量等进行设置,本技术实施例不限于此。
88.下面以对多个第二运维知识答案按照点击调权排序策略进行排序为例,进行说明。在一种可能的实施方式中,本技术实施例提供的运维知识在线问答方法,点击调权排序策略,包括:
89.确定在用户运维问题下,不同用户对多个第二运维知识答案的点击量;利用各第二运维知识答案的点击量确定各第二运维知识答案的权重;按照各第二运维知识答案的权
重大小,对多个第二运维知识答案进行排序。
90.在同一个用户运维问题下,不同用户对多个运维知识答案的点击量可以一定程度上反映该运维知识答案与该用户运维问题的匹配程度,若不同用户对某个第二运维知识答案的点击量越多,表示该第二运维知识答案与该用户运维问题之间的匹配度越高,则可以通过增加该第二运维知识答案的权重,并将权重值较高的第二运维知识答案排在前面,有利于用户选择更加合适的运维知识答案,提高了用户的检索效率。
91.本技术实施例中,通过按照不同用户对第二运维知识答案的点击量确定各第二运维知识答案的权重,并按照各第二运维知识答案的权重大小,对多个第二运维知识答案进行排序,不仅可以提高第二运维知识答案的可靠性,还可以提高用户的检索效率。
92.在上述实施例的基础上,可能存在新加入至es数据库的内容,由于新加入至es数据库的内容可能还没有用户点击,通过点击量对新加入至es数据库中的内容进行排序显失公平,不利于用户的检索效果。为了解决上述问题,在一种可能的实施方式中,本技术实施例提供的运维知识在线问答方法,还包括:
93.若多个第二运维知识答案中存在新的运维知识答案,则将新的运维知识答案的权重设置为预设值,新的运维知识答案加入es数据库的时间小于预设时间。
94.本技术实施例中,通过对新的运维知识答案的权重设置预设值,避免了新的运维知识答案由于被用户点击数量过低而被埋没,进一步保证了第二运维知识答案的可靠性。本技术实施例新的运维知识答案的权重设置的预设值不做限制,在一种可能的实施方式中,新的运维知识答案的权重设置的预设值可以是某个固定值,比如0.4或0.5或0.6等。在另一种可能的实施方式中,新的运维知识答案的权重设置的预设值,也可以是多个第二运维知识答案的权重的均值。本技术实施例仅以此为例,并不限于此。
95.为便于介绍,示例性的,图3是本技术一实施例提供的终端设备的界面示意图,如图3所示,服务器推送多个运维知识答案中的目标运维知识答案至终端设备,终端设备通过终端设备显示界面a,显示多个目标运维知识答案的超链接,例如目标运维知识答案分别为目标运维知识答案1、目标运维知识答案2、目标运维知识答案3。其中,目标运维知识答案1可以为第一运维知识答案,目标运维知识答案2和目标运维知识答案3可以为第二运维知识答案。用户点击目标运维知识答案1的超链接之后,终端设备的显示界面切换至终端设备显示界面b,呈现目标运维知识答案1的具体内容。本技术实施例仅以此为例,并不限于此。
96.本技术实施例中,通过对用户运维问题基于ann模型或者嵌套pattern进行问题泛化,并分别在运维知识图谱数据库和es数据库中进行检索,生成多个运维知识答案,并按照预设排序规则对多个运维知识答案进行排序,将知识图谱数据库检索到的运维知识答案排在es数据库中检索到的运维知识答案之前,并筛选出目标运维知识答案推送给用户,相比于现有技术中通过问答知识库进行检索问答信息方式,不仅可以提高运维知识在线问答的效率、检索准确率,可以精准触达结果,还可以实现从传统知识库到智能知识库的跃升。
97.在图2所示的实施例的基础上,在一种可能的实施方式中,图4是本技术另一实施例提供的运维知识在线问答方法的流程示意图,该方法可以由运维知识在线问答装置执行,该装置可以通过软件和/或硬件的方式实现,下面以服务器为执行主体对运维知识在线问答方法进行说明,如图4所示,本技术实施例提供的运维知识在线问答方法,在步骤s101获取用户运维问题之前,还可以包括:
98.步骤s201:获取运维知识数据集合,运维知识数据集合包括结构化数据和非结构化数据。
99.运维知识数据集合中包括多种运维知识数据,通过数据采集可以获取运维知识数据,运维知识数据可以通过系统中的日志文件、互联网页面、数据库(data base,db)以及外部应用程序编程接口(application programming interface;api)等获取,通过对运维知识数据进行处理,生成运维知识数据集合,运维知识数据集合包括结构化数据和非结构化数据。
100.步骤s202:根据运维知识数据的多级主题对运维知识数据集合进行场景归类,并对运维知识数据集合进行标注。
101.运维知识数据存在不同的主题,根据自上而下多级主题,对运维知识数据集合进行场景归类,并对运维知识数据集合的场景进行标注。运维知识数据的主题类别可以根据实际情况进行设置,例如,运维知识数据可以分为主题分类层、概念层、实体层及事件层等。
102.步骤s203:分别对标注后的结构化数据进行知识引入、属性映射、数据清洗和数据融合,对标注后的非结构化数据进行知识抽取、属性映射、数据清洗和数据融合,生成运维知识图谱数据库。
103.在对运维知识数据集合进行标注之后,针对标注后的结构化数据,进行知识引入、属性映射、数据清洗以及数据融合的操作,对标注后的非结构化数据进行知识抽取、属性映射、数据清洗和数据融合的操作,生成运维知识图谱数据库。本技术实施例对知识引入、知识抽取、属性映射、数据清洗以及数据融合等具体算法不做限制,具体可以根据实际需求进行选择,本技术实施例对此不做限制。本技术实施例中,通过对运维知识数据集合进行数据处理和数据融合,生成了运维知识图谱数据库,可以保证运维知识问答系统的可靠性和运维知识答案的准确性。
104.非结构化数据可能包括excel数据表、word文件、html文件等,在一种可能的实施方式中,本技术实施例提供的运维知识在线问答方法,非结构化数据包括excel数据表,对标注后的非结构化数据进行知识抽取,包括:
105.按照excel数据表的行头或列头的顺序遍历excel数据表;确定excel数据表各行之间或各列之间的内容重复度;按照内容重复度,确定excel数据表的spo三元组,以进行知识抽取。
106.为便于介绍,例如,excel数据表中包括多行服务器数据,每行服务器数据包括服务器的型号、中央处理器(central processing unit,cpu)、内存等信息,通过按照excel数据表每行的行头,获取每行的内容,并确定各行之间内容的内容重复度,若内容重复度超过预设阈值,则可以确定抽取excel数据表每行的数据作为spo三元组,例如“服务器1,型号1,48核处理器,128g内存”等。与此类似,还可以按照excel数据表的列头,获取每列的内容并确定每列之间内容的内容重复度,进而根据内容重复度对excel数据表进行知识抽取。
107.本技术实施例中,通过按照excel数据表的行头或列头的顺序遍历excel数据表,并按照excel数据表各行之间或各列之间的内容重复度,对excel数据表进行知识抽取,提高了对excel数据表进行知识抽取的效率和准确度,本技术实施例中,采用上述无schema文本抽取策略,相比于现有技术中的schema文本抽取策略,可以降低运维知识图谱数据库构建的成本。
108.在上述实施例的基础上,在一种可能的实施方式中,运维知识图谱数据库包括运维知识图谱实体库和运维知识图谱属性库,本技术实施例提供的运维知识在线问答方法还可以包括:对运维知识图谱实体库和运维知识图谱属性库进行别名配置,确定运维知识图谱数据库的同义词表。
109.通过对运维知识图谱实体库和运维知识图谱属性库进行别名配置,确定运维知识图谱数据库的同义词表,在对用户运维问题在运维知识图谱数据库中进行匹配时,可以同时在运维知识图谱数据库的同义词表中进行匹配,以提高用户运维问题的匹配率,进而可以提高运维知识答案的准确性以及提高运维知识在线问答的效率。
110.在上述实施例的基础上,在另一种可能的实施方式中,本技术实施例提供的运维知识在线问答方法,还包括:对用户运维问题进行统计分析;将超过第一预设数量的用户运维问题标记为热点知识,并将热点知识存储在运维知识图谱数据库的热门运维知识库中。
111.用户运维问题代表了用户的需求,通过对用户运维问题进行统计分析,可以了解到用户对哪方面的运维知识的需求量较大或者更感兴趣,通过设置第一预设数量,并将超过第一预设数量的用户运维问题标记为热点知识,进而将热点知识存储在运维知识图谱数据库的热门运维知识库中。
112.在根据用户运维问题在运维知识图谱数据库中进行模板匹配的过程中,可以通过优先在热门运维知识库中搜索运维知识答案,并将在热门运维知识库中的运维知识答案,作为目标运维知识答案推送至用户,进而提高目标运维知识的可靠性。
113.图5是本技术一实施例提供的运维知识问答方法的架构示意图,如图5所示,本技术实施例提供的架构主要包括图谱生产、全文生产、检索策略和智能检索&问答四个方面,其中,图谱生产用于构建运维知识图谱数据库,全文生产用于构建es数据库,检索策略和智能检索&问答,用于分别在es数据库和运维知识图谱数据库中进行检索运维知识答案。其中,图谱生产过程中包括data-push、data-clean、data-fusion以及data-buile构建neo4j,全文生产过程包括data-push、word-segment、text-build,在服务器通过app、app-plugin获取到用户运维问题之后,通过对用户运维问题进行pattern-analyze和web-server,在运维知识图谱数据库和es数据库中检索运维知识答案。下述为本技术装置实施例,可以用于执行本技术方法实施例。对于本技术装置实施例中未披露的细节,请参照本技术方法实施例。
114.图6是本技术一实施例提供的运维知识在线问答装置的结构示意图,该装置可以通过软件和/或硬件的方式实现,例如可以通过服务器实现,如图6所示,本技术实施例提供的运维知识在线问答装置可以包括:获取模块31、生成模块32和推送模块33。
115.获取模块31,用于获取用户运维问题。
116.生成模块32,用于对用户运维问题基于人工神经网络ann模型或者嵌套pattern进行问题泛化,并分别在运维知识图谱数据库中进行模板匹配生成第一运维知识答案,在分布式搜索es数据库中进行搜索生成多个第二运维知识答案。
117.推送模块33,用于按照第一运维知识答案在第二运维知识之前的第一排序策略,以及多个第二运维答案的点击调权排序策略,对多个运维知识答案进行排序,并推送多个运维知识答案中的目标运维知识答案,多个运维知识答案包括第一运维知识答案和第二运维知识答案,点击调权排序策略用于根据多个第二运维知识答案的点击量对多个第二运维
知识答案进行排序。
118.在一种可能的实施方式中,本技术实施例提供的运维知识在线问答装置,推送模块33,还用于:
119.确定在用户运维问题下,不同用户对多个第二运维知识答案的点击量;利用各第二运维知识答案的点击量确定各第二运维知识答案的权重;按照各第二运维知识答案的权重大小,对多个第二运维知识答案进行排序。
120.在一种可能的实施方式中,本技术实施例提供的运维知识在线问答装置,推送模块33还用于:
121.若多个第二运维知识答案中存在新的运维知识答案,则将新的运维知识答案的权重设置为预设值,新的运维知识答案加入es数据库的时间小于预设时间。
122.本实施例的装置可以执行上述图2所示的方法实施例,其技术原理和技术效果与上述实施例相似,此处不再赘述。
123.在图6所示实施例的基础上,进一步地,图7是本技术另一实施例提供的运维知识在线问答装置的结构示意图,该装置可以通过软件和/或硬件的方式实现,例如可以通过服务器实现,如图7所示,本技术实施例提供的运维知识在线问答装置,还可以第一处理模块34。
124.获取模块31,还用于获取运维知识数据集合,运维知识数据集合包括结构化数据和非结构化数据。
125.第一处理模块34,用于根据运维知识数据的多级主题对运维知识数据集合进行场景归类,并对运维知识数据集合进行标注。
126.第一处理模块34,还用于分别对标注后的结构化数据进行知识引入、属性映射、数据清洗和数据融合,对标注后的非结构化数据进行知识抽取、属性映射、数据清洗和数据融合,生成运维知识图谱数据库。
127.在一种可能的实施方式中,本技术实施例提供的运维知识在线问答装置,非结构化数据包括excel数据表,第一处理模块34具体用于:
128.按照excel数据表的行头或列头的顺序遍历excel数据表;确定excel数据表各行之间或各列之间的内容重复度;按照内容重复度,确定excel数据表的主谓宾spo三元组,以进行知识抽取。
129.在一种可能的实施方式中,本技术实施例提供的运维知识在线问答装置,运维知识图谱数据库包括运维知识图谱实体库和运维知识图谱属性库,第一处理模块34,还用于:
130.对运维知识图谱实体库和运维知识图谱属性库进行别名配置,确定运维知识图谱数据库的同义词表。
131.在上述实施例的基础上,进一步地,如图7所示,本技术实施例提供的运维知识在线问答装置,还可以包括第二处理模块35。
132.第二处理模块35,用于对用户运维问题进行统计分析;将超过第一预设数量的用户运维问题标记为热点知识,并将热点知识存储在运维知识图谱数据库的热门运维知识库中。
133.本实施例的装置可以执行上述图4所示的方法实施例,其技术原理和技术效果与上述实施例相似,此处不再赘述。
134.本技术所提供的装置实施例仅仅是示意性的,图6和图7中的模块划分仅仅是一种逻辑功能划分,实际实现时可以有另外的划分方式。例如多个模块可以结合或者可以集成到另一个系统。各个模块相互之间的耦合可以是通过一些接口实现,这些接口通常是电性通信接口,但是也不排除可能是机械接口或其它的形式接口。因此,作为分离部件说明的模块可以是或者也可以不是物理上分开的,既可以位于一个地方,也可以分布到同一个或不同设备的不同位置上。
135.图8是本技术实施例提供的电子设备的结构示意图,电子设备可以为服务器,如图8所示,该电子设备包括:
136.接收器40、发送器41、处理器42和存储器43以及计算机程序;其中,接收器40和发送器41,实现与其他设备之间的数据传输,计算机程序被存储在存储43中,并且被配置为由处理器42执行,计算机程序包括用于执行上述运维知识在线问答方法的指令,其内容及效果请参考方法实施例。
137.此外,本技术实施例还提供一种计算机可读存储介质,计算机可读存储介质中存储有计算机执行指令,当用户设备的至少一个处理器执行该计算机执行指令时,用户设备执行上述各种可能的方法。
138.其中,计算机可读介质包括计算机存储介质和通信介质,其中通信介质包括便于从一个地方向另一个地方传送计算机程序的任何介质。存储介质可以是通用或专用计算机能够存取的任何可用介质。一种示例性的存储介质耦合至处理器,从而使处理器能够从该存储介质读取信息,且可向该存储介质写入信息。当然,存储介质也可以是处理器的组成部分。处理器和存储介质可以位于asic中。另外,该asic可以位于用户设备中。当然,处理器和存储介质也可以作为分立组件存在于通信设备中。
139.本领域普通技术人员可以理解:实现上述各方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成。前述的程序可以存储于一计算机可读取存储介质中。该程序在执行时,执行包括上述各方法实施例的步骤;而前述的存储介质包括:rom、ram、磁碟或者光盘等各种可以存储程序代码的介质。
140.本技术实施例还提供一种计算机程序产品,包括计算机指令,该计算机指令被处理器执行时实现上述实施例中方法中的各个步骤。
141.本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本技术的其它实施方案。本技术旨在涵盖本技术的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本技术的一般性原理并包括本技术未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本技术的真正范围和精神由下面的权利要求书指出。
142.应当理解的是,本技术并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本技术的范围仅由所附的权利要求书来限制。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献