一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种基于知识图谱的冶金知识问答方法及系统与流程

2022-03-26 12:04:33 来源:中国专利 TAG:


1.本发明涉及智能冶金领域,尤其涉及一种基于知识图谱的冶金知识问答方法及系统。


背景技术:

2.目前知识图谱领域蓬勃发展,并广泛应用于通用领域和垂直领域的知识管理。然而传统冶金行业的生产管理方面也存在着以下问题:
3.1)缺少冶金行业故障知识的整合库,不利于冶金从业人员快速获取生产故障原因及解决方案;
4.2)现有的知识库语义检索准确率、高效性不高且智能化程度不高,不能很好的支持近义词、不同表达方式的相同语义识别;
5.3)多数检索平台仅仅采取文字输入的方式,用户输入文字较为繁琐,便捷性差。


技术实现要素:

6.鉴于以上现有技术存在的问题,本发明提出一种基于知识图谱的冶金知识问答方法及系统,主要解决冶金行业传统检索方式操作繁琐,影响作业效率的问题。
7.为了实现上述目的及其他目的,本发明采用的技术方案如下。
8.一种基于知识图谱的冶金知识问答方法,包括:
9.获取冶金相关的询问语音,并将所述询问语音转换为第一文本向量;
10.根据预设的冶金知识图谱,从冶金描述文本数据中获取冶金过程对应的实体信息,并根据所述实体信息创建问答向量库,所述问答库中包含问题向量以及对应的答复向量;
11.根据所述第一文本向量从所述问答向量库中获取多个匹配的问题向量,并对所述匹配的问题向量进行排序,根据排序结果获取对应问题向量的答复向量并输出。
12.可选地,根据所述第一文本向量从所述问答向量库中获取多个匹配的问题向量,包括:
13.利用关键词搜索引擎对所述第一文本向量进行分词,获取多个词向量,根据所述词向量从已有的故障报告以及故障文本中获取匹配的关键词,构建关联词向量,并根据所述关联词向量从所述问答向量库中获取多个匹配的问题向量;和/或,
14.利用向量搜索引擎将所述第一文本向量和所述问答向量库中的问题向量映射到同一个语义向量空间,通过相似度检索算法从所述语义向量空间中获取与所述第一文本向量相似度达到所述设定阈值的问题向量。
15.可选地,所述关键词搜索引擎包括:elasticsearch搜索引擎。
16.可选地,所述向量搜索引擎包括:faiss引擎和/或annoy引擎。
17.可选地,根据预设的冶金知识图谱,从冶金描述文本数据中获取冶金过程对应的实体信息,并根据所述实体信息创建问答向量库,包括:
18.获取所述冶金知识图谱中的多组实体关系,根据所述实体关系构建第一句子向量;
19.将所述冶金描述文本数据拆分为多个子句,每个所述子句作为第二句子向量;
20.将所述第一句子向量和所述第二句子向量输入预训练的句子向量模型进行相似度比对,获取与所述第一句子向量匹配的第二句子向量,作为问题向量;
21.设置各所述问题向量对应的答复向量,创建所述问答向量库。
22.可选地,所述冶金描述文本数据包括:冶金故障报告、故障总结。
23.可选地,对所述匹配的问题向量进行排序,包括:
24.通过深度学习排序算法获取所述匹配的问题向量与所述第一文本向量的相似度值,根据所述相似度值对所述多个匹配的问题向量进行排序。
25.可选地,所述深度学习排序算法包括:关键词检索算法、bm25算法和/或余弦相似度算法。
26.一种基于知识图谱的冶金知识问答系统,包括:
27.语音识别模块,用于获取冶金相关的询问语音,并将所述询问语音转换为第一文本向量;
28.问答向量库创建模块,用于根据预设的冶金知识图谱,从冶金描述文本数据中获取冶金过程对应的实体信息,并根据所述实体信息创建问答向量库,所述问答库中包含问题向量以及对应的答复向量;
29.输出响应模块,用于根据所述第一文本向量从所述问答向量库中获取多个匹配的问题向量,并对所述匹配的问题向量进行排序,根据排序结果获取对应问题向量的答复向量并输出。
30.如上所述,本发明一种基于知识图谱的冶金知识问答方法及系统,具有以下有益效果。
31.利用预设的知识图谱获取冶金行业较为全面的冶金知识数据,通过语音输入快速完成冶金信息的检索匹配,获取需要的数据输出,为作业人员提供便捷的检索方式的同时,提高数据输出的准确性和有效性。
附图说明
32.图1为本发明一实施例中基于知识图谱的冶金知识问答方法的流程示意图。
具体实施方式
33.以下通过特定的具体实例说明本发明的实施方式,本领域技术人员可由本说明书所揭露的内容轻易地了解本发明的其他优点与功效。本发明还可以通过另外不同的具体实施方式加以实施或应用,本说明书中的各项细节也可以基于不同观点与应用,在没有背离本发明的精神下进行各种修饰或改变。需说明的是,在不冲突的情况下,以下实施例及实施例中的特征可以相互组合。
34.需要说明的是,以下实施例中所提供的图示仅以示意方式说明本发明的基本构想,遂图式中仅显示与本发明中有关的组件而非按照实际实施时的组件数目、形状及尺寸绘制,其实际实施时各组件的型态、数量及比例可为一种随意的改变,且其组件布局型态也
可能更为复杂。
35.请参阅图1,本发明提供基于知识图谱的冶金知识问答方法,包括以下步骤。
36.步骤s01,获取冶金相关的询问语音,并将所述询问语音转换为第一文本向量;
37.步骤s02,根据预设的冶金知识图谱,从冶金描述文本数据中获取冶金过程对应的实体信息,并根据所述实体信息创建问答向量库,所述问答库中包含问题向量以及对应的答复向量;
38.步骤s03,根据所述第一文本向量从所述问答向量库中获取多个匹配的问题向量,并对所述匹配的问题向量进行排序,根据排序结果获取对应问题向量的答复向量并输出。
39.在一实施例中,语音录入功能可采用了现有的语音实时转写工具。前端调用对应的语音转写api,将语音流实时转换为文字信息,输入到问答对话框中实现了语音智能输入,具体的语音转写工具可根据实际应用需求进行选择,这里不作限制。
40.在一实施例中,精准识别用户语音输入的冶金会话后,可利用自然语言处理技术hanlp对冶金会话进行预处理并转换成语义向量(即第一文本向量)。具体地,利用hanlp工具及收集的冶金行业专用名词词典对冶金会话进行分词、词性标注、实体识别、纠错及语义召回等预处理,并进一步利用句子向量模型sentence bert将问题语句转换成词向量,得到对应的第一文本向量。
41.在一实施例中,根据预设的冶金知识图谱,从冶金描述文本数据中获取冶金过程对应的实体信息,并根据所述实体信息创建问答向量库,包括:
42.获取所述冶金知识图谱中的多组实体关系,根据所述实体关系构建第一句子向量;
43.将所述冶金描述文本数据拆分为多个子句,每个所述子句作为第二句子向量;
44.将所述第一句子向量和所述第二句子向量输入预训练的句子向量模型进行相似度比对,获取与所述第一句子向量匹配的第二句子向量,作为问题向量;
45.设置各所述问题向量对应的答复向量,创建所述问答向量库。
46.具体地,可收集冶金行业的相关资料如故障描述文本、故障汇总解决方案等,通过提取实体-关系-实体或实体-关系-属性三元组,生成对应的知识图谱。具体的知识图谱构建过程可采用现有技术,这里不再赘述。基于预先构建的底层知识图谱中的实体关系,通过搜集冶金故障报告和故障总结,抽取出故障知识,并利用句子向量模型sentence bert构建故障问答向量库。
47.在一实施例中,根据所述第一文本向量从所述问答向量库中获取多个匹配的问题向量,包括:
48.利用关键词搜索引擎对所述第一文本向量进行分词,获取多个词向量,根据所述词向量从已有的故障报告以及故障文本中获取匹配的关键词,构建关联词向量,并根据所述关联词向量从所述问答向量库中获取多个匹配的问题向量;和/或,
49.利用向量搜索引擎将所述第一文本向量和所述问答向量库中的问题向量映射到同一个语义向量空间,通过相似度检索算法从所述语义向量空间中获取与所述第一文本向量相似度达到所述设定阈值的问题向量。
50.在一实施例中,利用关键词搜索引擎进行关键词召回,关键词搜索引擎可采用elasticsearch搜索引擎,elasticsearch将第一文本向量进行自动分词处理,并在非结构
化故障报告及故障文本中进行全文索引和相关性搜索,快速获取高匹配度返回结果。
51.在一实施例中,利用向量搜索引擎进行语义召回,向量搜索引擎可采用faiss或annoy向量索引算法,faiss或annoy索引算法为问答向量库中的问题向量构建一个索引,用户输入问题和问答向量库中的问题被映射到同一个语义向量空间,通过ann算法快速获得最相似的k个问题向量。
52.在一实施例中,对所述匹配的问题向量进行排序,包括:
53.通过深度学习排序算法获取所述匹配的问题向量与所述第一文本向量的相似度值,根据所述相似度值对所述多个匹配的问题向量进行排序。
54.具体地,所述深度学习排序算法,包括:结合传统的关键词检索、bm25、cosine相似度算法以及一些基于神经网络训练的word2vec模型或者卷积匹配模型等共同对topk问题进行排序。
55.完成排序后,可将排序结果反馈给用户,每个问题向量对应一个索引信息,用户可通过语音输入匹配对应的索引信息,进行问题选择。根据用户选择输出对应问题向量对应的答复向量。答复向量对应具体问题的解决方案,可在通过知识图谱从各非结构化冶金描述文本中获取问题向量后,基于获取的问题向量配置对应的解决方案作为问题向量对应的答复向量,存储在问答向量库中。
56.在一实施例中,问答流程包括:
57.步骤1,利用sentence bert语意向量模型将提出的问题转换成语义向量,同时基于底层知识图谱抽取构建故障问答向量库;
58.步骤2,结合elasticsearch关键词召回及faiss、annoy向量召回技术,将问题向量与问答向量库训练的语义向量进行相似度对比,获取与提出的问题相似的topk问题;
59.步骤3,利用排序算法对topk问题进行排序,从而关联出输入问题的最佳答案。
60.本实施例中还提供了一种基于知识图谱的冶金知识问答系统,用于执行前述方法实施例中所述的基于知识图谱的冶金知识问答方法。由于系统实施例的技术原理与前述方法实施例的技术原理相似,因而不再对同样的技术细节做重复性赘述。
61.在一实施例中,基于知识图谱的冶金知识问答系统,包括:
62.语音识别模块,用于获取冶金相关的询问语音,并将所述询问语音转换为第一文本向量;
63.问答向量库创建模块,用于根据预设的冶金知识图谱,从冶金描述文本数据中获取冶金过程对应的实体信息,并根据所述实体信息创建问答向量库,所述问答库中包含问题向量以及对应的答复向量;
64.输出响应模块,用于根据所述第一文本向量从所述问答向量库中获取多个匹配的问题向量,并对所述匹配的问题向量进行排序,根据排序结果获取对应问题向量的答复向量并输出。
65.综上所述,本发明一种基于知识图谱的冶金知识问答方法及系统,支持问答会话语音输入,不需要手动输入,极大地节省了冶金一线从业人员的时间;借助底层知识图谱搭建了一个较为全面的冶金故障知识库,帮助冶金从业人员快速获取生产故障原因及解决方案;基于关键词搜索引擎和向量搜索引擎结合的搜索匹配索引技术大大提高了搜索的准确率,并且支持语义理解实现了问答的智能化;能够达到毫秒级响应的高校检索,更适合钢铁
生产场景。所以,本发明有效克服了现有技术中的种种缺点而具高度产业利用价值。
66.上述实施例仅例示性说明本发明的原理及其功效,而非用于限制本发明。任何熟悉此技术的人士皆可在不违背本发明的精神及范畴下,对上述实施例进行修饰或改变。因此,举凡所属技术领域中具有通常知识者在未脱离本发明所揭示的精神与技术思想下所完成的一切等效修饰或改变,仍应由本发明的权利要求所涵盖。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献