一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

事务信息查询方法、装置、计算机设备及存储介质与流程

2022-04-16 16:25:54 来源:中国专利 TAG:


1.本技术涉及人工智能技术领域,尤其涉及一种事务信息查询方法、装置、计算机设备及存储介质。


背景技术:

2.在日常生活中,常常会遇到各种事务流程相关的公文,这些公文记录了既定的事务流程。人们在办理事务时,需要按照公文的规定去办理。这些条文常常显得冗长繁杂,难以直接获取到有用的信息。虽然可以在相关机构中安排经办人员帮忙解读公文、辅助办理,但由于公文定义的事务流程可能存在变动、经办人员专业程度存在差异,用户还是存在难以便利地获取到有用信息的情况。


技术实现要素:

3.本技术实施例的目的在于提出一种事务信息查询方法、装置、计算机设备及存储介质,以解决事务信息获取效率较低的问题。
4.为了解决上述技术问题,本技术实施例提供一种事务信息查询方法,采用了如下所述的技术方案:
5.获取事务信息文本;
6.识别所述事务信息文本中的事件以及各事件之间的事理关系,并识别所述事件中的本体以及各本体之间的本体关系;
7.根据所述事件、所述事理关系、所述本体和所述本体关系,构建语义网框架;
8.基于所述语义网框架生成所述事务信息文本所对应的事务知识图谱;
9.获取事务查询文本;
10.计算所述事务查询文本与所述事务知识图谱中各节点的语义相似度,并根据所述语义相似度和所述事务知识图谱确定事务信息查询结果。
11.为了解决上述技术问题,本技术实施例还提供一种事务信息查询装置,采用了如下所述的技术方案:
12.文本获取模块,用于获取事务信息文本;
13.文本识别模块,用于识别所述事务信息文本中的事件以及各事件之间的事理关系,并识别所述事件中的本体以及各本体之间的本体关系;
14.框架构建模块,用于根据所述事件、所述事理关系、所述本体和所述本体关系,构建语义网框架;
15.图谱生成模块,用于基于所述语义网框架生成所述事务信息文本所对应的事务知识图谱;
16.查询获取模块,用于获取事务查询文本;
17.事务查询模块,用于计算所述事务查询文本与所述事务知识图谱中各节点的语义相似度,并根据所述语义相似度和所述事务知识图谱确定事务信息查询结果。
18.为了解决上述技术问题,本技术实施例还提供一种计算机设备,采用了如下所述的技术方案:
19.获取事务信息文本;
20.识别所述事务信息文本中的事件以及各事件之间的事理关系,并识别所述事件中的本体以及各本体之间的本体关系;
21.根据所述事件、所述事理关系、所述本体和所述本体关系,构建语义网框架;
22.基于所述语义网框架生成所述事务信息文本所对应的事务知识图谱;
23.获取事务查询文本;
24.计算所述事务查询文本与所述事务知识图谱中各节点的语义相似度,并根据所述语义相似度和所述事务知识图谱确定事务信息查询结果。
25.为了解决上述技术问题,本技术实施例还提供一种计算机可读存储介质,采用了如下所述的技术方案:
26.获取事务信息文本;
27.识别所述事务信息文本中的事件以及各事件之间的事理关系,并识别所述事件中的本体以及各本体之间的本体关系;
28.根据所述事件、所述事理关系、所述本体和所述本体关系,构建语义网框架;
29.基于所述语义网框架生成所述事务信息文本所对应的事务知识图谱;
30.获取事务查询文本;
31.计算所述事务查询文本与所述事务知识图谱中各节点的语义相似度,并根据所述语义相似度和所述事务知识图谱确定事务信息查询结果。
32.与现有技术相比,本技术实施例主要有以下有益效果:识别记录事务流程的事务信息文本中的事件以及事件之间的事理关系,并识别事件中的本体以及本体之间的本体关系,然后构建语义网框架,语义网框架具有丰富的语义表达能力,可以准确全面地描述事务信息;根据语义网框架构建事务知识图谱,从而以图谱的形式展示事务流程;将事务查询文本转化为表征向量,计算与事务知识图谱中各节点的语义相似度,从而确定事务查询文本在事务知识图谱中所在的位置,从而可以准确从事务知识图谱中确定事务查询结果,自动匹配出所需的事务信息,提高了事务信息获取效率。
附图说明
33.为了更清楚地说明本技术中的方案,下面将对本技术实施例描述中所需要使用的附图作一个简单介绍,显而易见地,下面描述中的附图是本技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
34.图1是本技术可以应用于其中的示例性系统架构图;
35.图2是根据本技术的事务信息查询方法的一个实施例的流程图;
36.图3是根据本技术的事务信息查询装置的一个实施例的结构示意图;
37.图4是根据本技术的计算机设备的一个实施例的结构示意图。
具体实施方式
38.除非另有定义,本文所使用的所有的技术和科学术语与属于本技术的技术领域的
技术人员通常理解的含义相同;本文中在申请的说明书中所使用的术语只是为了描述具体的实施例的目的,不是旨在于限制本技术;本技术的说明书和权利要求书及上述附图说明中的术语“包括”和“具有”以及它们的任何变形,意图在于覆盖不排他的包含。本技术的说明书和权利要求书或上述附图中的术语“第一”、“第二”等是用于区别不同对象,而不是用于描述特定顺序。
39.在本文中提及“实施例”意味着,结合实施例描述的特定特征、结构或特性可以包含在本技术的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例,也不是与其它实施例互斥的独立的或备选的实施例。本领域技术人员显式地和隐式地理解的是,本文所描述的实施例可以与其它实施例相结合。
40.为了使本技术领域的人员更好地理解本技术方案,下面将结合附图,对本技术实施例中的技术方案进行清楚、完整地描述。
41.如图1所示,系统架构100可以包括终端设备101、102、103,网络104和服务器105。网络104用以在终端设备101、102、103和服务器105之间提供通信链路的介质。网络104可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。
42.用户可以使用终端设备101、102、103通过网络104与服务器105交互,以接收或发送消息等。终端设备101、102、103上可以安装有各种通讯客户端应用,例如网页浏览器应用、购物类应用、搜索类应用、即时通信工具、邮箱客户端、社交平台软件等。
43.终端设备101、102、103可以是具有显示屏并且支持网页浏览的各种电子设备,包括但不限于智能手机、平板电脑、电子书阅读器、mp3播放器(moving picture expertsgroup audio layer iii,动态影像专家压缩标准音频层面3)、mp4(moving pictureexperts group audio layer iv,动态影像专家压缩标准音频层面4)播放器、膝上型便携计算机和台式计算机等等。
44.服务器105可以是提供各种服务的服务器,例如对终端设备101、102、103上显示的页面提供支持的后台服务器。
45.需要说明的是,本技术实施例所提供的事务信息查询方法一般由服务器执行,相应地,事务信息查询装置一般设置于服务器中。
46.应该理解,图1中的终端设备、网络和服务器的数目仅仅是示意性的。根据实现需要,可以具有任意数目的终端设备、网络和服务器。
47.继续参考图2,示出了根据本技术的事务信息查询方法的一个实施例的流程图。所述的事务信息查询方法,包括以下步骤:
48.步骤s201,获取事务信息文本。
49.在本实施例中,事务信息查询方法运行于其上的电子设备(例如图1所示的服务器)可以通过有线连接方式或者无线连接方式与终端进行通信。需要指出的是,上述无线连接方式可以包括但不限于3g/4g/5g连接、wifi连接、蓝牙连接、wimax连接、zigbee连接、uwb(ultra wideband)连接、以及其他现在已知或将来开发的无线连接方式。
50.具体地,服务器首先需要获取事务信息文本。事务信息文本记录了事务流程信息。例如,事务信息文本可以是政务公文,记录了既定的办事流程。事务信息文本中记录了至少一个事务流程。
51.需要强调的是,为进一步保证上述事务信息文本的私密和安全性,上述事务信息
文本还可以存储于一区块链的节点中。
52.本技术所指区块链是分布式数据存储、点对点传输、共识机制、加密算法等计算机技术的新型应用模式。区块链(blockchain),本质上是一个去中心化的数据库,是一串使用密码学方法相关联产生的数据块,每一个数据块中包含了一批次网络交易的信息,用于验证其信息的有效性(防伪)和生成下一个区块。区块链可以包括区块链底层平台、平台产品服务层以及应用服务层等。
53.步骤s202,识别事务信息文本中的事件以及各事件之间的事理关系,并识别事件中的本体以及各本体之间的本体关系。
54.具体地,对事务信息文本进行自然语言处理,以识别事务信息文本中所记录的事件以及事理关系。其中,事件是达成一个目标的流程所构成的整体,事理关系是指不同事件之间的关系。例如,“应届生如何落户s市”以及“应届生如何申请s市住房补贴”就是两个事件,两个事件可以是条件关系,“应届生申请s市住房补贴”的前提条件是“应届生落户s市”。
55.同时,还要识别事件中的本体以及各本体之间的本体关系。本体是事件中涉及到的实体,在前边“应届生如何落户s市”的例子中,可能出现的本体包括“应届生、户口、人力资源局、电话、137xxxxxxxx(电话号码)”等,其中,本体“电话”的属性值为“137xxxxxxxx”。
56.步骤s203,根据事件、事理关系、本体和本体关系,构建语义网框架。
57.具体地,根据识别到的事件、事理关系、本体和本体关系生成语义网框架。语义网框架用于结构化地描述事件、事理关系、本体和本体关系。在一个实施例中,语义网框架可以用owl语言描述,是用owl构建的描述体系。owl语言(web ontology language)是一种网络本体语言,是语义网技术栈的核心之一,可以快速、灵活地进行数据建模,对知识图谱进行语义层地描述。
58.知识图谱的基石是rdf(resource description framework),即资源描述框架,它的本质是一个数据模型,提供了一个统一的标准,用于描述实体或资源,是表示事物的一种方法和手段。在rdf中,rdfs(resource description framework schema)是基础的模式语言。然而,rdfs的表达能力依旧有限,因此后来发展出了owl进行数据建模,对知识图谱进行语义层的描述。
59.根据识别到的事件、事理关系、本体和本体关系,按照owl中的预设逻辑进行填充,即可得到基于owl的语义网框架。
60.以事务信息文本为政务公文为例,说明owl本体描述体系中的主要本体以及关系:
61.组织rdfs:class.organization;
62.企业:company,属于组织子类,rdfs:subclassof organization;
63.投资基金:fund,属于组织子类,rdfs:subclassof organization;
64.政府部门:govoffice,属于组织子类,rdfs:subclassof organization,如人社局,派出所;每个govoffice会和联系信息进行关联,联系信息是复合知识结构cvt,包括地址address,电话telephone等;
65.人:rdfs:class.person;
66.办事员:officer,属于人的子类,rdfs:subclassof person;
67.政务事务:即事件,rdfs:class.business,包括落户,办证等事务,政务事务是复合知识结构cvt,可以包含子事务,rdfs:class.subbusiness,属于政务事务的子类,rdfs:
subclassof business,如办理落户这件事,包含初审,原户口迁出,派出所登记等子事务,以及对应的部门和办事员等;
68.文件材料,rdfs:class.file,每个事务和子事务可能会涉及文件和材料,如落户的初审流程中,可能需要各种文件材料的提交;
69.各个事务之间有事理关系,代表事件之间的顺承、因果、条件和上下位等事理逻辑关系。如果一个办事流程中,需要先办事务a,才能到事务b,则事务a是事务b的前置流程,以rdfs:before进行表示,通过owl语义网络定义反关系rdfs:before owl:inverseof rdfs:after,自动推理事务b是事务a的后置流程rdfs:after。
70.步骤s204,基于语义网框架生成事务信息文本所对应的事务知识图谱。
71.具体地,基于owl构建的语义网框架是知识图谱的语义层描述,根据语义网框架可以生成事务知识图谱,事物知识图谱以图谱的形式展示了事务信息文本中的事件流程。事务知识图谱包括节点和连接边,连接边用于连接节点。节点和连接边都具有表征向量。
72.步骤s205,获取事务查询文本。
73.具体地,在进行应用时,需要获取事物查询文本。事物查询文本基于用户操作生成,例如,用户可以输入问题,将用户输入的问题作为事务查询文本,或者,对用户的语音问句进行语音识别,转换成事务查询文本。
74.步骤s206,计算事务查询文本与事务知识图谱中各节点的语义相似度,并根据语义相似度和事务知识图谱确定事务信息查询结果。
75.具体地,将事务查询文本转换为表征向量,知识图谱中的节点和边也具有表征向量。将事务查询文本与知识图谱中各节点的表征向量进行语义相似度的计算,其中,可以将表征向量之间的余弦相似度作为语义相似度。
76.根据语义相似度选取若干个节点。例如,选取语义相似度大于预设的相似度阈值的节点,然后在事务知识图谱中,从该节点出发,将所有可能的路径作为事务信息查询结果,将其返回给查询的用户,完成事务信息查询。由于事务知识图谱反应了事件流程,根据事务查询文本从事务知识图谱中截取到的事务信息查询结果也可以反应用户所需要的事件流程。
77.本实施例中,识别记录事务流程的事务信息文本中的事件以及事件之间的事理关系,并识别事件中的本体以及本体之间的本体关系,然后构建语义网框架,语义网框架具有丰富的语义表达能力,可以准确全面地描述事务信息;根据语义网框架构建事务知识图谱,从而以图谱的形式展示事务流程;将事务查询文本转化为表征向量,计算与事务知识图谱中各节点的语义相似度,从而确定事务查询文本在事务知识图谱中所在的位置,从而可以准确从事务知识图谱中确定事务查询结果,自动匹配出所需的事务信息,提高了事务信息获取效率。
78.进一步的,上述识别事务信息文本中的事件以及各事件之间的事理关系的步骤可以包括:将事务信息文本拆分为多个子文本;对于每个子文本,根据子文本的tf-idf信息确定子文本中的关键词;将关键词输入事件识别模型,以获取子文本记录的事件;将存在事件的子文本输入事理关系识别模型,得到各事件间的事理关系。
79.具体地,对事务信息文本进行拆分,例如,根据事务信息文本中的段落对事务信息文本进行拆分,或者以句子为单位对事务信息文本进行拆分,或者根据事务信息文本中的
编号等进行拆分,得到多个子文本。
80.对于每个子文本,对子文本进行分词得到多个分词,然后计算每个分词的tf-idf值,从而得到子文本的tf-idff信息。其中,tf-idf(term frequency

inverse document frequency)是一种用于信息检索与数据挖掘的常用加权技术。tf是词频(term frequency),是指某一个给定的词在文件中出现的频率。idf是逆文本频率指数(inverse document frequency),可以由总文件数目除以包含某词语之文件的数目,再求对数得到。
81.tf-idf用以评估分词对子文本的重要程度。可以根据tf-idf值,在子文本中确定关键词。例如,可以将分词的tf-idf值与预设阈值相比较,如果tf-idf值大于预设阈值,则该分词可以作为子文本中的关键词。
82.然后将关键词输入预先训练完毕的事件识别模型,事件识别模型可以判断子文本中是否记录了事件。在一个实施例中,关键词需要满足一定的数量,然后根据关键词对子文本进行标注,再输入事件识别模型,事件识别模型还可以输出事件标签,用于对事件进行描述。在一个实施例中,事件识别模型可以基于词袋模型(bag of words,bow)构建,将关键词输入训练完毕的词袋模型,得到识别结果。例如,将“落户、应届生、户口”等关键词输入词袋模型,得到识别结果“落户事件”。
83.事件之间具有事理关系,例如顺承、因果、条件和上下位等。事件时间识别结果,将存在事件的子文本输入预先训练完毕的事理关系识别模型,由事理关系识别模型判断子文本中事件之间的关系,从而得到事理关系。在一个实施例中,事理关系识别模型可以基于bert模型构建。
84.本实施例中,根据if-idf信息识别关键词,将关键词输入事件识别模型进行事件识别,然后将存在事件的子文本输入事理关系识别模型,得到事件之间的事理关系,从而挖掘出事务信息文本中事件层面的信息。
85.进一步的,上述识别事件中的本体以及各本体之间的本体关系的步骤包括:根据实体识别算法对事件所在的子文本进行处理,得到子文本中的本体以及对应的本体类型;基于本体类型以及预设的本体类型关系表,确定各本体之间的本体关系。
86.具体地,获取包含事件的子文本,通过实体识别算法对子文本进行实体识别,得到子文本中包含的实体,以及实体的实体类型。为了与基于owl语言的语义网框架相对应,这里用“本体”以及“本体类型”指代子文本中的“实体”以及“实体类型”。其中,本体类型用于表述本体的类型属性,例如,对于本体“s市”,其本体类型为“城市”。
87.不同类型的本体之间具有本体关系,本体关系可以记录在预先设置好的本体类型关系表中。根据本体的本体类型在本体类型关系表中进行查询,即可得到本体之间的本体关系。例如,通过本体类型关系表,确定“申报材料”关联于“办事员”。
88.本实施例中,通过实体识别算法识别本体以及本体类型,并通过本体类型关系表确定本体之间的本体关系,从而挖掘出事件内部本体层面的信息。
89.进一步的,上述步骤s204可以包括:根据语义网框架构建事务信息文本所对应的初始事务知识图谱;基于距离模型确定初始事务知识图谱中节点和连接边的表征向量,得到事务知识图谱。
90.具体地,语义网框架是对知识图谱的语义层描述,基于语义网框架可以构建知识图谱。构建事务知识图谱的可以包括两步,首先根据语义网框架构建事务信息文本所对应
的初始事务知识图谱,初始事务知识图谱中包括节点和连接边,但是尚未确定节点和连接边的表征向量。
91.还需要通过向量表示初始事务知识图谱中的各元素(节点和连接边)。在图谱中,两个节点及其之间的连接边又可以叫头实体-关系-尾实体的三元组,头实体、关系和尾实体都具有表征向量,依次为h,r,t。距离模型可以用来确定各元素的表征向量,并衡量各元素的表征向量是否合理。距离模型是基于距离的评分函数,对于三元组(h,r,t),当h r与t很接近时,可以认为表征向量可以较好地表征初始实务知识图谱中的各元素,从而得到事务知识图谱。
92.本实施例中,先根据语义网框架构建初始事务知识图谱,再确定初始事务知识图谱中节点和连接边的表征向量,完成事务知识图谱的构建。
93.进一步的,上述步骤s206可以包括:对事务查询文本进行分词处理,得到多个子词;将各子词分别映射为词向量;通过长短期记忆网络对词向量进行编码,得到事务查询文本的文本表征向量;计算文本表征向量与事务知识图谱中各节点的表征向量之间的语义相似度;根据语义相似度,在事务知识图谱中确定事务信息查询结果,并将事务信息查询结果返回至查询终端。
94.具体地,在事务知识图谱中查询时,先对事务查询文本进行分词处理,得到多个分词。将各子词映射为词向量,按照各子词在事务查询文本中的顺序,将各子词所对应的词向量输入长短期记忆网络进行编码,长短期记忆网络(long-short term memory,lstm,是一种时间循环神经网络)可以将各子词在事务查询文本中的位置信息加入编码,从而加入上下文信息,可以更好地进行语义表达。
95.长短期记忆网络编码后输出事务查询文本的文本表征向量。然后计算文本表征向量与实务知识图谱中各节点的表征向量计算语义相似度。根据语义相似度在事务知识图谱中选取节点,然后将节点引申出的全部路径,即部分事务知识图谱作为事务信息查新结果。事务信息查询结果可以被发送至查询终端进行展示。
96.进一步的,上述根据语义相似度,在事务知识图谱中确定事务信息查询结果的步骤可以包括:对各语义相似度进行降序排列,得到相似度序列;从相似度序列中选取至少一个语义相似度;在事务知识图谱中,确定语义相似度所对应节点所在的子图谱;将子图谱确定为事务信息查询结果。
97.具体地,将计算得到的多个语义相似度进行降序排列得到语义相似度序列,可以从相似度序列中选取排在前n位(n为预设数值,且n为正整数)的语义相似度。在事务知识图谱中确定选取到的相似度所对应的节点,然后将该节点引申出的子图谱作为事务信息查询结果。
98.在一个实施例中,还可以根据节点引申出的子图谱生成文本,然后将文本作为事务信息查询结果。
99.本实施例中,对语义相似度进行降序排列,根据语义相似度的大小从相似度队列中选取至少一个语义相似度,将语义相似度所对应节点所在的子图谱作为事务信息查询结果,可以确保事务信息查询结果的准确性。
100.本实施例中,对事务查询文本进行分词处理,通过长短期记忆网络对各分词的词向量进行语义和位置信息的编码,可以生成事务查询文本更加准确的文本表征向量,从而
提高了依据文本表征向量在事务知识图谱中进行事务信息查询的准确性。
101.进一步的,上述步骤s206之后,还可以包括:识别事务查询文本中的本体及其对应的本体类型;根据本体及其对应的本体类型,从事务知识图谱中匹配对应的子图谱;将匹配到的子图谱确定为事务信息查询结果。
102.具体地,除了通过向量计算进行事务信息查询,还可以通过查询模板进行事务信息的查询。通过实体识别算法识别事务查询文本中的本体及其对应的本体类型,根据本体和本体类型填充查询模板,然后将查询模板与事务知识图谱进行匹配,如果查询到子图谱中具有与查询模板中相同的本体以及本体类型,则可以将子图谱确定为事务信息查询结果。
103.本实施例中,识别事务查询文本中的本体及其对应的本体类型,可以直接根据本体以及本体类型在事务知识图谱中进行匹配,丰富了事务信息查询的方式。
104.本技术实施例可以基于人工智能技术对相关的数据进行获取和处理。其中,人工智能(artificial intelligence,ai)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。
105.人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、操作/交互系统、机电一体化等技术。人工智能软件技术主要包括计算机视觉技术、机器人技术、生物识别技术、语音处理技术、自然语言处理技术以及机器学习/深度学习等几大方向。
106.本技术可应用于智慧政务领域中,从而推动智慧城市的建设。
107.本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,该计算机程序可存储于一计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,前述的存储介质可为磁碟、光盘、只读存储记忆体(read-only memory,rom)等非易失性存储介质,或随机存储记忆体(random access memory,ram)等。
108.应该理解的是,虽然附图的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,其可以以其他的顺序执行。而且,附图的流程图中的至少一部分步骤可以包括多个子步骤或者多个阶段,这些子步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,其执行顺序也不必然是依次进行,而是可以与其他步骤或者其他步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。
109.进一步参考图3,作为对上述图2所示方法的实现,本技术提供了一种事务信息查询装置的一个实施例,该装置实施例与图2所示的方法实施例相对应,该装置具体可以应用于各种电子设备中。
110.如图3所示,本实施例所述的事务信息查询装置300包括:文本获取模块301、文本识别模块302、框架构建模块303、图谱生成模块304、查询获取模块305以及事务查询模块306,其中:
111.文本获取模块301,用于获取事务信息文本。
112.文本识别模块302,用于识别事务信息文本中的事件以及各事件之间的事理关系,
并识别事件中的本体以及各本体之间的本体关系。
113.框架构建模块303,用于根据事件、事理关系、本体和本体关系,构建语义网框架。
114.图谱生成模块304,用于基于语义网框架生成事务信息文本所对应的事务知识图谱。
115.查询获取模块305,用于获取事务查询文本。
116.事务查询模块306,用于计算事务查询文本与事务知识图谱中各节点的语义相似度,并根据语义相似度和事务知识图谱确定事务信息查询结果。
117.本实施例中,识别记录事务流程的事务信息文本中的事件以及事件之间的事理关系,并识别事件中的本体以及本体之间的本体关系,然后构建语义网框架,语义网框架具有丰富的语义表达能力,可以准确全面地描述事务信息;根据语义网框架构建事务知识图谱,从而以图谱的形式展示事务流程;将事务查询文本转化为表征向量,计算与事务知识图谱中各节点的语义相似度,从而确定事务查询文本在事务知识图谱中所在的位置,从而可以准确从事务知识图谱中确定事务查询结果,自动匹配出所需的事务信息,提高了事务信息获取效率。
118.在本实施例的一些可选的实现方式中,文本识别模块302可以包括:文本拆分子模块、关键词确定子模块、事件识别子模块以及事理关系识别子模块,其中:
119.文本拆分子模块,用于将事务信息文本拆分为多个子文本。
120.关键词确定子模块,用于对于每个子文本,根据子文本的tf-idf信息确定子文本中的关键词。
121.事件识别子模块,用于将关键词输入事件识别模型,以获取子文本记录的事件。
122.事理关系识别子模块,用于将存在事件的子文本输入事理关系识别模型,得到各事件间的事理关系。
123.本实施例中,根据if-idf信息识别关键词,将关键词输入事件识别模型进行事件识别,然后将存在事件的子文本输入事理关系识别模型,得到事件之间的事理关系,从而挖掘出事务信息文本中事件层面的信息。
124.在本实施例的一些可选的实现方式中,文本识别模块302还可以包括:本体识别子模块以及本体关系确定子模块,其中:
125.本体识别子模块,用于根据实体识别算法对事件所在的子文本进行处理,得到子文本中的本体以及对应的本体类型。
126.本体关系确定子模块,用于基于本体类型以及预设的本体类型关系表,确定各本体之间的本体关系。
127.本实施例中,通过实体识别算法识别本体以及本体类型,并通过本体类型关系表确定本体之间的本体关系,从而挖掘出事件内部本体层面的信息。
128.在本实施例的一些可选的实现方式中,图谱生成模块304可以包括:初始构建子模块以及向量确定子模块,其中:
129.初始构建子模块,用于根据语义网框架构建事务信息文本所对应的初始事务知识图谱。
130.向量确定子模块,用于基于距离模型确定初始事务知识图谱中节点和连接边的表征向量,得到事务知识图谱。
131.本实施例中,先根据语义网框架构建初始事务知识图谱,再确定初始事务知识图谱中节点和连接边的表征向量,完成事务知识图谱的构建。
132.在本实施例的一些可选的实现方式中,事务查询模块306可以包括文本分词子模块、子词映射子模块、表征获取子模块、相似度计算子模块以及结果确定子模块,其中:
133.文本分词子模块,用于对事务查询文本进行分词处理,得到多个子词。
134.子词映射子模块,用于将各子词分别映射为词向量。
135.表征获取子模块,用于通过长短期记忆网络对词向量进行编码,得到事务查询文本的文本表征向量。
136.相似度计算子模块,用于计算文本表征向量与事务知识图谱中各节点的表征向量之间的语义相似度。
137.结果确定子模块,用于根据语义相似度,在事务知识图谱中确定事务信息查询结果,并将事务信息查询结果返回至查询终端。
138.本实施例中,对事务查询文本进行分词处理,通过长短期记忆网络对各分词的词向量进行语义和位置信息的编码,可以生成事务查询文本更加准确的文本表征向量,从而提高了依据文本表征向量在事务知识图谱中进行事务信息查询的准确性。
139.在本实施例的一些可选的实现方式中,结果确定子模块可以包括:相似度排列单元、相似度选取单元、子图谱确定单元以及结果确定单元,其中:
140.相似度排列单元,用于对各语义相似度进行降序排列,得到相似度序列。
141.相似度选取单元,用于从相似度序列中选取至少一个语义相似度。
142.子图谱确定单元,用于在事务知识图谱中,确定语义相似度所对应节点所在的子图谱。
143.结果确定单元,用于将子图谱确定为事务信息查询结果。
144.本实施例中,对语义相似度进行降序排列,根据语义相似度的大小从相似度队列中选取至少一个语义相似度,将语义相似度所对应节点所在的子图谱作为事务信息查询结果,可以确保事务信息查询结果的准确性。
145.在本实施例的一些可选的实现方式中,事务信息查询装置300还可以包括:查询识别模块、子图谱匹配模块以及结果确定模块,其中:
146.查询识别模块,用于识别事务查询文本中的本体及其对应的本体类型。
147.子图谱匹配模块,用于根据本体及其对应的本体类型,从事务知识图谱中匹配对应的子图谱。
148.结果确定模块,用于将匹配到的子图谱确定为事务信息查询结果。
149.本实施例中,识别事务查询文本中的本体及其对应的本体类型,可以直接根据本体以及本体类型在事务知识图谱中进行匹配,丰富了事务信息查询的方式。
150.为解决上述技术问题,本技术实施例还提供计算机设备。具体请参阅图4,图4为本实施例计算机设备基本结构框图。
151.所述计算机设备4包括通过系统总线相互通信连接存储器41、处理器42、网络接口43。需要指出的是,图中仅示出了具有组件41-43的计算机设备4,但是应理解的是,并不要求实施所有示出的组件,可以替代的实施更多或者更少的组件。其中,本技术领域技术人员可以理解,这里的计算机设备是一种能够按照事先设定或存储的指令,自动进行数值计算
和/或信息处理的设备,其硬件包括但不限于微处理器、专用集成电路(application specific integrated circuit,asic)、可编程门阵列(field-programmable gate array,fpga)、数字处理器(digital signal processor,dsp)、嵌入式设备等。
152.所述计算机设备可以是桌上型计算机、笔记本、掌上电脑及云端服务器等计算设备。所述计算机设备可以与用户通过键盘、鼠标、遥控器、触摸板或声控设备等方式进行人机交互。
153.所述存储器41至少包括一种类型的可读存储介质,所述可读存储介质包括闪存、硬盘、多媒体卡、卡型存储器(例如,sd或dx存储器等)、随机访问存储器(ram)、静态随机访问存储器(sram)、只读存储器(rom)、电可擦除可编程只读存储器(eeprom)、可编程只读存储器(prom)、磁性存储器、磁盘、光盘等。在一些实施例中,所述存储器41可以是所述计算机设备4的内部存储单元,例如该计算机设备4的硬盘或内存。在另一些实施例中,所述存储器41也可以是所述计算机设备4的外部存储设备,例如该计算机设备4上配备的插接式硬盘,智能存储卡(smart media card,smc),安全数字(secure digital,sd)卡,闪存卡(flash card)等。当然,所述存储器41还可以既包括所述计算机设备4的内部存储单元也包括其外部存储设备。本实施例中,所述存储器41通常用于存储安装于所述计算机设备4的操作系统和各类应用软件,例如事务信息查询方法的计算机可读指令等。此外,所述存储器41还可以用于暂时地存储已经输出或者将要输出的各类数据。
154.所述处理器42在一些实施例中可以是中央处理器(central processing unit,cpu)、控制器、微控制器、微处理器、或其他数据处理芯片。该处理器42通常用于控制所述计算机设备4的总体操作。本实施例中,所述处理器42用于运行所述存储器41中存储的计算机可读指令或者处理数据,例如运行所述事务信息查询方法的计算机可读指令。
155.所述网络接口43可包括无线网络接口或有线网络接口,该网络接口43通常用于在所述计算机设备4与其他电子设备之间建立通信连接。
156.本实施例中提供的计算机设备可以执行上述事务信息查询方法。此处事务信息查询方法可以是上述各个实施例的事务信息查询方法。
157.本实施例中,识别记录事务流程的事务信息文本中的事件以及事件之间的事理关系,并识别事件中的本体以及本体之间的本体关系,然后构建语义网框架,语义网框架具有丰富的语义表达能力,可以准确全面地描述事务信息;根据语义网框架构建事务知识图谱,从而以图谱的形式展示事务流程;将事务查询文本转化为表征向量,计算与事务知识图谱中各节点的语义相似度,从而确定事务查询文本在事务知识图谱中所在的位置,从而可以准确从事务知识图谱中确定事务查询结果,自动匹配出所需的事务信息,提高了事务信息获取效率。
158.本技术还提供了另一种实施方式,即提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机可读指令,所述计算机可读指令可被至少一个处理器执行,以使所述至少一个处理器执行如上述的事务信息查询方法的步骤。
159.本实施例中,识别记录事务流程的事务信息文本中的事件以及事件之间的事理关系,并识别事件中的本体以及本体之间的本体关系,然后构建语义网框架,语义网框架具有丰富的语义表达能力,可以准确全面地描述事务信息;根据语义网框架构建事务知识图谱,从而以图谱的形式展示事务流程;将事务查询文本转化为表征向量,计算与事务知识图谱
中各节点的语义相似度,从而确定事务查询文本在事务知识图谱中所在的位置,从而可以准确从事务知识图谱中确定事务查询结果,自动匹配出所需的事务信息,提高了事务信息获取效率。
160.通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本技术的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如rom/ram、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,空调器,或者网络设备等)执行本技术各个实施例所述的方法。
161.显然,以上所描述的实施例仅仅是本技术一部分实施例,而不是全部的实施例,附图中给出了本技术的较佳实施例,但并不限制本技术的专利范围。本技术可以以许多不同的形式来实现,相反地,提供这些实施例的目的是使对本技术的公开内容的理解更加透彻全面。尽管参照前述实施例对本技术进行了详细的说明,对于本领域的技术人员来而言,其依然可以对前述各具体实施方式所记载的技术方案进行修改,或者对其中部分技术特征进行等效替换。凡是利用本技术说明书及附图内容所做的等效结构,直接或间接运用在其他相关的技术领域,均同理在本技术专利保护范围之内。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献