一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

油气文档的生成方法及装置与流程

2022-06-25 03:16:14 来源:中国专利 TAG:


1.本发明涉及油田勘测技术领域,尤其涉及一种油气文档的生成方法及装置。


背景技术:

2.一直以来,在油气勘探、开发及生产的过程中,有大量格式规整的专业文档需要撰写和审核。在撰写油气文档的过程中,一般需要业务专家通过翻阅原始文档后,从原始文档中查找所需的数据,再拷贝到专业文档中。
3.因此,在现有的油气文档生成过程中,需要领域专家消耗一定的时间和精力进行文档的填写,由于油气文档的数据来源于油气数据,这就导致在油气文档的生成过程中不仅需要业务专家消耗多的时间进行数据的查找,还需要由业务专家将查找到的数据填写到文档的对应位置中,导致油气文档的生成过程中需要消耗较多的时间,从而影响油气文档的生成效率。


技术实现要素:

4.鉴于上述问题,本发明提供一种油气文档的生成方法及装置,主要目的在于解决目前油气文档的生成效率较低问题。
5.为解决上述技术问题,第一方面,本发明提供了一种油气文档的生成方法,该方法包括:
6.通过油气知识体系数据构建对应油气领域的知识图谱框架,其中,所述知识图谱框架中包含油气本体之间的对应关系,所述油气知识体系数据是通过将油气数据按照业务流程和业务对象归纳后得到的;
7.根据所述油气数据及所述知识图谱框架生成知识图谱;
8.根据自然语言技术对示例模板进行处理,得到标准模板,其中,所述标准模板是基于示例模板中的部分内容经过所述知识图谱中实体的占位符替换后得到的模板;
9.根据所述知识图谱以及标准模板,生成油气文档,其中,所述油气文档为所述标准模板中每个占位符经知识图谱中的对应实体替换后得到的。
10.可选的,所述根据自然语言技术对示例模板进行处理,得到标准模板,包括:
11.根据通过自然语言技术在示例文档中的确定出数据部分,并利用对应所述知识图谱中实体的占位符替换所述项目部分对应的数据部分,得到标准模板。
12.可选的,在所述通过油气知识体系数据构建对应油气领域的知识图谱框架之前,所述方法还包括:
13.获取油气知识体系数据,所述油气知识体系数据是油气领域的历史数据基于业务流程及业务对象归纳处理后得到的,所述油气知识体系数据包含油气本体以及油气本体间的对应关系;
14.所述通过油气知识体系数据构建对应油气领域的知识图谱框架,包括:
15.将所述油气知识体系数据中的油气本体按照知识图谱三元组进行图谱化处理,得
到所述知识图谱框架。
16.可选的,所述知识图谱框架包括:知识图谱本体库;所述将所述油气知识体系数据中的油气本体按照知识图谱三元组进行图谱化处理,得到所述知识图谱框架包括:
17.根据所述油气知识体系数据,从所述多个本体之间确定知识本体的根节点,所述知识本体的根节点包括盆地;
18.根据所述油气本体间的对应关系确定所述知识本体根节点的子节点。
19.可选的,所述根据所述油气数据及所述知识图谱框架生成知识图谱包括:
20.对所述油气数据中的每个实体的实体内容按照所述知识图谱本体库的构架形进行构建,得到对应所述知识图谱本体库的知识图谱。
21.可选的,在所述根据所述油气数据及所述知识图谱框架生成知识图谱之后,所述方法还包括:
22.将所述知识图谱输出,并接收修改指示,所述修改指示中包含需修改的所述油气实体的实体内容和/或所述油气实体间的对应关系;
23.根据所述修改指示对所述知识图谱中的所述油气实体的实体内容及所述油气实体间的对应关系进行修改。
24.第二方面,本发明实施例还提供了一种油气文档的生成装置,包括:
25.构建单元,用于通过油气知识体系数据构建对应油气领域的知识图谱框架,其中,所述知识图谱框架中包含油气本体之间的对应关系,所述油气知识体系数据是通过将油气数据按照业务流程和业务对象归纳后得到的;
26.第一生成单元,用于根据所述油气数据及所述知识图谱框架生成知识图谱;
27.处理单元,用于根据自然语言技术对示例模板进行处理,得到标准模板,其中,所述标准模板是基于示例模板中的部分内容经过所述知识图谱中实体的占位符替换后得到的模板;
28.第二生成单元,用于根据所述知识图谱以及标准模板,生成油气文档,其中,所述油气文档为所述标准模板中每个占位符经知识图谱中的对应实体替换后得到的。
29.可选的,所述处理单元,具体用于根据通过自然语言技术在示例文档中的确定出数据部分,并利用对应所述知识图谱中实体的占位符替换所述项目部分对应的数据部分,得到标准模板。
30.可选的,所述装置还包括:
31.获取单元,用于获取油气知识体系数据,所述油气知识体系数据是油气领域的历史数据基于业务流程及业务对象归纳处理后得到的,所述油气知识体系数据包含油气本体以及油气本体间的对应关系;
32.所述构建单元,具体用于将所述油气知识体系数据中的油气本体按照知识图谱三元组进行图谱化处理,得到所述知识图谱框架。
33.可选的,所述知识图谱框架包括:知识图谱本体库;
34.所述构建单元包括:
35.第一确定模块,用于根据所述油气知识体系数据,从所述多个本体之间确定知识本体的根节点,所述知识本体的根节点包括盆地;
36.第二确定模块,用于根据所述油气本体间的对应关系确定所述知识本体根节点的
子节点。
37.可选的,所述第一生成单元具体用于对所述油气数据中的每个实体的实体内容按照所述知识图谱本体库的构架形进行构建,得到对应所述知识图谱本体库的知识图谱。
38.可选的,所述装置还包括:
39.交互单元,用于将所述知识图谱输出,并接收修改指示,所述修改指示中包含需修改的所述油气实体的实体内容和/或所述油气实体间的对应关系;
40.修改单元,用于根据所述修改指示对所述知识图谱中的所述油气实体的实体内容及所述油气实体间的对应关系进行修改。
41.为了实现上述目的,根据本发明的第三方面,提供了一种存储介质,所述存储介质包括存储的程序,其中,在所述程序运行时控制所述存储介质所在设备执行上述所述的油气文档的生成方法。
42.为了实现上述目的,根据本发明的第四方面,提供了一种处理器,所述处理器用于运行程序,其中,所述程序运行时执行上述所述的油气文档的生成方法。
43.借由上述技术方案,本发明提供的油气文档的生成方法及装置,对于现有的基于业务专家填写油气文档导致的效率较低的问题,本发明通过油气知识体系数据构建对应油气领域的知识图谱框架,再根据所述油气数据及所述知识图谱框架生成知识图谱,之后根据自然语言技术对示例模板进行处理,得到标准模板;根据所述知识图谱以及标准模板,生成油气文档,从而实现油气文档的自动化生成功能。在上述方案中。在上述方案中,由于所述油气知识体系数据是通过将油气数据按照业务流程和业务对象归纳后得到的,且知识图谱框架中包含油气实体之间的对应关系,继而可以使基于知识图谱框架和油气数据生成的知识图谱中包含有全部的油气相关的数据,使后续进行基于该知识图谱生成油气文档的过程中无需业务专家从油气数据中进行所需数据的查找,可以提高油气文档的生成效率。同时,由于所述标准模板是基于示例模板中的部分内容经过所述知识图谱中实体的占位符替换后得到的模板,且所述油气文档为所述标准模板中每个占位符经知识图谱中的对应实体替换后得到的,这就可以实现一种基于示例模板生成标准模板,再基于标准模板中的占位符替换为所需的油气数据的自动化填充效果,从而实现了一种能够基于知识图谱对标准模板进行自动化的填充得到油气文档的功能,使油气文档的生成过程无需业务专家进行数据的复制和填充,极大提高了油气文档的生成效率。另外,本发明所述的方法能够基于自动化进行执行,也就是说在整个操作过程无需由业务专家的介入,可以在避免因人工操作导致的填写错误的问题时,还能够起到节约人力的效果。
44.上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,而可依照说明书的内容予以实施,并且为了让本发明的上述和其它目的、特征和优点能够更明显易懂,以下特举本发明的具体实施方式。
附图说明
45.通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本发明的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:
46.图1示出了本发明实施例提供的一种油气文档的生成方法流程图;
47.图1-a示出了本发明实施例提供的一种油气文档的生成方法执行过程中知识图谱框架的示意图;
48.图2示出了本发明实施例提供的另一种油气文档的生成方法流程图;
49.图3示出了本发明实施例提供的一种油气文档的生成装置的组成框图;
50.图4示出了本发明实施例提供的另一种油气文档的生成装置的组成框图;
51.图5示出了本发明实施例提供的一种用于油气文档的生成的设备的组成框图。
具体实施方式
52.下面将参照附图更详细地描述本发明的示例性实施例。虽然附图中显示了本发明的示例性实施例,然而应当理解,可以以各种形式实现本发明而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本发明,并且能够将本发明的范围完整的传达给本领域的技术人员。
53.为了解决目前油气文档的生成效率较低问题,本发明实施例提供了一种油气文档的生成方法,如图1所示,该方法包括:
54.101、通过油气知识体系数据构建对应油气领域的知识图谱框架。
55.其中,所述知识图谱框架中包含油气本体之间的对应关系,所述油气知识体系数据是通过将油气数据按照业务流程和业务对象归纳后得到的。
56.一般来说,在油气钻探过程中存在各个业务流程,以及相关的业务对象。其中,业务对象如盆地、构造单元、油气田、井、钻井、压裂、酸化等。在本发明实施例中,所述油气知识体系数据可以理解为经过人工的抽象和归纳,形成钻探相关的综合知识体系。
57.同时,所述知识图谱框架可以理解为基于油气知识体系所构建的一种基于知识图谱思想的、包含有不同的油气本体之间的对应关系的框架。本体是对同类实体的概括和抽象,例如对应本体“盆地”,油气数据中的“塔里木盆地”、“准噶尔盆地”可以作为对应的实体。其中,知识图谱的基本组成单位是“实体-关系-实体”三元组,以及实体及其相关属性值组成的键值对,实体之间通过关系相互联结,构成网状的知识结构。由于知识图谱具有简单、明确的特点,可以直白的表征每个实体以及实体间关系。在本实施例中,各个油气实体可以为前述中每个业务对象,由于每个业务对象在所述油气知识体系数据中具有关联关系,因此形成所述知识图谱框架中的每个油气本体之间也存在对应关系。
58.例如,在生成的知识图谱框架中可以通过知识图谱三元组的方式来表示各个油气本体及其对应关系。如图1-a所示,其中,用知识图谱的节点来表示油气勘探业务中的盆地、构造单元、作业区、油气田、油气藏、井、钻井、压裂等油气本体。同时,用知识图谱的边来表示上述各个油气本体之间的关系。
59.102、根据油气数据及所述知识图谱框架生成知识图谱。
60.基于前述步骤中得到的所述知识图谱框架中仅包含了各种油气实体之间的关系,而不涉及具体的每个实体内容,因此,在本步骤中可以将包含有具体实体内容的油气数据与所述知识图谱框架进行内容的填充,从而生成包含有具体的实体内容的知识图谱。
61.103、根据自然语言技术对示例模板进行处理,得到标准模板。
62.其中,所述标准模板是基于示例模板中的部分内容经过所述知识图谱中实体的占位符替换后得到的模板。
63.在本发明实施例中,所述示例模板可以为通过预先获取的示例,也可以是基于多种文档报告进行综合分析后得到的示例模板,其中该示例模板中可以包括具体的数据项目以及对应的每种数据项目的数据内容,另外,在实际应用中所述示例文档可以包含有多个不同的具体文档,这些文档具有相似性,其中很多部分是固定不变的,例如每个项目的名称,而不同的仅在于每个项目对应的具体数据。例如,在示例文档可以分别如下述表1、表2所示:
64.表1
[0065][0066]
表2
[0067][0068]
通过表1、表2可知,这两个文档都包含有地理位置、井口坐标以及开钻日期三个项目,二者区别仅在于每个项目对应的项目数据,也就是说项目部分是完全相同的(例如地理位置、井口坐标等项目部分),其区别在于每个项目部分所对应的数据部分是不同的(例如24,33与25,15)。因此,在本发明实施例中,可以通过对上述文档进行综合分析,从中确定相同部分和不同部分,从而实现对表格或文档中的数据部分识别的效果。
[0069]
由此,当确定了示例文档中的数据部分后,则可以通过知识图谱中实体的占位符对项目部分对应的数据部分进行替换,其中该占位符需要与每个项目对应的实体相对应,以确保后续生成文档时的准确性。
[0070]
例如,基于上述表2中的示例,经过本步骤所述的方法处理后的标准模板可以如表3所示:
[0071]
表3
[0072][0073][0074]
104、根据所述知识图谱以及标准模板,生成油气文档。
[0075]
其中,所述油气文档为所述标准模板中每个占位符经知识图谱中的对应实体替换后得到的。
[0076]
由于前述步骤102中得到的知识图谱实际上包含了全部的油气数据,因此,在本步骤中可以基于标准模板中的占位符确定其对应的实体内容,并将对应的实体内容添加到该标准模板中,具体的替换方式则可以是通过将实体内容替换对应的占位符进行,从而得到含有具体油气数据的文档,即所述油气文档。
[0077]
对于现有的基于业务专家填写油气文档导致的效率较低的问题,本发明通过油气知识体系数据构建对应油气领域的知识图谱框架,再根据所述油气数据及所述知识图谱框架生成知识图谱,之后根据自然语言技术对示例模板进行处理,得到标准模板;根据所述知识图谱以及标准模板,生成油气文档,从而实现油气文档的自动化生成功能。在上述方案中。在上述方案中,由于所述油气知识体系数据是通过将油气数据按照业务流程和业务对象归纳后得到的,且知识图谱框架中包含油气实体之间的对应关系,继而可以使基于知识图谱框架和油气数据生成的知识图谱中包含有全部的油气相关的数据,使后续进行基于该知识图谱生成油气文档的过程中无需业务专家从油气数据中进行所需数据的查找,可以提高油气文档的生成效率。同时,由于所述标准模板是基于示例模板中的部分内容经过所述知识图谱中实体的占位符替换后得到的模板,且所述油气文档为所述标准模板中每个占位符经知识图谱中的对应实体替换后得到的,这就可以实现一种基于示例模板生成标准模板,再基于标准模板中的占位符替换为所需的油气数据的自动化填充效果,从而实现了一种能够基于知识图谱对标准模板进行自动化的填充得到油气文档的功能,使油气文档的生成过程无需业务专家进行数据的复制和填充,极大提高了油气文档的生成效率。另外,本发明所述的方法能够基于自动化进行执行,也就是说在整个操作过程无需由业务专家的介入,可以在避免因人工操作导致的填写错误的问题时,还能够起到节约人力的效果。
[0078]
进一步的,作为对图1所示实施例的细化及扩展,本发明实施例还提供了另一种油气文档的生成方法,如图2所示,其具体步骤包括:
[0079]
201、获取油气知识体系数据。
[0080]
其中,所述油气知识体系数据是油气领域的历史数据基于业务流程及业务对象归纳处理后得到的,所述油气知识体系数据包含油气本体以及油气本体间的对应关系。
[0081]
由于实际应用中,油气领域涉及的数据是非常庞杂的,因此,在本实施例中,可以首先获取基于人工操作得到的油气知识体系数据。该油气知识体系数据实际上是通过人工基于业务流程和业务对象进行归纳处理后的数据,由于油气知识体系数据中已经基于业务对象和业务流程进行了梳理和归纳,因此包含有每种油气本体的具体的内容,即本体内容,以及各个油气本体之间的关系,即油气本体间的对应关系。例如,本体“井”中与本体“井筒”之间是“井包含井筒”的关系。
[0082]
202、通过油气知识体系数据构建对应油气领域的知识图谱框架。
[0083]
其中,所述知识图谱框架中包含油气本体之间的对应关系,所述油气知识体系数据是通过将油气数据按照业务流程和业务对象归纳后得到的。
[0084]
具体的,本步骤可以包括:将所述油气知识体系数据中的油气本体按照知识图谱三元组进行图谱化处理,得到所述知识图谱框架。
[0085]
基于前述步骤201可知,在油气知识体系数据中包含了每个油气本体及其相关的油气本体间的对应关系,因此,在本步骤中可以按照知识图谱的理论以三元组的形式处理上述油气本体以及对应关系。例如,在构建过程中,由于本体的三元组实际上包含的是两个
本体以及本体间对应关系,因此,在按照知识图谱理论以三元组的形式处理油气本体及对应关系时可以将存在对应关系的两个油气本体通过表征对应关系的连边形成连接关系,以此类推最终形成以油气本体为节点,油气本体间对应关系为连边的网状知识点框架。
[0086]
另外,在具体执行过程中,所述知识图谱框架可以为知识图谱本体库。
[0087]
这样,本步骤在构建知识图谱本体库的具体过程还可以按照下述方式进行:
[0088]
首先,根据所述油气知识体系数据,从所述多个实体之间确定知识实体的根节点,所述知识实体的根节点包括盆地;然后,根据所述油气本体间的对应关系确定所述知识本体根节点的子节点。
[0089]
由于每个油气实体的对应关系是确定的,也就是说首先可以确定知识图谱本体库中的最底层的根节点,基于油气领域的特点,可以将盆地定义为知识图谱本体库的根节点,然后按照与盆地存在对应关系的实体设置为其子节点,并以此类推,每个节点代表一个实体、每一个连线代表被连接的本体之间的对应关系,从而生成一个包括有盆地、油气田、油气藏、井等一系列实体之间连接的“网”,得到所述知识图谱本体库。
[0090]
203、根据油气数据及所述知识图谱框架生成知识图谱。
[0091]
具体的,本步骤可以包括:对所述油气数据中的每个实体的实体内容按照所述知识图谱本体库的构架形进行构建,得到对应所述知识图谱本体库的知识图谱。
[0092]
基于前述步骤202可知,在得到知识图谱本体库后,由于该知识图谱本体库中包含有以三元组形式表征的本体,因此,在本步骤中可以按照知识图谱本体库中的实体间的框架形式来构建每种实体对应的实体内容,从而得到包含有具体实体内容的知识图谱。需要说明的是,在实际应用中,可以通过人工标注后进行构建,或者通过机器学习等方式执行,在此不做具体限定,根据实际需要确定。
[0093]
204、根据自然语言技术对示例模板进行处理,得到标准模板。
[0094]
其中,所述标准模板是基于示例模板中的部分内容经过所述知识图谱中实体的占位符替换后得到的模板。
[0095]
具体的,本步骤可以具体包括:根据通过自然语言技术在示例文档中的确定出数据部分,并利用对应所述知识图谱中实体的占位符替换所述项目部分对应的数据部分,得到标准模板。
[0096]
其中,对于项目部分和数据部分的识别可通过自然语言处理技术执行,其中,自然语言处理是计算机科学领域与人工智能领域中的一个重要方向。它研究能实现人与计算机之间用自然语言进行有效通信的各种理论和方法。其中可以具体操作时可以利用nlp(natural language processing,自然语言处理)技术进行。例如,在识别所述示例模板中的数据部分和项目部分的过程中,当所述示例模板为多个油气报告时,则可以通过对油气报告进行分词,得到词组,并过滤其中的语气词和助词,并提取其中的实体词汇,然后确定哪些是本实施例中的油气实体,哪些是油气实体对应的数据内容,以此确定其中的项目部分和数据部分。当然,本实施例所述的基于自然语言处理技术进行处理的方式包括但不限于上述的方式,还可以基于实际需要选取适合的方式执行。
[0097]
205、根据所述知识图谱以及标准模板,生成油气文档。
[0098]
其中,所述油气文档为所述标准模板中每个占位符经知识图谱中的对应实体替换后得到的。
[0099]
基于上述步骤所述的方法,由于标准模板中包含有占位符,而该占位符与实际的实体之间存在对应关系,在本步骤中可以基于前述步骤得到的知识图谱直接获取对应所述占位符的油气实体,并根据油气实体的内容直接替换所述占位符,从而使原来的标准模板中的每个项目都对应了实际需要的数据(油气实体的实体内容),从而实现了对油气文档的自动填充功能。
[0100]
另外,基于上述实施例所述的方法,在执行步骤203的方法中所述根据所述油气数据及所述知识图谱框架生成知识图谱之后,还可以基于用户的需要对已构建的知识图谱进行展示和修订,其具体可以执行下述步骤:
[0101]
206、将所述知识图谱输出,并接收修改指示。
[0102]
其中,所述修改指示中包含需修改的所述油气实体的实体内容和/或所述油气实体间的对应关系。
[0103]
由于实际过程中可能存在实体内容错误,获取是对应关系发生变化的情况,在此可以基于本步骤的方法通过接收该修改指示进行。同时,本步骤中输出所述知识图谱的方式可以通过预设显示屏进行显示,在此不做限定,可基于实际需要选取输出方式。
[0104]
207、根据所述修改指示对所述知识图谱中的所述油气实体的实体内容及所述油气实体间的对应关系进行修改。
[0105]
通过修改指示进行修改,可以确保当用户需要进行知识图谱的矫正时,及时进行矫正修改的功能,从而确保了知识图谱的准确性,继而确保了后续基于该知识图谱进行油漆文档生成的文档的准确性。
[0106]
进一步的,作为对上述图1所示方法的实现,本发明实施例还提供了一种油气文档的生成装置,用于对上述图1所示的方法进行实现。该装置实施例与前述方法实施例对应,为便于阅读,本装置实施例不再对前述方法实施例中的细节内容进行逐一赘述,但应当明确,本实施例中的装置能够对应实现前述方法实施例中的全部内容。如图3所示,该装置包括:构建单元31、第一生成单元32、处理单元33及第二生成单元34,其中
[0107]
构建单元31,可以用于通过油气知识体系数据构建对应油气领域的知识图谱框架,其中,所述知识图谱框架中包含油气本体之间的对应关系,所述油气知识体系数据是通过将油气数据按照业务流程和业务对象归纳后得到的;
[0108]
第一生成单元32,可以用于根据所述油气数据及所述构建单元31构建的知识图谱框架生成知识图谱;
[0109]
处理单元33,可以用于根据自然语言技术对示例模板进行处理,得到标准模板,其中,所述标准模板是基于示例模板中的部分内容经过所述知识图谱中实体的占位符替换后得到的模板;
[0110]
第二生成单元34,可以用于根据所述第一生成单元32生成的知识图谱以及处理单元33得到的标准模板,生成油气文档,其中,所述油气文档为所述标准模板中每个占位符经知识图谱中的对应实体替换后得到的。
[0111]
进一步的,作为对上述图2所示方法的实现,本发明实施例还提供了一种油气文档的生成装置,用于对上述图2所示的方法进行实现。该装置实施例与前述方法实施例对应,为便于阅读,本装置实施例不再对前述方法实施例中的细节内容进行逐一赘述,但应当明确,本实施例中的装置能够对应实现前述方法实施例中的全部内容。如图4所示,该装置包
括:构建单元41、第一生成单元42、处理单元43及第二生成单元44,其中
[0112]
构建单元41,可以用于通过油气知识体系数据构建对应油气领域的知识图谱框架,其中,所述知识图谱框架中包含油气本体之间的对应关系,所述油气知识体系数据是通过将油气数据按照业务流程和业务对象归纳后得到的;
[0113]
第一生成单元42,可以用于根据所述油气数据及所述构建单元41构建的知识图谱框架生成知识图谱;
[0114]
处理单元43,可以用于根据自然语言技术对示例模板进行处理,得到标准模板,其中,所述标准模板是基于示例模板中的部分内容经过所述知识图谱中实体的占位符替换后得到的模板;
[0115]
第二生成单元44,可以用于根据所述第一生成单元42生成的知识图谱以及处理单元43得到的标准模板,生成油气文档,其中,所述油气文档为所述标准模板中每个占位符经知识图谱中的对应实体替换后得到的。
[0116]
所述处理单元43,可以具体用于根据通过自然语言技术在示例文档中的确定出数据部分,并利用对应所述知识图谱中实体的占位符替换所述项目部分对应的数据部分,得到标准模板。
[0117]
进一步的,所述装置还包括:
[0118]
获取单元45,可以用于获取油气知识体系数据,其中,所述油气知识体系数据是油气领域的历史数据基于业务流程及业务对象归纳处理后得到的,所述油气知识体系数据包含油气本体以及油气本体间的对应关系;
[0119]
所述构建单元41,具体可以用于将所述获取单元45获取的油气知识体系数据中的油气本体按照知识图谱三元组进行图谱化处理,得到所述知识图谱框架。
[0120]
进一步的,所述知识图谱框架包括:知识图谱本体库;
[0121]
所述构建单元41包括:
[0122]
第一确定模块411,可以用于根据所述油气知识体系数据,从所述多个实体之间确定知识实体的根节点,所述知识实体的根节点包括盆地;
[0123]
第二确定模块412,可以用于根据所述油气本体间的对应关系确定所述知识本体根节点的子节点。
[0124]
进一步的,所述第一生成单元42,具体可以用于对所述油气数据中的每个实体的实体内容按照所述知识图谱本体库的构架形进行构建,得到对应所述知识图谱本体库的知识图谱。
[0125]
进一步的,所述装置还包括:
[0126]
交互单元46,可以用于将所述第一生成单元42生成的知识图谱输出,并接收修改指示,所述修改指示中包含需修改的所述油气实体的实体内容和/或所述油气实体间的对应关系;
[0127]
修改单元47,可以用于根据所述交互单元46接收的修改指示对所述知识图谱中的所述油气实体的实体内容及所述油气实体间的对应关系进行修改。
[0128]
借由上述技术方案,本发明实施例提供一种油气文档的生成方法及装置,对于现有的基于业务专家填写油气文档导致的效率较低的问题,本发明通过油气知识体系数据构建对应油气领域的知识图谱框架,再根据所述油气数据及所述知识图谱框架生成知识图
谱,之后根据自然语言技术对示例模板进行处理,得到标准模板;根据所述知识图谱以及标准模板,生成油气文档,从而实现油气文档的自动化生成功能。在上述方案中。在上述方案中,由于所述油气知识体系数据是通过将油气数据按照业务流程和业务对象归纳后得到的,且知识图谱框架中包含油气实体之间的对应关系,继而可以使基于知识图谱框架和油气数据生成的知识图谱中包含有全部的油气相关的数据,使后续进行基于该知识图谱生成油气文档的过程中无需业务专家从油气数据中进行所需数据的查找,可以提高油气文档的生成效率。同时,由于所述标准模板是基于示例模板中的部分内容经过所述知识图谱中实体的占位符替换后得到的模板,且所述油气文档为所述标准模板中每个占位符经知识图谱中的对应实体替换后得到的,这就可以实现一种基于示例模板生成标准模板,再基于标准模板中的占位符替换为所需的油气数据的自动化填充效果,从而实现了一种能够基于知识图谱对标准模板进行自动化的填充得到油气文档的功能,使油气文档的生成过程无需业务专家进行数据的复制和填充,极大提高了油气文档的生成效率。另外,本发明所述的方法能够基于自动化进行执行,也就是说在整个操作过程无需由业务专家的介入,可以在避免因人工操作导致的填写错误的问题时,还能够起到节约人力的效果。
[0129]
处理器中包含内核,由内核去存储器中调取相应的程序单元。内核可以设置一个或以上,通过调整内核参数来提高油气文档的生成效率。
[0130]
本发明实施例提供了一种存储介质,其上存储有程序,该程序被处理器执行时实现所述油气文档的生成方法。
[0131]
本发明实施例提供了一种处理器,所述处理器用于运行程序,其中,所述程序运行时执行所述油气文档的生成方法。
[0132]
本发明实施例提供了一种设备50,如图5所示,设备包括至少一个处理器501、以及与处理器连接的至少一个存储器502、总线503;其中,处理器501、存储器502通过总线503完成相互间的通信;处理器501用于调用存储器中的程序指令,以执行上述的油气文档的生成方法。
[0133]
本文中的设备可以是服务器、pc、pad、手机等。
[0134]
本技术还提供了一种计算机程序产品,当在数据处理设备上执行时,适于执行初始化有如下方法步骤的程序:通过油气知识体系数据构建对应油气领域的知识图谱框架,其中,所述知识图谱框架中包含油气本体之间的对应关系,所述油气知识体系数据是通过将油气数据按照业务流程和业务对象归纳后得到的;根据所述油气数据及所述知识图谱框架生成知识图谱;根据自然语言技术对示例模板进行处理,得到标准模板,其中,所述标准模板是基于示例模板中的部分内容经过所述知识图谱中实体的占位符替换后得到的模板;根据所述知识图谱以及标准模板,生成油气文档,其中,所述油气文档为所述标准模板中每个占位符经知识图谱中的对应实体替换后得到的。
[0135]
进一步的,所述根据自然语言技术对示例模板进行处理,得到标准模板,包括:
[0136]
根据通过自然语言技术在示例文档中的确定出数据部分,并利用对应所述知识图谱中实体的占位符替换所述项目部分对应的数据部分,得到标准模板。
[0137]
进一步的,在所述通过油气知识体系数据构建对应油气领域的知识图谱框架之前,所述方法还包括:
[0138]
获取油气知识体系数据,所述油气知识体系数据是油气领域的历史数据基于业务
流程及业务对象归纳处理后得到的,所述油气知识体系数据包含油气本体以及油气本体间的对应关系;
[0139]
所述通过油气知识体系数据构建对应油气领域的知识图谱框架,包括:
[0140]
将所述油气知识体系数据中的油气本体按照知识图谱三元组进行图谱化处理,得到所述知识图谱框架。
[0141]
进一步的,所述知识图谱框架包括:知识图谱本体库;所述将所述油气知识体系数据中的油气本体按照知识图谱三元组进行图谱化处理,得到所述知识图谱框架包括:
[0142]
根据所述油气知识体系数据,从所述多个实体之间确定知识实体的根节点,所述知识实体的根节点包括盆地;
[0143]
根据所述油气本体间的对应关系确定所述知识本体根节点的子节点。
[0144]
进一步的,所述根据所述油气数据及所述知识图谱框架生成知识图谱包括:
[0145]
对所述油气数据中的每个实体的实体内容按照所述知识图谱本体库的构架形进行构建,得到对应所述知识图谱本体库的知识图谱。
[0146]
进一步的,在所述根据所述油气数据及所述知识图谱框架生成知识图谱之后,所述方法还包括:
[0147]
将所述知识图谱输出,并接收修改指示,所述修改指示中包含需修改的所述油气实体的实体内容和/或所述油气实体间的对应关系;
[0148]
根据所述修改指示对所述知识图谱中的所述油气实体的实体内容及所述油气实体间的对应关系进行修改。
[0149]
本技术是参照根据本技术实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
[0150]
在一个典型的配置中,设备包括一个或多个处理器(cpu)、存储器和总线。设备还可以包括输入/输出接口、网络接口等。
[0151]
存储器可能包括计算机可读介质中的非永久性存储器,随机存取存储器(ram)和/或非易失性内存等形式,如只读存储器(rom)或闪存(flash ram),存储器包括至少一个存储芯片。存储器是计算机可读介质的示例。
[0152]
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(pram)、静态随机存取存储器(sram)、动态随机存取存储器(dram)、其他类型的随机存取存储器(ram)、只读存储器(rom)、电可擦除可编程只读存储器(eeprom)、快闪记忆体或其他内存技术、只读光盘只读存储器(cd-rom)、数字多功能光盘(dvd)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
[0153]
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的
包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个
……”
限定的要素,并不排除在包括要素的过程、方法、商品或者设备中还存在另外的相同要素。
[0154]
本领域技术人员应明白,本技术的实施例可提供为方法、系统或计算机程序产品。因此,本技术可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且,本技术可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、cd-rom、光学存储器等)上实施的计算机程序产品的形式。
[0155]
以上仅为本技术的实施例而已,并不用于限制本技术。对于本领域技术人员来说,本技术可以有各种更改和变化。凡在本技术的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本技术的权利要求范围之内。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献