一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种公共服务问答库构建方法与流程

2021-12-17 18:10:00 来源:中国专利 TAG:


1.本发明涉及化学用品安全服务领域,具体涉及一种公共服务问答库构建方法。


背景技术:

2.危险化学品种类繁多、应用广泛,且遍布生产、经营、储存、运输、使用各个环节,危险化学品在经历这些环节时,稍有不慎便极易引发火灾、爆炸、中毒、泄漏等事故,从而导致危险化学品事故具有多发性、易发性、突发性、复杂性、连续性、扩散性、救援难度大等特点。当化学品事故发生时,若无法及时获取专业的应急处置信息,易引发严重后果。目前企业、公众在查询化学品相关问题时,尚未有一个专门针对危险化学品问题查询的系统,缺乏为各类用户服务时提供全面的各种问题类型咨询以及专业、唯一的问答结果。


技术实现要素:

3.本发明的目的在于提供一种公共服务问答库构建方法,该构建方法针对不同用户的危险化学品问答服务需求,通过将权威多源数据库整合构建出一个专业、全面、权威的问答库。
4.本发明为了实现上述目的,采用的技术解决方案是:
5.一种公共服务问答库构建方法,基于知识本体,通过问题库构建、评价体系构建、知识的问答获取、问答库的持续优化和问答库应用来构建用于危险化学品的公共信息服务问答库。
6.优选的,所述问题库构建的方法包括如下步骤:
7.步骤a1,通过问答库获取与应用的基础,并利用基于本体的知识表示方法,对危险化学品公共信息服务领域实体进行本质抽象;
8.步骤a2,强调实体间的关系,并通过多种知识表示元素将这些关联表达和反映出来,以达到实现最大程度的危险化学品公共信息服务的问题共享与重用;
9.步骤a3,根据服务来源、数据类型的不同,对问题进行分类,形成多种类别的问答库;
10.步骤a4,采用知识树的方法对问答进行组织,在每一层中,知识节点与其相邻常点在粒度上保持一致;
11.步骤a5,系统根据用户业务经验针对每一类问答设置对应的树形问答体系。
12.优选的,所述步骤a1中的多种知识表示元素包括概念、属性、关系、函数、公理和实例;
13.所述步骤a4中知识树的层次越高,知识节点与其相邻常点的粒度越大;知识树的层次越低,知识节点与其相邻常点的粒度越小。
14.优选的,所述步骤a3中的多种类别的问答库为四类,四类问答库分别为基础查询类、应急响应类、事故案例类和安全管理类;确定好这四类后,再对这四类中的每一类问答库可以进一步详细分类;
15.步骤a5中的步骤用户可对树形问答体系进行编辑,添加或删除节点,并可对节点名称进行重置。
16.优选的,所述评价体系构建的内容包括问答库的完整度构建、问答库的有效性构建和问答库的相关度构建。
17.优选的,所述问答库的完整度构建由业务专家确定不同类型问答属性的权重值及分值,系统根据问答条目属性填充的完整性直接计算得出;完整性计算规则为:权重*得分,从而得出每一个问答条目的完整度百分比。
18.优选的,所述问答库的有效性构建是由系统与业务专家交互得到,业务专家查看某一问答条目时,可以对该问答的有用性进行评价,系统会实时显示每一问答条目的有用性数量分布情况。
19.优选的,所述问答库的相关度构建由业务专家评价某一知识条目是否与业务相关,指定相关值;结合公众用户对问答条目进行相关性评价时,采用中位值进行显示。
20.优选的,所述知识的问答获取的内容包括知识获取过程、问答标注的过程和问答维护的过程。
21.优选的,所述知识获取过程是从结构化和非结构化的数据资源中提取知识的过程;
22.结构化知识获取指从特定格式的数据,从结构化数据库记录、xml等含有标签的半结构化数据中进行解析,从而获取多个知识实体及其详细属性,以及知识实体间存在的关联关系;
23.非结构化知识获取则通过导入的文本类材料提取文档中提及的实体与关系、要素关键词与文档摘要等,通过自动识别抽取内容的类别将其存储到不同的知识条目集合中。
24.优选的,所述问答标注的过程为采用众包方式对问答库进行知识标注,标注人员可以选中某实体对其进行标注,标注的知识在多个数据源中互联互通;
25.若待标注的知识已存在于知识库中,则智能提示补全,节约标注时间,提高标注效率,保证标注的统一性。
26.优选的,所述问答维护的过程为针对每个知识实体,以可视化的形式对与该实体存在直接关系的关联实体进行展示,并支持对该实体的关联实体及关联关系的可视化编辑对知识实体进行维护。
27.优选的,所述问答库的持续优化的方法是将构建出的危险化学品公共信息服务问答库进行持久化存储,利用基于图结构存储的知识持久化技术,在分布式图数据处理平台的基础上,采用新型的查询模型、算法和计算平台分别从图数据查询模型、分布式查询算法、分布式查询执行优化三个方面对知识进行持久化,并提供快速高效的新型分布式查询技术,实现快速高效的数据存储与查询。
28.优选的,所述问答库应用基于构建的面向基础查询、应急响应、事故案例、安全管理四大类别的问答库,除能够直接提供相关问答的检索和推荐外,还能够提供用于问答知识的多种应用功能。
29.优选的,所述多种应用功能包括联想与推演、启发式搜索、个性化推荐及智能问答分析。
30.本发明的有益效果是:
31.本发明中的公共服务问答库构建方法,基于知识本体,通过问题库构建、评价体系构建、知识的问答获取、问答库的持续优化和问答库应用来构建用于危险化学品的公共信息服务问答库。与现有技术相比,本发明针对不同用户的危险化学品问答服务需求,通过将权威多源数据库整合构建出一个专业、全面、权威的问答库,解决了面向危险化学品信息服务领域的危化品种类多,用户提出的问题也是多种多样,改变了由于个人记忆力有限,不能全部记住所有的危化品知识,导致无法及时专业的处理化学事故引发的严重后果。
32.本发明专利解决了面向危险化学品信息服务领域的危化品种类多,用户提出的问题也是多种多样。因此,基于检索式的问题问答,通过问句理解、信息检索、答案生成等技术手段,改变了目前尚未有一个专门针对危险化学品问题查询的系统,通过将权威多源数据库整合构建出一个专业、全面、权威的问答库,构建完善的危险化学品公共服务问题,将平台由服务内容提供向知识服务转变,就需要以“用户需求”为中心,为用户提供个性化的知识服务。
33.通过把现有的应急响应数据库、化学品速查通、chemwatch、化救通以及事故案例数据库等相关的权威数据库进行整合,基于知识本体,从问答库构建、评价体系构建、问答获取、问答库的持续优化、问答库应用等方面来构建危险化学品公共信息服务问答库,为用户提供个性化的知识服务。
附图说明
34.为了清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
35.图1是公共服务问答库构建方法得程序框图。
36.图2是问题库构建的方法程序框图。
具体实施方式
37.本发明提供了一种公共服务问答库构建方法,为使本发明的目的、技术方案及效果更加清楚、明确,以下对本发明进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
38.下面结合附图对本发明进行详细说明:
39.实施例1
40.结合图1和图2,一种公共服务问答库构建方法,基于知识本体,通过问题库构建、评价体系构建、知识的问答获取、问答库的持续优化和问答库应用来构建用于危险化学品的公共信息服务问答库。
41.问题库构建的方法包括如下步骤:
42.步骤a1,通过问答库获取与应用的基础,并利用基于本体的知识表示方法,对危险化学品公共信息服务领域实体进行本质抽象;
43.步骤a2,强调实体间的关系,并通过多种知识表示元素将这些关联表达和反映出来,以达到实现最大程度的危险化学品公共信息服务的问题共享与重用;
44.步骤a3,根据服务来源、数据类型的不同,对问题进行分类,形成多种类别的问答库;
45.步骤a4,采用知识树的方法对问答进行组织,在每一层中,知识节点与其相邻常点在粒度上保持一致;
46.步骤a5,系统根据用户业务经验针对每一类问答设置对应的树形问答体系。
47.步骤a1中的多种知识表示元素包括概念、属性、关系、函数、公理和实例;
48.所述步骤a4中知识树的层次越高,知识节点与其相邻常点的粒度越大;知识树的层次越低,知识节点与其相邻常点的粒度越小。
49.步骤a3中的多种类别的问答库为四类,四类问答库分别为基础查询类、应急响应类、事故案例类和安全管理类;确定好这四类后,再对这四类中的每一类问答库可以进一步详细分类。本发明中的问答库除了上述四类外,还可进行问答库的拓展应用,拓展应用是根据不同企业的不同需求的拓展应用。
50.步骤a5中的步骤用户可对树形问答体系进行编辑,添加或删除节点,并可对节点名称进行重置。
51.评价体系构建包括问答库的完整度构建、问答库的有效性构建和问答库的相关度构建。
52.问答库的完整度构建由业务专家确定不同类型问答属性的权重值及分值,系统根据问答条目属性填充的完整性直接计算得出;完整性计算规则为:权重*得分,从而得出每一个问答条目的完整度百分比。
53.问答库的有效性构建是由系统与业务专家交互得到,业务专家查看某一问答条目时,可以对该问答的有用性进行评价,系统会实时显示每一问答条目的有用性数量分布情况。
54.问答库的相关度构建由业务专家评价某一知识条目是否与业务相关,指定相关值;结合公众用户对问答条目进行相关性评价时,采用中位值进行显示。
55.知识的问答获取的内容包括知识获取过程、问答标注的过程和问答维护的过程。
56.知识获取过程是从结构化和非结构化的数据资源中提取知识的过程;
57.结构化知识获取指从特定格式的数据,从结构化数据库记录、xml等含有标签的半结构化数据中进行解析,从而获取多个知识实体及其详细属性,以及知识实体间存在的关联关系;
58.非结构化知识获取则通过导入的文本类材料提取文档中提及的实体与关系、要素关键词与文档摘要等,通过自动识别抽取内容的类别将其存储到不同的知识条目集合中。
59.问答标注的过程为采用众包方式对问答库进行知识标注,标注人员可以选中某实体对其进行标注,标注的知识在多个数据源中互联互通;
60.若待标注的知识已存在于知识库中,则智能提示补全,节约标注时间,提高标注效率,保证标注的统一性。
61.问答维护的过程为针对每个知识实体,以可视化的形式对与该实体存在直接关系的关联实体进行展示,并支持对该实体的关联实体及关联关系的可视化编辑对知识实体进行维护。
62.问答库的持续优化方法是将构建出的危险化学品公共信息服务问答库进行持久
化存储,利用基于图结构存储的知识持久化技术,在分布式图数据处理平台的基础上,采用新型的查询模型、算法和计算平台分别从图数据查询模型、分布式查询算法、分布式查询执行优化三个方面对知识进行持久化,并提供快速高效的新型分布式查询技术,实现快速高效的数据存储与查询。
63.问答库应用基于构建的面向基础查询、应急响应、事故案例、安全管理四大类别的问答库,除能够直接提供相关问答的检索和推荐外,还能够提供用于问答知识的多种应用功能。
64.多种应用功能包括联想与推演、启发式搜索、个性化推荐及智能问答分析。
65.实施例2
66.结合图1和图2,公共服务问答库构建方法将基于知识本体来构建问答库,将从问答库构建、评价体系构建、问答获取、问答库的持续优化、问答库应用等方面来构建危险化学品公共信息服务问答库。
67.01、问答库构建,知识表示是问答库获取与应用的基础,利用基于本体的知识表示方法,对危险化学品公共信息服务领域实体进行本质抽象,强调实体间的关系,并通过多种知识表示元素将这些关联表达和反映出来,主要由概念、属性、关系、函数、公理、实例构成,以达到实现最大程度的危险化学品公共信息服务的问题共享与重用。
68.根据服务来源、数据类型的不同,对问题进行分类,形成面向基础查询、应急响应、事故案例、安全管理四大类别的问答库,每一类问答库可以进一步详细分类。采用知识树的方法对问答进行组织,在每一层中,知识节点与其相邻常点在粒度上保持一致。层次越高,粒度越大;层次越低,粒度越小。系统根据用户业务经验针对每一类问答设置对应的树形问答体系。用户可对该体系进行编辑,添加或删除节点,并可对节点名称进行重置。
69.02、评价体系构建,问答库从完整度、有效性和相关度三个方面进行评价。完整性由业务专家确定不同类型问答属性的权重值及分值,系统根据问答条目属性填充的完整性直接计算得出,完整性计算规则为:权重*得分,从而得出每一个问答条目的完整度百分比;问答的有效性是由系统与业务专家交互得到,业务专家查看某一问答条目时,可以对该问答的有用性进行评价,系统会实时显示每一问答条目的有用性数量分布情况。问答的有用性,由业务专家评价某一知识条目是否与业务相关,指定相关值。结合公众用户对问答条目进行相关性评价时,采用中位值进行显示。
70.03、问答获取,包括问答提取、问答标注和问答维护等技术。
71.1)构架问答库的过程,实际上是从结构化和非结构化的数据资源中提取知识的过程。结构化知识获取指从特定格式的数据,例如结构化数据库记录、xml等含有标签的半结构化数据中进行解析,从而获取多个知识实体及其详细属性,以及知识实体间存在的关联关系;非结构化知识获取则通过导入的文本类材料提取文档中提及的实体与关系、要素关键词与文档摘要等,通过自动识别抽取内容的类别将其存储到不同的知识条目集合中。
72.2)采用众包方式对问答库进行知识标注,标注人员可以选中某实体对其进行标注,标注的知识在多个数据源中互联互通。若待标注的知识已存在于知识库中,则智能提示补全,节约标注时间,提高标注效率,保证标注的统一性。
73.3)针对每个知识实体,以可视化的形式对与该实体存在直接关系的关联实体进行展示,并支持对该实体的关联实体及关联关系的可视化编辑对知识实体进行维护。
74.04、问答库的持续优化的目的是将构建出的危险化学品公共信息服务问答库进行持久化存储,利用基于图结构存储的知识持久化技术,在分布式图数据处理平台的基础上,采用新型的查询模型、算法和计算平台分别从图数据查询模型、分布式查询算法、分布式查询执行优化三个方面对知识进行持久化,并提供快速高效的新型分布式查询技术,实现快速高效的数据存储与查询。
75.05、问答库应用
76.基于上述构建的面向基础查询、应急响应、事故案例、安全管理四大类别的问答库,除能够直接提供相关问答的检索和推荐外,还能够提供问答知识的联想与推演、启发式搜索、个性化推荐及智能问答等多种丰富的分析应用功能。
77.实施例3
78.本发明中的公共服务问答库构建方法,根据服务来源、数据类型的不同,对问题进行分类,形成面向基础查询、应急响应、事故案例、安全管理四大类别的问答库,每一类问答库可以进一步详细分类。
79.第一类基础查询问答主要是针对用户学习,自我补充化学品相关知识,如咨询氰化钠是否是剧毒品,重点监管的危险化工工艺,重点监管的化学品等问题,其答案来源于国家颁布的目录或行业规定等,还包括一些化学品相关的法律法规等。
80.第二类应急响应问答主要是咨询事故状态下的危化品应急响应措施,即当化学品发生火灾、爆炸、中毒、泄漏等事故时,咨询化学品的理化特性、危险性、应急处置措施等问题,根据化学品安全技术说明书的内容,一种化学品至少可以提取出30个相关问题。
81.第三类是事故案例问答,主要针对学者研究事故发生发展的规律,查找事故根原因,做学术研究。
82.第四类安全管理问答主要是关于安全生产标准化问题、应急演练、危化品运输管理等。
83.在构建问答库的时候要做到常见问题优先、相近问题分组存放、相似问题合并处理。
84.①
常见问题优先。要遵循先放入常见问题的意识,毕竟企业的维护精力有限,常见问题在用户咨询工作中能发挥的作用更大,所以先放常见问题是必要的。结合实际咨询需求,建议先放入农药类化学品中毒急救方面的常见问题,方便用户查找。
85.②
相近问题分组存放。意思相近的问题要尽量放在一个组,不同类型问题(sds相关问题、事故案例类问题等)放在不同组。因为问答库是通过在库内匹配和用户问题最相近的问题来完成回复的,比如“氢气的灭火剂”和“氢气用什么灭火”意思基本相同,如果不放在同一组,问答库就会认为两个问题是不同的,进而使问答库产生语义上的混淆。不同类型的问题进行分组也有利于知识库对问题的识别。
86.③
相似问题合并处理。如果主要关键词相同,只是语句顺序不同、连接词不同的问题不必添加在相似问题中。比如“氢气用什么灭火”和“氢气的灭火剂有哪些”,两个问题的主要关键词都是“氢气、灭火”,在库内有“氢气的灭火剂”的情况下,即使不添加相似问题也可以识别回复,添加过多反而会增加问答库的工作量。
87.实施例4、
88.化学品问答库构建完成后,企业在使用过程中需要通过问答库优化来提高用户问
题的覆盖率和匹配准确率。企业在对化学品问答库统计的数据进行分析的时候,可能会发现构建的问答库在匹配中会出现无法匹配答案或匹配的答案不合适的情况,出现这种情况后我们首先要分析出现这种情况的深层次原因到底是什么,然后根据使用问题有针对性的优化问答库。
89.(1)无法匹配答案
90.①
化学品问答库不能理解用户问题:问答库无法根据用户问题匹配答案时,可能问答库中已经有可以回答的答案,但是因为用户的问法比较特别,导致问答库无法匹配,这时候可以通过添加相似问题来实现优化,解决这类问题。
91.②
化学品问答库无答案可以匹配:问答库无法匹配答案时,也可能是因为问答库中没有这个问题的答案,这种情况下补充添加问题的答案就可以解决问题。
92.(2)匹配答案错误
93.①
答案本身不合适:化学品问答库本身具备自然语义处理能力,可以对近似问题进行匹配回答,如果在答案回复使用户不满意的情况下,反查发现问题匹配没有问题,那企业可能需要通过修改答案来进行问题库的优化。
94.②
多个问题相似:如果因为多个问题相似导致化学品问答库匹配错误,企业要注意尽量把非常相似的问题添加相似问答,采用一个答案,减少知识的种类。如果确实是问题描述相似,但答案有较大差别,可以将问题添加为关联问题,问答库无法准确判断时,通过推荐点选的方式实现这部分问题的回复。
95.(3)发动用户参与,优化问题库
96.问答库在构建初期无法涵盖所有的化学品相关问题,通过与用户互动的方式,发动用户积极参与问答库的优化。用户在使用过程中遇到未检索出所需问题时,可以通过给后台留言的方式,把所要查询的问题发给后台。后台人员在反查问答库时,若有对应的答案,则可以把用户的提问方式作为近似问题补充添加到问答库中。若问答库中也没有答案,则可以通过查询文献资料或问询专家的方式,找到答案,并把问题及答案一并添加至问答库中,从而逐步扩充问答库的知识储备,达到优化问答库,完善问答库的目的。
97.与现有技术相比,本发明针对不同用户的危险化学品问答服务需求,通过将权威多源数据库整合构建出一个专业、全面、权威的问答库,解决了面向危险化学品信息服务领域的危化品种类多,用户提出的问题也是多种多样,改变了由于个人记忆力有限,不能全部记住所有的危化品知识,导致无法及时专业的处理化学事故引发的严重后果。
98.本发明专利解决了面向危险化学品信息服务领域的危化品种类多,用户提出的问题也是多种多样。因此,基于检索式的问题问答,通过问句理解、信息检索、答案生成等技术手段,改变了目前尚未有一个专门针对危险化学品问题查询的系统,通过将权威多源数据库整合构建出一个专业、全面、权威的问答库,构建完善的危险化学品公共服务问题,将平台由服务内容提供向知识服务转变,就需要以“用户需求”为中心,为用户提供个性化的知识服务。
99.当然,上述说明并非是对本发明的限制,本发明也并不仅限于上述举例,本技术领域的技术人员在本发明的实质范围内所做出的变化、改型、添加或替换,也应属于本发明的保护范围。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献