一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

化学品安全知识图谱的构建方法及装置与流程

2022-05-18 16:16:10 来源:中国专利 TAG:


1.本技术涉及知识图谱技术领域,特别涉及一种化学品安全知识图谱的构建方法及装置。


背景技术:

2.1.知识图谱
3.知识图谱是结构化的语义知识库,用于描述物理世界中的概念及其相互关系,通过将描述粒度从文档级别细化到数据级别,以聚合海量文档中的语义知识,从而实现知识的快速响应和语义推理。“领域知识图谱”以其更加符合实际应用需求的特性在不同领域得到了广泛应用。
4.2.化学品安全技术说明书(material safety data sheet,msds)
5.msds是化学品生产或销售企业按法律要求向客户提供的有关化学品特征的一份综合性法律文件。它提供化学品的理化参数、燃爆性能、对健康的危害、安全使用贮存、泄漏处置、急救措施以及有关的法律法规等内容。化学品生产商和进口商用msds来阐明化学品的理化特性(如ph值,闪点,易燃度,反应活性等)以及对使用者的健康(如致癌,致畸等)可能产生的危害,包括安全使用化学品的指引、潜在的可能由化学品引发的威胁,及给实际操作人员、运输存储人员和紧急救护人员一个安全处理方法等。所以危化品领域一直要求研发和生产化学品组织要根据实际接触者、使用者、操作者及其他应急人员看得懂的语言来书写msds文件。msds也被称为安全技术/数据说明书sds(safety data sheet)。国际标准化组织(iso)以及欧洲国家通常采用sds术语,北美,澳洲以及亚洲许多国家则采用msds术语。msds与sds仅仅是不同国家标准中对化学品安全技术描述的两种不同缩写,在化学品供应链上所起的作用完全一致,在描述格式及内容上的差异也主要取决于所采用的危险性分类和格式编辑等相关的标准。
6.我国在2008年前的gb/t16483-2000中将msds称为csds(chemical safety data sheet),2008年重新修订的标准gb/t 16483-2008《化学品安全技术说明书内容和项目顺序》中,采用了与国际标准化组织给出的术语,将csds缩写为sds。但在日常工作中,我国企业还是将化学品安全技术说明书习惯称之为msds。
7.根据联合国全球化学品统一分类和标签制度(ghs制度)、欧盟化学品注册、评估、许可和限制(reach法规)、iso 11014-2009、gb/t 16483-2008、gb/t 17519-2013等国内外化学品安全相关标准的规定,msds一般由以下十六部分信息组成:化学品及企业标识、成分/组成信息、危险性概述、急救措施、消防措施、泄漏应急处理、操作处置与储存、接触控制/个体防护、理化特性、稳定性和反应性、毒理学资料、生态学资料、废弃处置、运输信息、法规信息、其它信息。不同国家的标准或同一国家不同时期的标准对msds每个部分的标题、编号和前后顺序都进行了相关的规范,化学品组织在生产、运输、销售和使用过程中都必须遵守这些标准规范文档编制和使用msds。
8.msds是化学品供应链上物质信息传递的主要方式之一,其内容涉及到化学品的整
个生命周期,包含了化学品的危害信息和安全防护建议等。msds为接触化学品的相关人员提供了有关人类健康和环境安全防护方面的必要措施,也为不同环节的相关人员提供有价值的综合性建议。目前,msds已成为众多先进化学品组织进行化学品安全管理的重要手段,也是我国《危险化学品安全管理条例》明确提出的企业责任和政府监管重点。因此正确的msds对企业来讲,无论是保证化学品质量,还是对化学品风险管理都具有重要作用。
9.3.基于msds的“领域知识图谱构建”10.面向化工领域的符合msds规范的各种文档按照风险评估需求将其转换为化学品安全知识图谱的过程。本专利的化学品安全知识图谱构建采用自底向上的方法,通过对msds文档及其相关的领域标准规范中的实体和关系进行归纳组织,形成底层概念,再逐步抽取上层共性特征,尤其是工业安全价值相关的主要概念实体及关系。主要分析步骤包括知识建模、存储、抽取、融合、计算以及应用。
11.msds十六部分的内容很多,生产、运输、销售和使用过程中,安全管理人员及一般客户并不需要都熟悉所有知识点,对于安全生产管理和风险管理人员关注的那些知识点的具体数值,包括这些参考标准来源也不容易记住。本专利基于msds中与事故预防、风险分级管控、隐患排查相关的工艺安全信息及各种潜在的危害构建安全知识图谱,将海量的msds文档及其关联的技术标准形成化学品安全知识图谱,并存储到数据库中,再通过大数据分析技术形成安全生产所需的各种知识就非常方便生产企业、监管机构、安全评价等相关人员查询和使用。这是因为传统的文档表示方式的化学品msds是面向专业人员的,对应组织的风险管理、风险应对和风险分级管控和隐患排查等工业安全应用需求还存在如下不足:
12.(1)msds没有明确描述十六部分内容之间的内部因果和关联关系,特别是相关概念及其联系需要它的使用者依据自己的知识背景,查阅相关的技术标准及其机理文件进行理解。
13.(2)msds没有针对安全评价、风险管理等直接工业安全生产需求给出危化品安全管理相关的关键特性,需要它的使用者根据危化品在生产、运输、销售和使用等上下文环境及相关的支持文件自己来理解和把握。
14.(3)msds是对各种化学品的描述,限于它使用者的背景知识及其技术手段,使用者难以揭示不同化学品之间的本质安全等深层次关联关系。


技术实现要素:

15.本技术提供一种化学品安全知识图谱的构建方法及装置,采用自然语言处理、数据挖掘等大数据分析技术对msds文档进行处理,构建针对安全生产、风险管理、分级管控、隐患排查等相关的化学品安全知识图谱,以弥补传统msds在生产、运输、销售和使用的不足,可以广泛应用于msds的分析处理中。
16.本技术第一方面实施例提供一种化学品安全知识图谱的构建方法,包括以下步骤:获取至少一份化学品安全技术说明书文档;从所述至少一份化学品安全技术说明书文档中提取实体、关系和实体或者实体、属性和属性值以及知识图谱特征;根据提取的所述实体、关系和实体或者实体、属性和属性值以及知识图谱特征构建所述化学品安全技术说明书文档的知识图谱。
17.可选地,在本技术的一个实施例中,所述根据提取的所述实体、关系和实体或者实
体、属性和属性值以及知识图谱特征构建所述化学品安全技术说明书文档的知识图谱,包括:以各个化学品的名称构建所述化学品安全知识图谱的中心结点,使得从所述中心节点一跳到达所述化学品安全技术说明书文档的十六部分对应的节点;根据所述化学品安全技术说明书文档的十六部分之间的因果和关联关系构建二跳结点,并且判断所述二跳节点是否满足展开条件;如果不能满足所述展开条件,则根据所述化学品安全技术说明书文档的十六部分之间或与第一支撑标准规范文档的关联关系构建三跳结点,并根据所述化学品安全技术说明书文档的十六部分之间或与第二支撑标准规范文档的关联关系构建四跳结点。
18.可选地,在本技术的一个实施例中,还包括:利用知识融合将所有化学品安全技术说明书文档的知识图谱进行融合。
19.可选地,在本技术的一个实施例中,还包括:构建所述化学品安全技术说明书文档的知识图谱与外部组织及其使用的关联关系。
20.可选地,在本技术的一个实施例中,所述构建所述化学品安全技术说明书文档的知识图谱与外部组织及其使用的关联关系,包括:识别所述外部组织的实际类别;若所述实际类别为面向监管,则基于《危险化学品安全管理条例》规定的四项备案制度、五项名单公告制度、七项其他法律规章、十五项审查、审批制度生成所述化学品安全知识图谱的至少一个展开结点;若所述实际类别为面向生产,则基于化学品的注册、评估、授权和限制信息,结合化学品新特征的公告、化学品安全技术说明书和化学品安全标签与国家标准的关系、化学品生产的监管生成所述化学品安全知识图谱的至少一个展开结点;若所述实际类别为面向供应链,则基于化学品安全性评估、安全标签和安全数据单、化学品的危害信息和安全防护建议信息和clp法规内容生成所述化学品安全知识图谱的至少一个展开结点。
21.本技术第二方面实施例提供一种化学品安全知识图谱的构建装置,包括:获取模块,用于获取至少一份化学品安全技术说明书文档;提取模块,用于从所述至少一份化学品安全技术说明书文档中提取实体、关系和实体或者实体、属性和属性值以及知识图谱特征;构建模块,用于根据提取的所述实体、关系和实体或者实体、属性和属性值以及知识图谱特征构建所述化学品安全技术说明书文档的知识图谱。
22.可选地,在本技术的一个实施例中,所述构建模块,包括:中心结点确定单元,用于以各个化学品的名称构建所述化学品安全知识图谱的中心结点,使得从所述中心节点一跳到达化学品安全技术说明书文档的十六部分对应的节点;二跳结点确定单元,用于根据所述化学品安全技术说明书文档的十六部分之间的因果和关联关系构建二跳结点,并且判断所述二跳节点是否满足展开条件;外环结点确定单元,用于在不能满足所述展开条件时,根据所述化学品安全技术说明书文档的十六部分之间或与第一支撑标准规范文档的关联关系构建三跳结点,并根据所述化学品安全技术说明书文档的十六部分之间或与第二支撑标准规范文档的关联关系构建四跳结点。
23.可选地,在本技术的一个实施例中,还包括:融合模块,用于利用知识融合将所有化学品安全技术说明书文档的知识图谱进行融合。
24.可选地,在本技术的一个实施例中,还包括:关联模块,用于构建所述化学品安全技术说明书文档的知识图谱与外部组织及其使用的关联关系。
25.可选地,在本技术的一个实施例中,所述关联模块,包括:识别单元,用于识别所述外部组织的实际类别;第一生成单元,用于在所述实际类别为面向监管时,基于《危险化学
品安全管理条例》规定的四项备案制度、五项名单公告制度、七项其他法律规章、十五项审查、审批制度生成所述化学品安全知识图谱的至少一个展开结点;第二生成单元,用于在所述实际类别为面向生产时,基于化学品的注册、评估、授权和限制信息,结合化学品新特征的公告、化学品安全技术说明书和化学品安全标签与国家标准的关系、化学品生产的监管生成所述化学品安全知识图谱的至少一个展开结点;第三生成单元,用于在所述实际类别为面向供应链时,基于化学品安全性评估、安全标签和安全数据单、化学品的危害信息和安全防护建议信息和clp法规内容生成所述化学品安全知识图谱的至少一个展开结点。
26.本技术的化学品安全知识图谱的构建方法及装置,具有以下有益效果:
27.1)化学品物性结构化:通过自然语言处理技术分析大量化学品安全技术说明书,挖掘出各化学品的十六部分之间的因果和关联关系。首先挖掘到一个化学品的分子式就是其本质属性,它决定一个化学品的物性。通过挖掘大量的msds,发现“理化特性”、“稳定性和反应性”、“毒理学资料”和“生态学资料”是一个化学品四个方面的物性,化学品安全知识图谱构建方法就是围绕各个化学品的物性展开的。
28.2)本质属性与物性关系结构化:挖掘msds十六部分之间的因果和关联关系,并把这些因果和关联关系在知识图谱中展现出来,主要是本质属性和物性之间的因果关系以及物性和其它部分之间的因果关系。
29.3)化学品关键特性结构化:从一种msds挖掘出它的关键特性,并把该关键特性和其它部分之间的关联关系在知识图谱中展现出来。
30.4)知识融合:通过知识融合构建所有msds知识图谱之间的关联关系,接着把这种关联关系在知识图谱中展现出来。并和支撑标准规范文档《常用危险化学品的分类及标志》gb 13690-2009和《危险化学品安全管理条例》等进行知识融合。
31.5)智能图析挖掘。构建化学品安全知识图谱后,就可以在该知识图谱上使用图计算与图算法进行推理和挖掘,可以进行的操作包括但不限于:图遍历、路径计算、统计计算、路径探寻、中心度分析和群体分析等。
32.6)智能知识问答。每份msds都是独立的,一旦构建完这些msds的知识图谱,则它们之间的关联关系就通过知识融合展示出来了;知识点被具有语义信息的边所关联,从问句到知识图谱的知识点的匹配关联过程中,可以用到大量其关联节点的因果和关联信息,通过这些因果和关联信息可以对问句的语义理解更加精确,还可以通过查询语句查询出msds之间的关联关系,这是msds文档不具备的。
33.本技术附加的方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本技术的实践了解到。
附图说明
34.本技术上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解,其中:
35.图1为根据本技术实施例提供的一种化学品安全知识图谱的构建方法的流程图;
36.图2为根据本技术实施例提供的化学品安全技术说明书知识图谱概图;
37.图3为根据本技术实施例提供的化学品的本质属性示意图;
38.图4为根据本技术实施例提供的化学品的物性示意图;
39.图5为根据本技术实施例提供的决定危险性概述的因素示意图;
40.图6为根据本技术实施例提供的急救措施途径和原因的决定因素示意图;
41.图7为根据本技术实施例提供的决定消防措施的因素示意图;
42.图8为根据本技术实施例提供的决定泄漏应急处理的因素示意图;
43.图9为根据本技术实施例提供的决定操作处置与储存的因素示意图;
44.图10为根据本技术实施例提供的接触控制/个体防护途径和原因的决定因素示意图;
45.图11为根据本技术实施例提供的决定废弃处置的因素示意图;
46.图12为根据本技术实施例提供的决定运输信息的因素示意图;
47.图13为根据本技术实施例提供的决定法规信息的因素示意图;
48.图14为根据本技术实施例提供的化学品安全知识图谱的构建装置结构示意图。
具体实施方式
49.下面详细描述本技术的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,旨在用于解释本技术,而不能理解为对本技术的限制。
50.本技术能够通过自然语言处理技术可为不同的化学品组织高效地构建其化学品安全知识图谱,并把构建的知识图谱存储到相应的数据库中,以方便后续的数据处理和各种应用开发工作。本技术的高效性体现在一旦把msds转换成知识图谱并把知识图谱存储到数据库中后,通过与msds相关的支撑技术文件及危化品在生产、运输、销售和使用等上下文环境关联就变成了危化品安全智能知识图谱平台,危化品安全相关的各个知识点之间都有边相关联,可以进行智能图计算和智能知识问答等深层安全生产相关应用的研发。
51.图1为根据本技术实施例提供的一种化学品安全知识图谱的构建方法的流程图。
52.如图1所示,该化学品安全知识图谱的构建方法包括以下步骤:
53.在步骤s101中,获取至少一份化学品安全技术说明书文档。
54.为了构建化学品安全知识图谱,首先获取化学品安全技术说明书,以对化学品安全技术说明书中的特征进行分析后构建知识图谱。
55.在步骤s102中,从至少一份化学品安全技术说明书文档中提取实体、关系和实体或者实体、属性和属性值以及知识图谱特征。
56.具体地,知识图谱在逻辑上可分为模式层与实例层两个层次。模式层构建在实例层之上,是知识图谱的核心,通常采用本体库来管理知识图谱的模式层。本体是结构化知识库的概念模板,通过本体库而形成的知识库不仅层次结构较强,并且冗余程度较小。模式层:实体-关系-实体,实体-属性-属性值。在本技术中将采用以上两种模式层来具体描述基于msds的危化品安全知识图谱。
57.在本技术中,对于每份msds的知识图谱,其核心实体就是该说明书所涉及的危化品名称,一跳实体就是msds的十六部分标题,二跳或者多跳实体就是各个属性或者属性值。
58.实例层主要是由一系列的事实组成,而知识将以事实为单位进行存储。本技术采用(实体1,关系,实体2)和(实体、属性,属性值)这样的三元组来表达事实,并采用数据库作为实例层数据的存储介质。目前采用的是开源图数据库neo4j。各个危化品的知识图谱都是
逐步展开的,其中危化品的名字为其知识图谱的中心结点,第1跳结点共16个,它们分别对应于msds的十六部分。各个1跳结点的展开根据msds的内容、挖掘的物性、msds各个部分之间的因果或关联关系以及不同msds之间的融合。
59.进一步地,本技术的实施例提取的化学品安全知识图谱特征可以为化学品名称以及化学品安全技术说明书中十六部分间的因果和关联关系等。
60.在步骤s103中,根据提取的实体、关系和实体或者实体、属性和属性值以及知识图谱特征构建化学品安全技术说明书文档的知识图谱。
61.可选地,在本技术的一个实施例中,根据提取的实体、关系和实体或者实体、属性和属性值以及知识图谱特征构建化学品安全技术说明书文档的知识图谱,包括:以各个化学品的名称构建化学品安全知识图谱的中心结点,使得从中心节点一跳到达化学品安全技术说明书文档的十六部分对应的节点;根据化学品安全技术说明书文档的十六部分之间的因果和关联关系构建二跳结点,并且判断二跳节点是否满足展开条件;如果不能满足展开条件,则根据化学品安全技术说明书文档的十六部分之间或与第一支撑标准规范文档的关联关系构建三跳结点,并根据化学品安全技术说明书文档的十六部分之间或与第二支撑标准规范文档的关联关系构建四跳结点。
62.本技术的实施例将msds的十六节内容分为三部分:本质属性、物性、各种危险处理措施,本质属性包括化学品及企业标识和成分/组成信息,物性包括理化特性、稳定性和反应性、毒理学资料和生态学资料,各种危险处理措施包括危险性概述、急救措施、消防措施、泄漏应急处理、操作处置与储存、接触控制/个体防护、废弃处置、运输信息、法规信息和其它信息;msds知识图谱的中心结点是化学品的名称,第一跳结点是msds的十六部分;第二跳结点分两部分,一部分是化学品本质属性结点到四个物性结点,它们是因果关系,另一部分是msds十六节的内容结点;第三跳结点分为两类,第一类展示所属小节的内容,第二类描述结点间的因果和关联关系;第四跳结点都是描述结点间关联关系的,没有新结点生成。
63.在本技术的实施例中,如图2所示,中心结点是各个化学品的名称,从中心结点一跳能够到达msds十六部分对应的节点。二跳结点揭示了msds十六部分之间的因果和关联关系,具体包括:
64.首先描述化学品的本质属性知识图谱,例如分子式、名称以及与之相关的一些特性,附图3所示;这部分构建了msds第一部分“化学品及企业标识”和msds第二部分“成分/组成信息”的知识图谱。本质特性主要是指化学品的分子式,它是化学品的内在组成。
65.通过自然语言处理技术发现,第一部分“化学品及企业标识”和第二部分“成分/组成信息”是一个危化品的本质属性,第一部分“化学品及企业标识”包括“危险品名称”、“产品名称”、“英文别名”、“分子式”、“相对分子质量”和“cas no”,它们都是一个危化品的基本属性。一种危化品的特性是由其分子组成决定的,分子式才是一种危化品的物质基础,而msds就是描述如何处理危化品出现各种情况时对应的处理方式。因此危化品的分子组成才是最本质属性,知识图谱要展现挖掘的这种知识,并把它呈现出来。其中“分子式”是危化品最本质属性是因,是它决定了四种物性,四种物性是果。第二部分“成分/组成信息”包括“有害物成分”和“cas no”,它们也都是危化品的基本属性。
66.第二构建化学品本质属性和物性之间关系的知识图谱,物性是化学品本质属性的外在表现,也就是一个化学品的分子式决定了它的物性。因此本质属性和物性之间关系知
识图谱实际上是描述了化学品分子式和msds第九部分“理化特性”、第十部分“稳定性和反应性”、第十一部分“毒理学资料”和第十二部分“生态学资料”之间的因果关系,附图4描述了这些因果关系。其中,msds中的这四种物性描述的都是一些实验结果和事实结论,它们的二跳知识图谱还分别描述危化品物性各自的特性,也就是通过展开各自属性及其支撑技术标准文件可关联属性值对应的技术标准内容。
67.四种物性包括:第九部分“理化特性”、第十部分“稳定性与反应性”、第十一部分“毒理学资料”和第十二部分“生态学资料”。第九部分“理化特性”描述的是一种危化品的外观与性状等特性,它描述了危化品在不同温度和压力下的特性,它们是一个危化品自己的特性。第十部分“稳定性与反应性”不仅描述了一种危化品本身的特性还描述了如何与其它化学品相处;第十一部分“毒理学资料”主要从健康危害方面描述了一种危化品的毒性以及其对实验对象的损害;第十二部分“生态学资料”主要从环境危害的角度描述了一种危化品的危害方式,包括生态毒性、生物降解性、非生物降解性和生物富集性。这四种物性共同构成了一种危化品物性的四个方面,知识图谱要充分展示出这四种物性。
68.第三构建化学品危险性和物性之间因果关系的知识图谱,msds第三部分“危险性概述”一般有5小节,通过自然语言处理技术发现“毒理学资料”是与“健康危害”因果相关的;“生态学资料”是与“环境危害”因果相关的;“理化特性”、“生态学资料”以及“稳定性和反应性”是与“燃爆危险”因果相关的;“理化特性”和“毒理学资料”是与“侵入途径”因果相关的;附图5描述了化学品危险性与物性之间的这些因果关系。在知识图谱的二跳结点中,“危险性概述”要展开其5小节的内容;“危险性类别”与泄漏应急处理、消防措施、操作处置与储存、个体防护、运输信息的关联关系将在知识图谱的多跳中构建,多跳就是从化学品名称出发超过二跳可达的结点。
69.通过自然语言处理技术进一步发现msds的第三条特性“危险性概述”是对这四种物性危害的一个简要概括,这一部分一共描述危化品的五种特征,它们是“危险性类别”、“侵入途径”、“健康危害”、“环境危害”和“燃爆危险”。其中“危险性类别”给这种危化品定性,根据《常用危险化学品的分类及标志》(gb 13690-2009)可知,危险化学品被分为八类,它们是:“爆炸品”、“压缩气体和液化气体”、“易燃液体”、“易燃固体、自燃物品和遇湿易燃物品”、“氧化剂和有机过氧化物”、“有毒品”、“放射性物品”和“腐蚀品”。对于每种化学品在其msds中都给出了它的主要特性,也就是要给它定性,并且对每种化学品应选用适当的基本危险特性来表示它们易发生的危险。在知识图谱中充分揭示了“危险性类别”的定性作用,并且挖掘出每种危险性类别具有的基本特性,这是msds没有明说,而需要使用者自己把握的。
[0070]“危险性概述”的其它四个特性是对第一个特性的支持,它们从四个方面描述了该危化品的危险性表现形式,并且在后面还要展开讲,以从多个角度揭示危化品的危险性,这也正是危化品内部的因果和关联关系。进一步发现“侵入途径”是由“理化特性”决定的,危化品的外观与性状是其“侵入途径”的直接原因,因此“理化特性”是因,“侵入途径”是果。“健康危害”讲的是中毒后的症状,它实际上是第十一部分“毒理学资料”的危害形式,也就是揭示了“健康危害”症状的原因,因此它是“健康危害”的物质基础和因,也就是说“毒理学资料”这一物性蕴含了“健康危害”症状,“健康危害”是其果;更进一步看到“急救措施”主要是从毒性也就是从“毒理学资料”角度考虑如何对中毒人员进行急救的。“环境危害”讲的就
是生态危害方面的事情了,它实际上是第十二部分“生态学资料”的危害形式,也就是揭示了“环境危害”的原因,因此它是“环境危害”的物质基础和因,也就是说“生态学资料”这一物性蕴含了“环境危害”并且“环境危害”是其果。“燃爆危险”讲的就是“理化特性”和“稳定性和反应性”方面的事情了,它实际上是第九部分“理化特性”和第十部分“稳定性和反应性”的危险形式,也就是揭示了“燃爆危险”的原因,因此它们是“燃爆危险”的物质基础和因,也就是说“理化特性”和“稳定性和反应性”这两种物性蕴含了“燃爆危险”并且“燃爆危险”是其果。知识图谱要清晰地揭示出“危险性概述”和四种物性之间的因果关系。
[0071]
第四构建危化品急救措施和物性之间因果关系的知识图谱,通过自然语言处理技术分析msds第四部分“急救措施”的内容。第三部分“危险性概述”的“侵入途径”一般为“吸入、食入、经皮吸收”,第四部分“急救措施”是从四个方面来讲述的,它们是“吸入”、“食入”、“皮肤接触”和“眼睛接触”,讲述了在这几种情况下如何进行急救,因此和“侵入途径”是直接相关的;知识图谱当然要显示描述这种关联关系。msds中的“急救措施”描述了针对第三部分“危险性概述”的“健康危害”在各种侵入途径下做出的反应,因此“理化特性”和“毒理学资料”等物性与“急救措施”之间是因果相关的;附图6描述了危化品急救措施与物性之间的这些因果关系。在二跳结点中,“急救措施”要展开自己各小节的内容,以便构建知识图谱的“属性-属性值”部分。知识图谱要构建出“理化特性”和“毒理学资料”这两种物性与“急救措施”之间的因果关系。
[0072]
第五构建危化品消防措施和物性之间因果关系的知识图谱。msds第五部分“消防措施”有4小节,通过自然语言处理技术发现“理化特性”、“毒理学资料”以及“稳定性和反应性”与“危险特性”是因果相关的;4种物性与“灭火注意事项及措施”是因果相关的;附图7描述了这些因果关系。在二跳结点中,“消防措施”要展开自己4小节的内容。
[0073]“消防措施”包含四部分“危险特性”、“有害燃烧产物”、“灭火方法”和“灭火注意事项及措施”,它们不是凭空出现的而是四种物性的要求,是“理化特性”、“稳定性和反应性”、“毒理学资料”和“生态学资料”共同决定的。其中“危险特性”描述的是“理化特性”和“毒理学资料”在发生危险时的表现形式;也描述了该危化品的“稳定性和反应性”,也就是和那些危化品在一起会发生危险的反应以及独处时的表现。“灭火注意事项及措施”描述的是在处理危化品危险事故时,消防人员如何根据该危化品的“理化特性”和“毒理学资料”来保护好自己,还要进一步考虑在进行灭火的时候如何保护好生态环境。知识图谱要展示好“消防措施”和四种物性之间的因果关系。
[0074]
第六危化品泄漏应急处理和物性之间因果关系的知识图谱,通过自然语言处理技术发现msds第六部分“泄漏应急处理”主要是“理化特性”、“毒理学资料”和“生态学资料”与“泄漏应急处理”因果相关;附图8描述了这些因果关系。在二跳结点中,“泄漏应急”处理还要展开自己各小节的内容。
[0075]“泄漏应急处理”是由“理化特性”、“毒理学资料”和“生态学资料”共同决定的,这三种物性是因“泄漏应急处理”是果;在进行“泄漏应急处理”时,要从“理化特性”和“毒理学资料”两方面的危险性保护好应急处理人员和周围的人群;还要从“生态学资料”的危险性方面减轻对环境的影响。知识图谱要把这些因果关系构建处理好。
[0076]
第七构建危化品操作处置与储存和物性之间因果关系的知识图谱,通过自然语言处理技术发现4种物性都与msds第七部分“操作处置与储存”是因果相关的;附图9描述了这
些因果关系。在二跳结点中,“操作处置与储存”还要展开自己各小节的内容。
[0077]“操作处置与储存”的知识图谱要构建出其与四种物性的因果关系,其中“操作注意事项”要从“理化特性”的危险性和“毒理学资料”的危险性两方面保护好操作人员;要从“稳定性和反应性”方面考虑避免与其它相关化学品接触,还要从“生态学资料”方面考虑对环境的影响。而“储存注意事项”主要描述的是如何从“理化特性”的危险性和“稳定性和反应性”两方面来储存该危化品。知识图谱要充分揭示出这些因果关系。
[0078]
第八构建危化品“接触控制/个体防护”和物性之间因果关系的知识图谱,通过自然语言处理技术发现只有“毒理学资料”和“理化特性”与msds第八部分“接触控制/个体防护”因果相关;附图10描述了这些因果关系。在二跳结点中,“接触控制/个体防护”还要展开自己各小节的内容。
[0079]“个体防护”主要是谈从“理化特性”和“毒理学资料”的危险性两方面如何保护好自己,这两种物性和“个体防护”是因果关系,“个体防护”又和“急救措施”的四个方面呼应起来了,知识图谱要揭示出这些因果和关联关系。也可以看出msds的文档是前后呼应的,知识图谱理所当然要把这些因果和关联关系构建出来。
[0080]
第九构建危化品废弃处置和物性之间因果关系的知识图谱,通过自然语言处理技术发现只有“理化特性”、“毒理学资料”和“生态学资料”与msds第十三部分“废弃处置”因果相关;附图11描述了这些因果关系。在二跳结点中,“废弃处置”还要展开自己各小节的内容。
[0081]“废弃处置”主要是根据“理化特性”、“毒理学资料”和“生态学资料”等三种物性来进行处置的,这三种物性不一样的危化品处置策略不一致,这三种物性一样的危化品处置策略是一致的。这三种物性和“废弃处置”之间是因果关系,知识图谱要构建出这些因果关系来。
[0082]
第十构建危化品运输信息和物性之间因果关系的知识图谱,通过自然语言处理技术发现4种物性都与msds第十四部分“运输信息”因果相关;附图12描述了这些因果关系。在二跳结点中,“运输信息”还要展开自己各小节的内容。
[0083]“运输信息”是从危化品的“理化特性”、“稳定性和反应性”、“毒理学资料”和“生态学资料”等四种物性来进行考虑的,其中“包装类别”、“包装标志”和“包装方法”主要是从“理化特性”和“毒理学资料”两方面来考虑的;而“运输注意事项”需要是从“理化特性”、“稳定性和反应性”、“毒理学资料”和“生态学资料”等四种物性来考虑的;因此这四种物性和“运输信息”之间是因果关系,知识图谱要充分揭示这些因果关系。
[0084]
第十一构建危化品法规信息和物性之间因果关系的知识图谱,法规当然要从物性的各个角度来进行立法处理,因此4种物性都与msds第十五部分的“法规信息”因果相关;附图13描述了这些因果关系。在二跳结点中,“法规信息”还要展开自己各小节的内容。
[0085]“法规信息”也是从危化品的四种物性出发进行立法的,从msds可以看出,不同物性危化品的法规信息是不同的,但相同物性危化品的法规信息是相同的。因此也可以当着四种物性是因“法规信息”是果,知识图谱要把msds的这些特性构建出来。
[0086]
进一步地,当二跳结点不能完全展开某部分的内容或者不能展示该部分和其它部分之间的关联关系时,本技术就展开msds该部分知识图谱的三跳或者四跳结点。其中三跳结点揭示msds化学品安全技术说明书十六部分之间或与支撑标准规范文档(《常用危险化
学品的分类及标志》gb 13690-2009和《危险化学品安全管理条例》)的关联关系,具体包括以下步骤:
[0087]
第一构建“毒理学资料”知识图谱的三跳结点,用来显示各自的内容。
[0088]
第二构建“危险性概述”知识图谱的三跳结点,其中描述“侵入途径”的3个结点展开和其它部分的关联关系,而“危险性类别”的三跳结点揭示的是该化学品的关键特性。此外,化学品安全技术说明书和第一支撑标准规范文档的关联关系构建三跳结点。
[0089]
四跳结点揭示msds十六部分之间或与支撑标准规范文档(《常用危险化学品的分类及标志》gb 13690-2009和《危险化学品安全管理条例》)的关联关系。对于化学品安全技术说明书这部分只构建了其“危险性概述”的“危险性类别”展开的情况,它们都是该化学品关键特性和msds其它部分的关联关系,本身并没有生成新的结点。此外,化学品安全技术说明书和第二支撑标准规范文档的关联关系构建四跳结点。
[0090]
可选地,在本技术的一个实施例中,还包括:利用知识融合将所有化学品安全技术说明书文档的知识图谱进行融合。
[0091]
具体地,如果一个结点是叶结点,那么就构建它和其它化学品之间的关联关系,这种关联关系是通过知识融合来实现的。
[0092]
上述分析主要揭示了危化品的本质特征和msds十六部分之间的因果关系,危化品之间也具有某些联系,它们的联系采用msds十六部分的具体内容进行关联。之所以这样做是因为每个msds的十六部分框架内容都相同,在知识图谱中无法分清各个危化品的区别和联系。而它们的区别和联系就体现在各个条款的具体内容上,不同msds知识图谱的区别和联系就体现在知识图谱的叶结点上。如果某两个危化品在某个具体条目上相同,那么它们相应知识图谱的叶结点就指向同一个,也就是这两种危化品共用一个知识图谱的叶结点;采用这种知识融合的方式来实现msds之间的关联。两种危化品共用的叶结点越多,则它们之间的共性就越大。反之,两种危化品共用的叶结点越少,则它们之间的差异就越大。化学品知识图谱就是要揭示出以上分析的三种情况即:危化品内部的因果和关联关系、危化品的基本特征和危化品之间的关联关系。
[0093]
可选地,在本技术的一个实施例中,还包括:构建化学品安全技术说明书文档的知识图谱与外部组织及其使用的关联关系。
[0094]
可选地,在本技术的一个实施例中,构建化学品安全技术说明书文档的知识图谱与外部组织及其使用的关联关系,包括:
[0095]
识别外部组织的实际类别;
[0096]
若实际类别为面向监管,则基于《危险化学品安全管理条例》规定的四项备案制度、五项名单公告制度、七项其他法律规章、十五项审查、审批制度生成化学品安全知识图谱的至少一个展开结点;
[0097]
若实际类别为面向生产,则基于化学品的注册、评估、授权和限制信息,结合化学品新特征的公告、化学品安全技术说明书和化学品安全标签与国家标准的关系、化学品生产的监管生成化学品安全知识图谱的至少一个展开结点;
[0098]
若实际类别为面向供应链,则基于化学品安全性评估、安全标签和安全数据单、化学品的危害信息和安全防护建议信息和clp法规内容生成化学品安全知识图谱的至少一个展开结点。
[0099]
具体地,面向监管,危化品的使用都要接受监管,本技术的知识图谱就要展示各个危化品需要监管的内容:《危险化学品安全管理条例》规定的四项备案制度(企业责任)、五项名单公告制度(政府责任)、七项其他法律规章(企业责任、政府责任)、十五项审查、审批制度(企业责任、政府责任)。
[0100]
面向生产,化学品的生产是需要一些条件的,它包括:化学品的注册、评估、授权和限制,危化品新特征的公告,msds和化学品安全标签与国家标准的关系;危化品生产的监管;它们都要在知识图谱中展现出来。
[0101]
面向供应链,危化品的管理涉及到其整个生命周期包括:危化品安全性评估、安全标签(ghs标签)和安全数据单(sds)、危化品的危害信息和安全防护建议等和clp法规内容;它们都要在知识图谱中展示出来。
[0102]
根据本技术实施例提出的化学品安全知识图谱的构建方法,根据危化品的四种关键物性“理化特性”、“稳定性和反应性”、“毒理学资料”和“生态学资料”来构建msds的知识图谱,通过这四种物性能够充分挖掘出msds十六部分之间的因果和关联关系。进一步发现“化学品及企业标识”和“成分/组成信息”是化学品的基本属性,是其分子式决定了四种物性。这样知识图谱就能够充分揭示出msds内部的各种因果和关联关系。因此本技术不是把msds简单地转换为知识图谱,而是通过知识图谱充分揭示它们各个部分之间的因果和关联关系,这样能够从知识图谱中看到每种化学品十六部分之间是一个有机的整体,能够看出基本物性的来源是什么,基本物性是什么,基本物性是如何因果决定msds的其它部分。本技术进行msds的知识图谱构建时还要挖掘出各种化学品的关键特性,主要是从第三部分“危险性概述”的“健康危害”、“环境危害”和“燃爆危险”中挖掘出msds的关键特性,并把这些关键特性和危化品其它部分的特性进行关联,本技术从危化品关键特性的角度构建出msds十六部分之间的关联关系。本技术还要融合所有msds的知识图谱,通过知识图谱非常容易看出两种危化品之间的关联关系。本技术还要构建各个危化品全生命周期各个部分之间的因果和关联关系知识图谱,包括生产、监管和供应链等。基于以上特点,本技术可以广泛应用于msds知识图谱的构建和使用中。
[0103]
其次参照附图描述根据本技术实施例提出的化学品安全知识图谱的构建装置。
[0104]
图14为根据本技术实施例提供的化学品安全知识图谱的构建装置结构示意图。
[0105]
如图14所示,该化学品安全知识图谱的构建装置10包括:获取模块100、提取模块200和构建模块300。
[0106]
其中,获取模块100,用于获取至少一份化学品安全技术说明书文档。提取模块200,用于从至少一份化学品安全技术说明书文档中提取实体、关系和实体或者实体、属性和属性值以及知识图谱特征。构建模块300,用于根据提取的实体、关系和实体或者实体、属性和属性值以及知识图谱特征构建化学品安全技术说明书文档的知识图谱。
[0107]
可选地,在本技术的一个实施例中,构建模块,包括:中心结点确定单元,用于以各个化学品的名称构建化学品安全知识图谱的中心结点,使得从中心节点一跳到达化学品安全技术说明书文档的十六部分对应的节点;二跳结点确定单元,用于根据化学品安全技术说明书文档的十六部分之间的因果和关联关系构建二跳结点,并且判断二跳节点是否满足展开条件;外环结点确定单元,用于在不能满足展开条件时,根据化学品安全技术说明书文档的十六部分之间或与第一支撑标准规范文档的关联关系构建三跳结点,并根据化学品安
全技术说明书文档的十六部分之间或与第二支撑标准规范文档的关联关系构建四跳结点。
[0108]
可选地,在本技术的一个实施例中,还包括:融合模块,用于利用知识融合将所有化学品安全技术说明书文档的知识图谱进行融合。
[0109]
可选地,在本技术的一个实施例中,还包括:关联模块,用于构建化学品安全技术说明书文档的知识图谱与外部组织及其使用的关联关系。
[0110]
可选地,在本技术的一个实施例中,关联模块,包括:识别单元,用于识别外部组织的实际类别;第一生成单元,用于在实际类别为面向监管时,基于《危险化学品安全管理条例》规定的四项备案制度、五项名单公告制度、七项其他法律规章、十五项审查、审批制度生成化学品安全知识图谱的至少一个展开结点;第二生成单元,用于在实际类别为面向生产时,基于化学品的注册、评估、授权和限制信息,结合化学品新特征的公告、化学品安全技术说明书和化学品安全标签与国家标准的关系、化学品生产的监管生成化学品安全知识图谱的至少一个展开结点;第三生成单元,用于在实际类别为面向供应链时,基于化学品安全性评估、安全标签和安全数据单、化学品的危害信息和安全防护建议信息和clp法规内容生成化学品安全知识图谱的至少一个展开结点。
[0111]
需要说明的是,前述对化学品安全知识图谱的构建方法实施例的解释说明也适用于该实施例的化学品安全知识图谱的构建装置,此处不再赘述。
[0112]
根据本技术实施例提出的化学品安全知识图谱的构建装置,具有以下优点:
[0113]
知识组织结构化。知识图谱描述了msds的十六部分组成结构,并按照层次关系对每一部分相关内容进行了结构化组织。对于任意一个msds,用户都可依据系统自动生成的危化品安全知识图谱从存储数据库中搜索和展示其相关的内容。基于数据库技术的危化品安全知识图谱比使用msds文档更灵活和方便。
[0114]
智能图析挖掘。基于构建的化学品安全知识图谱使用图计算与图算法可以对危化品的安全机理、风险应对等安全管理需求进行推理和挖掘,例如可以进行的智能图析挖掘操作包括但不限于:图遍历、路径计算、统计计算、路径探寻、中心度分析和群体分析等。针对安全生产等用户还可以进行分类查询、模糊查询和聚集查询;可以类似数据库一样来使用该知识图谱开发满足各种安全生产需求的各种应用。
[0115]
智能知识问答。每份msds都是独立的,一旦构建完这些msds及其相关支持标准规范文档的知识图谱,则各种危化品及它们之间的因果关系和关联关系就展示出来了;知识图谱作为知识融合的载体,所有知识点都被具有语义信息的边所关联,从问句到知识图谱的知识点的匹配关联过程中,可以用到大量其关联节点的因果和关联信息,通过这些因果和关联信息可以对问句的语义理解更加精确。当然还可以通过查询语句查询出msds之间的关联关系,包括msds与相关标准规范、危化品在生产、运输、销售和使用等上下文环境关联关系。
[0116]
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本技术的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不必须针对的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任一个或n个实施例或示例中以合适的方式结合。此外,在不相互矛盾的情况下,本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结
合和组合。
[0117]
此外,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。在本技术的描述中,“n个”的含义是至少两个,例如两个,三个等,除非另有明确具体的限定。
[0118]
流程图中或在此以其他方式描述的任何过程或方法描述可以被理解为,表示包括一个或n个用于实现定制逻辑功能或过程的步骤的可执行指令的代码的模块、片段或部分,并且本技术的优选实施方式的范围包括另外的实现,其中可以不按所示出或讨论的顺序,包括根据所涉及的功能按基本同时的方式或按相反的顺序,来执行功能,这应被本技术的实施例所属技术领域的技术人员所理解。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献