一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

境外传染病输入的口岸卫生检疫案例情景匹配方法及系统与流程

2021-11-17 11:55:00 来源:中国专利 TAG:
境外传染病输入的口岸卫生检疫案例情景匹配方法及系统与流程

本发明涉及智能应急辅助技术领域,特别涉及一种境外传染病输入的口岸卫生检疫案例推理中的情景匹配方法及系统。

背景技术

口岸卫生检验检疫应急状态下的防疫防控愈加频繁,传染病境外输入风险加大,出现了很多起境外输入新冠肺炎案例,而应急处置方案是有效应对和疫情防控的前提。现阶段对于境外传染病输入案例带来的潜在口岸公共卫生事件,应对的处置方案更多的停留在应急预案研究上,长期的处置案例可以为突发事件的应对提供数据、知识和规则,但目前还未形成一套基于境外传染病输入的口岸卫生检疫案例的应对处置方案生成的有效方法。

在基于案例推理的突发事件应急辅助决策支持系统中,案例匹配是一项关键技术,通过相匹配的参考案例中解决问题的方法,使其重用或修改解决现有的实际问题。案例的结构化和文本语义分析是案例匹配的关键问题,有学者引入共性知识元模型对案例加以结构化表示,引入模糊逻辑理论解决案例中的模糊概念属性,构建概念树实现语义概念相似度匹配等。但多数情况下,案例结构化表示要对案例涉及的知识元的多个属性加以分类描述,结构过于复杂,且需要具有很强的专业知识背景才能进行较为完整的描述;而案例的匹配不是基于对自然语言理解的基础上来实现的,对文本的语义匹配不够精准。



技术实现要素:

为了应对突发传染病境外输入卫生检疫安全事件,精准的案例情景匹配可以提供科学、合理的参考案例及应急处置方案。本发明提出了一种境外传染病输入的口岸卫生检疫案例情景匹配方法,设计合理,效果良好,能够为境外传染病输入案例情景进行智能匹配,准确率较高。

为实现上述目的,本发明采用如下技术方案:

一种境外传染病输入的口岸卫生检疫案例情景匹配方法,包括以下步骤:

步骤1,境外传染病输入的口岸卫生检疫案例情景构建,包括提取和定义境外传染病输入的口岸卫生检疫案例的主要情景构成要素,建立案例的情景集合,定义的情景采用以下四元组表示,

Si=(H,L,D,M)

式中,Si表示案例中的一个情景,H表示致灾体、L表示承灾体、D表示应急管理活动、M 表示驱动要素;

步骤2,基于境外传染病输入的口岸卫生检疫案例领域的词向量模型,构建多特征融合的神经网络情景匹配模型,构造情景对文本的语义相似度;

步骤3,将步骤2构建好的神经网络情景匹配模型应用于境外传染病输入的口岸卫生检疫案例推理中,包括将待匹配情景输入神经网络情景匹配模型,获取最相似情景,提取相应基本信息和处置措施。

而且,步骤2的实现方式如下,

针对境外传染病输入口岸卫生检疫案例领域类语料,进行繁简转换和分词处理,以及词向量模型的训练;进行基于词向量的文本语义共现的相似性计算,文本语义偏移相似度计算和语义相反相似性的计算,作为BP神经网络的输入特征;

构建BP神经网络进行多特征融合,实现情景匹配。

而且,所述BP神经网络的输入层有3个节点,隐藏层包含了6个节点,输出层包含了一个节点,为融合匹配结果。

而且,步骤3,输入待匹配情景的承灾体、驱动要素、致灾体的文本,通过情景匹配在历史案例的情景集合中找出最相似的情景。

本发明提供一种境外传染病输入的口岸卫生检疫案例情景匹配系统,用于实现如上所述的一种境外传染病输入的口岸卫生检疫案例情景匹配方法。

而且,包括以下模块,

第一模块,用于境外传染病输入的口岸卫生检疫案例情景构建,包括提取和定义境外传染病输入的口岸卫生检疫案例的主要情景构成要素,建立案例的情景集合,定义的情景采用以下四元组表示,

Si=(H,L,D,M)

式中,Si表示案例中的一个情景,H表示致灾体、L表示承灾体、D表示应急管理活动、M 表示驱动要素;

第二模块,用于基于境外传染病输入的口岸卫生检疫案例领域的词向量模型,构建多特征融合的神经网络情景匹配模型,构造情景对文本的语义相似度;

第三模块,用于将第二模块构建好的神经网络情景匹配模型应用于境外传染病输入的口岸卫生检疫案例推理中,包括将待匹配情景输入神经网络情景匹配模型,获取最相似情景,提取相应的基本信息和处置措施。

或者,包括处理器和存储器,存储器用于存储程序指令,处理器用于调用存储器中的存储指令执行如上所述的一种境外传染病输入的口岸卫生检疫案例情景匹配方法。

或者,包括可读存储介质,所述可读存储介质上存储有计算机程序,所述计算机程序执行时,实现如上所述的一种境外传染病输入的口岸卫生检疫案例情景匹配方法。

本发明所讨论的境外传染病输入的口岸卫生检疫案例情景匹配方法,是基于案例情景构建方法和自然语言处理方法的基础提出的,相比于一般的案例匹配方法,案例的情景结构更能精准匹配案例中的关键构成要素,情景对文本语义相似性和对立情景的语义相反特性的融合能实现更加智能的案例情景匹配,提供合理的参考案例及其应急处置的候选方案。

与现有技术相比,本发明的有益效果在于:1)现阶段还没有针对境外传染病输入病例带来的潜在口岸公共卫生事件的有效的应急处置方案的生成方法,本发明在分析了大量的境外传染病输入的口岸卫生检疫案例基础上,通过对案例进行情景构建,融合情景文本中语义共现相似性、语义偏移相似性和对立情景的相反语义三个特征,构建了境外传染病输入的口岸卫生检疫案例情景匹配模型,应用于口岸公共卫生事件应对时的案例推理和应急辅助决策支持,能有效地为突发的口岸公共卫生事件与相关案例进行智能匹配,提供更为科学、合理的参考案例的应急处置候选方案;2)本发明给出的多特征融合的情景匹配方法,不仅考虑文本的语义相似性,而且考虑了案例中大量存在的对立情景,与单一特征的文本语义匹配相比,其匹配方法更为合理,准确率也更高。

附图说明

图1是本发明实施例中词向量训练样例的结果示意图;

图2是本发明实施例中三层神经网络结构训练模型计算情景对的文本相似度示意图;

图3是本发明实施例中神经网络模型训练,均方误差随迭代次数的变化过程示意图。

图4是本发明实施例中建立情景匹配的神经网络模型示意图。

具体实施方式

为了对本发明的技术特征、目的和效果有更加清楚的理解,下面将结合附图及实施例对本发明作进一步说明。

本发明通过案例情景化的结构以及对文本自然语言的理解,更能较为精准匹配案例中的关键构成要素,可应用于境外传染病输入的口岸卫生检疫案例推理,能对境外传染病输入带来的潜在口岸卫生检疫安全事件与相关案例进行智能匹配,提供更为理的参考案例的应急处置方案。

本发明的实施例提供了一种境外传染病输入的口岸卫生检疫案例情景语义匹配方法,具体包括如下步骤:

步骤一、境外传染病输入的口岸卫生检疫案例情景构建。

本步骤提取和定义境外传染病输入的口岸卫生检疫案例的主要情景构成要素,建立案例的情景集合,定义的情景以一个四元组来表示:

Si=(H,L,D,M)

式中:Si表示案例中的一个情景,H表示致灾体、L表示承灾体、D表示应急管理活动、 M表示驱动要素。致灾体主要是引起案例发生的传染病病毒及感染者;承灾体主要是传染病病例密切接触人员和检疫人员等;应急管理活动主要是为疫情防控采取的应急处置措施;驱动要素是能够影响出境外传染病输入的口岸卫生检疫案例演变的情景要素,对情景转换起主导作用的影响因素。

实施例进行情景分析、情景构建,每个情景采用四元组来表示:

例如,对“搭乘莫斯科-北京CA910航班的旅客于2020年4月6日在山西太原武宿国际机场海关入境,新冠肺炎确诊病例有35例”这一案例,实施例通过提取和定义该案例的致灾体、承灾体、应急管理活动和驱动要素4个情景要素,并根据事件发展分为6个情景。情景1:入境旅客检疫,旅客出现异常症状,海关检疫14名旅客体温超过37℃,其中有4 名旅客体温超过38℃。用四元组表示为:

S1=(“发热旅客”,“发热旅客及相关人员”,“入境检疫”,“海关检疫14名旅客体温超过 37℃,其中有4名旅客体温超过38℃”);

情景2:检疫人员按规范开展医学排查、流行病学调查,海关检疫14名发热旅客和2名体温正常旅客有咳嗽、呼吸困难、咽部不适等症状。用四元组表示为:

S2=(“发热旅客”,“发热旅客及相关人员”,“医学排查、流行病学调查”,“海关检疫14 名发热旅客和2名体温正常旅客有咳嗽、呼吸困难、咽部不适等症状”);

情景3:采集同机所有旅客咽拭子样本以及血液样本,海关检疫16名旅客出现异常症状。用四元组表示为:

S3=(“发热旅客”,“有异常症状的旅客及相关人员”,“采集同机所有旅客咽拭子样本以及血液样本”,“海关检疫16名旅客出现异常症状”);

情景4:实验室检测与复核。用四元组表示为:

S4=(“发热旅客”,“有异常症状的旅客及相关人员”,“实验室检测与复核”,“海关检疫16 名旅客出现异常症状”);

情景5:通报检测结果,对35名旅客进行隔离医学观察和动态诊治。用四元组表示为:

S5=(“新冠病毒”,“确诊旅客及相关人员”,“隔离医学观察和动态诊治”,“除有异常症状的16名旅客外,还有19名旅客(共35名)新冠病毒核酸检测为阳性”)。

情景6:对35名旅客进行追踪回访,做好后续跟踪处置。用四元组表示为:

S6=(“新冠病毒”,“确诊旅客及相关人员”,“追踪回访和后续跟踪处置”,“除有异常症状的16名旅客外,还有19名旅客(共35名)新冠病毒核酸检测为阳性”)。

步骤二、基于境外传染病输入的口岸卫生检疫案例领域的词向量模型,构建多特征融合的神经网络情景匹配模型,构造情景对文本的语义相似度:

本步骤构建多特征融合的神经网络情景匹配模型,包括:境外传染病输入的口岸卫生检疫案例领域的词向量模型,计算情景对文本语义共现与语义偏移的相似度,以及对立情景的语义相反系数,构建多特征融合的神经网络情景匹配模型,构造情景对文本的语义相似度计算方法。

实施例首先基于境外传染病输入卫生检疫案例领域内词向量建模,实现文本语义共现、语义偏移和语义相反相似性的计算,即针对境外传染病输入口岸卫生检疫案例领域类语料,进行繁简转换和分词处理,以及词向量模型的训练;基于词向量的文本语义共现的相似性计算,文本语义偏移相似度计算和语义相反相似性的计算,作为输入特征。具体实现包括以下子步骤:

(1)针对境外传染病输入口岸卫生检疫案例领域类语料,进行繁简转换和分词处理,以及词向量模型的训练。

根据收集的案例实现不同语料规模在领域内的词向量建模,将词语映射到一个高维的空间向量。

具体实施时,可以采用word2vec模型进行训练,词向量的维度设定为400维。文本进行词向量训练的过程和训练得到的词向量部分结果参考图1,如“旅客新冠病毒核酸检测为阳性”这一文本,可以分词为“旅客”、“新冠”、“病毒”、“核酸”、“检测”、“为”和“阳性”,通过word2vec 模型训练得到每一个分词的词向量。

(2)基于词向量的文本语义共现的相似性计算,包括以下步骤:

1)使用分词工具将文本S和T分词,表示为S(s1,s2,…,sm)和T(t1,t2,…,tn),并通过上面的词向量建模训练出对应的词向量,计算每个词汇的权重wi=1/ni,ni为某词语si在所有文档中出现的频率,频率越高,代表其专业性越小,权重小;

2)对于文本S中每一个词si,采用词向量间余弦距离方法计算si与文本T中每个词的词汇相似度,在文本T中找到一个与si相似度最大的词tj,得到最大匹配值,记为Simmax(si,T)。

3)将得到的每个词向量的最大匹配值Simmax(si,T)与阈值α(阈值α优选建议取值为0.6) 进行比较,高于阈值α的判定为两句的交集,即共现部分Sim(si,T),低于或等于α的记为不相似部分,以1-Simmax(si,T)计算其差异程度,即非共现部分,设采用Sim1(si,T)来综合共现部分和非共现部分,即共现与差异综合部分。

4)交换S和T,重复步骤2)和步骤3);

5)文本语义共现的相似度Jsim(S,T)计算公式如(2)所示,分子部分表示文本S和T中词的共现值,即文本S和T在语义上的共现部分。分母不仅包含了S和T在语义上的共现部分 (分子),而且包括了所有匹配值低于阈值α的非共现部分。

(3)文本语义偏移相似度计算包括以下步骤:

1)根据顺序给文本S和T中每个词语进行位置编码,以文本S为例计算词语si在文本中的相对位置pos(si),可以采用公式(3)计算,i为词语si在文本中位置编码,len(S)为句子S 中词语的个数。

pos(si)=i/len(S) (3)

2)计算文本S中每个词语si与文本T中词语ts的偏移距离

3)计算文本S到文本T的语义偏移相似度PSim(S,T)ST和文本T到S的语义偏移相似度 PSim(S,T)TS。

5)计算语义偏移相似度。

(4)语义相反的相似度采用否定系数来判定,在入境传染病输入的口岸卫生检疫案例的情景中,经常会出现如“属于留观病例”与“不属于留观病例”,“旅客新冠病毒核酸检测为阳性”与“旅客新冠病毒核酸检测为阴性”等对立的情景,而利用传统的相似度计算方法不能很好的区分这样的对立情景,通过文本的谓语中心词,根据指定否定词和反义词的来判定文本意思是否相反,如果语义相反,则设定否定系数r=-1,否则否定系数r=1

实施例中,从步骤一已经构建的入境传染病输入的口岸卫生检疫案例情景集合中提取了 1594对情景,计算基于词向量的语义共现相似度Jsim和语义偏移相似度Psim,以及语义相反的否定系数r,计算的部分结果如下表所示:

表1部分情景对文本相似性计算结果

然后,构建BP神经网络进行多特征融合,实现情景匹配。

将基于词向量的语义共现相似度(如公式(2)所示)、语义偏移相似度(如公式(5)所示)、否定系数视为情景匹配相似性判定的三个特征,作为神经网络的输入层,采用如图2所示的三层神经网络结构,输入层有3个节点,隐藏层包含了6个节点,其值可以通过将输入值进行一个线性变换和非线性变换计算得到,输出层包含了一个节点,为融合匹配结果,其值是通过将隐藏层的节点值进行一个线性变换和非线性变换计算得到,训练该网络可以确定模型中的参数,以实现情景对的文本融合匹配度的计算。输入层到隐藏层的权值、隐藏层到输出层的权值基于该网络的实现过程如下:

(1)输入节点为J(Jsim)、P(Psim)和R(r),隐藏层节点hn的输出值是通过一个如式(6)所示的线性变换αn和一个非线性变换(非线性激活函数g(αn),如式(7))计算得到,其中 wjn,wpn,wrn分别为输入层节点J、P和R到隐藏层节点的权重,b1为线性变换的参数,e为自然常数。

αn=wjn·J wpn·P wrn·R b1 (6)

(2)隐藏层节点hn到输出层的第t次输出值yt’通过一个如式(8)所示的线性变换βt和非线性变换(非线性激活函数g(βt),如式(9))计算得到,其中wny为隐藏层每个节点到输出节点的权重,b2为线性变换的参数。

(3)第t次预测结果yt’与实际值y的误差Et采用最小二乘法求取:

(4)采用梯度下降法更新参数,使得误差Et一步步减小。根据式(11)和式(12)计算隐藏层到输出层的权值wny调整值Δwny和b2调整值Δb2,式中η为学习率。

(5)计算输入层到隐藏层的权值wji、wpi、wri的调整值Δwjn、Δwpn、Δwrn和b1的调整值Δb1。

(6)根据如式(14)所示调整参数,重新计算误差Et,当满足迭代终止条件:误差Et小于一定值(1e-05),终止递归。

实施例的具体实现子步骤如下:

(1)通过模型训练,得到输入层到隐含层的权重矩阵和隐含层到输出层的权重(如下表所示),训练中的均方误差随迭代次数的变化参考图3,均方误差在迭代次数为129次时出现极小值,表明模型训练收敛结束,训练的神经网络模型参考图4。

表2情景对文本相似性计算神经网络模型权重计算结果

(2)根据确定的神经网络模型计算情景匹配度,部分计算结果如下。

表3情景匹配度计算结果

步骤三,将构建好情景匹配模型应用于境外传染病输入的口岸卫生检疫案例推理中。

通过步骤一、步骤二的实施,可以得到情景文本语义多特征融合的案例情景匹配模型。结合历史案例的情景集合,可以对当前案例的情景进行匹配,找到参考案例的应急处置措施。输入待匹配情景的承灾体、驱动要素、致灾体3个要素的文本,如承灾体为“旅客”、驱动要素为“体温监测发现5名发热旅客”、致灾体为“新冠病毒”等,通过本发明的情景匹配方法可以在历史案例的情景集合中找出如下表所示的与其最相似的情景。表中列出与待匹配情景最为相似的3个情景的基本信息和处置措施,情景1的处置措施为“医学排查、流行病学调查”,情景2 和情景3处置措施均为“入境旅客检疫”。

表4案例情景匹配结果

若以“旅客新冠病毒检测为阴性”为例进行匹配,得到如下表所示的5个最相似的情景,可以参考这5个情景的处置措施“对该发热旅客和密切接触者进行单独隔离留观,待间隔24小时再次进行采样核酸检测,对涉事环境进行消毒”进行应对。这些可以为常态和应急状态下防疫防控提供可参考的应急处置方案。

表5“旅客新冠病毒检测为阴性”的案例情景匹配结果

具体实施时,本发明技术方案提出的方法可由本领域技术人员采用计算机软件技术实现自动运行流程,实现方法的系统装置例如存储本发明技术方案相应计算机程序的计算机可读存储介质以及包括运行相应计算机程序的计算机设备,也应当在本发明的保护范围内。

在一些可能的实施例中,提供一种境外传染病输入的口岸卫生检疫案例情景匹配系统,包括以下模块,

第一模块,用于境外传染病输入的口岸卫生检疫案例情景构建,包括提取和定义境外传染病输入的口岸卫生检疫案例的主要情景构成要素,建立案例的情景集合,定义的情景采用以下四元组表示,

Si=(H,L,D,M)

式中,Si表示案例中的一个情景,H表示致灾体、L表示承灾体、D表示应急管理活动、M 表示驱动要素;

第二模块,用于基于境外传染病输入的口岸卫生检疫案例领域的词向量模型,构建多特征融合的神经网络情景匹配模型,构造情景对文本的语义相似度;

第三模块,用于将第二模块构建好的神经网络情景匹配模型应用于境外传染病输入的口岸卫生检疫案例推理中,包括将待匹配情景输入神经网络情景匹配模型,获取最相似情景,提取相应基本信息和处置措施。

在一些可能的实施例中,提供一种境外传染病输入的口岸卫生检疫案例情景匹配系统,包括处理器和存储器,存储器用于存储程序指令,处理器用于调用存储器中的存储指令执行如上所述的一种境外传染病输入的口岸卫生检疫案例情景匹配方法。

在一些可能的实施例中,提供一种境外传染病输入的口岸卫生检疫案例情景匹配系统,包括可读存储介质,所述可读存储介质上存储有计算机程序,所述计算机程序执行时,实现如上所述的一种境外传染病输入的口岸卫生检疫案例情景匹配方法。

本文中所描述的具体实施例仅仅是对本发明精神作举例说明。本发明所属技术领域的技术人员可以对所描述的具体实施例做各种各样的修改或补充或采用类似的方式替代,但并不会偏离本发明的精神或者超越所附权利要求书所定义的范围。

再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献