一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种流行病调查表分析方法、系统、存储介质及设备与流程

2022-06-29 17:04:43 来源:中国专利 TAG:


1.本发明涉及突发公共卫生事件处理技术领域,特别涉及一种流行病调查表分析方法、系统、存储介质及设备。


背景技术:

2.随着社会经济的不断发展、城市化进程的不断加快以及城市交通事业的不断完善,在为人们出行和聚会提供极大便利的同时,也为传染病的快速传播和流行提供了便利条件,新发突发传染病暴发疫情时有发生。
3.新发突发重大传染病暴发流行、外来生物入侵等突发公共卫生事件不仅严重威胁人类健康,而且制约经济的发展,还给社会稳定和国家安全带来极大的威胁和挑战,是当今预防医学和公共卫生领域面临的突出问题。突发公共卫生事件应急处置的及时性和精准性对于降低损失,有效处置至关重要,其中重要的一环便是现场流行病学调查,实时动态采集、整合突发事件现场采样、检测、伤病员临床特征、暴露人群隔离检疫、危险因素、处置措施等信息,对于全方位掌握事件的发生发展态势、污染范围的划定、危害评估、影响因素、人群脆弱性特征、卫生资源估算、干预措施效果评估等尤为重要,事关医学救援与处置成败的关键。
4.现有技术当中,流行病调查表的数据由于数据列较多,而且各类的流调表种类繁多,如果需要针对每个流调表进行统计分析,工作量比较大,影响分析效率。


技术实现要素:

5.基于此,本发明的目的是提供一种流行病调查表分析方法、系统、存储介质及设备,以解决现有技术中对流行病调查表统计分析效率低的技术问题。
6.本发明一方面提供一种流行病调查表分析方法,所述方法包括:
7.获取多张流行病调查表单,所述表单包括至少一表格、以及设于所述表格内的文字信息,所述文字信息包括流调人员的身份信息、区域信息以及在某一时刻的轨迹信息;
8.结合预训练的数据处理模型对所述表单进行预处理,从预处理后的表单中获取所述文字信息,并依据句意完整度判断所述文字信息是否存在遗漏;
9.若所述文字信息存在遗漏,则补全所述文字信息;
10.结合补充后的文字信息,获取分析指令,所述分析指令包括统计图类型,根据所述统计图类型,结合所述身份信息、所述区域信息以及所述轨迹信息对所述补充后的文字信息进行统计分析,得到分析后的数据统计图。
11.上述流行病调查表分析方法,通过对表单的数据进行预处理,以过滤无关数据,提高数据处理效率的同时,也提高了数据处理结果的准确性,有利于降低表单数据处理的工作量;进一步的,依据句意完整度判断文字信息是否存在遗漏,当存在文字信息存在遗漏时,补全文字信息,保证了表单分析处理结果的准确性,结合分析指令对表单信息进行统计分析,得到分析后的数据统计图,通过统计图直观反应表单信息,解决了现有技术中对流行
病调查表统计分析效率低的技术问题。
12.另外,根据本发明上述的流行病调查表分析方法,还可以具有如下附加的技术特征:
13.进一步地,所述结合预训练的数据处理模型对所述表单进行预处理的步骤包括:
14.识别所述表格以及所述文字信息,根据所述表格判断所述文字信息是否在所述表格范围内;
15.若否,将不在所述表格范围内的文字信息进行调整,以使所述不在所述表格范围内的文字信息调整在所述表格的范围内。
16.进一步地,所述将不在所述表格范围内的文字信息进行调整,以使所述不在所述表格范围内的文字信息调整在所述表格的范围内的步骤包括:
17.所述表格包括多个单元格,根据所述单元格获取所述表格的边框信息,根据所述边框信息获取所述文字信息与所述单元格的相对位置关系;
18.根据所述相对位置关系获取所述文字信息在所述单元格的具体方位,根据所述具体方位将所述文字信息往远离所述方位的方向移动,以使所述文字信息位于所述单元格内。
19.进一步地,所述将不在所述表格范围内的文字信息进行调整,以使所述不在所述表格范围内的文字信息调整在所述表格的范围内的步骤包括:
20.所述文字信息包括多个字体,根据所述字体获取字体属性,所述字体属性包括字体尺寸信息;
21.根据所述字体尺寸信息判断所述字体的尺寸是否大于预设尺寸;
22.若是,获取大于预设尺寸的字体,并调节所述大于预设尺寸的字体的尺寸,以使所述不在所述表格范围内的文字信息调整在所述表格的范围内。
23.进一步地,所述获取大于预设尺寸的字体,并调节所述大于预设尺寸的字体的尺寸,以使所述不在所述表格范围内的文字信息调整在所述表格的范围内的步骤包括:
24.获取大于预设尺寸的字体,并采集所述大于预设尺寸的字体的临近字体;
25.根据所述预设尺寸判断所述临近字体的尺寸是否大于所述预设尺寸;
26.若否,则将所述大于预设尺寸的字体进行尺寸缩小以使缩小后的所述大于预设尺寸的字体的尺寸不大于所述临近字体的尺寸;
27.若是,则将所述大于预设尺寸的字体进行尺寸缩小以使缩小后的所述大于预设尺寸的字体的尺寸不大于所述预设尺寸,并缩小所述临近字体的尺寸以使缩小后的所述临近字体的尺寸不大于所述预设尺寸。
28.进一步地,所述若所述文字信息存在遗漏,则补全所述文字信息的步骤包括:
29.所述身份信息包括姓名、身份证号以及电话号码,若所述姓名存在遗漏时,则根据所述身份证号补全所述姓名或所述电话号码,或当所述身份证号存在遗漏时,根据所述电话号码补全所述身份证号。
30.本发明另一方面提供一种流行病调查表分析系统,所述系统包括:
31.获取模块,用于获取多张流行病调查表单,所述表单包括至少一表格、以及设于所述表格内的文字信息,所述文字信息包括流调人员的身份信息、区域信息以及在某一时刻的轨迹信息;
32.预处理模块,用于结合预训练的数据处理模型对所述表单进行预处理,从预处理后的表单中获取所述文字信息,并依据句意完整度判断所述文字信息是否存在遗漏;
33.补全模块,用于若所述文字信息存在遗漏,则补全所述文字信息;
34.统计分析模块,用于结合补充后的文字信息,获取分析指令,所述分析指令包括统计图类型,根据所述统计图类型,结合所述身份信息、所述区域信息以及所述轨迹信息对所述补充后的文字信息进行统计分析,得到分析后的数据统计图。
35.本发明另一方面提供一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如上述的流行病调查表分析方法。
36.本发明另一方面还提供一种数据处理设备,包括存储器、处理器以及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如上述的流行病调查表分析方法。
附图说明
37.图1为本发明第一实施例中流行病调查表分析方法的流程图;
38.图2为本发明第二实施例中流行病调查表分析方法的流程图;
39.图3为本发明第二实施例中表单示意图;
40.图4为本发明第二实施例中步骤s2021至s2024的具体流程图;
41.图5为本发明第三实施例中流行病调查表分析系统的系统框图。
42.如下具体实施方式将结合上述附图进一步说明本发明。
具体实施方式
43.为了便于理解本发明,下面将参照相关附图对本发明进行更全面的描述。附图中给出了本发明的若干实施例。但是,本发明可以以许多不同的形式来实现,并不限于本文所描述的实施例。相反地,提供这些实施例的目的是使对本发明的公开内容更加透彻全面。
44.除非另有定义,本文所使用的所有的技术和科学术语与属于本发明的技术领域的技术人员通常理解的含义相同。本文中在本发明的说明书中所使用的术语只是为了描述具体的实施例的目的,不是旨在于限制本发明。本文所使用的术语“及/或”包括一个或多个相关的所列项目的任意的和所有的组合。
45.为了有效的控制流行病的传染情况,避免传染给更多人员,通常需要对流行病确诊感染者或者疑似感染者进行流行病学调查,以更好的掌握确诊感染者的行动轨迹,根据其行动轨迹获取与之相关的密切接触人员,从而重点对密切接触人员进行流行病检测,提高从确诊感染者中快速筛选出被感染人员,避免被感染人员成为感染源进行传播病毒。
46.在本技术中,通过对表单的数据进行预处理,以过滤无关数据,提高数据处理效率的同时,也提高了数据处理结果的准确性,有利于降低表单数据处理的工作量;进一步的,依据句意完整度判断文字信息是否存在遗漏,当存在文字信息存在遗漏时,补全文字信息,保证了表单分析处理结果的准确性,结合分析指令对表单信息进行统计分析,得到分析后的数据统计图,通过统计图直观反应表单信息,解决了现有技术中对流行病调查表统计分析效率低的技术问题。
47.以新型冠状病毒肺炎(corona virus disease 2019,covid-19)为例(简称“新冠
肺炎”),对本技术中的技术方案进行说明。
48.实施例一
49.请参阅图1,所示为本发明第一实施例中的流行病调查表分析方法,所述方法包括步骤s101至步骤s104:
50.s101、获取多张流行病调查表单,表单包括至少一表格、以及设于表格内的文字信息,文字信息包括流调人员的身份信息、区域信息以及在某一时刻的轨迹信息。
51.在流行病调查(下文简称:流调)的过程中,通常会将调查获取到的信息进行表格汇总,以便更好的对被调查人员进行信息追踪,从而获得密切接触人员。通常情况下,一般会对被流调人员的身份信息、行程涉及的区域信息以及接触过的人员进行信息统计,将这些数据填写在同一表单中,根据身份信息以及区域信息可以获得被流调人员的轨迹信息,从而更直观的获取被流调人员所涉及到的区域。
52.s102、结合预训练的数据处理模型对表单进行预处理,从预处理后的表单中获取文字信息,并依据句意完整度判断文字信息是否存在遗漏。
53.在实际的表单获取过程中,由于时间原因以及人员不同,通过每个人填写出来的信息均很难一致,例如,有些人在填写时,会采用较大的行距、字距;有些人的字迹书写较潦草;有些人的喜欢空行填写信息,等等。此时,为了使得数据能够得到正确处理,避免出现数据遗漏或者数据读取错误的情况,需要对表单的数据进行预处理,以使对表单的数据进行初步筛选及调整。
54.s103、若文字信息存在遗漏,则补全文字信息。
55.在上述步骤中,通常会存在文字简写或者不写的情况,造成文字缺失,此时,需要根据表单中的前后文字信息对缺失的文字进行添加,以使表单中的文字信息完整。同时,在得到表单原件中,也容易出现表单中的文字信息出现重复的情况,此时,需要识别出重复的文字信息并对重复的文字信息进行相应的删减,以使最终得到的文字信息符合分析要求。
56.s104、结合补充后的文字信息,获取分析指令,分析指令包括统计图类型,根据统计图类型,结合身份信息、区域信息以及轨迹信息对补充后的文字信息进行统计分析,得到分析后的数据统计图。
57.在实际过程中,根据不同的统计需求,往往需要经表单中的数据做不同的图表分析,以使得目标人员能够直观获取到流调情况,提高效率。在图表分析过程中,以统计图类型中的柱状图为例,需要对表单中的身份信息、区域信息以及轨迹信息以及补充后的文字信息进行分析,从而得到柱状图中的横轴数据、纵轴数据以及效果数据。
58.综上,本发明上述实施例当中的流行病调查表分析方法,通过对表单的数据进行预处理,以过滤无关数据,提高数据处理效率的同时,也提高了数据处理结果的准确性,有利于降低表单数据处理的工作量;进一步的,依据句意完整度判断文字信息是否存在遗漏,当存在文字信息存在遗漏时,补全文字信息,保证了表单分析处理结果的准确性,结合分析指令对表单信息进行统计分析,得到分析后的数据统计图,通过统计图直观反应表单信息,解决了现有技术中对流行病调查表统计分析效率低的技术问题。
59.实施例二
60.请查阅图2,所示为本发明第二实施例中的流行病调查表分析方法,所述方法包括步骤s201至步骤s204:
61.s201、获取多张流行病调查表单,表单包括至少一表格、以及设于表格内的文字信息,文字信息包括流调人员的身份信息、区域信息以及在某一时刻的轨迹信息。
62.在流调的过程中,随着调查的深入,往往会收集到多张表单,例如a小区流调信息汇总表;b小区流调信息汇总表;或者“张三”流调表,等等,为了获得更加全面和细致的流调结果,将流调信息统计的越详细越好,由此将产生多个表单,表单中设有至少一表格,每一表格又设有多个分栏,每一分栏可设置不同的属性,从而根据分栏属性对流调结果进行信息汇总。例如,如图3所示,在一表单中,每一栏的属性由左至右分别为:序号、姓名、到达区域、到达时间、离开时间、接触人员以及备注,从而,根据此表单用于对流调人员进行初步的信息采集,根据此表单的文字信息,可以建立该流调人员的轨迹信息。进一步的,获取流调人员在流调区域的逗留时长,根据逗留时长将不同的区域匹配不同的颜色,以使工作人员能够直观的获取流调人员在流调区域的逗留时长。例如,将逗留时长在0.5h以下的,定义为浅绿色;0.5h-1h的定义为黄色;1h-1.5h的定义为橙色,1.5h-2h的定义为蓝色,大于2小时的定义为紫色。
63.s202、结合预训练的数据处理模型对表单进行预处理,从预处理后的表单中获取文字信息,并依据句意完整度判断文字信息是否存在遗漏。
64.在流调信息的实际采集过程中,通常会遇到各种情况,例如,b同志在填写信息时,与之前a同志填写的信息之间,间隔了一行进行填写,导致两行之间出现信息空白行,此时,需要对信息空白行进行数据预处理,以使在信息汇总时,消除信息空白行,一方面能够减小系统计算工作量,另一方面也可以使得统计后的表单更美观。
65.进一步的,请参阅图4,在一些可选实施例中,结合预训练的数据处理模型对表单进行预处理的步骤包括步骤s2021至s2024:
66.s2021、识别表格以及文字信息;
67.s2022、根据表格判断文字信息是否在表格范围内。
68.若否,则执行步骤s2023;
69.s2023、将不在表格范围内的文字信息进行调整,以使不在表格范围内的文字信息调整在表格的范围内。
70.若是,则执行步骤s2024;
71.s2024、无需对文字信息进行调整。
72.在将不在表格范围内的文字信息进行调整的过程中,表格包括多个单元格,根据单元格获取表格的边框信息,根据边框信息获取文字信息与单元格的相对位置关系;根据相对位置关系获取文字信息在单元格的具体方位,根据具体方位将文字信息往远离方位的方向移动,以使文字信息位于单元格内。
73.具体的,当获取到存在文字信息位于单元格的左边,导致文字信息部分已经超出单元格的左侧边界时,需要对该文字信息进行调整,以使该文字信息能够位于单元格的单元格范围内。具体的,将该文字信息往单元格的右侧移动,以使文字信息远离单元格左侧,回归至单元格的范围内。
74.在一些可选实施例中,文字信息包括多个字体,根据字体获取字体属性,字体属性包括字体尺寸信息;根据字体尺寸信息判断字体的尺寸是否大于预设尺寸;若是,获取大于预设尺寸的字体,并调节大于预设尺寸的字体的尺寸,以使不在表格范围内的文字信息调
整在表格的范围内。
75.具体的,在调节大于预设尺寸的字体的尺寸,以使不在表格范围内的文字信息调整在表格的范围内的步骤包括如下过程:
76.获取大于预设尺寸的字体,并采集大于预设尺寸的字体的临近字体;
77.根据预设尺寸判断临近字体的尺寸是否大于预设尺寸;
78.若否,则将大于预设尺寸的字体进行尺寸缩小以使缩小后的大于预设尺寸的字体的尺寸不大于临近字体的尺寸;
79.若是,则将大于预设尺寸的字体进行尺寸缩小以使缩小后的大于预设尺寸的字体的尺寸不大于预设尺寸,并缩小临近字体的尺寸以使缩小后的临近字体的尺寸不大于预设尺寸。
80.在上述过程中,避免字体的尺寸过大或者过小,从而影响系统的对数据的采集效率以及后期汇总统计时的运行效率,在前期将字体大小做统一处理,使得单元格内的文字信息的尺寸控制在一个区间范围内,例如,预设尺寸大小为14-18磅。
81.s203、若文字信息存在遗漏,则补全文字信息。
82.在上述步骤中,身份信息包括姓名、身份证号以及电话号码,若姓名存在遗漏时,则根据身份证号补全姓名或电话号码,或当身份证号存在遗漏时,根据电话号码补全身份证号。
83.具体的,在对文字信息进行数据处理时,还包括,依据文字信息判断是否存在重复文字,若存在重复文字,识取重复文字,结合文字信息判断重复文字是否为多余文字,若是,则删除重复文字。
84.s204、结合补充后的文字信息,获取分析指令,分析指令包括统计图类型,根据统计图类型,结合身份信息、区域信息以及轨迹信息对补充后的文字信息进行统计分析,得到分析后的数据统计图。
85.在上述步骤中,当需要将文字信息以柱状图的形式进行分析示出时,可以将每一个人的流调结果做成一柱状图,具体的,将柱状图的横轴定义为区域信息,纵轴定义为逗留时长,从而对获得的文字信息进行分析,最后得到柱状图以示出分析后的数据统计结果,便于工作人员进行查看。
86.需要指出的是,本发明第二实施例所提供的方法,其实现原理及产生的一些技术效果和第一实施例相同,为简要描述,本实施例未提及之处,可参考第一实施例中相应内容。
87.综上,本发明上述实施例当中的流行病调查表分析方法,通过对表单的数据进行预处理,以过滤无关数据,提高数据处理效率的同时,也提高了数据处理结果的准确性,有利于降低表单数据处理的工作量;进一步的,依据句意完整度判断文字信息是否存在遗漏,当存在文字信息存在遗漏时,补全文字信息,保证了表单分析处理结果的准确性,结合分析指令对表单信息进行统计分析,得到分析后的数据统计图,通过统计图直观反应表单信息,解决了现有技术中对流行病调查表统计分析效率低的技术问题。
88.实施例三
89.请参阅图5,所示为本发明第三实施例中的流行病调查表分析系统,所述系统包括:
90.获取模块,用于获取多张流行病调查表单,所述表单包括至少一表格、以及设于所述表格内的文字信息,所述文字信息包括流调人员的身份信息、区域信息以及在某一时刻的轨迹信息;
91.预处理模块,用于结合预训练的数据处理模型对所述表单进行预处理,从预处理后的表单中获取所述文字信息,并依据句意完整度判断所述文字信息是否存在遗漏;
92.补全模块,用于若所述文字信息存在遗漏,则补全所述文字信息;
93.统计分析模块,用于结合补充后的文字信息,获取分析指令,所述分析指令包括统计图类型,根据所述统计图类型,结合所述身份信息、所述区域信息以及所述轨迹信息对所述补充后的文字信息进行统计分析,得到分析后的数据统计图。
94.在一些可选实施例中,预处理模块包括:
95.判断单元,用于识别所述表格以及所述文字信息,根据所述表格判断所述文字信息是否在所述表格范围内;
96.第一执行单元,用于当所述文字信息不在所述表格范围内时,将不在所述表格范围内的文字信息进行调整,以使所述不在所述表格范围内的文字信息调整在所述表格的范围内。
97.在一些可选实施例中,第一执行单元包括:
98.第一获取子单元,用于所述表格包括多个单元格,根据所述单元格获取所述表格的边框信息,根据所述边框信息获取所述文字信息与所述单元格的相对位置关系;
99.移动子单元,用于根据所述相对位置关系获取所述文字信息在所述单元格的具体方位,根据所述具体方位将所述文字信息往远离所述方位的方向移动,以使所述文字信息位于所述单元格内。
100.在一些可选实施例中,第一执行单元还包括:
101.第二获取子单元,用于根据字体获取字体属性,所述字体属性包括字体尺寸信息;
102.第一判断子单元,用于根据所述字体尺寸信息判断所述字体的尺寸是否大于预设尺寸;
103.第一执行子单元,用于当所述字体的尺寸大于预设尺寸时,获取大于预设尺寸的字体,并调节所述大于预设尺寸的字体的尺寸,以使所述不在所述表格范围内的文字信息调整在所述表格的范围内。
104.综上,本发明上述实施例当中的流行病调查表分析系统,通过对表单的数据进行预处理,以过滤无关数据,提高数据处理效率的同时,也提高了数据处理结果的准确性,有利于降低表单数据处理的工作量;进一步的,依据句意完整度判断文字信息是否存在遗漏,当存在文字信息存在遗漏时,补全文字信息,保证了表单分析处理结果的准确性,结合分析指令对表单信息进行统计分析,得到分析后的数据统计图,通过统计图直观反应表单信息,解决了现有技术中对流行病调查表统计分析效率低的技术问题。
105.此外,本发明的实施例还提出一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现上述实施例中方法的步骤。
106.此外,本发明的实施例还提出一种数据处理设备,包括存储器、处理器以及存储在存储器上并可在处理器上运行的计算机程序,处理器执行程序时实现上述实施例中方法的步骤。
107.在流程图中表示或在此以其他方式描述的逻辑和/或步骤,例如,可以被认为是用于实现逻辑功能的可执行指令的定序列表,可以具体实现在任何计算机可读介质中,以供指令执行系统、装置或设备(如基于计算机的系统、包括处理器的系统或其他可以从指令执行系统、装置或设备取指令并执行指令的系统)使用,或结合这些指令执行系统、装置或设备而使用。就本说明书而言,“计算机可读介质”可以是任何可以包含、存储、通信、传播或传输程序以供指令执行系统、装置或设备或结合这些指令执行系统、装置或设备而使用的装置。
108.计算机可读介质的更具体的示例(非穷尽性列表)包括以下:具有一个或多个布线的电连接部(电子装置),便携式计算机盘盒(磁装置),随机存取存储器(ram),只读存储器(rom),可擦除可编辑只读存储器(eprom或闪速存储器),光纤装置,以及便携式光盘只读存储器(cdrom)。另外,计算机可读介质甚至可以是可在其上打印程序的纸或其他合适的介质,因为可以例如通过对纸或其他介质进行光学扫描,接着进行编辑、解译或必要时以其他合适方式进行处理来以电子方式获得程序,然后将其存储在计算机存储器中。
109.应当理解,本发明的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中,多个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或固件来实现。例如,如果用硬件来实现,和在另一实施方式中一样,可用本领域公知的下列技术中的任一项或他们的组合来实现:具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路,具有合适的组合逻辑门电路的专用集成电路,可编程门阵列(pga),现场可编程门阵列(fpga)等。
110.在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。
111.尽管已经示出和描述了本发明的实施例,本领域的普通技术人员可以理解:在不脱离本发明的原理和宗旨的情况下可以对这些实施例进行多种变化、修改、替换和变型,本发明的范围由权利要求及其等同物限定。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献