一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种遗传资源处理的预警方法和装置与流程

2021-11-15 19:00:00 来源:中国专利 TAG:


1.本发明涉及数据处理技术领域,具体涉及一种遗传资源处理的预警方法和装置。


背景技术:

2.人类遗传资源是:1)生命科学研究的重要物质和信息基础(认识人类进化、研究种族之间血缘关系、研究人的寿命和衰老等),2)认知和掌握疾病发生、发展的基础资料(新靶点发现、创新药物、新型疫苗、先进医疗装备、生物治疗技术、人口健康研究等),因此,为了国家安全,各个国家对于人类遗传资源的利用都有相关规定。
3.因此,如何安全可靠的对遗传资源相关数据进行管理,成为本领域技术人员亟待解决的技术问题之一。


技术实现要素:

4.有鉴于此,本发明实施例提供一种遗传资源处理的预警方法和装置,以实现对遗传资源相关数据进行管理。
5.为实现上述目的,本发明实施例提供如下技术方案:
6.一种遗传资源处理的预警装置,包括:
7.第一监控模块,用于对目标对象内的资源信息进行监控,判断所述目标对象内是否出现新的资源信息,当所述目标对象内出现新的资源信息时向第一采集模块输出采集指令,所述资源信息包括关于遗传资源的目标法规文件,以及行政处罚文件;
8.第一采集模块,用于在获取到所述采集指令时,由所述目标对象内获取所述新的资源信息;
9.第一识别模块,用于采用自然语言处理技术对所述第一采集模块采集的资源信息的内容进行识别,得到目标字段,基于所述目标字段生成存储文件并进行存储;
10.第一预警模块,用于当所述第一采集模块更新本地存储内容时,输出预警信号。
11.可选的,上述遗传资源处理的预警装置中,所述第一监控模块判断所述目标对象内是否出现新的资源信息时,具体用于:
12.对所述目标对象中所新增的数据内容进行关键字识别,当所述新增的数据内容命中的关键字数量大于预设值时,表明所述目标对象内出现新的资源信息;
13.或者是,采用人工智能模型对目标对象中所新增的数据内容的主题字段进行识别,基于识别结果判断被识别的数据内容是否属于所述资源信息,如果属于时,表明所述目标对象内出现新的资源信息。
14.可选的,上述遗传资源处理的预警装置中,所述第一识别模块在采用自然语言处理技术对所述第一采集模块采集的资源信息的内容进行识别,得到目标字段时,具体用于:
15.采用分类模型基于所述第一采集模块采集的资源信息的内容对所述资源信息进行分类,获取与分类结果相匹配的目标字段列表,基于所述目标字段列表对所述第一采集模块采集的资源信息进行数据抓取,基于抓取数据生成与所述目标字段列表相匹配的数据
表。
16.可选的,上述遗传资源处理的预警装置中,还包括:
17.申报资料监控模块,用于目标文档管理系统相连,检测所述目标系统中存储的遗传资源申报书准备文件是否更新,所述遗传资源申报书准备文件包括但不限于研究方案文件、知情同意书文件、伦理审查批件文件、国际合作协议文件;
18.遗传资源采集模块,用于获取并存储更新后的遗传资源申报书准备文件;
19.第二预警模块,用于当检测到遗传资源申报书准备文件更新时,生成预警信号。
20.可选的,上述遗传资源处理的预警装置中,还包括:
21.遗传资源样本采集模块,用于获取遗传资源采集数据;
22.遗传资源申报文件存储模块,用于将获取到的获取遗传资源采集数据和与其对应的预设遗传资源申报文件各项指标进行比较,判断采集数据与所述申报文件中的申报数据是否一致,如果不一致,向第三预警模块输出触发指令;
23.第三预警模块,用于获取到触发指令时,生成预警信号。
24.可选的,上述遗传资源处理的预警装置中,还包括:
25.推送模块,用于当检测到所述遗传资源处理的预警装置内有预警信号生成时,根据预设推送规则,将所述预警信号推送至目标用户。
26.一种遗传资源处理的预警方法,包括:
27.对目标对象内的资源信息进行监控,判断所述目标对象内是否出现新的资源信息,所述资源信息包括关于遗传资源的目标法规文件,以及行政处罚文件;
28.获取所述目标对象内新的资源信息时;
29.采用自然语言处理技术对采集的资源信息的内容进行识别,得到目标字段,基于所述目标字段生成存储文件并进行存储,生成并输出预警信号;
30.可选的,上述遗传资源处理的预警方法中,判断所述目标对象内是否出现新的资源信息包括:
31.对所述目标对象中所新增的数据内容进行关键字识别,当所述新增的数据内容命中的关键字数量大于预设值时,表明所述目标对象内出现新的资源信息;
32.或者是,采用人工智能模型对目标对象中所新增的数据内容的主题字段进行识别,基于识别结果判断被识别的数据内容是否属于所述资源信息,如果属于时,表明所述目标对象内出现新的资源信息。
33.可选的,上述遗传资源处理的预警方法中,所述采用自然语言处理技术对采集的资源信息的内容进行识别,得到目标字段,包括:
34.采用分类模型基于采集到的资源信息的内容对所述资源信息进行分类,获取与分类结果相匹配的目标字段列表,基于所述目标字段列表对采集到的资源信息进行数据抓取,基于抓取数据生成与所述目标字段列表相匹配的数据表。
35.可选的,上述遗传资源处理的预警方法中,还包括:
36.基于目标系统中存储的遗传资源申报书准备文件对本地存储的遗传资源申报书准备文件监控,所述遗传资源申报书准备文件包括但不限于研究方案文件、知情同意书文件、伦理审查批件文件、国际合作协议文件;
37.获取并存储更新后的遗传资源申报书准备文件;
38.当检测到遗传资源申报书准备文件更新时,生成预警信号。
39.可选的,上述遗传资源处理的预警方法中,还包括:
40.获取遗传资源采集数据;
41.将获取到的获取遗传资源采集数据和与其对应的预设遗传资源申报文件各项指标进行比较,判断采集数据与所述申报文件中的申报数据是否一致,如果不一致,生成并输出预警信号。
42.可选的,上述遗传资源处理的预警方法中,还包括:
43.当检测到所述遗传资源处理的预警方法中内有预警信号生成时,根据预设推送规则,将所述预警信号推送至目标用户。
44.基于上述技术方案,本发明实施例提供的上述方案,通过所述第一监控模块对目标对象内的发布内容进行监控,当检测到所述目标对象发布目标法规文件或行政处罚文件时,获取所述目标对象发布的目标法规文件或行政处罚文件,采用所述第一识别模块对所述目标法规文件或行政处罚文件数据抓取,得到目标字段,对所述目标字段进行存储,然后生成并输出预警信号,实现了目标法规文件,以及行政处罚文件管理,以及预警。
附图说明
45.为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
46.图1为本技术实施例公开的遗传资源处理的预警装置的结构示意图;
47.图2为本技术实施例公开的遗传资源处理的预警方法的流程示意图。
具体实施方式
48.下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
49.下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。为了更加特定地强调实施的独立性,本说明书涉及许多模块或单元。举例而言,模块或单元可由硬件电路实现,该硬件电路包括特制vlsi电路或门阵列,比如逻辑芯片、晶体管,或其它组件。模块或单元也可在可编程的硬设备中实现,比如场效可编程门阵列、可编程阵列逻辑、可编程逻辑设备等等。
50.模块或单元也可在藉由各种形式的处理器所执行的软件中实现。比如说,一可执行码模块可包括一个或多个实体的或逻辑的计算机指令区块,该区块可能形成为,比如说,对象、程序或函数。然而,鉴别模块或单元的可执行部分不需要物理上放置在一起,但可由存于不同位置的不同指令所组成,当逻辑上组合在一起时,形成模块或单元且达到该模块
或单元所要求的目的。实际上,可执行码模块或单元可以是一单一指令或多个指令,甚至可以分布在位于不同的程序中的数个不同的码区段,并且横跨数个存储设备。同样地,操作数据可被辨识及显示于此模块或单元中,并且可以以任何合适的形式实施且在任何合适的数据结构形式内组织。操作数据可以集合成单一数据集,或可分布在具有不同的存储设备的不同的位置,且至少部分地只以电子信号方式存在于一系统或网络。
51.本说明书所提及的“实施例”或类似用语表示与实施例有关的特性、结构或特征,包括在本发明的至少一实施例中。因此,本说明书所出现的用语“在一实施例中”、“在实施例中”以及类似用语可能但不必然都指向相同实施例。再者,本发明所述特性、结构或特征可以以任何方式结合在一个或多个实施例中。以下说明将提供许多特定的细节,比如编程序、软件模块、用户选择、网络交易、数据库查询、数据库结构、硬件模块、硬件电路、硬件芯片等例子,以提供对本发明实施例的了解。然而相关领域的普通技术人员将看出本发明,即使没有利用其中一个或多个特定细节,或利用其它方法、组件、材料等亦可实施。另一方面,为避免混淆本发明,公知的结构、材料或操作并没有详细描述。
52.为了对遗传资源数据进行管理,本技术公开了一种遗传资源处理的预警装置,参见图1,该装置可以包括:
53.第一监控模块100、第一采集模块200、第一识别模块300和第一预警模块 400;
54.在本方案中,所述第一监控模块100用于对目标对象内的资源信息进行监控,判断所述目标对象内是否出现新的资源信息,当所述目标对象内出现新的资源信息时向第一采集模块200输出采集指令,所述资源信息包括目标法规文件,以及行政处罚文件;
55.具体的,所述第一监控模块100用于采用预设方式对监控列表内的目标对象内存储的资源信息进行监控,判断所述目标对象内是否出现新的资源信息,其中,所述预设防止可以指的是现有技术中的任意一种数据监控方式,例如,在本方案中,所述预设防止可以为爬虫或者是rss订阅等方式,所述监控列表内的目标对象指的是目标网站,在现有方案中,所述目标网站为发布目标法规文件以及行政处罚文件的网站,所述目标网站的数量可以为多个。所述第一监控模块100用于对所述目标网站内的发布内容进行监控,当检测到所述目标网站发布新的目标法规文件或行政处罚文件时,表明所述目标对象内出现新的资源信息。
56.在本技术实施例公开的技术方案中,所述目标对象内发布的文件可能是本技术中所需监控的资源信息对应的文件,也可以是其他类型的文件,为了判断所述目标对象内发布的新的文件是否是本技术所需架空的资源信息文件,上述方案中,所述第一监控模块100判断所述目标对象内是否出现新的资源信息时,具体用于:
57.对所述目标对象中所新增的数据内容进行关键字识别,当所述新增的数据内容命中的关键字数量大于预设值时,表明所述目标对象内出现新的资源信息;在本方案中,可以预先设置多个关键字,基于所述关键字对所述目标对象发布的内容进行匹配,当所述目标对象某个发布内容命中所述关键字,且命中的关键字的数量大于预设值时,表明所述目标对象的发布内容为本方案所需监控的资源信息,所述关键字的理性可以依据用户需求自行设定。
58.或者是,在本方案中,也可以预先配置一个人工智能模型,所述人工智能模型内加载有用于对所述目标对象的发布内容进行识别的神经网络模型,通过所述人工智能模型对
所述目标对象发布的内容的主题字段进行识别,基于识别结果判断被识别的数据内容是否属于所述目标法规文件或行政处罚文件,如果属于时,表明所述目标对象内出现新的资源信息,否则,不触发后续操作。
59.所述第一采集模块200,用于在获取到所述第一监控模块100输出的采集指令时,由所述目标对象内获取所述新的资源信息;所述第一采集模块200由所述目标网站内获取所述目标网站发布的新的目标法规文件以及行政处罚文件;
60.第一识别模块300,用于采用自然语言处理技术对所述第一采集模块200 采集的资源信息的内容进行识别,得到目标字段,基于所述目标字段生成存储文件并进行存储;
61.在本方案中,所述第一识别模块300用于对所述第一采集模块200采集到的资源信息的内容进行识别,并采用预设处理方式对所述资源信息进行预处理,生成预设格式的文件列表,例如,以所述行政处罚文件为例,本方案中,通过对获取到的行政处罚文件进行预处理,所述预处理后的文件中,具有处罚单位字段、处罚单位地址字段、触发单位法人字段、触发时间字段、处罚原因字段、触发类别字段、触发结果字段等,基于这些字段构建数据表,并对构建好的数据表进行存储。
62.本方案中,在存储所述目标对象内发布的资源信息时,可以对这些信息进行格式转换后进行存储,例如,所述第一识别模块300在采用自然语言处理技术对所述第一采集模块200采集的资源信息的内容进行识别,得到目标字段时,具体用于:
63.采用分类模型基于所述第一采集模块200采集的资源信息的内容对所述资源信息进行分类,获取与分类结果相匹配的目标字段列表,基于所述目标字段列表对所述第一采集模块200采集的资源信息进行数据抓取,基于抓取数据生成与所述目标字段列表相匹配的数据表。上述方案中,所述目标法规文件以及行政处罚文件所需抓取的字段不同,在本方案中,可以预先采用所述分类模块对所述目标对象发布的资源信息进行分类,判断发布内容是目标法规文件还是行政处罚文件,
64.例如,构建好的数据表可以如下所示:
[0065][0066]
所述第一预警模块400,用于当所述第一采集模块200更新本地存储内容时,输出预警信号。即,当所述第一预警模块400当检测到有新的资源信息存储在本地存储设备中时,输出预警信号,提示用户有新的目标法规文件或行政处罚文件,其中,该预警信号中具有用于对更新的目标法规文件或行政处罚文件进行定位的地址信号。
[0067]
在本技术上述实施例提供的方案中,通过所述第一监控模块100对目标对象内的发布内容进行监控,当检测到所述目标对象发布目标法规文件或行政处罚文件时,获取所
述目标对象发布的目标法规文件或行政处罚文件,采用所述第一识别模块300对所述目标法规文件或行政处罚文件数据抓取,得到目标字段,对所述目标字段进行存储,然后生成并输出预警信号,实现了目标法规文件,以及行政处罚文件管理,以及预警。
[0068]
本技术实施例公开的上述系统,除了可以对所述目标法规文件以及行政处罚文件进行监控外,还可以对遗传资源申报书准备文件进行监控,所述遗传资源申报书准备文件可以包括但不限于研究方案文件、知情同意书文件、伦理审查批件文件、国际合作协议文件,对这些文件进行监控和及时更新本地文件。对此,上述方案中还可以包括:
[0069]
申报资料监控模块500,用于目标文档管理系统相连,检测所述目标系统中存储的遗传资源申报书准备文件是否更新,其中,所述目标文档管理系统可以包括但不限于sharepoint、企业内容管理(ecm)等系统,这些系统中存储有所述研究方案文件、知情同意书文件、伦理审查批件文件、国际合作协议文件等,系统内部的相应文件会不定期进行更新;
[0070]
遗传资源采集模块600,用于获取并存储更新后的遗传资源申报书准备文件;
[0071]
申报变更识别模块610,用于将获取到的遗传资源申报书准备文件与已存储的本地遗传资源申报书准备文件进行对比,如果两者不一致时,更新本地以存储的遗传资源申报书准备文件;
[0072]
第二预警模块700,用于当检测到遗传资源申报书准备文件更新时,生成预警信号,在本步骤中国将获取到的遗传资源申报书准备文件中的预置条件与已经存储的遗传资源申报书准备文件的预置条件进行对比,判断是否需要更新本地存储的遗传资源申报书准备文件,如果预置条件发生变化,则需要更新文件,否则不需要更新文件,所述阈值条件可以包括但不限于:方案版本及版本日期、伦理审查批件号、知情同意书版本号、筛选人数/入组人数、是否出境、是否涉及基因检测、是否涉及生物标志物、人类遗传资源来源、项目摘要、项目名称、合作方、联系方式(联系人、电话、邮箱、通讯地址)、临床试验批件号等。当所述阈值条件中的任意一项发生变化时,则判定需要更新本地存储的遗传资源申报书准备文件,并生成预警信号。在本方案中,可以通过该预警信号所包含的地址数据对更新的本地存储的遗传资源申报书准备文件进行定位。
[0073]
在本技术另一实施例公开的技术方案中,还可以包括:
[0074]
遗传资源样本采集模块800,用于通过主动(如通过可穿戴设备跟踪受试者样本采集量)或被动(人工获取相关信息上传至监控模块)的方式获取遗传资源采集数据;
[0075]
遗传资源变更识别模块900,用于将获取到的获取遗传资源采集数据和与其对应的预设遗传资源申报文件各项指标进行比较,判断采集数据与所述申报文件中的申报数据是否一致,如果不一致,控制第三预警模块1000输出预警信号;在本方案中,所述各项指标可以为样本类型、单例数量、例数、合计数量、单位规格、检测内容、检测单位等,当上述任意一项指标不一致时,均触发第三预警模块1000。
[0076]
例如,遗传资源申报文件中申请的样本采集计划为:全血100管、尿液 100管;受试者入组后在site实际产生的遗传资源采集数据为全血100管,尿液120管,血浆500ml;
[0077]
则所述遗传资源变更识别模块900会识别出:尿液已申请

20管;血浆未申请

500ml。基于这些识别出的数据生成预警信号,且所述预警信号中具有用于对所述遗传资源采集数据进行定位的地址信息。
[0078]
第三预警模块1000,用于当检测到遗传资源申报文件更新或者是有新的遗传资源申报文件存储时,生成预警信号。
[0079]
在本技术另一实施例公开的技术方案中,还包括:推送模块1100,用于当检测到所述遗传资源处理的预警装置内有预警信号生成时,根据预设推送规则,将所述预警信号推送至目标用户。具体的,所述根据预设推送规则,将所述预警信号推送至目标用户,可以指的是,基于所述预警信号对应的文件类型,获取对应的目标用户的通讯地址,基于所述通讯地址,向目标用户发送所述预警信号。
[0080]
对应于上述方法,本技术还公开了一种遗传资源处理的预警方法,参见图2,方法包括:
[0081]
对目标对象内的资源信息进行监控,判断所述目标对象内是否出现新的资源信息,所述资源信息包括关于遗传资源的目标法规文件,以及行政处罚文件;
[0082]
获取所述目标对象内新的资源信息时;
[0083]
采用自然语言处理技术对采集的资源信息的内容进行识别,得到目标字段,基于所述目标字段生成存储文件并进行存储,生成并输出预警信号;
[0084]
可选的,上述遗传资源处理的预警方法中,判断所述目标对象内是否出现新的资源信息包括:
[0085]
对所述目标对象中所新增的数据内容进行关键字识别,当所述新增的数据内容命中的关键字数量大于预设值时,表明所述目标对象内出现新的资源信息;
[0086]
或者是,采用人工智能模型对目标对象中所新增的数据内容的主题字段进行识别,基于识别结果判断被识别的数据内容是否属于所述资源信息,如果属于时,表明所述目标对象内出现新的资源信息。
[0087]
可选的,上述遗传资源处理的预警方法中,所述采用自然语言处理技术对采集的资源信息的内容进行识别,得到目标字段,包括:
[0088]
采用分类模型基于采集到的资源信息的内容对所述资源信息进行分类,获取与分类结果相匹配的目标字段列表,基于所述目标字段列表对采集到的资源信息进行数据抓取,基于抓取数据生成与所述目标字段列表相匹配的数据表。
[0089]
可选的,上述遗传资源处理的预警方法中,还包括:
[0090]
基于目标系统中存储的遗传资源申报书准备文件对本地存储的遗传资源申报书准备文件监控,所述遗传资源申报书准备文件包括但不限于研究方案文件、知情同意书文件、伦理审查批件文件、国际合作协议文件;
[0091]
获取并存储更新后的遗传资源申报书准备文件;
[0092]
当检测到遗传资源申报书准备文件更新时,生成预警信号。
[0093]
可选的,上述遗传资源处理的预警方法中,还包括:
[0094]
获取遗传资源采集数据;
[0095]
将获取到的获取遗传资源采集数据和与其对应的预设遗传资源申报文件各项指标进行比较,判断采集数据与所述申报文件中的申报数据是否一致,如果不一致,生成并输出预警信号。
[0096]
可选的,上述遗传资源处理的预警方法中,还包括:
[0097]
当检测到所述遗传资源处理的预警方法中内有预警信号生成时,根据预设推送规
则,将所述预警信号推送至目标用户。
[0098]
为了描述的方便,描述以上系统时以功能分为各种模块分别描述。当然,在实施本技术时可以把各模块的功能在同一个或多个软件和/或硬件中实现。
[0099]
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于系统或系统实施例而言,由于其基本相似于方法实施例,所以描述得比较简单,相关之处参见方法实施例的部分说明即可。以上所描述的系统及系统实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性劳动的情况下,即可以理解并实施。
[0100]
专业人员还可以进一步意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
[0101]
结合本文中所公开的实施例描述的方法或算法的步骤可以直接用硬件、处理器执行的软件模块,或者二者的结合来实施。软件模块可以置于随机存储器(ram)、内存、只读存储器(rom)、电可编程rom、电可擦除可编程rom、寄存器、硬盘、可移动磁盘、cd

rom、或技术领域内所公知的任意其它形式的存储介质中。
[0102]
还需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个
……”
限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
[0103]
对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其它实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献