一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种出血预测模型的构建训练方法及装置与流程

2022-11-30 11:33:58 来源:中国专利 TAG:


1.本技术涉及疾病的智能预测技术领域,尤其涉及一种出血预测模型的构建及训练方法。


背景技术:

2.在妇产科、骨科、普外科、泌尿外科等科室的患者进行手术或有创操作时,有时会面临严重甚至是致命性的出血风险。这类出现出血状况的患者或者有已知或尚未发现的出血性疾病,或者存在因治疗相关(使用抗凝或抗血小板药物)而导致可能的出血风险。
3.目前麻醉和手术医师对术中输血的预判主要根据医师的临床经验进行判断。因此对于相关临床经验较为匮乏的年轻医生,对围手术期出血风险评估缺乏经验,会直接影响到术前备血等环节,影响手术质量。因此,目前手术中尚缺乏可参考的临床证据,从传统方法进行围手术期出血风险评估有很大的不确定性。
4.针对围手术期出血预测相关技术方向的研究,目前比较匮乏,一方面是因为当前研究过程中相关参数数据信息质量较低,在研究过程中直接使用真实数据进行出血预测准确率较差、成功率较低,因此目前往往只是用于理论研究,并未落实到实际应用中;另一方面,当前的研究主要为结合磁共振技术或者特定硬件测测装置进行分析预测,并且预测对象为特定的某项手术,对于其他疾病的预测需要重新设计预测流程,该类方法灵活性差。


技术实现要素:

5.有鉴于此,本技术实施例提供了一种出血预测模型的构建训练方法及装置,旨在实现围术期出血风险预测预警。
6.第一方面,本技术实施例提供了一种出血预测模型的构建训练方法,包括:
7.获取第一样本参数信息和训练参数信息;
8.根据极端梯度回归模型、所述第一样本参数信息和自动寻优技术确定第一算法模型,所述第一算法模型为以极端梯度回归模型为基础、包括最优样本参数信息的算法模型;
9.依据所述训练参数信息对所述第一算法模型进行训练。
10.可选的,所述根据极端梯度回归模型、所述第一样本参数信息和自动寻优技术确定第一算法模型,包括:
11.根据极端梯度回归模型和自动寻优技术将所述第一样本参数信息调整为最优样本参数信息;
12.根据所述最优样本参数信息确定第一算法模型。
13.可选的,所述获取样本参数信息和训练参数信息之后,还包括:
14.根据所述第一样本参数构建极端梯度回归模型;
15.所述根据所述第一样本参数构建极端梯度回归模型,包括:对所述第一样本参数信息进行降低空间分辨率的重采样,得到第二样本参数信息,使所述第二样本参数信息的空间分辨率与所述第一样本参数信息的空间分辨率相同;
16.基于所述第二样本参数信息和所述第一样本参数信息,迭代建立决策树,形成极端梯度回归模型。
17.可选的,所述获取第一样本参数信息和训练参数信息之前,还包括:
18.获取研究需求;
19.根据所述研究需求获取需求样本参数信息和第一数据标准,所述第一数据标准为对应所述需求样本参数信息的筛选标准;
20.筛选所述需求样本参数信息确定第一样本参数信息。
21.可选的,所述根据所述研究需求获取需求样本参数信息和数据标准之后,还包括:
22.根据所述研究需求确定数据治理方案;
23.根据所述数据治理方案确定第二数据标准,所述第二数据标准为对应数据治理方案的数据质量筛选标准。
24.可选的,所述依据所述训练参数信息对所述第一算法模型进行训练包括:
25.将所述训练参数信息输入至所述第一算法模型中,所述训练参数为实时采集更新的参数信息;
26.更新所述第一算法模型。
27.可选的,所述更新所述第一算法模型之后,还包括:
28.获取第一时刻的历史算法模型和第二时刻更新后的算法模型,所述第一时刻早于所述第二时刻;
29.将所述历史算法模型和更新后的算法模型比对评估,确定对所述历史算法模型的评估结果,所述评估结果用于指示所述历史算法模型的灵敏度和稳定性。
30.第二方面,本技术实施例提供了一种出血预测模型的构建训练装置,所述装置包括:
31.获取模块,用于获取第一样本参数信息和训练参数信息;
32.第一算法模型确定模块,用于根据极端梯度回归模型、所述第一样本参数信息和自动寻优技术确定第一算法模型,所述第一算法模型为以极端梯度回归模型为基础、包括最优样本参数信息的算法模型;
33.模型训练模块,用于依据所述训练参数信息对所述第一算法模型进行训练。
34.可选的,所述装置还包括:
35.需求获取模块,用于获取研究需求;
36.标准信息获取模块,用于根据所述研究需求获取需求样本参数信息和第一数据标准,所述第一数据标准为对应所述需求样本参数信息的筛选标准;
37.筛选模块,用于筛选所述需求样本参数信息确定第一样本参数信息。
38.可选的,所述装置还包括:
39.治理方案确定模块,用于根据所述研究需求确定数据治理方案;
40.第二数据标准确定模块,用于根据所述数据治理方案确定第二数据标准,所述第二数据标准为对应数据治理方案的数据质量筛选标准。
41.本技术实施例提供了一种出血预测模型的构建训练方法。在执行所述方法时,获取第一样本参数信息和训练参数信息;根据极端梯度回归模型、所述第一样本参数信息和自动寻优技术确定第一算法模型,所述第一算法模型为以极端梯度回归模型为基础、包括
最优样本参数信息的算法模型;依据所述训练参数信息对所述第一算法模型进行训练。这样,通过获取样本参数信息囊括手术前收集的基本信息以及主刀人的信息,保证预测模型指标的全面性,基于此实现预测模型的构建,并根据实时收集的数据对模型进行训练更新,获得数据全面、应用性高、更新迭代效率高的预测模型。
附图说明
42.为更清楚地说明本实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
43.图1为本技术实施例提供的出血预测模型的构建训练方法的一种方法流程图;
44.图2为本技术实施例提供的出血预测模型的构建训练方法的一种方法流程图;
45.图3为本技术实施例提供的出血预测模型的构建训练装置的一种结构示意图。
具体实施方式
46.为了使本技术领域的人员更好地理解本技术方案,下面将结合本技术实施例中的附图,对本技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本技术一部分实施例,而不是全部的实施例。基于本技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本技术保护的范围。
47.正如前文所述,目前麻醉和手术医师对术中输血的预判主要根据医师的临床经验进行判断。因此对于相关临床经验较为匮乏的年轻医生,对围手术期出血风险评估缺乏经验,会直接影响到术前备血等环节,影响手术质量。因此,目前手术中尚缺乏可参考的临床证据,从传统方法进行围手术期出血风险评估有很大的不确定性。针对围手术期出血预测相关技术方向的研究,目前比较匮乏,但是,发明人经过研究发现,一方面因为当前研究过程中相关参数数据信息质量较低,在研究过程中直接使用真实数据进行出血预测准确率较差、成功率较低,因此目前往往只是用于理论研究,并未落实到实际应用中;另一方面,当前的研究主要为结合磁共振技术或者特定硬件测测装置进行分析预测,并且预测对象为特定的某项手术,对于其他疾病的预测需要重新设计预测流程,该类方法灵活性差。
48.为了解决这一问题,本技术实施例提供了一种出血预测模型的构建训练方法。在执行所述方法时,获取第一样本参数信息和训练参数信息;根据极端梯度回归模型、所述第一样本参数信息和自动寻优技术确定第一算法模型,所述第一算法模型为以极端梯度回归模型为基础、包括最优样本参数信息的算法模型;依据所述训练参数信息对所述第一算法模型进行训练。这样,通过获取样本参数信息囊括手术前收集的基本信息以及主刀人的信息,保证预测模型指标的全面性,基于此实现预测模型的构建,并根据实时收集的数据对模型进行训练更新,获得数据全面、应用性高、更新迭代效率高的预测模型。相比于现有的根据临床经验进行自主判断,这样的预测模型预测方式更具灵活性,相比于现有的根据一种疾病构建预测过程,本发明数据覆盖面广,对于不同的疾病仅需要对数据进行调整,无需对每种不同的检测进行模型构建,省时省力、数据全面、应用性高。
49.本技术实施例提供的方法由医院后台系统执行,例如可以由医院后台服务器执
行。所述银行后台服务器可以是一台服务器设备,也可以是由多台服务器组成的服务器集群。将最优的模型算法包封装为分类器,支持患者术前出血预测;支持筛选随访对象工具,作为医生的辅助工具,用于筛选随访对象。
50.显然,所描述的实施例仅是本技术一部分实施例,而不是全部的实施例。基于本技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本技术保护的范围。
51.以下通过一个实施例,对本技术提供的出血预测模型的构建训练进行说明。参见图1,图1为本技术实施例提供的一种出血预测模型的构建训练方法的一种方法流程图图,包括:
52.s101:获取第一样本参数信息和训练参数信息。
53.第一样本参数信息为用于模型构建的研究参数数据。本技术基于综合性医院的真实世界数据开展围术期出血风险研究,选取了历时5年的四万多条患者手术历史数据,数据覆盖主要科室包括骨科、普外、神外、胸外、妇产科、心血管等。不仅覆盖面广,而且体现了大城市综合医院手术近几年的发展趋势微创、高龄的特色。
54.训练参数信息为在实际应用过程中不断获取的新数据,在后续过程中用于构建新数据集进行模型验证、优化、迭代的数据。
55.在实际应用场景中,获取数据库中的数据后需要进行一定程度上的筛选和过滤,该部分详见后文,在此不做赘述。
56.s102:根据极端梯度回归模型、所述第一样本参数信息和自动寻优技术确定第一算法模型。
57.关于极端梯度回归模型和自动寻优技术,本技术基于患者历史诊疗数据构围术期出血临床科研数据集,采用极端梯度下降法进行训练,最终形成围术期出血风险预测模型。极端梯度下降法:模型训练方法极端梯度下降法(xgboost)是一种基于迭代决策树模型的集成学习算法,它采用二阶导数优化目标函数,将多个弱分类器进行融合从而演化成强分类器。该算法最大的特点在于多线程计算,并利用正则化提升技术减少过度拟合,从而保证模型的鲁棒性。同时可自定义损失函数、稀疏特征的处理、允许缺失值等,具有灵活、计算速度快、不易受异常值干扰、稳健性好的优势。本技术在基础的极端梯度下降算法模型基础上,采用了自动寻优技术,代替手动调参,令模型自动将参数调整到最优值;结合机器学习技术与医学领域专业知识相结合,使结论具备完整的证据链,可解释性强。
58.极端梯度回归模型的构建过程包括:对所述第一样本参数信息进行降低空间分辨率的重采样,得到第二样本参数信息,使所述第二样本参数信息的空间分辨率与所述第一样本参数信息的空间分辨率相同;基于所述第二样本参数信息和所述第一样本参数信息,迭代建立决策树,形成极端梯度回归模型。
59.在实际算法模型构建过程中,首先根据极端梯度回归模型和自动寻优技术将所述第一样本参数信息调整为最优样本参数信息;而后,根据所述最优样本参数信息确定第一算法模型。
60.其中,最优样本参数信息为在实际预测过程中影响出血的最核心因素。根据该核心影响因素构建第一算法模型,用于后续对出血进行预测的模型主体。总体来说,本技术中基于围术期出血临床科研数据库(第一样本参数信息),使用逻辑回归、极端梯度提升、人工
神经网络等多种算法,对围手术期出血产生影响的因素进行筛查。分析单因子影响/多因子联合作用与围手术期出血量的相关度,找到影响出血的核心因素。设计算法成效评估规则/算法(第一算法模型),对不同模型的结果分别进行评估,对比评估结果,筛选出最优的预测模型。
61.在实际应用场景中,将最优的模型算法(第一算法模型)包封装为分类器,转化为智能控件进行应用,支持患者术前出血预测;支持筛选随访对象工具,作为医生的辅助工具,用于筛选随访对象。
62.s103:依据所述训练参数信息对所述第一算法模型进行训练更新。
63.训练参数信息为在实际应用过程中不断获取的新数据,在后续过程中用于构建新数据集进行模型验证、优化、迭代的数据。
64.在实际应用场景中,本方案与科研数据平台相结合,不断采集新数据进行在线训练,对历史模型进行验证,评估其灵敏度与稳定性;同时对模型进行迭代,不断提升模型成效,优化智能控件性能。
65.由此,本技术通过获取样本参数信息囊括手术前收集的基本信息以及主刀人的信息,保证预测模型指标的全面性,基于此实现预测模型的构建,并根据实时收集的数据对模型进行训练更新,获得数据全面、应用性高、更新迭代效率高的预测模型。以手术通用指标为基础构建通用模型,在保证通用手术预测准确度的基础上,结合在线训练技术,根据研究需求对不同专科手术方向进行模型深化,进一步提升专科手术围术期出血预测性能。
66.下面对本技术实施例提供的出血预测模型的构建训练方法进行详细介绍。参见图2所示,图2为本技术实施例提供的出血预测模型的构建训练方法的另一种流程示意图。其具体过程如下:
67.s201:获取研究需求。
68.获取模型实际应用过程中所需的研究需求方向。
69.s202:根据所述研究需求获取需求样本参数信息和第一数据标准。
70.根据上述研究需求对数据库中的数据信息进行定向获取,所述第一数据标准为对应所述需求样本参数信息的筛选标准。
71.数据集标准制定:本技术针对围手术期出血的研究,本专利由同仁医院医学专家组与计算所信息化和标准化专家共同规划和制定《围术期出血临床科研数据标准》,确认围手术期出血研究所需的数据项与对应的数据标准。
72.s203:根据所述研究需求确定数据治理方案。
73.数据治理方案:本技术针对电子病历中积累的真实世界数据特点,可以包括:以流程为特点建设的事务性系统数据根据科学研究的特点,按照主题与生命关键事件时序关系组织;急救(绿色通道)病人部分人口学信息缺失、疾病诊断采集信息精细化程度不一、非结构化非标准化等特点,针对数据项制定了对应的数据治理方案,保证数据质量。
74.根据研究需求对数据治理方案进行选择,在实际应用场景中,数据治理方案可以选择多个中的一个,也可以选择治理方案中的多个,对多个方案进行融合,关于融合方式在本技术中不做限制,可以根据实际需求进行适应性调整。
75.s204:根据所述数据治理方案确定第二数据标准。
76.所述第二数据标准为对应数据治理方案的数据质量筛选标准,根据当前获取到的
数据治理方案,系统可以获取其对应的第二数据标准。
77.s205:筛选所述需求样本参数信息确定第一样本参数信息。
78.对数据库中获取得到的需求样本参数信息进行筛选,确定满足数据标准且满足研究需求的参数信息,用于后续的模型构建过程。
79.在实际应用过程中,可以根据实际需求选择第一数据标准和第二数据标准中的一个进行数据信息筛选,在两个数据标准都需要满足时,则根据两个数据标准对数据信息进行筛选过滤。关于两个数据标准的选择和制定需求,可以根据实际应用情况进行调整,例如可以自主设置数据标准中的数据大小。
80.依据制定的围术期出血临床科研数据标准,科研数据平台从前期治理的数据中提取对应的数据构建围术期出血临床科研数据库。同时,在实际应用过程中针对出现数据大量缺失的数据项的情况,可以构建补充crf表单,由医生手动补录相关数据,保证数据库完整度。
81.s206:获取第一样本参数信息和训练参数信息。
82.获取上述过程中筛选后确定的第一样本参数信息和实时获取的训练参数信息。
83.s207:根据极端梯度回归模型、所述第一样本参数信息和自动寻优技术确定第一算法模型。
84.基于围术期出血临床科研数据库,使用逻辑回归、极端梯度提升、人工神经网络等多种算法,对围手术期出血产生影响的因素进行筛查。分析单因子影响/多因子联合作用与围手术期出血量的相关度,找到影响出血的核心因素。设计算法成效评估规则/算法,对不同模型的结果分别进行评估,对比评估结果,筛选出最优的预测模型。
85.s208:将所述训练参数信息输入至所述第一算法模型中,更新所述第一算法模型。
86.所述训练参数为实时采集更新的参数信息。与科研数据平台相结合,不断采集新数据进行在线训练,对历史模型进行验证,评估其灵敏度与稳定性;同时对模型进行迭代,不断提升模型成效,优化智能控件性能。
87.s209:获取第一时刻的历史算法模型和第二时刻更新后的算法模型。
88.所述第一时刻早于所述第二时刻,即获取更新时刻前的历史算法模型,并且获取以新数据更新后的算法模型。
89.s210:将所述历史算法模型和更新后的算法模型比对评估,确定对所述历史算法模型的评估结果。
90.对不同模型的结果分别进行评估,对比评估结果,筛选出最优的预测模型。而后,将最优的模型算法包封装为分类器,支持患者术前出血预测。
91.本技术在应用过程中确认围手术期出血研究所需的数据项与对应的数据标准、数据质量质控标准,并根据数据标注对数据库中的数据信息进行过滤筛选,保证数据的针对性,为模型构建打下良好基础。在模型完成构建后,将模型与科研数据平台相结合,不断采集新数据进行在线训练,对历史模型进行验证,评估其灵敏度与稳定性;同时对模型进行迭代,不断提升模型成效,优化智能控件性能。
92.以上为本技术实施例提供出血预测模型的构建训练方法的一些具体实现方式,基于此,本技术还提供了对应的装置。下面将从功能模块化的角度对本技术实施例提供的装置进行介绍。
93.参见图3所示的出血预测模型的构建训练装置的结构示意图,本实施例中,该装置可以包括:
94.获取模块300,用于获取第一样本参数信息和训练参数信息;
95.第一算法模型确定模块301,用于根据极端梯度回归模型、所述第一样本参数信息和自动寻优技术确定第一算法模型,所述第一算法模型为以极端梯度回归模型为基础、包括最优样本参数信息的算法模型;
96.模型训练模块302,用于依据所述训练参数信息对所述第一算法模型进行训练。
97.所述装置还包括:
98.需求获取模块,用于获取研究需求;
99.标准信息获取模块,用于根据所述研究需求获取需求样本参数信息和第一数据标准,所述第一数据标准为对应所述需求样本参数信息的筛选标准;
100.筛选模块,用于筛选所述需求样本参数信息确定第一样本参数信息。
101.所述装置还包括:
102.治理方案确定模块,用于根据所述研究需求确定数据治理方案;
103.第二数据标准确定模块,用于根据所述数据治理方案确定第二数据标准,所述第二数据标准为对应数据治理方案的数据质量筛选标准。
104.本技术实施例还提供了对应的设备以及计算机存储介质,用于实现本技术实施例提供的方案。
105.其中,所述设备包括存储器和处理器,所述存储器用于存储指令或代码,所述处理器用于执行所述指令或代码,以使所述设备执行本技术任一实施例所述的方法。
106.所述计算机存储介质中存储有代码,当所述代码被运行时,运行所述代码的设备实现本技术任一实施例所述的方法。
107.本技术实施例中提到的“第一”、“第二”(若存在)等名称中的“第一”、“第二”只是用来做名字标识,并不代表顺序上的第一、第二。
108.通过以上的实施方式的描述可知,本领域的技术人员可以清楚地了解到上述实施例方法中的全部或部分步骤可借助软件加通用硬件平台的方式来实现。基于这样的理解,本技术的技术方案可以以软件产品的形式体现出来,该计算机软件产品可以存储在存储介质中,如只读存储器(英文:read-only memory,rom)/ram、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者诸如路由器等网络通信设备)执行本技术各个实施例或者实施例的某些部分所述的方法。
109.本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于装置实施例而言,由于其基本相似于方法实施例,所以描述得比较简单,相关之处参见方法实施例的部分说明即可。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性劳动的情况下,即可以理解并实施。
110.以上所述仅是本技术示例性的实施方式,并非用于限定本技术的保护范围。
再多了解一些

本文用于创业者技术爱好者查询,仅供学习研究,如用于商业用途,请联系技术所有人。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献