一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种基于多维度疾病特征的动态病组分组实现方法与流程

2021-11-26 23:45:00 来源:中国专利 TAG:


1.本发明涉及计算机信息管理技术领域,尤其涉及一种基于多维度疾病特征的动态分组分组实现方法。


背景技术:

2.疾病相关分组,是根据病人的年龄、性别、住院天数、临床诊断、病症、手术、疾病严重程度、合并症与并发症及转归等因素,将病例归入若干组的分组体系。被归入一组的病例具有相近的临床症状和趋同的资源消耗程度。疾病诊断相关分组被作为工具应用于医疗费用支付,是当今世界公认的比较先进的支付方式之一。通过统一的疾病诊断分类定额支付标准的制定,达到医疗资源利用标准化。有助于激励医院加强医疗质量管理,迫使医院为获得利润主动降低成本、缩短住院天数和减少诱导性医疗费用支付,有利于费用控制。
3.医疗保险费用支付计算是医疗保障体系的重要环节,关系到医疗保险各方的利益。当前医疗费用的增长速度快,为了防止医疗保险出现入不敷出的情况,需要做医保控费。传统的医保支付方式有按项目付费和按人头付费等方法。现行的按项目付费,缺乏约束机制,出现了重复检查、大处方等过度医疗行为,造成医疗资源的浪费,致使医疗费用持续快速增长。按人头付费是医疗保险机构每月或每年按医院或医生服务的人数和规定收费的定额,预付给服务提供方一笔固定的费用。按人头付费会诱导医院选择性接收病人,如接收症状较轻、住院时间相对较短者,推诿重病患者;分解患者住院次数,以获取更多的“人头”;医院缺乏竞争意识,医务人员没有提高医疗技能的积极性,甚至可能出现医疗质量的下降。
4.根据已知的病例基础数据,包括病例的个人信息、疾病信息、治疗信息、住院时间、费用等,运用相关算法综合考虑医院的各种因素,实现对病例的疾病诊断分组,从而为后期的医保支付定价等应用打下基础,是当前需要解决的技术问题。


技术实现要素:

5.本发明旨在提供一种基于分类模型及cart算法来进行病例分类的方法。
6.为达到上述目的,本发明是采用以下技术方案实现的:
7.一种基于多维度疾病特征的动态病组分组实现方法,包括以下步骤:
8.步骤1:确定待分类病例中每一个病例的病种,获取一个及以上病种集;
9.步骤2:建立分类模型,并采用分类模型对所述病种集中的病例按照治疗费用进行分类。
10.优选的,所述步骤1包括以下步骤:
11.步骤101:获取所述待分类病例的疾病名称、手术操作方式;
12.步骤102:根据所述手术操作方式确定诊治方式;
13.步骤103:根据所述疾病名称和所述诊治方式确定所述待分类病例的病种。
14.进一步的,在步骤102中,通过预先建立的诊治编码库查询手术操作方式所对应的诊治方式。
15.进一步的,在步骤103中,通过预先建立的病种编码库查询所述疾病名称和所述诊治方式所对应的病种。
16.优选的,在步骤2中,建立分类模型包括以下步骤:
17.步骤201:将预先建立的影响因素库中的所有因素作为自变量,将所述病种集中的病例的治疗费用作为因变量;
18.步骤202:采用cart算法在所述影响因素库中的所有因素中选择最佳切分点作为分裂节点,并在每个分裂节点下重复所述最佳切分点的选择过程,直至达到cart算法预设的停止条件,生成分类回归树;
19.步骤203:对所述分类回归树进行剪枝,生成所述分类模型。
20.进一步的,在步骤202中,所述最佳切分点的选择过程包括以下步骤:
21.步骤202a:对于所述影响因素库中的每一个因素,计算切分前的基尼系数和切分后的基尼系数;
22.步骤202b:计算所述切分前的基尼系数与所述切分后的基尼系数的差值;
23.步骤202c:选择所述差值的最大值所对应的因素作为最佳切分点。
24.进一步的,在步骤102中,所述诊治编码库通过以下步骤建立:
25.步骤102a:对现有的诊治方式进行分类编码;
26.步骤102b:将手术与操作编码icd-9-cm-3及名称归入对应的诊治方式,则手术与操作编码icd-9-cm-3及名称和其归属的诊治方式形成了所述诊治编码库。
27.进一步的,在步骤103中,所述病种编码库通过以下步骤建立:
28.步骤103a:按照who所制定的国际疾病分类编码icd-10,截取编码的前三位作为预设的疾病大类;
29.步骤103b:对所述病种大类进行细分,即截取国际疾病分类编码icd-10编码的前四位作为预设的疾病亚类;
30.步骤103c:将上述疾病亚类和所述诊治方式进行对应,形成病种编码库。
31.进一步的,所述影响因素库中的因素包括患者的年龄、性别、吸烟史、身体素质、是否抢救、并发症状况以及是否呼吸机辅助。
32.进一步的,在步骤202中,切分前的基尼系数gini(d)的计算公式为:
[0033][0034]
切分后的基尼系数gini
a
(d)计算公式为:
[0035][0036]
其中,d为临床诊疗病例与资源消耗数据集,m为将临床诊疗病例与资源消耗数据集进行分类所产生的分类数量,p
i
为每个病例选择其中任一分类的概率。
[0037]
本发明具有以下有益效果:
[0038]
本发明将临床症状和治疗费用大致相同的病例归为一类,与现有的采用人工分类的方式相比,分类速度更快、精度更高,且根据上述分类进行医保费用计算,能够实现科学合理的医保控费。
附图说明
[0039]
图1为采用本发明方法对慢性阻塞性肺病进行分类的示意图。
具体实施方式
[0040]
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图,对本发明进行进一步详细说明。
[0041]
一种基于多维度疾病特征的动态病组分组实现方法,包括以下步骤:
[0042]
步骤1:确定待分类病例中每一个病例的病种,获取一个及以上病种集。
[0043]
具体地,所述步骤1包括以下步骤:
[0044]
步骤101:获取所述待分类病例的疾病名称、手术操作方式;
[0045]
步骤102:根据所述手术操作方式确定诊治方式;
[0046]
步骤103:根据所述疾病名称和所述诊治方式确定所述待分类病例的病种。
[0047]
在步骤102中,通过预先建立的诊治编码库查询手术操作方式所对应的诊治方式。在步骤103中,通过预先建立的病种编码库查询所述疾病名称和所述诊治方式所对应的病种。
[0048]
具体地,在步骤102中,所述诊治编码库通过以下步骤建立:
[0049]
步骤102a:对现有的诊治方式进行分类编码;
[0050]
步骤102b:将手术与操作编码icd-9-cm-3及名称归入对应的诊治方式,则手术与操作编码icd-9-cm-3及名称和其归属的诊治方式形成了所述诊治编码库。
[0051]
在步骤103中,所述病种编码库通过以下步骤建立:
[0052]
步骤103a:按照who所制定的国际疾病分类编码icd-10,截取编码的前三位作为预设的疾病大类;
[0053]
步骤103b:对所述病种大类进行细分,即截取国际疾病分类编码icd-10编码的前四位作为预设的疾病亚类;
[0054]
步骤103c:将上述疾病亚类和所述诊治方式进行对应,形成病种编码库。
[0055]
所述病种,均为诊疗方案和出入院标准比较明确、诊疗技术比较成熟、临床路径稳定、综合服务成本差异不大的病种。在具体实施中,诊治编码库采用如下方法建立:
[0056]
首先,对常用的诊治方式进行分类并编码,主要包括20种诊治方式,如下表所示:
[0057]
代码诊治方式代码诊治方式0保守治疗10适形放疗1传统手术11适形调强放疗2微创手术12腹水回输术3介入治疗13修复手术4人工肝治疗14体外碎石5透析治疗15容积调强6干细胞移植16血液净化7机械通气17机械持续降温8超声乳化18肾移植9玻璃体切割19冠脉造影
[0058]
然后,将常用的手术与操作编码icd-9-cm-3及名称归入对应的诊治方式,则常用的手术与操作编码icd-9-cm-3及名称和其归属的诊治方式就形成了诊治编码库,常用的手术与操作编码icd-9-cm-3共计5398个,下表举例示出其中5个:
[0059][0060][0061]
具体实施过程中病种编码库采用如下方式建立:首先,按照who制定的国际疾病分类编码icd-10,截取编码的前三位作为预设疾病大类,共计有20个疾病大类,包括:某些传染病和寄生虫病a00-b99、肿瘤c00-d48、血液及造血器官疾病和涉及免疫机制的某些疾患d50-d89、内分泌、营养和代谢疾病e00-e90等;对病种大类进行细分,再截取icd-10编码的前四位作为预设疾病亚类,共计有187个疾病亚类,包括:伤寒a01.0、未特指的副伤寒a01.4、沙门菌肠炎a02.0、未特指的细菌性痢疾a03.9、其他肠道大肠杆菌感染a04.4等。然后,将上述的187个疾病亚类和本实施例中已经确定的主要诊治方式进行对应,形成“病种编码库”,共计4654个病种。比如疾病亚类为“a04.8其他特指的细菌性肠道感染”,诊治方式为“0保守治疗”,则确定该病例为病种“bz1”,下表举例了病种编码库中的5个病种:
[0062]
[0063][0064]
当病例在同一个icd-10亚目下,同时存在几种不同的诊治方式时,以优先级数值来判断优先顺序,数值越高,判断优先级越高。比如,icd-10亚目为“a16.2”的病例,同时存在“保守治疗”、“微创手术”、“机械通气”三种诊治方式,则以优先级来判断该病例属于优先级最高的“bz5”。上述“优先级”是临床专家根据各病种的诊疗方式的资源消耗、技术难度、风险程度作出的评定。
[0065]
诊治编码库和病种编码库建立后,就可将病例的手术与操作编码icd-9-cm-3匹配预先构建的“诊治编码库”,可以得到手术与操作编码对应的诊治方式;然后根据病例的诊治方式,匹配预先构建的“病种编码库”,可以得到病例对应的具体病种。
[0066]
步骤2:建立分类模型,并采用分类模型对所述病种集中的病例按照治疗费用进行分类。
[0067]
具体地,在步骤2中,建立分类模型包括以下步骤:
[0068]
步骤201:将预先建立的影响因素库中的所有因素作为自变量,将所述病种集中的病例的治疗费用作为因变量;
[0069]
步骤202:采用cart算法在所述影响因素库中的所有因素中选择最佳切分点作为分裂节点,并在每个分裂节点下重复所述最佳切分点的选择过程,直至达到cart算法预设的停止条件,生成分类回归树;
[0070]
步骤203:对所述分类回归树进行剪枝,生成所述分类模型。
[0071]
在具体实施中,所述分类模型的建立包括:将预先建立的影响因素库中的所有因素作为自变量;所述影响因素库中的因素包括:患者的年龄、性别、吸烟史、身体素质、是否抢救、并发症状况、是否呼吸机辅助;将所述病种集中的病例的治疗费用作为因变量;采用cart算法在所述影响因素库中的所有因素中选择最佳切分点作为分裂节点;在每个分裂节点下重复所述最佳切分点的选择过程,直至达到cart算法预设的停止条件,生成分类回归树;对所述分类回归树进行剪枝,生成所述分类模型。所述影响因素库中的因素包括患者的年龄、性别、吸烟史、身体素质、是否抢救、并发症状况以及是否呼吸机辅助。
[0072]
具体地,在步骤202中,所述最佳切分点的选择过程包括以下步骤:
[0073]
步骤202a:对于所述影响因素库中的每一个因素,计算切分前的基尼系数和切分后的基尼系数;
[0074]
步骤202b:计算所述切分前的基尼系数与所述切分后的基尼系数的差值;
[0075]
步骤202c:选择所述差值的最大值所对应的因素作为最佳切分点。
[0076]
进一步的,在步骤202中,切分前的基尼系数gini(d)的计算公式为:
[0077][0078]
切分后的基尼系数gini
a
(d)计算公式为:
[0079][0080]
其中,d为临床诊疗病例与资源消耗数据集,m为将临床诊疗病例与资源消耗数据集进行分类所产生的分类数量,p
i
为每个病例选择其中任一分类的概率。如果计算连续值的基尼系数,需要将排序后的相邻值的中点作为分裂点,同样使用上面的公式计算。
[0081]
在对分类模型进行建立时还需要确定以下参数:
[0082]
1、决策树的复杂度:控制决策树增长(即控制分类数量);
[0083]
2、每个类别应包含的最少病例数,作为算法停止的条件。
[0084]
此外,当cart算法选取并发症作为切分特征变量时,将切分后节点费用均值高于预设阈值的并发症确定为重要并发症,将切分后节点费用均值低于预设阈值的并发症确定为一般并发症。
[0085]
下面以慢性阻塞性肺病的病例分类作为实施例,来说明分类过程。首先通过预先构建的“诊治编码库”和“病种编码库”,确定病例所属病种为“慢性阻塞性肺病”。针对慢性阻塞性肺病,设置病例治疗费用为因变量,自变量为年龄、性别、吸烟史、身体素质、是否抢救、并发症、是否呼吸机辅助等所有多维度的特征信息,运用cart算法选取合适的影响因素,由cart算法快速、自适应地寻找最有效的分组因素及分组条件。在分类模型建立时,设置决策树的复杂度为0.01,以控制决策树增长(控制分类数量);设置每个类别应包含的最少病例数为50,作为算法停止的条件。
[0086]
cart算法首先选择并发症作为切分变量,分为无并发症和有并发症,将有并发症的病例进一步细分,规则为切分后节点费用均值高于预设阈值的并发症确定为重要并发症,将切分后节点费用均值低于预设阈值的并发症确定为一般并发症;对无并发症的病例,进一步以呼吸机辅助时间划分,分为无呼吸机支持和有呼吸机支持,将有呼吸机支持进一步以辅助时长细分,划分为伴96小时以上呼吸机支持和伴96小时以下呼吸机支持;对伴96小时以下呼吸机支持进一步以年龄进一步细分,分为66岁以上和小于等于65岁;对于年龄在66岁以上的病人,进一步以上一年住院天数进行细分,分成上一年无住院记录和上一年有住院记录,上一年有住院记录再进一步细分为上一年住院天数1-30天和上一年住院天数30天以上;对于上一年无住院记录的病人,以是否有吸烟史,形成最终的分类模型。
[0087]
如图1所示,根据cart算法将病例数据集划分为9组,分别是:1)慢性阻塞性肺病伴重要并发症(平均费用为13555.9元);2)慢性阻塞性肺病伴一般并发症(平均费用为10039.7元);3)慢性阻塞性肺病无并发症且无呼吸机支持(平均费用为6110.3元);4)慢性阻塞性肺病无并发症且伴96小时以上呼吸机支持(平均费用为11636.3元);5)慢性阻塞性肺病无并发症且伴96小时以下呼吸机支持,小于等于65岁(平均费用为8684.9元);6)慢性阻塞性肺病无并发症且伴96小时以下呼吸机支持,66岁以上,上一年住院天数30天及以上(平均费用为12436.3元);7)慢性阻塞性肺病无并发症且伴96小时以下呼吸机支持,66岁以上,上一年住院天数1-30天(平均费用为11636.3元);8)慢性阻塞性肺病无并发症且伴96小
时以下呼吸机支持,66岁以上,上一年无住院记录,有吸烟史(平均费用为9345.7元);9)慢性阻塞性肺病无并发症且伴96小时以下呼吸机支持,66岁以上,上一年无住院记录,无吸烟史(平均费用为8543.7元)。各组费用的平均值可作为预测医疗服务费用的参考值。
[0088]
当然,本发明还可有其它多种实施例,在不背离本发明精神及其实质的情况下,熟悉本领域的技术人员可根据本发明作出各种相应的改变和变形,但这些相应的改变和变形都应属于本发明所附的权利要求的保护范围。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献