医保套现诈骗行为识别方法及系统与流程

2022-11-14 00:09:13 来源：中国专利 TAG：

1.本公开涉及数据处理技术领域，具体涉及到一种医保套现诈骗行为识别方法及装置。

背景技术：

2.医保费用明细表中，有一些流水号对应的购买药品的数量和金额为负值。一般来说，记录为负值的数据表示有病人退药，大部分医院会将退药的费用以现金的形式退还给病人，因此，若有病人退药次数频繁或者退药费用特别高，那么该病人就有很大可能存在医保套现诈骗的情形。
3.相关技术中，无法对医保套现诈骗进行预警。

技术实现要素：

4.本公开的主要目的在于提供一种医保套现诈骗行为识别方法及系统。
5.为了实现上述目的，根据本公开的第一方面，提供了一种医保套现诈骗行为识别方法，包括：获取待识别人群的退药记录和与退药记录相对应的买药记录，得到待识别数据集合；基于待识别数据集合，利用预设的聚类规则对待识别人群进行分类，得到医保套现诈骗的可疑人群；利用预训练的多元回归模型对所述可疑人群的数据进行处理，得到异常数据的人群；对异常数据的人群进行判别，确定是否属于医保套现诈骗对象。
6.可选的，基于待识别数据集合，利用预设的聚类规则对待识别人群进行分类包括：在不同维度对数据集合中的数据进行聚类，其中，不同维度包括基于买药记录和退药记录确定的维度；基于预设的规则，对聚类后的数据进行分类。
7.可选地，对异常数据的人群进行判别，确定是否属于医保套现诈骗对象包括：基于异常数据中的退药记录与买药记录，利用预设的判定条件确定异常数据的人群中各个对象是否属于医保套现诈骗对象。
8.可选地，多元回归模型为多元线性回归模型。
9.根据本公开的第二方面，提供了一种医保套现诈骗行为识别系统，包括：数据处理模块，获取待识别人群的退药记录和与退药记录相对应的买药记录，得到待识别数据集合；聚类模块，基于待识别数据集合，利用预设的聚类规则对待识别人群进行分类，得到医保套现诈骗的可疑人群；模型处理模块，利用预训练的多元回归模型对所述可疑人群的数据进行处理，得到异常数据的人群；判定模块，对异常数据的人群进行判别，确定是否属于医保套现诈骗对象。
10.可选地，基于待识别数据集合，利用预设的聚类规则对待识别人群进行分类包括：在不同维度对数据集合中的数据进行聚类，其中，不同维度包括基于买药记录和退药记录确定的维度；基于预设的规则，对聚类后的数据进行分类。
11.可选地，对异常数据的人群进行判别，确定是否属于医保套现诈骗对象包括：基于异常数据中的退药记录与买药记录，利用预设的判定条件确定异常数据的人群中各个对象
是否属于医保套现诈骗对象。
12.可选地，多元回归模型为多元线性回归模型。
13.根据本公开的第三方面，提供了一种计算机可读存储介质，存储有计算机指令，所述计算机指令用于使所述计算机执行第一方面任意一项实现方式所述的医保套现诈骗行为识别方法。
14.根据本公开的第四方面，提供了一种电子设备，包括：至少一个处理器；以及与所述至少一个处理器通信连接的存储器；其中，所述存储器存储有可被所述至少一个处理器执行的计算机程序，所述计算机程序被所述至少一个处理器执行，以使所述至少一个处理器执行第一方面任意一项实现方式所述的医保套现诈骗行为识别方法。
15.在本公开实施例医保套现诈骗行为识别方法及系统中，包括：获取待识别人群的退药记录和与退药记录相对应的买药记录，得到待识别数据集合；基于待识别数据集合，利用预设的聚类规则对待识别人群进行分类，得到医保套现诈骗的可疑人群；利用预训练的多元回归模型对所述可疑人群的数据进行处理，得到异常数据的人群；对异常数据的人群进行判别，确定是否属于医保套现诈骗对象。通过基于病人退药记录和相对应的买药记录的数据，利用多元线性回归模型进行评价和判别，实现了对医保套现诈骗人群进行评价和判别的目的，克服了相关技术中无法对医保套现诈骗行为进行识别的问题。
附图说明
16.为了更清楚地说明本公开具体实施方式或现有技术中的技术方案，下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图是本公开的一些实施方式，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。
17.图1是根据本公开实施例的医保套现诈骗行为识别方法的流程图；
18.图2是根据本公开实施例的电子设备的示意图。
具体实施方式
19.为了使本技术领域的人员更好地理解本公开方案，下面将结合本公开实施例中的附图，对本公开实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本公开一部分的实施例，而不是全部的实施例。基于本公开中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都应当属于本公开保护的范围。
20.需要说明的是，本公开的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象，而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换，以便这里描述的本公开的实施例。此外，术语“包括”和“具有”以及他们的任何变形，意图在于覆盖不排他的包含，例如，包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元，而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
21.需要说明的是，在不冲突的情况下，本公开中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本公开。
22.根据本公开实施例，提供了一种医保套现诈骗行为识别方法，如图1所示，该方法包括如下的步骤101至步骤104：
23.步骤101：获取待识别人群的退药记录和与退药记录相对应的买药记录，得到待识别数据集合。
24.在本实施例中，可以获取人群中各个病人的退药记录和当前药品退药前相应的买药记录，该些记录可以包括用户数据，如病人id号、病人科室、就诊id号、开嘱医生id号、医嘱项等；退药记录和买药记录中还可以包括药品数据，如药品的名称、单价、数量、总价、开药时间、退药时间、开药次数、退药次数、退药的总价等。
25.进一步地，获取的记录可以是周期内的数据，例如，一个月。
26.本实施例利用了病人退药记录和相对应的买药记录的数据，通过构建有关医保套现诈骗人群多元线性回归评价和判别模型，便于快捷的对医保套现诈骗人群进行评价和判别。
27.步骤102：基于待识别数据集合，利用预设的聚类规则对待识别人群进行分类，得到医保套现诈骗的可疑人群。
28.在本实施例中，用于基于k-means聚类方法将退药人群进行分类，得到医保套现诈骗可疑的病人人群。
29.作为本实施例一种可选的实现方式，基于待识别数据集合，利用预设的聚类规则对待识别人群进行分类包括：
30.在不同维度对数据集合中的数据进行聚类，其中，不同维度包括基于买药记录和退药记录确定的维度；基于预设的规则，对聚类后的数据进行分类。
31.在本可选的实现方式中，可以在不同的维度对数据进行聚类，不同的维度可以包括退药费用、看诊次数、药品购买数量、购买药品类型是否与病人相符等维度。
32.示例性，以退药费用为例，如果绝大多数病人的退药费用在预设范围内(例如，0-200之间)，有少数人的退药费用远远大于平均值，那么采用k-means聚类方法，可以将退药人群分为两类：一类人退药金额特别高；一类人退药金额比较正常。对于退药金额特别高的可以认为属于可疑人群。通过聚类方法可以得到套现诈骗可疑病人以及可疑人群等。
33.示例性地，所买的药物跟本人性别不符，可以认定为可疑人群；所买的用户数据中医嘱项对应的药品量超过相同或者相似医嘱中药品用量的平均值k倍以上，如平均值10倍以上，该情形可以认定为可能存在医保套现诈骗行为的可疑人群；退药总金额远大于平均值，如约超过200元以上者认定为可疑人群；所看门诊次数远超过平均值，如超过60次以上者为可疑人群。
34.步骤103：利用预训练的多元回归模型对所述可疑人群的数据进行处理，得到异常数据的人群。
35.在本实施例中，在创建模型时，可以基于上述记录中的药品数据作为变量构建医保套现诈骗判别的多元回归模型，多元回归是指一个因变量(预报对象),多个自变量(预报因子)的回归模型。基本方法是根据各变量值算出交叉乘积，这种包括两个或两个以上自变量的回归称为多元回归。
36.作为本实施例一种可选的实现方式，多元回归模型为多元线性回归模型。
37.在本可选的实现方式中，设y为因变量x1,x2
…
xk为自变量，并且自变量与因变量
之间为线性关系时，则多元线性回归模型为:y＝b0 b1x1
…
bkxk e其中，b0为常数项，b1,b2
…
bk为回归系数。b1为x1,x2
…
xk固定时，x1每增加一个单位对y的效应，即x1对y的偏回归系数；同理b2为x1,x2
…
xk固定时，x2每增加一个单位对y的效应，即，x2对y的偏回归系数等等。一般来说，多元性回归模型的参数估计，同一元线性回归方程一样，也是在要求误差平方和(σe)为最小的前提下，用最小二乘法求解参数。
38.示例性地，在本实施例中可以通过样本对多元线性回归模型进行训练，在训练完成后可以直接用于本实施例的识别方法中。通过训练完成的多元线性回归模型可以确定输入的记录中哪些存在数据存在异常。
39.本实施例首先通过聚类方法得到套现诈骗可疑病人以及可疑人群等，然后利用多元线性回归模型，对可疑病人以及可疑人群数据进行分析，提高了多元线性回归模型的可靠性。
40.步骤104：对异常数据的人群进行判别，确定是否属于医保套现诈骗对象。
41.在本实施例中，对于确定的异常数据可以进行进一步地判定，判定方法可以是通过对退药相关的数据按照预设的规则进行判定。
42.本实施例将退药人群的退药记录和相对应的买药记录单独提取出来进行分析，通过建立多元回归和判别学习模型，做到快捷地对医保套现诈骗人群进行评价和判别
43.作为本实施例一种可选的实现方式，对异常数据的人群进行判别，确定是否属于医保套现诈骗对象包括：基于异常数据中的退药记录与买药记录，利用预设的判定条件确定异常数据的人群中各个对象是否属于医保套现诈骗对象。
44.在本可选的实现方式中，通过提取出的退药人群的数据，如果在该周期内的消费记录中只有退药记录而没有买药记录，该人群退掉的药品可以是上个周期或者更早周期购买的药品。若病人进行套现诈骗，那么买药时间和退药时间不会间隔太久，因此，对于只有退药记录的人，买药时间和退药时间的间隔相对于既有买药又有退药记录的人而言比较长，所以这部分人不会进行套现诈骗。对于周期内既有买药记录又有退药记录的病人，由于行套现诈骗是为了获取更多的现金，因此可以用退药病人退药的总金额来判断该病人是否进行了套现诈骗。因此，若有人退药的总金额明显大于大多数人，那么他就有很大的可能进行了套现诈骗。
45.示例性地，周期内只有退药记录而无买药记录的数据为不存在医保套现诈骗行为；对于周期内既有退药记录又有买药记录的数据，进一步判断退药的总金额是否大于预设值(该预设值可以是基于大多数人的退药金额来确定)，如果总金额大于预设值，则判定为该记录数据对应的病人存在医保套现诈骗行为。
46.本实施例输入待判别病人的退药记录和相对应的买药记录的数据，便可以实现输出医保套现诈骗人群评价判别的结果。
47.需要说明的是，在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行，并且，虽然在流程图中示出了逻辑顺序，但是在某些情况下，可以以不同于此处的顺序执行所示出或描述的步骤。
48.根据本公开实施例，还提供了一种医保套现诈骗行为识别系统示，该系统包括：数据处理模块，获取待识别人群的退药记录和与退药记录相对应的买药记录，得到待识别数据集合。数据处理模块：用于获取病人退药记录和相对应的买药记录，并进行预处理，得到
病人退药记录和相对应的买药记录的数据集合。聚类模块，基于待识别数据集合，利用预设的聚类规则对待识别人群进行分类，得到医保套现诈骗的可疑人群；用于基于k-means聚类方法将退药人群进行分类，得到医保套现诈骗可疑的病人人群。模型处理模块，利用预训练的多元回归模型对所述可疑人群的数据进行处理，得到异常数据的人群。用于基于上述数据作为变量来构建医保套现诈骗判别的多元回归模型。判定模块，对异常数据的人群进行判别，确定是否属于医保套现诈骗对象，实现了输入待判别病人退药记录和相对应的买药记录的数据，并输出医保套现诈骗人群评价判别的结果。
49.作为本实施例一种可选的实现方式，基于待识别数据集合，利用预设的聚类规则对待识别人群进行分类包括：在不同维度对数据集合中的数据进行聚类，其中，不同维度包括基于买药记录和退药记录确定的维度；基于预设的规则，对聚类后的数据进行分类。
50.作为本实施例一种可选的实现方式，对异常数据的人群进行判别，确定是否属于医保套现诈骗对象包括：基于异常数据中的退药记录与买药记录，利用预设的判定条件确定异常数据的人群中各个对象是否属于医保套现诈骗对象。
51.作为本实施例一种可选的实现方式，多元回归模型为多元线性回归模型。
52.本公开实施例提供了一种电子设备，如图2所示，该电子设备包括一个或多个处理器21以及存储器22，图2中以一个处理器21为例。
53.该控制器还可以包括：输入装置23和输出装置24。
54.处理器21、存储器22、输入装置23和输出装置24可以通过总线或者其他方式连接，图2中以通过总线连接为例。
55.处理器21可以为中央处理器(centralprocessingunit，cpu)。处理器21还可以为其他通用处理器、数字信号处理器(digitalsignalprocessor，dsp)、专用集成电路(applicationspecificintegratedcircuit，asic)、现场可编程门阵列(field-programmablegatearray，fpga)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等芯片，或者上述各类芯片的组合。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
56.存储器22作为一种非暂态计算机可读存储介质，可用于存储非暂态软件程序、非暂态计算机可执行程序以及模块，如本公开实施例中的控制方法对应的程序指令/模块。处理器21通过运行存储在存储器22中的非暂态软件程序、指令以及模块，从而执行服务器的各种功能应用以及数据处理，即实现上述方法实施例的医保套现诈骗行为识别方法。
57.存储器22可以包括存储程序区和存储数据区，其中，存储程序区可存储操作系统、至少一个功能所需要的应用程序；存储数据区可存储根据服务器操作的处理装置的使用所创建的数据等。此外，存储器22可以包括高速随机存取存储器，还可以包括非暂态存储器，例如至少一个磁盘存储器件、闪存器件、或其他非暂态固态存储器件。在一些实施例中，存储器22可选包括相对于处理器21远程设置的存储器，这些远程存储器可以通过网络连接至网络连接装置。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
58.输入装置23可接收输入的数字或字符信息，以及产生与服务器的处理装置的用户设置以及功能控制有关的键信号输入。输出装置24可包括显示屏等显示设备。
59.一个或者多个模块存储在存储器22中，当被一个或者多个处理器21执行时，执行
如图1所示的方法。
60.本领域技术人员可以理解，实现上述实施例方法中的全部或部分流程，是可以通过计算机程序来指令相关的硬件来完成的，程序可存储于一计算机可读取存储介质中，该程序在执行时，可包括如上述各电机控制方法的实施例的流程。其中，存储介质可为磁碟、光盘、只读存储记忆体(read-onlymemory，rom)、随机存储记忆体(randomaccessmemory，ram)、快闪存储器(flashmemory)、硬盘(harddiskdrive，缩写：hdd)或固态硬盘(solid-statedrive，ssd)等；存储介质还可以包括上述种类的存储器的组合。
61.虽然结合附图描述了本公开的实施方式，但是本领域技术人员可以在不脱离本公开的精神和范围的情况下作出各种修改和变型，这样的修改和变型均落入由所附权利要求所限定的范围之内。

再多了解一些

1/2 1 2 下一页尾页

本文用于创业者技术爱好者查询，仅供学习研究，如用于商业用途，请联系技术所有人。

医保套现诈骗行为识别方法及系统与流程

相关文献

最热文献