一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种基于知识图谱的临床用药风险评估方法和系统与流程

2022-02-22 08:32:17 来源:中国专利 TAG:


1.本发明涉及合理用药安全性领域,特别是指一种基于知识图谱的临床用药风险评估方法和系统。


背景技术:

2.合理用药是指有效、安全、经济地防治和治愈疾病。据世界卫生组织(who)估计,全球每年三分之一的死亡患者死于不合理用药。在中国,临床不合理用药占病例数的12%~32%。用药安全是患者安全的重要组成部分,是医疗质量的核心。不安全处方是威胁用药安全的主要原因之一。影响处方安全的风险因素众多,主要包含不良药物相互作用、药物配伍禁忌、药物选用不当或者过量及重复用药等方面。
3.为了检测处方风险,传统方法是人工审方,即由专家药师审查处方风险,其弊端明显:工作量大,往往只能抽检。随着信息化技术的普及,用药监测软件在各大医院部署使用,这些软件是基于医药学及其相关学科基础知识构建的规则库,仅仅依赖规则库,较片面,无法完全覆盖用药逻辑,无法准确检测规则库中没有涵盖的超说明书用药风险,直接应用现有的用药监测系统对处方进行风险评估容易出错,在临床实践中,常造成错报、漏报。


技术实现要素:

4.本发明的主要目的在于克服现有技术中的上述缺陷,提出一种基于知识图谱的临床用药风险评估方法和系统,通过蕴含医疗文本知识和临床用药经验的医疗知识图谱,来提取相应特征以此判断超风险用药风险,具有优异的提取效率和准确率。
5.本发明采用如下技术方案:
6.一种基于知识图谱的临床用药风险评估方法,其特征在于,包括如下步骤:
7.s1、获取药品说明书数据和处方数据进行处理,提取药品属性信息和处方关系信息;
8.s2、根据药品属性信息和处方关系信息构建蕴含医疗文本知识和临床用药经验的医疗知识图谱;
9.s3、提取医疗知识图谱中的用药风险关系,并在医疗知识图谱上标记用药风险级别;
10.s4、根据医疗知识图谱提取多个特征来训练三个xgboost分类算法模型:药物相互作用风险模型、药不对症风险模型和个体用药风险模型,并利用训练好的三个模型检测医疗知识图谱的超说明书用药风险,三个模型分别对应检测药物联用风险、药不对症风险来和个体用药风险,并将检测出的风险标注在医疗知识图谱中;
11.s5、采用步骤s4得到的医疗知识图谱检测临床处方的用药风险。
12.优选的,所述步骤s1中,包括
13.s11、处理药品说明书数据,提取药品属性信息,其包括:
14.s111、利用正则匹配和自然语言处理中命名实体识别的方法从药品说明书数据抽
取重要属性信息,包括:药品名、适应症、成分、禁忌、药物相互作用和用法用量,并保存在在 csv文件;
15.s112、对从药品说明书数据中抽取出的信息利用正则匹配和结合人工修改的方法,去除多余的文本信息,将每条信息转换成为(药品属性名属性值)的格式,保存在txt文件中;
16.s12、处理处方数据,提取处方关系信息,其包括:
17.s121、数据清理:将药品去品牌化即删除数据括号内的厂商品牌;删除数据库中出现次数少于两次的诊断病症的所有处方数据,删除数据库中数据包含空值的处方数据;
18.s122、将数据库表中每条数据的每对关系转换成为(对象1关系名对象2)的格式,保存在txt文件中。
19.优选的,所述s2具体包括如下:
20.s21、下载neo4j图数据库,在数据库中import文件夹放入步骤s1得到的包含药品属性信息和处方关系信息的文件;
21.s22、利用neo4j导入语句编写导入指令;
22.s23、在neo4jweb控制台执行语句,将包含药品属性信息和处方关系信息的文件存到图数据库。
23.优选的,所述s3具体包括如下:
24.s31、标注药物之间的联合使用风险;
25.s32、标注药物与诊断疾病间的药不对症风险;
26.s33、标注药物被不同患者个体使用的风险。
27.优选的,所述s31具体包括如下:
28.s311、提取出医疗知识图谱中的表示药物相互作用并且相互作用风险等级为3的药物对,并筛选出药物对中两个药物从未出现在同一处方中的药物对,在医疗知识图谱上将此类药物对添加/标注一条权重为3的风险关系边;
29.s312、提取风险等级等于0,并且历史处方中出现次数超过10次或者联用频率超过30%的药物间关系对,在医疗知识图谱上将此类药物对添加一条权重为0的风险关系边。
30.优选的,所述s32具体包括如下:
31.s321、提取出药物与诊断之间为禁忌关系的药物-诊断对,并筛选出从未出现在同一张处方中的药物-诊断对,在医疗知识图谱上将此药物-诊断对添加一条权重为3的风险关系边;
32.s322、筛选出在历史处方中出现超过10次或者联用频率超过30%的药物-诊断对,在医疗知识图谱上将此类药物-诊断对添加一条权重为0的风险关系边。
33.优选的,所述s33具体包括如下:
34.s331、提取出药物与患者群体之间为禁忌关系的药物-群体对,并筛选出药物从未在处方中用于某群体的药物-群体对,在医疗知识图谱上将此类药物-群体对添加一条权重为3的风险关系边;
35.s332、提取药物与群体之间关系为适用,并且历史处方中出现该使用情况超过10次或者联用频率超过30%的药物-群体对,在医疗知识图谱上将此类药物-群体对添加一条标注权重为0的风险关系边。
36.优选的,所述s4中,训练药物相互作用风险模型具体包括如下:
37.s411、提取300对药物联用不符合说明书描述的用药对;
38.s412、根据医疗知识图谱上标记的用药风险级别,将级别d(drug1,drug2)作为一个特征;
39.s413、将药物对在医疗知识图谱上相连的频率f(drug1,drug2)作为一个特征,这个频率是指药物对之间相连的边数n(drug1,drug2)与这两种药物与所有药物相连接的边数 n(drug1)、n(drug2)的比值,
40.具体公式为:
41.s414、将药物对的使用频率作为特征;
42.s415、计算药物对中两个药物的优先连接preferential attachment(pa),利用知识图谱的preferential attachment算法得到这个特征:
43.具体公式为:pa(drug1,drug2)=|n(drug1)|
×
|n(drug2)|;
44.s416、将药物对是否在同一社群co-group(drug1,drug2)作为一个特征;
45.s417、将s412~s416步骤中在医疗知识图谱中提取的药物对的以上五个特征作为模型的输入,按照用药风险级别的标准交叉评估药物对的联用风险级别,将标注的联用风险级别作为标签,使用xgboost算法对药物相互作用风险模型训练。
46.优选的,所述s4中,训练药不对症风险模型具体包括如下:
47.s421、提取300对药物-诊断对不符合说明书描述的诊断-药物对;
48.s422、根据医疗知识图谱上标记的用药风险级别,得到药物与诊断之间的关系 d(drug,diagnosis)的特征;
49.s423、计算药物与诊断疾病间的连接频率f(drug,diagnosis)作为一个特征,具体公式为:其中,n(drug,diagnosis)表示药物drug和诊断diagnosis在同一张处方出现的次数、n(drug)表示药物drug在处方中出现的次数、 n(diagnosis)表示诊断在处方中出现的次数;
50.s424、计算药物在诊断处方中的出现次数作为特征,具体公式为:f(drug,diagnosis)=n(drug,diagnosis);
51.s425、计算诊断节点的不同药物连接数c(drug,diagnosis)作为特征;
52.s426、将药物与诊断是否在同一社群co-group(drug1,drug2)作为一个特征;
53.s427、将s422~s426步骤中在医疗知识图谱中提取的以上五个特征作为模型的输入,按照用药风险级别的标准交叉评估药不对症风险级别,将标注的药不对症风险级别作为标签,使用xgboost算法对药不对症风险模型训练。
54.优选的,所述s4中,训练个体用药风险模型具体包括如下:
55.s431、在知识图谱中提取药不对症风险特征进行机器学习任务检测药物联用风险;
56.s432、根据医疗知识图谱上标记的用药风险级别,得到药物与患者群体之间的关系 d(drug,patient)的特征;
57.s433、将药物与诊断疾病间的连接频率f(drug,diagnosis)作为一个特征,具体公式为:
[0058][0059]
s434、将患者所属的群体在处方中使用该药物的频率作为特征f(role,drug),具体公式为:其中,n(role,diagnosis,drug)表示药物drug和诊断diagnosis在同一张处方,并且患者属于人群role的次数、n(role,diagnosis)表示药物drug和诊断diagnosis在同一张处方的次数;
[0060]
s435、计算药物连接不同群体的数量作为特征;
[0061]
s436、计算药物的剂量的混合高斯分布;
[0062]
s437、参考患者的体重与患者的年龄范围;
[0063]
s438、将处方中提取的以上6个特征作为模型的输入,按照用药风险级别的标准交叉评估个体用药风险级别,将标注的个体用药风险级别作为标签,使用xgboost算法对个体用药风险模型训练。
[0064]
一种基于知识图谱的临床用药风险评估系统,其特征在于,包括如下:
[0065]
数据处理模块,获取药品说明书数据和处方数据进行处理,提取药品属性信息和处方关系信息;
[0066]
医疗知识图谱模块,根据药品属性信息和处方关系信息构建蕴含医疗文本知识和临床用药经验的医疗知识图谱;
[0067]
标记模块,提取医疗知识图谱中的用药风险关系,并在医疗知识图谱上标记用药风险级别;
[0068]
超说明用药风险模块,根据医疗知识图谱提取多个特征,利用xgboost算法训练三个分类模型:药物相互作用风险模型、药不对症风险模型和个体用药风险模型,并利用训练好的模型检测处方中的超说明书用药风险,三个模型分别对应检测药物联用风险、药不对症风险来和个体用药风险;
[0069]
处方用药风险评估模块,采用医疗知识图谱检测临床处方的用药风险。
[0070]
由上述对本发明的描述可知,与现有技术相比,本发明具有如下有益效果:
[0071]
1、本发明利用真实处方数据和药物说明书数据构建用药风险知识图谱,并利用机器学习技术挖掘医疗数据中的超说明书用药风险,补全医疗知识图谱中的用药风险,最终得到一个全面完整的用药风险图谱,利用其检测临床处方风险,具有优异的提取效率和准确率。
[0072]
2、本发明利用药品书说明书和真实处方数据构建知识图谱,得到一个具备药品说明书文本知识和临床用药经验的知识图谱,结合医疗文本知识和临床实践经验分析、从已知风险标记和超说明用药风险检测两个方面检测处方风险,更全面、灵活,避免造成冲突。
[0073]
3、本发明通过已知风险标记从知识图谱中找出在数据上既符合药品说明书描述,又符合临床用药实践的用药模式,并标记说明书描述所对应的风险级别。
[0074]
4、本发明基于知识图谱提取用药风险特征,利用机器学习分类技术检测知识图谱中的超说明用药风险,将专业药师对用药模式标记风险值作为标签,进行机器学习分类任务用于检测超说明书用药风险,提高检测精度、更安全。
附图说明
[0075]
图1为本发明方法流程图;
[0076]
图2为说明书数据示例;
[0077]
图3为处方数据示例;
[0078]
图4为图数据库导入语句;
[0079]
图5为导入数据后的图数据库;
[0080]
图6为超说明书用药的流程图;
[0081]
图7为用药风险级别表;
[0082]
图8为超说明书用药风险特征示例表;
[0083]
以下结合附图和具体实施例对本发明作进一步详述。
具体实施方式
[0084]
以下通过具体实施方式对本发明作进一步的描述。
[0085]
一种基于知识图谱的临床用药风险评估方法,包括如下步骤:
[0086]
s1、获取药品说明书数据和处方数据进行处理,提取药品属性信息和处方关系信息。该步骤中,参见图2药品说明书数据为docx格式的数据。如图3,处方数据为db格式的数据。具体包括如下:
[0087]
s11、处理药品说明书数据,提取药品属性信息,其包括:
[0088]
s111、利用正则匹配和自然语言处理中命名实体识别的方法从药品说明书数据抽取重要属性信息,包括:药品名、适应症、成分、禁忌、药物相互作用和用法用量,并保存在在 csv文件;
[0089]
s112、对从药品说明书数据中抽取出的信息利用正则匹配和结合人工修改的方法,去除多余的文本信息,将每条信息转换成为(药品属性名属性值)的格式,保存在txt文件中。
[0090]
s12、处理处方数据,提取处方关系信息,其包括:
[0091]
s121、数据清理:将药品去品牌化即删除数据括号内的厂商品牌;删除数据库中出现次数少于两次的诊断病症的所有处方数据,删除数据库中数据包含空值的处方数据;
[0092]
s122、将数据库表中每条数据的每对关系转换成为(对象1关系名对象2)的格式,保存在txt文件中。
[0093]
s2、根据药品属性信息和处方关系信息构建蕴含医疗文本知识和临床用药经验的医疗知识图谱。
[0094]
s21、下载neo4j图数据库,在数据库中import文件夹放入步骤s1得到的包含药品属性信息和处方关系信息的文件,即上一步得到的txt文件。
[0095]
s22、利用neo4j导入语句编写导入指令,参见图4;
[0096]
s23、在neo4jweb控制台执行语句,将包含药品属性信息和处方关系信息的文件存到图数据库,参见图5。
[0097]
s3、提取医疗知识图谱中的用药风险关系,并在医疗知识图谱上标记用药风险级别。
[0098]
该步骤中,提取同时符合医疗文本规则和历史处方经验的用药风险关系,包括允
许使用和禁止使用两类风险,并在图谱上标记用药风险级别,风险等级说明如表1所示。该步骤包括以下三大步骤:
[0099]
s31、标注药物之间的联合使用风险。具体包括如下:
[0100]
s311、提取出医疗知识图谱中的表示药物相互作用并且相互作用风险等级为3的药物对,并筛选出药物对中两个药物从未出现在同一处方中的药物对,在医疗知识图谱上将此类药物对添加/标注一条权重为3的风险关系边;
[0101]
s312、提取风险等级等于0,并且历史处方中出现模次数过10次或者联用频率超过30%的药物间关系对,在医疗知识图谱上将此类药物对添加一条权重为0的风险关系边。
[0102]
s32、标注药物与诊断疾病间的药不对症风险。具体包括如下:
[0103]
s321、提取出药物与诊断之间为禁忌关系的药物-诊断对,并筛选出从未出现在同一张处方中的药物-诊断对,在医疗知识图谱上将此药物-诊断对添加一条权重为3的风险关系边;
[0104]
s322、筛选出在历史处方中出现超过10次或者联用频率超过30%的药物-诊断对,在医疗知识图谱上将此类药物-诊断对添加一条权重为0的风险关系边。
[0105]
s33、标注药物被不同患者个体使用的风险。具体包括如下:
[0106]
s331、提取出药物与患者群体之间为禁忌关系的药物-群体对,并筛选出药物从未在处方中用于某群体的药物-群体对,在医疗知识图谱上将此类药物-群体对添加一条权重为3的风险关系边;
[0107]
s332、提取药物与群体之间关系为适用,并且历史处方中出现该使用情况超过10次或者联用频率超过30%的药物-群体对,在医疗知识图谱上将此类药物-群体对添加一条标注权重为0的风险关系边。
[0108]
s4、根据医疗知识图谱提取多个特征来训练三个xgboost分类算法模型:药物相互作用风险模型、药不对症风险模型和个体用药风险模型,并利用训练好的三个模型检测医疗知识图谱的超说明书用药风险,三个模型分别对应检测药物联用风险、药不对症风险来和个体用药风险,并标注在医疗知识图谱中。
[0109]
在处方中,主要存在药物、诊断疾病、患者这三个实体,因此在检测用药风险时,根据药物与药物、药物与疾病、药物与患者这三对关系,检测药物之间的药物联用风险、药物与诊断疾病之间的药不对症风险、药物与患者之间的个体化用药风险。
[0110]
其中,训练药物相互作用风险模型具体包括如下:
[0111]
s411、提取300对药物联用不符合说明书描述的用药对,例如说明书描述该药物对联用有抑制作用,处方中仍然存在使用病例。接下来在知识图谱中提取特征(s412~s416)。
[0112]
s412、根据医疗知识图谱上标记的用药风险级别,该用药风险级别中包括药物之间的联合使用风险级别,是评判风险的重要参考,将级别d(drug1,drug2)作为一个特征;
[0113]
s413、将药物对在医疗知识图谱上相连的频率f(drug1,drug2)作为一个特征,这个频率是指药物对之间相连的边数n(drug1,drug2)与这两种药物与所有药物相连接的边数n(drug1)、n(drug2)的比值,具体公式为:
[0114][0115]
频率越高,则表示药物越经常联用,一定程度上反应相连两个节点的风险较低,反
之则风险较高。
[0116]
s414、将药物对的使用频率作为特征。处方中的常用药的使用风险与非常见药相比,一般风险较低,非常见药则风险较高。
[0117]
s415、计算药物对中两个药物的优先连接preferential attachment(pa),这个特征表示药物对连接数的成绩,体现药物对的连接数水平,如果两个药物节点的连接数都很大,那么该节点对被连接的概率越大,表明风险较低。利用知识图谱的preferential attachment算法得到这个特征:
[0118]
具体公式为:pa(drug1,drug2)=|n(drug1)|
×
|n(drug2)|。
[0119]
s416、将药物对是否在同一社群co-group(drug1,drug2)作为一个特征,在构建mrkg时利用louvain算法对图谱进行了社群划分,如果药物对处于同一个社群,那么药物联用的风险就小,反之则风险较高。
[0120]
s417、将s412~s416步骤中在医疗知识图谱中提取的药物对的以上五个特征作为模型的输入,按照用药风险级别的标准交叉评估药物对的联用风险级别,将标注的联用风险级别作为标签,使用xgboost算法对药物相互作用风险模型训练。
[0121]
在知识图谱中提取药不对症风险特征进行机器学习任务检测药不对症风险,训练药不对症风险模型具体包括如下:
[0122]
s421、提取300对药物-诊断对不符合说明书描述的诊断-药物对,例如说明书描述该药物的适应症并不包含处方中的诊断病症;
[0123]
s422、根据医疗知识图谱上标记的用药风险级别,得到药物与诊断之间的关系 d(drug,diagnosis)的特征;根据禁忌关系、无关系、适应症关系分别将特征值记为-1,0,1。这是根据说明书中对药物与诊断之间的风险的描述,是评判风险的重要参考。
[0124]
s423、计算药物与诊断疾病间的连接频率f(drug,diagnosis)作为一个特征,具体公式为:其中,n(drug,diagnosis)表示药物drug和诊断 diagnosis在同一张处方出现的次数、n(drug)表示药物drug在处方中出现的次数、 n(diagnosis)表示诊断在处方中出现的次数。
[0125]
这个频率反应该诊断使用该药物的常见程度,疾病的常见用药的风险往往低于罕见用药,一定程度上反应相连两个节点的风险较低,反之则风险较高。
[0126]
s424、计算药物在诊断处方中的出现次数作为特征,因为处方中病症使用某种药物次数越多,风险一般越低,反之则风险较高,具体公式为:
[0127]
f(drug,diagnosis)=n(drug,diagnosis);
[0128]
s425、计算诊断节点的不同药物连接数c(drug,diagnosis)作为特征,若诊断的用药存在多种选择,则可替代性较高,则表明风险较低。
[0129]
s426、将药物与诊断是否在同一社群co-group(drug1,drug2)作为一个特征;如果药物与诊断处于同一社群,则风险较低,反之较高。例如,处方中的诊断都是妇科疾病,而处方中的药物都是妇科用药,则处方用药更为合理、安全;若出现儿科主题社群用药,则更可能存在风险。
[0130]
s427、将s422~s426步骤中在医疗知识图谱中提取的以上五个特征作为模型的输入,按照用药风险级别的标准交叉评估药不对症风险级别,将标注的药不对症风险级别作
为标签,使用xgboost算法对药不对症风险模型训练。
[0131]
进一步的,在医疗知识图谱中提取个体用药风险特征进行机器学习任务检测个体用药风险,训练个体用药风险模型具体包括如下:
[0132]
s431、在知识图谱中提取药不对症风险特征进行机器学习任务检测药物联用风险。
[0133]
s432、根据医疗知识图谱上标记的用药风险级别,得到药物与患者群体之间的关系 d(drug,patient)的特征,根据禁忌关系、无关系、适用关系分别将特征值记为-1,0,1。这是根据药品说明书中对患者群体使用风险的描述,是评判风险的重要参考。
[0134]
s433、将药物与诊断疾病间的连接频率f(drug,diagnosis)作为一个特征,具体公式为:
[0135][0136]
这个频率反应该诊断使用该药物的常见程度,疾病的常见用药的风险往往低于罕见用药,一定程度上反应相连两个节点的风险较低,反之则风险较高。
[0137]
s434、将患者所属的群体在处方中使用该药物的频率作为特征f(role,drug),具体公式为:
[0138][0139]
其中,n(role,diagnosis,drug)表示药物drug和诊断diagnosis在同一张处方,并且患者属于人群role的次数、n(role,diagnosis)表示药物drug和诊断diagnosis在同一张处方的次数。
[0140]
因为某类患者群体常常使用某种药,则反映其用药风险一般较低,反之则风险较高。
[0141]
s435、计算药物连接不同群体的数量作为特征,若某种药物适用于各种群体,则一定程度上反映其使用风险较低,反之较高。
[0142]
s436、计算药物的剂量的混合高斯分布,如果处方中药物的剂量处于该药物历史处方剂量的高分布区域,则说明剂量处于较合理的范围,反之则有风险。
[0143]
s437、参考患者的体重与患者的年龄范围,患者的体重与年龄是重要的物理特征,在临床实践中,大多数药物的剂量会根据体重和年龄开方。
[0144]
s438、将处方中提取的以上6个特征作为模型的输入,按照用药风险级别的标准交叉评估个体用药风险级别,将标注的个体用药风险级别作为标签,使用xgboost算法对个体用药风险模型训练。
[0145]
最后,利用前面训练好的模型检测医疗知识图谱内超说明书用药风险,并将检测出的风险标注在图谱中,得到一个更完整的蕴含用药风险的知识图谱,从而用于风险查询。
[0146]
s5、采用步骤s4得到的医疗知识图谱检测临床处方的用药风险。
[0147]
本发明还提出一种基于知识图谱的临床用药风险评估系统,包括如下:
[0148]
数据处理模块,获取药品说明书数据和处方数据进行处理,提取药品属性信息和处方关系信息;
[0149]
医疗知识图谱模块,根据药品属性信息和处方关系信息构建蕴含医疗文本知识和
临床用药经验的医疗知识图谱;
[0150]
标记模块,提取医疗知识图谱中的用药风险关系,并在医疗知识图谱上标记用药风险级别;
[0151]
超说明用药风险模块,根据医疗知识图谱提取多个特征,利用xgboost算法训练三个分类模型:药物相互作用风险模型、药不对症风险模型和个体用药风险模型,并利用训练好的模型检测处方的超说明书用药风险,三个模型分别对应检测药物联用风险、药不对症风险来和个体用药风险。
[0152]
处方用药风险评估模块,采用医疗知识图谱检测临床处方的用药风险。
[0153]
本发明的该系统应用上述的基于知识图谱的临床用药风险评估方法对处方进行用药风险评估。
[0154]
上述仅为本发明的具体实施方式,但本发明的设计构思并不局限于此,凡利用此构思对本发明进行非实质性的改动,均应属于侵犯本发明保护范围的行为。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献