一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种医学量表语义关联网络构建方法及系统

2023-01-14 13:00:46 来源:中国专利 TAG:

技术特征:
1.一种医学量表语义关联网络构建方法,其特征在于,包括以下步骤:获取医学量表参数,基于医学量表参数定义医学量表内容框架,并将实例文档映射到医学量表内容框架中,得到初始医学量表;提取初始医学量表中的文本,生成测量概念集合;利用医学量表领域、维度项语义对应的测量概念集合计算领域、维度项的第一语义关联标签赋值;提取医学量表条目、问题标签的文本取值,计算同类内容的第二语义关联标签赋值;结合第一语义关联标签赋值、第二语义关联标签赋值,进行相关关联推导,获得第三语义关联标签赋值;根据第一语义关联标签赋值结果、第二语义关联标签赋值结果、第三语义关联标签赋值结果,完成量表语义关联网络可视化。2.根据权利要求1所述的一种医学量表语义关联网络构建方法,其特征在于,定义医学量表内容包括:内容标签、内容标签的属性、内容标签间的关系、形成标准量表内容标签库。3.根据权利要求1所述的一种医学量表语义关联网络构建方法,其特征在于,将实例文档映射到医学量表内容框架中,具体包括:逐行扫描实例文档数据,采用基于规则的方法提取量表原始内容结构标签;通过jaccard相似系数字符串匹配算法计算原始内容结构标签与标准标签的相似度,将大于阈值的标准标签通过表单方式推荐给用户;用户通过表单进行确认或者修改,如果没有语义相同的标准标签,在标准量表内容标签库中新增标准标签。4.根据权利要求1所述的一种医学量表语义关联网络构建方法,其特征在于,生成测量概念集合具体为:提取医学量表的领域标签和维度标签对应的文本,运用领域文本分词算法对提取的原始文本进行分词,分词结果即为量表自由词汇;通过术语标准化算法,将自由词汇映射至指定医学术语系统中的概念;对映射获得的概念进行去重,形成测量概念集合。5.根据权利要求1所述的一种医学量表语义关联网络构建方法,其特征在于,利用医学量表领域、维度项语义对应的测量概念集合计算领域、维度项的第一语义关联标签赋值,具体包括:对于任意两个领域或维度项a和b,获得自由词汇集合分别为t
a
和t
b
,测量概念集合分别为概念集合c
a
和概念集合c
b
,语义关联计算方法如下:若概念集合c
a
和概念集合c
b
中都不为空,则执行下述步骤:通过字符串精确匹配算法判断概念集合c
a
和概念集合c
b
是否有相同测量概念:如果没有,进入下一步;如果有,进一步判断是否完全相同,完全相同时,a和b的语义关联标签赋值“等同测量概念”,否则赋值“有相同测量概念”;判断概念集合c
a
和概念集合c
b
中是否有测量概念在指定医学术语系统中处于同一层级关系路径中,且路径长度小于指定阈值;如果有,则a和b的语义关联标签赋值“广义相关”;否则进入下一步;运用字符串匹配算法计算概念集合c
a
和概念集合c
b
中测量概念所有术语对的相似度;如果任一术语对相似度大于指定阈值,则a和b的语义关联标签赋值“相似测量概念”。6.根据权利要求5所述的一种医学量表语义关联网络构建方法,其特征在于,若概念集
合c
a
和概念集合c
b
中都为空,则执行下述步骤:将t
a
和t
b
转化为词向量空间,通过余弦向量空间计算t
a
和t
b
的相似度;如果相似度大于指定阈值,则a和b的语义关联标签赋值“相似测量概念”。7.根据权利要求1所述的一种医学量表语义关联网络构建方法,其特征在于,结合第一语义关联标签赋值、第二语义关联标签赋值,进行相关关联推导,获得第三语义关联标签赋值,具体规则如下:如果两个问题项之间的语义关联标签取值“相同”或“相似”,则其对应的条目项和维度项之间的语义关联标签取值“问题相关”;如果两个条目项之间的语义关联标签取值“相同”或“相似”,则其对应的维度项之间的语义关联标签取值“条目相关”;如果两个维度项或领域项之间的语义关联标签取值“等同测量概念”或“有相同测量概念”,则其组成的条目项、问题项之间的语义关联标签取值“测量概念相关”。8.一种医学量表语义关联网络构建系统,其特征在于,包括量表文档获取模块,量表结构标签定义模块,量表内容结构映射模块,量表量测概念标注模块,量表语义关联分类计算模块,量表语义关联网络可视化模块;其中,量表文档获取模块,用于获取实例文档;量表结构标签定义模块,用于定义医学量表内容框架;量表内容结构映射模块,用于将实例文档映射到医学量表内容框架中,得到初始医学量表;量表量测概念标注模块,用于提取初始医学量表中的文本,生成测量概念集合;量表语义关联分类计算模块,用于利用医学量表领域、维度项语义对应的测量概念集合计算领域、维度项的第一语义关联标签赋值;提取医学量表条目、问题标签的文本取值,计算同类内容的第二语义关联标签赋值;结合第一语义关联标签赋值、第二语义关联标签赋值,进行相关关联推导,获得第三语义关联标签赋值;量表语义关联网络可视化模块,用于根据第一语义关联标签赋值结果、第二语义关联标签赋值结果、第三语义关联标签赋值结果,完成量表语义关联网络可视化。

技术总结
本发明公开了一种医学量表语义关联网络构建方法及系统,涉及大数据资源共享服务技术领域。包括以下步骤:定义医学量表内容框架,并将实例文档映射到医学量表内容框架中,得到初始医学量表;提取初始医学量表中的文本,生成测量概念集合;利用医学量表领域、维度项语义对应的测量概念集合计算领域、维度项的第一语义关联标签赋值;提取医学量表条目、问题标签的文本取值,计算同类内容的第二语义关联标签赋值;结合第一语义关联标签赋值、第二语义关联标签赋值,进行相关关联推导,获得第三语义关联标签赋值;根据第一、二、三语义关联标签赋值结果,完成量表语义关联网络可视化。本发明提高了医学量表资源知识服务效率和智能化水平。平。平。


技术研发人员:孙海霞 钱庆 郝洁 李姣 沈柳 郭臻
受保护的技术使用者:中国医学科学院医学信息研究所
技术研发日:2022.12.05
技术公布日:2022/12/30
再多了解一些

本文用于创业者技术爱好者查询,仅供学习研究,如用于商业用途,请联系技术所有人。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献