一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

基于不同应用场景的医学影像检查项目名称标准化方法及系统与流程

2022-07-22 23:29:47 来源:中国专利 TAG:

技术特征:
1.基于不同应用场景的医学影像检查项目名称标准化方法,其特征在于,该方法包括以下步骤:s1、基于实际应用场景中的源数据情况、人力资源、时间资源、准确率要求、硬件资源及泛化能力需求,选择对应的医学影像检查项目名称标准化方法;s2、采集各条历史检查数据中的检查部位及检查方法相关字段,并利用医学影像检查项目名称标准化方法将采集的字段映射为对应的标准检查项目名称。2.根据权利要求1所述的基于不同应用场景的医学影像检查项目名称标准化方法,其特征在于,所述医学影像检查项目名称标准化方法包括第一医学影像检查项目名称标准化方法、第二医学影像检查项目名称标准化方法、第三医学影像检查项目名称标准化方法及第四医学影像检查项目名称标准化方法中的一种。3.根据权利要求1所述的基于不同应用场景的医学影像检查项目名称标准化方法,其特征在于,所述源数据为采集到的需要进行标准化处理的各条历史检查数据中的检查部位及检查方法相关字段,所述检查部位及检查方法相关字段包括申请单中的检查部位及检查项目字段、检查报告中的影像所见及检查结果字段、dicom影像文件提取出的检查部位及检查描述字段。4.根据权利要求2所述的基于不同应用场景的医学影像检查项目名称标准化方法,其特征在于,采集各条历史检查数据中的检查部位及检查方法相关字段,并利用所述第一医学影像检查项目名称标准化方法将采集的字段映射为对应的标准检查项目名称包括以下步骤:s21、结合基于词典的分词算法及基于统计的机器学习算法对各条源数据中的字段进行分词处理,并对字段中的无用信息进行清洗;s22、利用编码器分别对清洗后的各条源数据中的每个字段进行编码,并通过tf-idf、word2vec、gcn或gcsts模型将编码结果转化为对应的词向量;s23、利用编码器分别对每个标准检查项目名称进行编码,并通过tf-idf、word2vec、gcn或gcsts模型将编码结果转化为对应的词向量;s24、分别计算清洗后的各条源数据中字段对应的词向量与每个标准项目名称对应的词向量间的文本相似度,并将相似度最高的标准项目名称与该条源数据进行对应。5.根据权利要求4所述的基于不同应用场景的医学影像检查项目名称标准化方法,其特征在于,所述基于词典的分词算法为按照预定的策略将预先建立的分词词典中所有词语与各条源数据中的字段逐一进行匹配,识别出字段中包含的属于分词词典的词语,并将识别到的词语作为有用信息返回;所述基于统计的机器学习算法为利用机器学习模型通过序列标注的方式对各条源数据中的字段进行分词,并将识别到的词语作为清洗后的有用信息返回。6.根据权利要求1所述的基于不同应用场景的医学影像检查项目名称标准化方法,其特征在于,所述标准检查项目名称由标准检查部位名称及标准检查方法名称组成,且所述标准检查项目名称为区域卫生医疗机构明确规定或结合影像设备特点及专家知识预先制定的标准的项目名称。7.根据权利要求2所述的基于不同应用场景的医学影像检查项目名称标准化方法,其特征在于,采集各条历史检查数据中的检查部位及检查方法相关字段,并利用所述第二医
学影像检查项目名称标准化方法将采集的字段映射为对应的标准检查项目名称包括以下步骤:s21’、结合基于词典的分词算法及基于统计的机器学习算法对各条源数据中的字段进行分词处理,并对字段中的无用信息进行清洗;s22’、医学影像专家利用专家知识对清洗后预设数量的源数据进行标准检查项目名称的对应标注;s23’、将预设数量的源数据及其对应的标注结果作为构建模型的样本数据集,并将该样本数据集划分为训练集和验证集;s24’、基于所述样本数据集构建文本分类机器学习模型,并进行初始化处理;s25’、利用所述训练集结合预先设定的分批处理数量、损失函数阈值及最大迭代次数对文本分类机器学习模型进行训练;s26’、将所述验证集中的源数据输入训练后的文本分类机器学习模型,得到与验证集中各条源数据相对应的检查项目名称;s27’、结合得到的与验证集中各条源数据相对应的检查项目名称与验证集中各条源数据对应的标注结果计算评价指标;s28’、判断评价指标值是否达到预设阈值,若是,则判断训练后的文本分类机器学习模型通过验证,并执行s29’,若否,则判断训练后的文本分类机器学习模型未通过验证,并调整模型对应的超参数、层结构或计算节点、训练集后重复执行s25
’‑
s28’,直至评价指标值达到预设阈值为止;s29’、利用训练后的文本分类机器学习模型对清洗后剩余的各条源数据进行映射,得到对应的标准检查项目名称。8.根据权利要求7所述的基于不同应用场景的医学影像检查项目名称标准化方法,其特征在于,所述文本分类机器学习模型包括基于词嵌入向量化的word2vec或fasttext、基于卷积神经网络特征提取的text-cnn或char-cnn、基于上下文机制的text-rnn或birnn或rcnn、基于记忆存储机制的entnet或dmn、基于注意力机制的han、基于集成学习的普通dt或优化dt。9.根据权利要求7所述的基于不同应用场景的医学影像检查项目名称标准化方法,其特征在于,所述评价指标包括micro-f1、marco-f1;所述超参数包括分批处理数量、损失函数阈值、最大迭代次数、输入词向量表征、卷积核大小、feature map特征图个数、激活函数、正则化项;所述层结构或计算节点包括构建并初始化的文本分类深度神经网络模型对应的输入层、隐藏层、输出层或池化层的结构或计算节点;所述训练集的调整指在训练集中增加医学专用同义词映射关系表后再对文本分类机器学习模型进行训练。10.根据权利要求2所述的基于不同应用场景的医学影像检查项目名称标准化方法,其特征在于,采集各条历史检查数据中的检查部位及检查方法相关字段,并利用所述第三医学影像检查项目名称标准化方法将采集的字段映射为对应的标准检查项目名称包括以下步骤:s21”、结合基于词典的分词算法及基于统计的机器学习算法对各条源数据中的字段进
行分词处理,并对字段中的无用信息进行清洗;s22”、对区域卫生医疗机构明确规定或结合影像设备特点及专家知识预先制定的标准检查项目名称进行实体及实体关系提取,得到各标准检查项目名称对应的实体及其实体关系;s23”、医学影像专家利用专家知识对清洗后预设数量的源数据进行实体及其实体关系的对应标注;s24”、将预设数量的源数据及其对应的标注结果作为构建模型的样本数据集,并将该样本数据集划分为训练集和验证集;s25”、基于所述样本数据集构建实体关系抽取模型,并进行初始化处理;s26”、利用所述训练集结合预先设定的分批处理数量、损失函数阈值及最大迭代次数对实体关系抽取模型进行训练;s27”、将所述验证集中的源数据输入训练后的实体关系抽取模型,得到与验证集中各条源数据相对应的检查项目名称;s28”、结合得到的与验证集中各条源数据相对应的检查项目名称与验证集中各条源数据对应的标注结果计算评价指标;s29”、判断评价指标值是否达到预设阈值,若是,则判断训练后的实体关系抽取模型通过验证,并执行s210”,若否,则判断训练后的实体关系抽取模型未通过验证,并调整模型对应的超参数、模型结构或计算节点、训练集后重复执行s26
”‑
s29”,直至评价指标值达到预设阈值为止;s210”、利用训练后的实体关系抽取模型对清洗后剩余的各条源数据进行映射,得到对应的标准检查项目名称。11.根据权利要求10所述的基于不同应用场景的医学影像检查项目名称标准化方法,其特征在于,所述实体关系抽取模型包括cr-cnn、att-cnn、att-blstm、lstm-rnns,且所述实体关系抽取模型由实体抽取模块、实体关系抽取模块、数据处理模块构成;其中,所述实体抽取模块用于从源数据中抽取出与检查部位及检查方法相关的实体词语;所述实体关系抽取模块用于抽取出各实体间的关系;所述数据处理模块用于结合抽取出的实体及实体间的关系进行处理,组合得到标准检查项目名称。12.根据权利要求10所述的基于不同应用场景的医学影像检查项目名称标准化方法,其特征在于,所述评价指标包括micro-f1、marco-f1;所述超参数包括分批处理数量、损失函数阈值、最大迭代次数、过滤器大小及数量、分类个数、序列长度;所述模型结构或计算节点为实体关系抽取模型的结构及相关计算节点;所述训练集的调整指在训练集中增加医学专用同义词映射关系表后再对模型进行训练。13.根据权利要求2所述的基于不同应用场景的医学影像检查项目名称标准化方法,其特征在于,采集各条历史检查数据中的检查部位及检查方法相关字段,并利用所述第四医学影像检查项目名称标准化方法将采集的字段映射为对应的标准检查项目名称包括以下
步骤:s21
”’
、结合基于词典的分词算法及基于统计的机器学习算法对各条源数据中的字段进行分词处理,并对字段中的无用信息进行清洗;s22
”’
、利用第一医学影像检查项目名称标准化方法将清洗后预设数量的源数据映射为对应的标准检查项目名称并进行标注;s23
”’
、将预设数量的源数据及其对应的标注结果作为构建模型的样本数据集,并将该样本数据集划分为训练集和验证集;s24
”’
、基于所述样本数据集构建文本分类深度神经网络模型,并进行初始化处理;s25
”’
、利用所述训练集结合预先设定的分批处理数量、损失函数阈值及最大迭代次数对文本分类深度神经网络模型进行训练;s26
”’
、将所述验证集中的源数据输入训练后的文本分类深度神经网络模型,得到与验证集中各条源数据相对应的检查项目名称;s27
”’
、结合得到的与验证集中各条源数据相对应的检查项目名称与验证集中各条源数据对应的标注结果计算评价指标;s28
”’
、判断评价指标值是否达到预设阈值,若是,则判断训练后的文本分类深度神经网络模型通过验证,并执行s29
”’
,若否,则判断训练后的文本分类深度神经网络模型未通过验证,并调整模型对应的超参数、层结构或计算节点、训练集后重复执行s25
”’‑
s28
”’
,直至评价指标值达到预设阈值为止;s29
”’
、利用训练后的文本分类深度神经网络模型对清洗后剩余的各条源数据进行映射,得到对应的标准检查项目名称。14.基于不同应用场景的医学影像检查项目名称标准化系统,用于实现权利要求1-13中任一所述的基于不同应用场景的医学影像检查项目名称标准化方法的步骤,其特征在于,该系统包括医学影像检查项目名称标准化方法选择模块、第一医学影像检查项目名称标准化方法映射模块、第二医学影像检查项目名称标准化方法映射模块、第三医学影像检查项目名称标准化方法映射模块及第四医学影像检查项目名称标准化方法映射模块;其中,所述医学影像检查项目名称标准化方法选择模块用于基于实际应用场景中的源数据情况、人力资源、时间资源、准确率要求、硬件资源及泛化能力需求,选择对应的医学影像检查项目名称标准化方法;所述第一医学影像检查项目名称标准化方法映射模块用于采集各条历史检查数据中的检查部位及检查方法相关字段,并利用第一医学影像检查项目名称标准化方法将采集的字段映射为对应的标准检查项目名称;所述第二医学影像检查项目名称标准化方法映射模块用于采集各条历史检查数据中的检查部位及检查方法相关字段,并利用第二医学影像检查项目名称标准化方法将采集的字段映射为对应的标准检查项目名称;所述第三医学影像检查项目名称标准化方法映射模块用于采集各条历史检查数据中的检查部位及检查方法相关字段,并利用第三医学影像检查项目名称标准化方法将采集的字段映射为对应的标准检查项目名称;所述第四医学影像检查项目名称标准化方法映射模块用于采集各条历史检查数据中的检查部位及检查方法相关字段,并利用第四医学影像检查项目名称标准化方法将采集的
字段映射为对应的标准检查项目名称。

技术总结
本发明公开了基于不同应用场景的医学影像检查项目名称标准化方法及系统,该方法包括以下步骤:基于实际应用场景中的源数据情况、人力资源、时间资源、准确率要求、硬件资源及泛化能力需求,选择对应的医学影像检查项目名称标准化方法;采集各条历史检查数据中的检查部位及检查方法相关字段,利用医学影像检查项目名称标准化方法将采集的字段映射为对应的标准检查项目名称。本发明可以选择适合的标准化方法实现对医学影像数据中复杂多样的检查部位、检查方法相关字段进行识别、治理,并最终与标准检查项目名称对应起来,以便医学影像数据在医疗、科研、教学、医保、大数据应用等各个领域得以利用。域得以利用。域得以利用。


技术研发人员:徐辉 吴鹏 秦浩 张城铭泽
受保护的技术使用者:中电通商数字技术(上海)有限公司
技术研发日:2022.04.06
技术公布日:2022/7/21
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献