一种基于动量自适应和声搜索的影像组学特征选择方法

2022-05-18 03:42:08 来源：中国专利 TAG：

1.本发明属于影像组学技术领域，具体涉及一种基于动量自适应和声搜索的影像组学特征选择方法。

背景技术：

2.肾上腺腺瘤(aa)是肾上腺最常见的良性肿瘤，起源于肾上腺皮质，多无特质性临床症状，常在体检或胸腹部其他检查中被意外发现，临床上依据肿瘤有无内分泌功能分为无功能腺瘤和功能性腺瘤，临床上以无功能腺瘤居多。目前，依据腺瘤平扫ct值的不同，以10hu为临界点，把》10hu的腺瘤定义为乏脂性肾上腺腺瘤(lp-aa)。肾上腺转移瘤(am)是最常见的肾上腺恶性肿瘤，其发病率仅次于良性的aa，原发灶最常来源于肺。在临床工作中，许多恶性肿瘤患者在筛查转移瘤时偶然发现肾上腺腺瘤，这类偶发的肾上腺腺瘤与转移瘤的鉴别成为医学影像鉴别中的难题。常见的肾上腺腺瘤胞质脂肪含量较高，且非腺瘤内不含脂质或含脂量较低，因此通过肿瘤平扫ct值的测量可鉴别典型的腺瘤和转移瘤。然而乏脂性腺瘤缺乏脂肪含量，难以鉴别。因此，如何有效鉴别转移瘤和乏脂性腺瘤是一个亟待解决的问题。
3.近几年来，随着机器学习技术的发展，机器学习在医学影像分析中的应用也越来越广泛，但是应用在肾上腺肿瘤辅助诊断上的研究较少，并且医学影像数据较为复杂多变，提取的影像组学特征维度较高，增加了传统机器学习方法计算的开销。特征选择的目标在于得到最优特征子集，剔除不相关或具有误导性的特征，从而提高分类的准确率和效率。目前的特征选择方法往往难以考虑到特征间的相关性，或是计算成本较高，且特征选择本质上是一种优化问题，因此，采用和声搜索算法来求解此类问题是可行的。但是离散和声搜索在求解此类问题时易陷入局部最优，降低了搜索的效率和准确性。

技术实现要素：

4.针对现有技术中存在的上述问题，本发明的目的在于提供一种基于动量自适应和声搜索的影像组学特征选择方法，采用了离散和声搜索，并在此基础上进行加强，有效地提高了搜索的效率和准确性。
5.本发明提供如下技术方案：一种基于动量自适应和声搜索的影像组学特征选择方法，包括以下步骤:
6.步骤1：手动勾选医学影像的感兴趣区域roi；
7.步骤2：读取包含感兴趣区域roi的肾上腺肿瘤ct影像数据；
8.步骤3：对读取的影像数据提取原始图像特征，并划分成训练集和测试集；
9.步骤4：定义一个最小化问题为目标函数，根据步骤3提取的图像特征初始化和声记忆库大小hms和特征总数n；
10.步骤5：根据步骤4中定义的目标函数及和声记忆库大小hms，初始化和声记忆库；
11.步骤6：基于步骤5中初始化的和声记忆库，初始化最大迭代次数、和声记忆取值概
率hmcr以及和声微调概率par；
12.步骤7：根据步骤6中定义的hmcr和par产生新解j；
13.步骤8：更新和声记忆库：判断新解的目标函数值是否优于当前记忆库的最差解，若是，则更新记忆库；
14.步骤9：重复步骤7～8，直到达到最大迭代次数，即达到终止条件，输出最优特征子集。
15.进一步的，所述步骤4中，目标函数公式为：
16.minf(x),x＝{x1,x2,
…
,xn},x1,x2,
…
,xn∈0,1
17.其中，xn为是否选取特征集x中第n个特征，0代表不选，1代表选，n为步骤4中初始化的特征总数。
18.进一步的，所述步骤5中，和声记忆库的形式为：
[0019][0020]
进一步的，所述步骤7中，解向量中的每一个分量i的产生包括以下两种方式：
[0021]
方式一、产生随机数r1，若随机数r1小于和声记忆取值概率hmcr，则取此时和声记忆库最优解向量的当前分量同时产生随机数r2，若随机数r2小于和声微调概率par，则微调当前分量，微调方式为：
[0022][0023]
其中为第j个解向量中的第i个分量，1≤j≤hms,1≤i≤n；
[0024]
方式二、产生随机数r1，若随机数r1大于hmcr，则随机取值。
[0025]
通过采用上述技术，与现有技术相比，本发明的有益效果如下：
[0026]
本发明通过动态调整hmcr和par，实现参数自适应，调节全局和局部搜索，动态控制变异概率，避免陷于局部最优解，增强了算法的鲁棒性；融合动量梯度下降的概念，考虑了前代参数值，加快了收敛；调整了适应度函数，更加契合特征搜索优化问题的本质。
附图说明
[0027]
图1为本发明基于动量自适应和声搜索的影像组学特征选择方法的流程图；
[0028]
图2为本发明实施例中准确率变化示意图，分别表示解空间中准确率的最大值、最小值以及平均值；
[0029]
图3为本发明实施例中最优特征子集的roc曲线示意图；
[0030]
图4为本发明实施例中适应度函数变化示意图，分别表示解空间中适应度函数值的最大值、最小值以及平均值。
具体实施方式
[0031]
为了使本发明的目的、技术方案及优点更加清楚明白，以下结合说明书附图及实施例，对本发明进行进一步详细说明。应当理解，此处所描述的具体实施例仅仅用以解释本
发明，并不用于限定本发明。
[0032]
相反，本发明涵盖任何由权利要求定义的在本发明的精髓和范围上做的替代、修改、等效方法以及方案。进一步，为了使公众对本发明有更好的了解，在下文对本发明的细节描述中，详尽描述了一些特定的细节部分。对本领域技术人员来说没有这些细节部分的描述也可以完全理解本发明。
[0033]
请参阅图1-4，一种基于动量自适应和声搜索的影像组学特征选择方法，包括以下步骤：
[0034]
步骤1：手动勾选所述医学影像的感兴趣区域roi，勾选出肿瘤区域；
[0035]
步骤2：读取包含感兴趣区域roi的肾上腺肿瘤ct影像数据，同时读取原文件和标注文件；
[0036]
步骤3：对读取的影像数据提取原始图像特征，具体为形状特征、纹理特征等，划分成训练集和测试集。使用python工具包pydicom完成特征提取，提取包括形状在内的105个特征；
[0037]
步骤4：初始化和声记忆库大小hms，假设一个最小化问题为此方法的目标函数，定义为：
[0038]
minf(x),x＝{x1,x2,
…
,xn},x1,x2,
…
,xn∈0,1
[0039]
其中xn为是否选取特征集x中第n个特征，0代表不选，1则代表选，n为步骤3中得到的特征总数，本实施例中n＝105。
[0040]
利用邻近算法knn作为分类器来拟合步骤3中划分的训练集，并在测试集上验证，提出了一种契合本实施例的适应度函数，在错误率的基础上还添加了可解释性方差占比、auc值和所选特征占比三个指标；所有特征的可解释方差由pca给出，通过计算所选特征的方差占比来判断特征选择的可靠性；auc值为受试者工作特征曲线(roc)下的面积，用于衡量分类器优劣的性能指标；所选特征占比为所选特征在特征集中占比大小，具体公式为：
[0041]
f(x)＝0.8
×
error(x) 0.05
×
(1-evar(x)) 0.1
×
(1-auc(x)) 0.05
×
f(x)
[0042]
其中：
[0043][0044][0045]
其中k为选取的特征数，λi为第i个特征的方差，n为步骤4中定义的n。
[0046][0047]
其中m代表步骤3划分的测试集中正类样本个数，n代表负类样本个数：
[0048][0049]
步骤5：根据步骤4中定义的目标函数和声记忆库大小hms初始化和声记忆库，和声
库的形式为：
[0050][0051]
步骤6：根据步骤5中初始化的和声记忆库，初始化最大迭代次数、和声记忆取值概率(hmcr)以及和声微调概率(par)，最大迭代次数，即循环的最大次数，也是循环的终止条件；和声记忆取值概率，即在产生新解时从和声记忆库保留解分量的概率大小；和声微调概率，即对解分量进行微调变异的概率；
[0052]
步骤7：根据步骤6中定义的hmcr和par，产生新解j，解向量中的每一个分量i的产生有以下几种方式：
[0053]
步骤7.1：产生随机数r1，若小于hmcr，则取此时和声记忆库最优解向量的当前分量并改变hmcr，公式如下：
[0054][0055]
其中yn为向量y的第n个分量，为第j个解向量的第i-1个分量，为当前最优解向量的第i-1个分量，hmcri为经过第i次变化后的hmcr。
[0056]
同时产生随机数r2，若小于par，则微调当前分量，微调方式为：
[0057][0058]
并调整par值，公式如下：
[0059][0060]
其中为当前最优解向量的第i个分量，为当前最差解向量的第i个分量。
[0061]
步骤7.2：产生随机数r1，若大于hmcr，则随机取值。
[0062]
步骤8：更新和声记忆库：判断新解的目标函数值是否优于当前记忆库的最差解，若是，则更新记忆库；
[0063]
步骤9：重复步骤7～8，直到达到最大迭代次数或满足终止条件，输出最优特征子集。
[0064]
其中，在本实施例中，各个参数如下所示：
[0065]
hcmr:0.9；par＝0.3；hms＝10；n＝105。
[0066]
以上所述仅为本发明的较佳实施例而已，并不用以限制本发明，凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等，均应包含在本发明的保护范围之内。

再多了解一些

1/2 1 2 下一页尾页

本文用于企业家、创业者技术爱好者查询，结果仅供参考。

上一篇：返回列表
下一篇：一种基于数字身份的优抚资金发放管理方法、设备及介质与流程

一种基于动量自适应和声搜索的影像组学特征选择方法

相关文献

最热文献