一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

基于随机森林的乳腺癌预测的制作方法

2022-03-16 01:28:02 来源:中国专利 TAG:

技术特征:
1.一种基于随机森林的乳腺癌预测发明,其步骤包括:采集直系亲属以及自己的乳腺ct图片由于在图像采集中不可避免受到噪声影响,因此需要增强图像效果。2.图像增强技术有增强对比度,直方图均衡化,锐化滤波器。3.通过增强对比度,可以增强原图之间的灰度反差。4.通过直方图均衡化,可以,把原始的直方图变为均匀分布的形式,增加了灰度值的动态范围,从而增强了图像效果。5.通过锐化滤波器消除图片噪声,增强被模糊的细节。6.基于深度学习知识,设计卷积神经网络,提取图像的特征值。7.卷积神经网络的激活函数选取relu函数,损失函数选取交叉熵损失函数,然后设置卷积层和池化层。8.特征图是通过对输入图像进行卷积计算和激活函数计算得到的。9.卷积过程就是用一个大小固定的卷积核按照一定步长扫描输入矩阵进行点积运算。10.池化层在卷积层之后,池化操作将相似的特征合并起来,并选取区域的最大值和平均值,池化操作的作用是缩小特征图的尺寸,减少计算量。11.多次训练卷积神经网络模型,使它趋于稳定。12.使用交叉验证和网格搜索选取模型参数。13.随机森林是基于决策树的,由若干个决策树集成,因此避免了单个决策树的偶然性,并且有效地解决了过拟合问题。14.随机森林的参数有决策树的数目,最大深度,最小样本树,最小分类样本树。15.这些参数需要经过网格搜索的过程来选择。16.网格搜索的主要函数是gridsearchcv。17.网格搜索的主要步骤如下:4.1定义需要搜索的参数列表,这里需要定义的参数列表有决策树的数目,最大深度,最小样本数,最小分类样本数。18.4.2使用gridsearchcv()函数,其中estimator指定模型,本发明中此处填写的是randomforestclassifier,param_grid定义参数搜索网格,cv用来指定交叉验证折树,这里指定cv=4。19.4.3接下来使用属性best_params_属性提取最优的参数。20.经过网格搜索后,选取的参数是整个模型最优的因此本发明可以达到预测准确性。21.确定每颗决策树的输入和输出。22.每颗决策树的输入为家庭所有成员的乳腺ct图像,姓名,性别,年龄,是否经常熬夜,是否经常吃垃圾食品,是否经常生气。23.随机森林的输出为是否是乳腺癌高危人群。24.0表示不是乳腺癌高危人群,1表示是乳腺癌高危人群。25.决策树上的非叶子结点代表实例的某个属性的测试,其后继分支代表该属性的可能值。26.决策树上的叶子结点代表实例的类别。27.信息增益用来衡量决策树区分训练的能力。
28.信息增益越大,说明分类效果越好。29.在确定决策树的结点分裂时,按照信息增益来选择分裂结点,选取信息增益最大的。30.当所有的叶子结点都为同一类型的时候,停止分裂,决策树构建完毕。31.构建随机森林。32.单个决策树容易出现过拟合的问题,因此在随机森林中选择属性时加入随机因素。33.在每个决策树的输入结点中,先随机从输入的属性集中随机选取k个属性的子集,然后从这个子集中选取最优属性用于划分。34.每颗决策树对输入项进行预测随机森林投票选取预测结果。35.预测结果最多的类别确定为最后的类别。36.其输出类别是所有决策树的输出类别的众数。37.这样可以避免单个决策树的预测偶然性。

技术总结
乳腺癌是死亡率较高的一种癌症,因此需要提前预测得乳腺癌的概率来预防乳腺癌。本发明设计了基于随机森林模型预测乳腺癌概率。本发明融合了随机森林,网格搜索,交叉验证,卷积神经网络,图像处理技术。首先收集家庭成员的所有乳腺癌筛查的CT报告图片,然后对收集到的图片通过基于深度学习的卷积神经网络提取图像的特征值,然后使用网格搜索的方法选取随机森林模型的最优参数,然后构建随机森林,随机森林的输入项有家庭所有成员的乳腺CT图像,姓名,性别,年龄,是否经常熬夜,是否经常生气。随机森林的输出为是否是乳腺癌高危人群。0表示不是乳腺癌高危人群,1表示是乳腺癌高危人群。本发明能够达到准确预测乳腺癌概率达到根据预测概率来预防乳腺癌的效果。预测概率来预防乳腺癌的效果。预测概率来预防乳腺癌的效果。


技术研发人员:张可欣
受保护的技术使用者:张可欣
技术研发日:2021.10.26
技术公布日:2022/3/15
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献