一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种基于MIC结合余弦相似度的原发性肝癌精准化疗HBV再激活预测方法

2023-02-06 13:41:25 来源:中国专利 TAG:

技术特征:
1.一种基于mic结合余弦相似度的原发性肝癌精准化疗hbv再激活预测方法,其特征在于:包括以下步骤:步骤1:采集num名接受精准化疗的肝癌患者的临床资料作为研究数据,获取影响患者hbv再激活的n个潜在因子;依据精准化疗后hbv是否再激活对接受精准化疗的肝癌患者添加标签,所述标签包括hbv已激活和hbv未激活;依据潜在因子和患者标签,构建原始数据集d{f1,f2,

,f
i


,f
n
,l},其中,f
i
表示具备第i个潜在因子的所有患者的指标数据集合,i=1,2,...,n;l为患者标签;步骤2:计算原始数据集d{f1,f2,

,f
i


,f
n
,l}中各潜在因子与患者标签之间的最大信息系数,记为mic(f
i
,l);步骤3:采用余弦相似度算法,计算原始数据集d{f1,f2,

,f
i


,f
n
,l}中各潜在因子间的余弦相似度;步骤4:利用根据最大信息系数和各潜在因子间的余弦相似度构建的评价函数,表示为:式中,k表示已选子集,similarity
normal
()表示潜在因子间的余弦相似度;f
k
表示具备第k个潜在因子的所有患者的指标数据集合;利用评价函数,计算原始数据集d{f1,f2,

,f
i


,f
n
,l}中各潜在因子的评价值,并基于评价值对原始数据集d{f1,f2,...,f
i
,...,f
n
,l}中的潜在因子进行排序,筛选出关键因子集合;步骤5:采用关键因子集合中各关键因子及患者标签,对支持向量机进行训练,并通过对支持向量机中的参数进行调整,得到最终可用的分类模型;步骤6:将待预测的关键因子输入至最终可用的分类模型中,得到肝癌患者接受放疗后,hbv是否激活的预测结果。2.根据权利要求1所述的一种基于mic结合余弦相似度的原发性肝癌精准化疗hbv再激活预测方法,其特征在于:步骤2具体包括:在二维坐标系中,通过在x轴方向划分x份、在y轴方向划分y份,构建得到网格g,原始数据集d{f1,f2,...,f
i
,...,f
n
,l}中的f
i
和l构成坐标点(f
i
,l),坐标点(f
i
,l)依次落在网格g中;根据式(1),计算原始数据集d{f1,f2,...,f
i
,...,f
n
,l}中每个潜在因子与患者标签之间的互信息:i((f
i
;l),x,y)=maxi((f
i
;l)|g)
ꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(1)式中,i((f
i
;l),x,y)表示f
i
和l在网格(x,y)上的互信息,(f
i
;l)|g表示坐标点(f
i
;l)在网格g中的分布,坐标点(f
i
;l)在网格g中的分布由坐标点(f
i
;l)中的数据落在每个小网格内的概率决定,i((f
i
;l)|g)表示(f
i
;l)|g的互信息,x和y取不同的值,表示不同的网格g划分方案;将i((f
i
;l),x,y)除以log2(min(x,y)),完成对i((f
i
;l),x,y)的归一化处理:给定多组(x,y),计算每组(x,y)下的m(f
i
;l)
(x,y)
的值,将所有m(f
i
;l)
(x,y)
中的最大值
作为潜在因子与患者标签之间的最大信息系数mic(f
i
;l):式中,b(num)是关于num的函数。3.根据权利要求1所述的一种基于mic结合余弦相似度的原发性肝癌精准化疗hbv再激活预测方法,其特征在于:步骤3具体包括:对原始数据集d{f1,f2,

,f
i


,f
n
,l}中各潜在因子根据式(4)进行余弦变换:式中,f(i)为f
i
的元素,ct(u)为经过余弦变换后的系数,u为用来补偿余弦变换时的系数,以实现变换后的矩阵为正交矩阵;对余弦变换后的潜在因子进行采样,得到高频分量;计算采样区域内的均值,将大于均值的高频分量置为1,小于均值的高频分量置为0,以此构建潜在因子的hash指纹;计算不同潜在因子的hash指纹间的距离,并将不同潜在因子的hash指纹间的距离与采样大小的比值作为各潜在因子间的余弦相似度。4.根据权利要求3所述的一种基于mic结合余弦相似度的原发性肝癌精准化疗hbv再激活预测方法,其特征在于:所述的潜在因子的hash指纹,表示为:式中,sample为采样区域大小,means( )表示采样区域内的均值。5.根据权利要求4所述的一种基于mic结合余弦相似度的原发性肝癌精准化疗hbv再激活预测方法,其特征在于:所述的各潜在因子间的余弦相似度,表示为:式中,distance(xor(hash1,hash2))为指纹hash1和指纹hash2异或后的汉明距离;sample为采样大小。

技术总结
本发明公开了一种基于MIC结合余弦相似度的原发性肝癌精准化疗HBV再激活预测方法,包括:依据潜在因子和患者标签,构建原始数据集;计算原始数据集中各潜在因子与患者标签之间的最大信息系数;采用余弦相似度算法,计算原始数据集中各潜在因子间的余弦相似度;利用根据最大信息系数和各潜在因子间的余弦相似度构建的评价函数,利用评价函数,计算原始数据集中各潜在因子的评价值,并基于评价值对原始数据集中的潜在因子进行排序,筛选出关键因子集合;采用关键因子集合中各关键因子及患者标签,对支持向量机进行训练,得到最终可用的分类模型;将待预测的关键因子输入至最终可用的分类模型中,得到肝癌患者接受放疗后,HBV是否激活的预测结果。激活的预测结果。激活的预测结果。


技术研发人员:袁高腾 周晓峰 汤剑松
受保护的技术使用者:河海大学
技术研发日:2022.11.18
技术公布日:2023/2/3
再多了解一些

本文用于创业者技术爱好者查询,仅供学习研究,如用于商业用途,请联系技术所有人。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献