跨场景迁移分类模型形成方法、装置及可读存储介质与流程

2021-11-06 03:42:00 来源：中国专利 TAG：

技术特征：
1.一种跨场景迁移分类模型形成方法，其特征在于，应用于计算机设备，所述方法包括：初始化样本集权重参数及确定分类算法和迭代次数，其中，所述样本集包括由源域样本集与目标域训练样本集组成的训练样本集及由目标域测试样本组成的目标域测试集；调用所述分类算法，基于所述训练样本集中各样本的权重分布情况及所述目标域测试集，得到一在所述目标域测试集上的分类器；计算所述分类器在所述目标域训练样本集的错误率，并基于所述错误率调整所述训练样本集的权重；计算所述分类器在所述目标域测试集上的模型效果参数，并存储对应的迭代标签；检测所述模型效果参数是否满足迭代结束条件，在不满足迭代结束条件时回到所述调用所述分类算法，基于所述训练样本集中各样本的权重分布情况及所述目标域测试集，得到一在所述目标域测试集上的分类器的步骤，直到所述模型效果参数满足迭代结束的条件时，将所述模型效果参数满足迭代结束的条件所对应的分类器作为训练好的分类模型。2.如权利要求1所述的跨场景迁移分类模型形成方法，其特征在于，在所述初始化样本集权重参数及确定分类算法和迭代次数的步骤中：初始化所述训练样本集的权重向量w1及权重调整参数β；其中，权重向量重向量n为源域样本集中样本数量，m为目标域训练样本集中样本数量，n为迭代次数。3.如权利要求2所述的跨场景迁移分类模型形成方法，其特征在于，所述训练样本集上的权重分布p
t
满足以下公式：其中，t＝1，...，n，t为对应的第几次迭代。4.如权利要求3所述的跨场景迁移分类模型形成方法，其特征在于，所述计算所述分类器在所述目标域训练样本集的错误率，并基于所述错误率调整所述训练样本集的权重的步骤包括：计算所述分类器在所述目标域训练样本集的错误率；基于所述错误率修正权重调整参数；基于修正后的权重调整参数对所训练样本集中的样本的权重进行调整；计算所述分类器在所述目标域训练样本集的错误率ξ
t
的公式如下：
修正后的权重调整参数βt：β
t
＝ε
t
/(1
‑
ε
t
)调整后的训练样本集中的样本的权重分布满足：其中，h(x)为预测标签概率，c(x)为标注标签概率。5.如权利要求4所述的跨场景迁移分类模型形成方法，其特征在于，所述计算所述分类器在所述目标域测试集上的模型效果参数，并存储对应的迭代标签的步骤，包括：计算受试者工作特征曲线下的面积值，将所述面积值作为所述模型效果参数的第一模型效果参数；计算所述受试者工作特征曲线中纵坐标与横坐标之差的绝对值的最大值，将所述最大值作为所述模型效果参数的第二模型效果参数；并记录所述模型效果参数对应的迭代次数；其中，所述受试者工作特征曲线以真阳性率为纵坐标及假阳性率为横坐标绘制的曲线。6.如权利要求5所述的跨场景迁移分类模型形成方法，其特征在于，在所述检测所述模型效果参数是否满足迭代结束条件的步骤中，所述迭代结束条件包括以下三种的任意一个：所述第一模型效果参数满足对应的判断规则；所述第二模型效果参数满足对应的判断规则；或，所述第一模型效果参数或所述第二模型效果参数满足对应的判断规则。7.如权利要求1
‑
6中任意一项所述的跨场景迁移分类模型形成方法，其特征在于，所述源域的样本为小于第一消费额度的消费贷款样本，所述目标域中的样本为大于第二消费额度的消费贷款样本，其中，第一消费额度不大于所述第二消费额度。8.如权利要求7所述的跨场景迁移分类模型形成方法，其特征在于，所述分类算法包括极端梯度提升模型。9.一种跨场景迁移分类模型形成装置，其特征在于，应用于计算机设备，所述装置包括：初始化模块，用于初始化样本集权重参数及确定分类算法和迭代次数，其中，所述样本集包括由源域样本集与目标域训练样本集组成的训练样本集及由目标域测试样本组成的目标域测试集；调用模块，用于调用所述分类算法，基于所述训练样本集中各样本的权重分布情况及所述目标域测试集，得到一在所述目标域测试集上的分类器；
计算与调整模块，用于计算所述分类器在所述目标域训练样本集的错误率，并基于所述错误率调整所述训练样本集的权重；计算与存储模块，用于计算所述分类器在所述目标域测试集上的模型效果参数，并存储对应的迭代标签；检测模块，检测所述模型效果参数是否满足迭代结束条件，在不满足迭代结束条件时，重复执行所述调用模块、计算与调整模块及计算与存储模块的功能，直到所述模型效果参数满足迭代结束的条件，将所述模型效果参数满足迭代结束的条件所对应的分类器作为训练好的分类模型。10.一种可读存储介质，其特征在于，所述可读存储介质中存储有指令，当其被执行时，使得计算机设备执行上述权利要求1
‑
8中任意一项所述的跨场景迁移分类模型形成方法。

技术总结
本申请提供的跨场景迁移分类模型形成方法、装置及可读存储介质，将源域样本集与目标域训练样本集组成训练样本集，训练样本集与目标域测试集的分布不同，通过调整源域样本与目标域训练样本的样本权重，找到源域样本中与目标域分布最接近的样本，同时放大目标域样本损失的影响，增加有效数据权重，降低无效数据权重。通过模型效果参数判断是否迭代结束，并将训练过程中表现最好的一次作为决策。相对于现有技术中迁移学习算法通过提升多个弱分类器，使用后一半的弱分类器进行综合投票，得出最后的决策的方式，本申请使用在训练过程中表现最好的学习器进行决策，相当于整个迁移学习过程只发生在模型训练过程中，降低了开发难度。降低了开发难度。降低了开发难度。

技术研发人员：顾凌云谢旻旗张阳王震宇
受保护的技术使用者：上海冰鉴信息科技有限公司
技术研发日：2021.08.16
技术公布日：2021/11/5

再多了解一些

2/2 首页上一页 1 2

本文用于企业家、创业者技术爱好者查询，结果仅供参考。

上一篇：返回列表
下一篇：电子签章生成方法、装置、设备及存储介质与流程

跨场景迁移分类模型形成方法、装置及可读存储介质与流程

相关文献

最热文献