一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

基于深度学习的在线评价系统模型提取方法及装置

2022-08-23 21:10:31 来源:中国专利 TAG:


1.本技术涉及信息安全技术领域,特别涉及一种基于深度学习的在线评价系统模型提取方法及装置。


背景技术:

2.在线评价系统正在改变人们选择商品或服务的方式,不论是线上购物,还是外出旅行、就餐,人们越来越倾向于借助在线评价系统展示的分值选择口碑好的商品或服务。在线评价系统由服务和用户两类主体组成,其中用户根据使用体验对某些服务进行打分,而系统会综合用户的打分计算服务的得分,并展示给所有用户。得分可以帮助用户进行服务选择,同时一个高的得分也会提高服务的关注度或收益,但这也导致大量网络攻击想恶意干扰服务得分,如水军刷单。为保证服务得分算法的客观性和服务得分的可信度,在线评价系统大多采用机器学习算法分析用户特征等属性,为不同用户的打分分配不同权重,如降低或取消水军打分的权重,而提高有经验的实名用户的打分的权重。由于考虑到商业机密和算法安全性等因素,在线评价系统具体的服务得分算法难以公开,从而导致服务得分算法可信度和抗攻击能力难以鉴定。
3.其中,模型提取可以在保护商业机密和算法安全性的前提下,提取出在线评价系统的服务得分算法,模型提取指从黑盒模型“复制”出一个替代模型。根据对抗攻击的迁移性,替代模型的可信度和抗攻击能力近似于原始模型,而“复制”来的替代模型内部结构都是公开的,因此可以通过分析替代模型来鉴定原始模型的可信度和抗攻击能力。
4.相关技术中,模型提取方法主要有四种:基于等式方程组、基于输入样本构造寻找决策边界、基于最优化问题和基于神经网络。基于等式方程组的模型提取方法适用于线性回归模型,如logistic回归;基于输入样本构造寻找决策边界的方法适用于分类模型,而样本构造可以根据线搜索等算法;基于最优化问题的方法把模型提取建模为最优化问题,根据目标函数的梯度等特性寻找最优解;基于神经网络的方法类似于基于最优化问题的方法,只不过适用性更广。
5.然而,相关技术的模型提取方法基于提取者拥有黑盒模型api(application programming interface,应用程序接口)的假设,可构造任意输入进行模型提取,而在在线评价系统中,提取者只能拿到部分给定的数据,无法满足模型提取的准确需求,模型提取的难度较高,并且基于开源算法作为目标模型进行提取并测试,使得模型提取的实用性较差,无法有效对在线评价系统进行模型提取,亟待解决。


技术实现要素:

6.本技术提供一种基于深度学习的在线评价系统模型提取方法及装置,可以在保护商业机密和算法安全性的前提下,实现在线评价系统模型提取,可适用于数据给定情况下的模型提取,实用性更强。
7.本技术第一方面实施例提供一种基于深度学习的在线评价系统模型提取方法,包
括以下步骤:基于在线评价系统数据集中的用户打分和服务得分数据,构建关于用户-服务的有向加权二分图,并根据所述有向加权二分图的特征进行图缩减,且将缩减后的图嵌入到矩阵中,生成预处理后的数据;基于深度学习框架构建替代模型,其中,所述替代模型以服务得到的用户打分序列为输入,输出服务得分的预测值;以及利用所述预处理后的数据,并以预设的不同超参数对所述替代模型进行模型训练,生成全局最优的替代模型。
8.可选地,在本技术的一个实施例中,所述基于在线评价系统数据集中的用户打分和服务得分数据,构建关于用户-服务的有向加权二分图,包括:根据所述用户打分和服务得分数据将用户和服务分别抽象成图中的多个结点,且将服务得分抽象为对应结点的属性,及将用户对服务的打分抽象为图中的多条边,打分的分值抽象为对应边的权重,生成所述有向加权二分图。
9.可选地,在本技术的一个实施例中,所述根据所述有向加权二分图的特征进行图缩减,包括:根据所述有向加权二分图的用户和服务结点的度分布,从所述有向加权二分图中选取大于预设度的用户结点和服务结点,生成有向加权二分子图。
10.可选地,在本技术的一个实施例中,所述以预设的不同超参数对所述替代模型进行模型训练,生成全局最优的替代模型,包括:选择不同的优化算法和模型结构构成多组超参数;对所述多组超参数的每组超参数进行模型训练,其中,在模型训练过程中,每隔预设轮数的迭代进行一次模型测试,以检测模型的性能与收敛情况,评估不同超参数下模型的表现;根据模型收敛速度及提取精度指标选出最优超参数组合,并基于所述最优超参数组合对应的模型为所述全局最优的替代模型。
11.可选地,在本技术的一个实施例中,所述替代模型为:
[0012][0013]
其中,为替代模型,f为在线评价系统的服务得分算法模型,r
ij
表示为第j位用户对第i个服务的打分值。
[0014]
本技术第二方面实施例提供一种基于深度学习的在线评价系统模型提取装置,包括:生成模块,用于基于在线评价系统数据集中的用户打分和服务得分数据,构建关于用户-服务的有向加权二分图,并根据所述有向加权二分图的特征进行图缩减,且将缩减后的图嵌入到矩阵中,生成预处理后的数据;构建模块,用于基于深度学习框架构建替代模型,其中,所述替代模型以服务得到的用户打分序列为输入,输出服务得分的预测值;以及提取模块,用于利用所述预处理后的数据,并以预设的不同超参数对所述替代模型进行模型训练,生成全局最优的替代模型。
[0015]
可选地,在本技术的一个实施例中,所述生成模块进一步用于根据所述用户打分和服务得分数据将用户和服务分别抽象成图中的多个结点,且将服务得分抽象为对应结点的属性,及将用户对服务的打分抽象为图中的多条边,打分的分值抽象为对应边的权重,生成所述有向加权二分图,并根据所述有向加权二分图的用户和服务结点的度分布,从所述有向加权二分图中选取大于预设度的用户结点和服务结点,生成有向加权二分子图。
[0016]
可选地,在本技术的一个实施例中,所述提取模块包括:选择单元,用于选择不同的优化算法和模型结构构成多组超参数;训练单元,用于对所述多组超参数的每组超参数进行模型训练,其中,在模型训练过程中,每隔预设轮数的迭代进行一次模型测试,以检测
模型的性能与收敛情况,评估不同超参数下模型的表现;获取单元,用于根据模型收敛速度及提取精度指标选出最优超参数组合,并基于所述最优超参数组合对应的模型为所述全局最优的替代模型。
[0017]
本技术第三方面实施例提供一种电子设备,包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述程序,以实现如上述实施例所述的基于深度学习的在线评价系统模型提取方法。
[0018]
本技术第四方面实施例提供一种计算机可读存储介质,所述计算机可读存储介质存储计算机指令,所述计算机指令用于使所述计算机执行如上述实施例所述的基于深度学习的在线评价系统模型提取方法。
[0019]
本技术实施例可以基于深度学习框架构建替代模型,利用经过图缩减预处理的在线评价系统数据集中的用户打分和服务得分数据,提高模型提取效率,进而缓解替代模型训练中可能发生的冷启动问题和数据规模大导致的难以训练与收敛慢的问题,并以不同超参数对替代模型进行模型训练,生成全局最优的替代模型,在保护商业机密和算法安全性的前提下,实现在线评价系统模型提取,可适用于数据给定情况下的模型提取,实用性更强。
[0020]
本技术附加的方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本技术的实践了解到。
附图说明
[0021]
本技术上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解,其中:
[0022]
图1为根据本技术实施例提供的一种基于深度学习的在线评价系统模型提取方法的流程图;
[0023]
图2为根据本技术一个实施例的基于生成对抗网络(gan)构建替代模型的原理示意图;
[0024]
图3为根据本技术一个实施例的基于深度学习的在线评价系统模型提取方法的替代模型训练算法伪代码示意图;
[0025]
图4为根据本技术一个实施例的基于深度学习的在线评价系统模型提取方法的模型训练、精调和测试的原理示意图;
[0026]
图5为根据本技术一个实施例的基于深度学习的在线评价系统模型提取方法的流程图;
[0027]
图6为根据本技术实施例提供的一种基于深度学习的在线评价系统模型提取装置的结构示意图;
[0028]
图7为根据本技术实施例提供的电子设备的结构示意图。
具体实施方式
[0029]
下面详细描述本技术的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,旨在用于解释本技术,而不能理解为对本技术的限制。
[0030]
下面参考附图描述本技术实施例的基于深度学习的在线评价系统模型提取方法及装置。针对上述背景技术中心提到的技术问题,本技术提供了一种基于深度学习的在线评价系统模型提取方法,在该方法中,可以基于深度学习框架构建替代模型,利用经过图缩减预处理的在线评价系统数据集中的用户打分和服务得分数据,提高模型提取效率,进而缓解替代模型训练中可能发生的冷启动问题和数据规模大导致的难以训练与收敛慢的问题,并以不同超参数对替代模型进行模型训练,生成全局最优的替代模型,在保护商业机密和算法安全性的前提下,实现在线评价系统模型提取,可适用于数据给定情况下的模型提取,且实用性更强。由此,解决了相关技术中出于保护商业机密和算法安全性的目的,提取者只能拿到部分给定的数据,无法满足模型提取的准确需求,使得模型提取的难度较高,并且基于开源算法作为目标模型进行提取并测试,使得模型提取的实用性较差,无法有效对在线评价系统进行模型提取,且由于替代模型训练中可能存在因冷启动问题和数据规模大导致的难以训练与收敛较慢,从而导致难以推广应用的技术问题。
[0031]
具体而言,图1为本技术实施例所提供的一种基于深度学习的在线评价系统模型提取方法的流程示意图。
[0032]
如图1所示,该基于深度学习的在线评价系统模型提取方法包括以下步骤:
[0033]
在步骤s101中,基于在线评价系统数据集中的用户打分和服务得分数据,构建关于用户-服务的有向加权二分图,并根据有向加权二分图的特征进行图缩减,且将缩减后的图嵌入到矩阵中,生成预处理后的数据。
[0034]
在实际执行过程中,本技术实施例可以基于在线评价系统数据集中的用户打分和服务得分数据,构建关于用户-服务的有向加权二分图,并根据图的特征进行图缩减后将图嵌入到矩阵中,完成数据预处理,实现数据格式重构,以符合后续步骤中替代模型对于输入输出数据格式的要求,并缓解后续步骤中替代模型训练中的冷启动和数据规模较大导致的难以训练与收敛较慢的问题。
[0035]
可选地,在本技术的一个实施例中,基于在线评价系统数据集中的用户打分和服务得分数据,构建关于用户-服务的有向加权二分图,包括:根据用户打分和服务得分数据将用户和服务分别抽象成图中的多个结点,且将服务得分抽象为对应结点的属性,及将用户对服务的打分抽象为图中的多条边,打分的分值抽象为对应边的权重,生成有向加权二分图。
[0036]
具体地,本技术实施例中数据预处理可以包括:图构建、图缩减、图嵌入和数据集划分。
[0037]
其中,图构建步骤中,本技术实施例可以根据在线评价系统数据集中的用户打分和服务得分数据,将用户和服务分别抽象成图中的结点,服务得分抽象为对应结点的属性,将用户对服务的打分抽象为图中的边,而打分的分值可以抽象为边的权重,构建有向加权二分图,即:
[0038]
g=(vu,vs,as,e,w),
[0039]
其中,|vu|=n,|vs|=m,分别代表n个用户结点和m个服务结点的集合,as={s1,s2,

,sm}为服务结点的属性,其中si表示服务i的得分,e为边的集合,w={w1,w2,

,wm},为e中对应边的权重集合。
[0040]
可选地,在本技术的一个实施例中,根据有向加权二分图的特征进行图缩减,包
括:根据有向加权二分图的用户和服务结点的度分布,从有向加权二分图中选取大于预设度的用户结点和服务结点,生成有向加权二分子图。
[0041]
进一步地,图缩减步骤中,本技术实施例可以根据图g中用户和服务结点的度(degree)分布,利用分布特性或聚类方法,从g中选取度较高的用户结点和服务结点,构成g的一个子图g

,即:
[0042][0043]
其中,分别为选取的用户结点集合和服务结点集合,为v
′s中服务对应的得分,表示缩减节点后剩余的边,为e

中边对应的权重。
[0044]
此外,图嵌入步骤中,本技术实施例可以将缩减后的图g

嵌入为邻接矩阵右拼接服务得分列向量的形式表示,即:
[0045][0046]
其中,socre=[s1ꢀ…ꢀ
sm]
t
,表示服务得分的列向量;||为横向拼接符;r
ij
定义如下式:
[0047][0048]
数据集划分步骤中,本技术实施例可以将嵌入后的矩阵embed(g

)的每一行代表一个服务收到的打分和自己的得分,因此可以将embed(g

)按行切分成m个行向量,并将其大部分作为训练数据集,其余作为测试数据集。
[0049]
在步骤s102中,基于深度学习框架构建替代模型,其中,替代模型以服务得到的用户打分序列为输入,输出服务得分的预测值。
[0050]
作为一种可能实现的方式,本技术实施例可以由深度学习模型构建,具体地,在替代模型构建中,基于生成对抗网络(gan)构建了替代模型,如图2所示,模型以服务得到的用户打分序列为输入,输出服务得分的预测值。
[0051]
其中,替代模型为生成对抗网络中的生成器,利用深度神经网络,从用户打分序列预测服务得分,并利用深度神经网络生成对抗网络中的判别器,输入为用户打分序列和对应的服务得分,判断输入的服务得分是原始模型计算的真实得分,还是由生成器生成的虚假得分,即执行二分类任务。进一步地,本技术实施例可以根据二人零和博弈相关知识,当生成对抗网络收敛时,生成器的鲁棒性最强,即认为此时的生成器作为替代模型性能最优。
[0052]
可选地,在本技术的一个实施例中,替代模型为:
[0053][0054]
其中,为替代模型,f为在线评价系统的服务得分算法模型,r
ij
表示为第j位用户对第i个服务的打分值。
[0055]
具体地,替代模型可以如下:
[0056][0057]
其中,为替代模型,f为在线评价系统的服务得分算法模型(即要提取的目标模
型)。
[0058]
即要求在输入相同的打分序列的情况下,替代模型预测的服务得分要尽可能与原始模型的服务得分相同。
[0059]
进一步地,本技术实施例可以记:
[0060][0061]
其中,ri表示服务i收到的用户打分序列,表示所有服务收到的用户打分序列的集合。
[0062]
进一步地,打分序列分别与对应的原始服务得分算法模型生成的数据集合和替代模型生成的数据集合可以如下:
[0063]zreal
={ri||si|i∈[1,m]},
[0064][0065]
其中,z
real
表示所有服务收到的打分与对应真实得分组合的集合,而z
gen
表示所有服务收到的打分与替代模型预测得分组合的集合。
[0066]
进一步地,基于生成对抗网络的替代模型训练的目标函数可以如下:
[0067][0068]
其中,d为生成对抗网络中的判别器,而d(in)的输出值表示对输入in∈z
real
的置信度,值越高表示判别器对输入in越可能对应真实得分。
[0069]
其中,具体的替代模型训练算法伪代码可以如图3所示。
[0070]
在步骤s103中,利用预处理后的数据,并以预设的不同超参数对替代模型进行模型训练,生成全局最优的替代模型。
[0071]
在实际执行过程中,如图4所示,本技术实施例可以利用预处理后的数据,设定不同超参数对替代模型进行模型训练,测试比较不同超参数下训练得到的模型性能,得到全局最优的替代模型,实现模型的训练、精调和测试,从而实现根据给定的数据进行模型提取,进而实现对在线评价系统的服务得分算法进行模型提取,可以在保护商业机密和算法安全性的前提下,提取出在线评价系统的服务的分算法,实现在线评价系统模型提取,实用性更高。
[0072]
需要注意的是,超参数可以由本领域技术人员根据实际情况进行设置,在此不做具体限制。
[0073]
可选地,在本技术的一个实施例中,以预设的不同超参数对替代模型进行模型训练,生成全局最优的替代模型,包括:选择不同的优化算法和模型结构构成多组超参数;对多组超参数的每组超参数进行模型训练,其中,在模型训练过程中,每隔预设轮数的迭代进行一次模型测试,以检测模型的性能与收敛情况,评估不同超参数下模型的表现;根据模型收敛速度及提取精度指标选出最优超参数组合,并基于最优超参数组合对应的模型为全局最优的替代模型。
[0074]
进一步地,本技术实施例可以选择不同的优化算法和模型结构(生成器、判别器的
网络层数、神经元数量)构成多组超参数,其中,优化算法可调参数如表1所示,模型结构可调参数如表2所示。
[0075]
表1
[0076][0077]
表2
[0078][0079]
进一步地,本技术实施例可以对每组超参数进行模型训练。在模型训练过程中,本技术实施例每隔一定轮数的迭代进行一次模型测试,检测模型的性能与收敛情况,用以评估不同超参数下模型的表现。
[0080]
模型测试采用均方误差mse作为损失函数,计算公式可以如下:
[0081][0082]
其中,||代表测试的得分数。
[0083]
从上式看出,均方误差mse值越小,替代模型预测的服务得分与真实值越接近,即模型性能越好。
[0084]
综上所述,本技术实施例可以根据模型收敛速度、提取精度指标选出最优超参数组合,对应的模型为最优替代模型。
[0085]
下面结合图2至图5所示,以一个实施例对本技术实施例的基于深度学习的在线评价系统模型提取方法进行详细阐述。
[0086]
如图5所示,本技术实施例包括以下步骤:
[0087]
步骤s501:基于在线评价系统数据集中的用户打分和服务得分数据,构建出关于用户-服务的有向加权二分图,根据图的特征进行图缩减后将图嵌入到矩阵中,完成数据预
处理。在实际执行过程中,本技术实施例可以基于在线评价系统数据集中的用户打分和服务得分数据,构建关于用户-服务的有向加权二分图,并根据图的特征进行图缩减后将图嵌入到矩阵中,完成数据预处理,实现数据格式重构,以符合后续步骤中替代模型对于输入输出数据格式的要求,并缓解后续步骤中替代模型训练中的冷启动和数据规模较大导致的难以训练与收敛较慢的问题。
[0088]
具体地,本技术实施例中数据预处理可以包括:图构建、图缩减、图嵌入和数据集划分。
[0089]
1、图构建。本技术实施例可以根据在线评价系统数据集中的用户打分和服务得分数据,将用户和服务分别抽象成图中的结点,服务得分抽象为对应结点的属性,将用户对服务的打分抽象为图中的边,而打分的分值可以抽象为边的权重,构建有向加权二分图,即:
[0090]
g=(vu,vs,as,e,w),
[0091]
其中,|vu|=n,|vs|=m,分别代表n个用户结点和m个服务结点的集合,as={s1,s2,

,sm}为服务结点的属性,其中si表示服务i的得分,e为边的集合,w={w1,w2,

,wm},为e中对应边的权重集合。
[0092]
2、图缩减。本技术实施例可以根据图g中用户和服务结点的度(degree)分布,利用分布特性或聚类方法,从g中选取度较高的用户结点和服务结点,构成g的一个子图g

,即:
[0093][0094]
其中,分别为选取的用户结点集合和服务结点集合,为vs′
中服务对应的得分,表示缩减节点后剩余的边,为e

中边对应的权重。
[0095]
3、图嵌入。本技术实施例可以将缩减后的图g

嵌入为邻接矩阵右拼接服务得分列向量的形式表示,即:
[0096][0097]
其中,socre=[s1ꢀ…ꢀ
sm]
t
,表示服务得分的列向量;||为横向拼接符;r
ij
定义如下式:
[0098][0099]
4、数据集划分。本技术实施例可以将嵌入后的矩阵embed(g

)的每一行代表一个服务收到的打分和自己的得分,因此可以将embed(g

)按行切分成m个行向量,并将其大部分作为训练数据集,其余作为测试数据集。
[0100]
步骤s502:替代模型构建中,基于生成对抗网络(gan)构建替代模型,模型以服务得到的用户打分序列为输入,输出服务得分的预测值。作为一种可能实现的方式,本技术实施例可以由深度学习模型构建,具体地,在替代模型构建中,基于生成对抗网络(gan)构建了替代模型,如图2所示,模型以服务得到的用户打分序列为输入,输出服务得分的预测值。
[0101]
其中,替代模型为生成对抗网络中的生成器,利用深度神经网络,从用户打分序列预测服务得分,并利用深度神经网络生成对抗网络中的判别器,输入为用户打分序列和对应的服务得分,判断输入的服务得分是原始模型计算的真实得分,还是由生成器生成的虚
假得分,即执行二分类任务。进一步地,本技术实施例可以根据二人零和博弈相关知识,当生成对抗网络收敛时,生成器的鲁棒性最强,即认为此时的生成器作为替代模型性能最优。
[0102]
具体地,替代模型的功能可以如下:
[0103][0104]
其中,为替代模型,f为在线评价系统的服务得分算法模型(即要提取的目标模型)。
[0105]
即要求在输入相同的打分序列的情况下,替代模型预测的服务得分要尽可能与原始模型的服务得分相同。
[0106]
进一步地,本技术实施例可以记:
[0107][0108]
其中,ri表示服务i收到的用户打分序列,表示所有服务收到的用户打分序列的集合。
[0109]
进一步地,打分序列分别与对应的原始服务得分算法模型生成的数据集合和替代模型生成的数据集合可以如下:
[0110]zreal
={ri||si|i∈[1,m]},
[0111][0112]
其中,z
real
表示所有服务收到的打分与对应真实得分组合的集合,而z
gen
表示所有服务收到的打分与替代模型预测得分组合的集合。
[0113]
进一步地,基于生成对抗网络的替代模型训练的目标函数可以如下:
[0114][0115]
其中,d为生成对抗网络中的判别器,而d(in)的输出值表示对输入in∈z
real
的置信度,值越高表示判别器对输入in越可能对应真实得分。
[0116]
其中,具体的替代模型训练算法伪代码可以如图3所示。
[0117]
步骤s503:使用预处理后的数据,设定不同超参数对替代模型进行模型训练,测试比较不同超参数下训练得到的模型性能,得到全局最优的替代模型。在实际执行过程中,如图4所示,本技术实施例可以利用预处理后的数据,设定不同超参数对替代模型进行模型训练,测试比较不同超参数下训练得到的模型性能,得到全局最优的替代模型,实现模型的训练、精调和测试,从而实现根据给定的数据进行模型提取,进而实现对在线评价系统的服务得分算法进行模型提取,可以在保护商业机密和算法安全性的前提下,提取出在线评价系统的服务的分算法,实现在线评价系统模型提取,实用性更高。
[0118]
进一步地,本技术实施例可以选择不同的优化算法和模型结构(生成器、判别器的网络层数、神经元数量)构成多组超参数。
[0119]
其中,本技术实施例可以对每组超参数进行模型训练。在模型训练过程中,本技术实施例每隔一定轮数的迭代进行一次模型测试,检测模型的性能与收敛情况,用以评估不同超参数下模型的表现。
[0120]
模型测试采用均方误差mse作为损失函数,计算公式可以如下:
[0121][0122]
其中,||代表测试的得分数。
[0123]
从上式看出,均方误差mse值越小,替代模型预测的服务得分与真实值越接近,即模型性能越好。
[0124]
综上所述,本技术实施例可以根据模型收敛速度、提取精度指标选出最优超参数组合,对应的模型为最优替代模型。
[0125]
根据本技术实施例提出的基于深度学习的在线评价系统模型提取方法,可以基于深度学习框架构建替代模型,利用经过图缩减预处理的在线评价系统数据集中的用户打分和服务得分数据,提高模型提取效率,进而缓解替代模型训练中可能发生的冷启动问题和数据规模大导致的难以训练与收敛慢的问题,并以不同超参数对替代模型进行模型训练,生成全局最优的替代模型,在保护商业机密和算法安全性的前提下,实现在线评价系统模型提取,可适用于数据给定情况下的模型提取,实用性更强。
[0126]
其次参照附图描述根据本技术实施例提出的基于深度学习的在线评价系统模型提取装置。
[0127]
图6是本技术实施例的基于深度学习的在线评价系统模型提取装置的方框示意图。
[0128]
如图6所示,该基于深度学习的在线评价系统模型提取装置10包括:生成模块100、构建模块200和提取模块300。
[0129]
具体地,生成模块100,用于基于在线评价系统数据集中的用户打分和服务得分数据,构建关于用户-服务的有向加权二分图,并根据有向加权二分图的特征进行图缩减,且将缩减后的图嵌入到矩阵中,生成预处理后的数据。
[0130]
构建模块200,用于基于深度学习框架构建替代模型,其中,替代模型以服务得到的用户打分序列为输入,输出服务得分的预测值。
[0131]
提取模块300,用于利用预处理后的数据,并以预设的不同超参数对替代模型进行模型训练,生成全局最优的替代模型。
[0132]
可选地,在本技术的一个实施例中,生成模块100进一步用于根据用户打分和服务得分数据将用户和服务分别抽象成图中的多个结点,且将服务得分抽象为对应结点的属性,及将用户对服务的打分抽象为图中的多条边,打分的分值抽象为对应边的权重,生成有向加权二分图,并根据有向加权二分图的用户和服务结点的度分布,从有向加权二分图中选取大于预设度的用户结点和服务结点,生成有向加权二分子图。
[0133]
可选地,在本技术的一个实施例中,提取模块300包括:选择单元和获取单元。
[0134]
其中,选择单元,用于选择不同的优化算法和模型结构构成多组超参数;训练单元,用于对多组超参数的每组超参数进行模型训练,其中,在模型训练过程中,每隔预设轮数的迭代进行一次模型测试,以检测模型的性能与收敛情况,评估不同超参数下模型的表现。
[0135]
获取单元,用于根据模型收敛速度及提取精度指标选出最优超参数组合,并基于最优超参数组合对应的模型为全局最优的替代模型。
[0136]
需要说明的是,前述对基于深度学习的在线评价系统模型提取方法实施例的解释说明也适用于该实施例的基于深度学习的在线评价系统模型提取装置,此处不再赘述。
[0137]
根据本技术实施例提出的基于深度学习的在线评价系统模型提取装置,可以基于深度学习框架构建替代模型,利用经过图缩减预处理的在线评价系统数据集中的用户打分和服务得分数据,提高模型提取效率,进而缓解替代模型训练中可能发生的冷启动问题和数据规模大导致的难以训练与收敛慢的问题,并以不同超参数对替代模型进行模型训练,生成全局最优的替代模型,在保护商业机密和算法安全性的前提下,实现在线评价系统模型提取,可适用于数据给定情况下的模型提取,实用性更强。
[0138]
图7为本技术实施例提供的电子设备的结构示意图。该电子设备可以包括:
[0139]
存储器701、处理器702及存储在存储器701上并可在处理器702上运行的计算机程序。
[0140]
处理器702执行程序时实现上述实施例中提供的基于深度学习的在线评价系统模型提取方法。
[0141]
进一步地,电子设备还包括:
[0142]
通信接口703,用于存储器701和处理器702之间的通信。
[0143]
存储器701,用于存放可在处理器702上运行的计算机程序。
[0144]
存储器701可能包含高速ram存储器,也可能还包括非易失性存储器(non-volatile memory),例如至少一个磁盘存储器。
[0145]
如果存储器701、处理器702和通信接口703独立实现,则通信接口703、存储器701和处理器702可以通过总线相互连接并完成相互间的通信。总线可以是工业标准体系结构(industry standard architecture,简称为isa)总线、外部设备互连(peripheral component,简称为pci)总线或扩展工业标准体系结构(extended industry standard architecture,简称为eisa)总线等。总线可以分为地址总线、数据总线、控制总线等。为便于表示,图7中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。
[0146]
可选地,在具体实现上,如果存储器701、处理器702及通信接口703,集成在一块芯片上实现,则存储器701、处理器702及通信接口703可以通过内部接口完成相互间的通信。
[0147]
处理器702可能是一个中央处理器(central processing unit,简称为cpu),或者是特定集成电路(application specific integrated circuit,简称为asic),或者是被配置成实施本技术实施例的一个或多个集成电路。
[0148]
本实施例还提供一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如上的基于深度学习的在线评价系统模型提取方法。
[0149]
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本技术的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不必须针对的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任一个或n个实施例或示例中以合适的方式结合。此外,在不相互矛盾的情况下,本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。
[0150]
此外,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性
或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。在本技术的描述中,“n个”的含义是至少两个,例如两个,三个等,除非另有明确具体的限定。
[0151]
流程图中或在此以其他方式描述的任何过程或方法描述可以被理解为,表示包括一个或更n个用于实现定制逻辑功能或过程的步骤的可执行指令的代码的模块、片段或部分,并且本技术的优选实施方式的范围包括另外的实现,其中可以不按所示出或讨论的顺序,包括根据所涉及的功能按基本同时的方式或按相反的顺序,来执行功能,这应被本技术的实施例所属技术领域的技术人员所理解。
[0152]
在流程图中表示或在此以其他方式描述的逻辑和/或步骤,例如,可以被认为是用于实现逻辑功能的可执行指令的定序列表,可以具体实现在任何计算机可读介质中,以供指令执行系统、装置或设备(如基于计算机的系统、包括处理器的系统或其他可以从指令执行系统、装置或设备取指令并执行指令的系统)使用,或结合这些指令执行系统、装置或设备而使用。就本说明书而言,"计算机可读介质"可以是任何可以包含、存储、通信、传播或传输程序以供指令执行系统、装置或设备或结合这些指令执行系统、装置或设备而使用的装置。计算机可读介质的更具体的示例(非穷尽性列表)包括以下:具有一个或n个布线的电连接部(电子装置),便携式计算机盘盒(磁装置),随机存取存储器(ram),只读存储器(rom),可擦除可编辑只读存储器(eprom或闪速存储器),光纤装置,以及便携式光盘只读存储器(cdrom)。另外,计算机可读介质甚至可以是可在其上打印所述程序的纸或其他合适的介质,因为可以例如通过对纸或其他介质进行光学扫描,接着进行编辑、解译或必要时以其他合适方式进行处理来以电子方式获得所述程序,然后将其存储在计算机存储器中。
[0153]
应当理解,本技术的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中,n个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或固件来实现。如,如果用硬件来实现和在另一实施方式中一样,可用本领域公知的下列技术中的任一项或他们的组合来实现:具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路,具有合适的组合逻辑门电路的专用集成电路,可编程门阵列(pga),现场可编程门阵列(fpga)等。
[0154]
本技术领域的普通技术人员可以理解实现上述实施例方法携带的全部或部分步骤是可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,该程序在执行时,包括方法实施例的步骤之一或其组合。
[0155]
此外,在本技术各个实施例中的各功能单元可以集成在一个处理模块中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。所述集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读取存储介质中。
[0156]
上述提到的存储介质可以是只读存储器,磁盘或光盘等。尽管上面已经示出和描述了本技术的实施例,可以理解的是,上述实施例是示例性的,不能理解为对本技术的限制,本领域的普通技术人员在本技术的范围内可以对上述实施例进行变化、修改、替换和变型。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献