一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

终端评价模型的构建方法、装置和存储介质与流程

2022-02-22 01:57:02 来源:中国专利 TAG:


1.本发明涉及信息处理技术领域,特别涉及一种终端评价模型的构建方法、装置和存储介质。


背景技术:

2.目前,物联网用户规模在不断地扩大,业务流程越来越复杂、业务端到端环节也越来越多。为了提升业务的端到端体验,需要一套合理有效的终端质差评价方法,以确定哪些终端存在质量问题,以便及早进行处理。
3.由于物联网设备场景和品牌繁多、更新快,不同厂商、不同型号的设备的评价方法即存在相似性的部分、也存在差异的部分。不同终端厂商质差指标评价存在差异,需要针对不同厂商调差训练不同评价模型。
4.在相关技术中,通常采取对新设备重新进行数据采集、打标的工作,以便重新训练新设备对应的评价模型。


技术实现要素:

5.发明人经过分析后发现,针对不同厂商的终端采集样本并重新打标的方式费时费力。并且,目前也缺乏一套通用的评价模型构造方法,需要大量地进行人工调参工作,导致这一过程的自动化程度低。此外,即使对于同一型号和厂商的设备,设备在更新换代后评价指标也易发生浮动,导致难以迅速得到大量新的标注样本。一方面终端升级后,关键指标的物理大小意义可能会发生变化,重新训练模型会缺乏大量样本积累;另一方面,一旦指标发生变化,已标注样本在现有方法下基本失效,标注资源严重浪费。
6.本发明实施例所要解决的一个技术问题是:如何提高构建终端评价模型的自动化程度。
7.根据本发明一些实施例的第一个方面,提供一种终端评价模型的构建方法,包括:获取参考终端对应的第一样本集合、以及待评价终端对应的第二样本集合;根据第一样本集合和第二样本集合中样本的分布情况,确定每个指标对应的、由参考终端迁移到待评价终端的迁移函数;将第一样本集合中的样本的各个指标值输入相应的迁移函数以获得迁移的指标值,并根据迁移的指标值确定第一样本集合的迁移样本集合;基于迁移样本集合以及第二样本集合中的样本,训练待评价终端的评价模型。
8.在一些实施例中,根据第一样本集合和第二样本集合中样本的分布情况,确定每个指标对应的、由参考终端迁移到待评价终端的迁移函数包括:对于每个指标,按照预设的维度,分别将第一样本集合和第二样本集合中样本的相应指标值划分为多个区间;在每个区间上,分别确定参考终端和待评价终端的指标的代表值;根据参考终端和待评价终端分别对应的指标的代表值,确定指标对应的、由参考终端迁移到待评价终端的迁移函数。
9.在一些实施例中:每个指标对应的迁移函数的损失函数根据指标对应的迁移偏差和偏差权重确定;迁移偏差根据迁移函数基于参考终端的代表值计算的输出值、以及待评
价终端的在相应区间的代表值之间的差距确定;偏差权重根据参考终端和待评价终端在相应区间和相应指标上的代表值的差距确定。
10.在一些实施例中,在每个区间上,指标的代表值为区间中的指标值的中位数。
11.在一些实施例中,指标的迁移函数是基于最小二乘法求解的。
12.在一些实施例中:将参考终端和待评价终端在相应区间和相应指标上的代表值的差距作为波动值,在波动值不大于预设阈值的情况下,偏差权重根据迁移函数的输出值、以及待评价终端在相应区间和相应指标上的代表值之差确定;在波动值大于预设阈值的情况下,偏差权重根据波动值、以及预设阈值确定,其中,偏差权重与波动值成正相关关系。
13.在一些实施例中,分布情况为样本在采集时间的各个区间的分布情况、或者样本在指标的取值的各个区间的分布情况。
14.在一些实施例中,基于迁移样本集合以及第二样本集合中的样本,训练待评价终端的评价模型包括:根据迁移样本集合以及第二样本集合中的样本、以及样本初始的权重,构建待评价终端的评价模型;采用第二样本集合测试待评价终端的评价模型的测试错误率;根据测试错误率,对迁移样本集合以及第二样本集合中样本的权重进行调整;根据调整权重后的样本更新待评价终端的评价模型;判断当前是否满足预设条件,如果不满足,重复执行采用第二样本集合测试待评价终端的评价模型的测试错误率。
15.在一些实施例中:对于第二样本集合中的每个样本,在待评价终端的评价模型对样本预测错误的情况下,样本的调整后的权重与测试错误率成正相关关系;在待评价终端的评价模型对样本预测正确的情况下,不对样本进行调整;对于迁移样本集合中的每个样本,在待评价终端的评价模型对样本预测错误的情况下,样本的调整后的权重与测试错误率成负相关关系;在待评价终端的评价模型对样本预测正确的情况下,不对样本进行调整。
16.在一些实施例中,根据测试错误率,对迁移样本集合以及第二样本集合中样本的权重进行调整包括:计算更新参数,其中,更新参数与测试错误率成正相关关系;对于第二样本集合中的每个样本,在待评价终端的评价模型对样本预测错误的情况下,将样本的权重调整为原权重与更新参数的乘积;对于迁移样本集合中的每个样本,在待评价终端的评价模型对样本预测错误的情况下,将样本的权重调整为原权重与更新参数的商。
17.在一些实施例中,更新参数根据预测错误率、与1和预测错误率之差的比值确定。
18.在一些实施例中,待评价终端的评价模型为支持向量机模型svm、基于决策树算法的轻量级梯度提升模型lightgbm、长短记忆网络lstm模型。
19.在一些实施例中,构建方法还包括:将待测的待评价终端的数据输入到待评价终端的评价模型,获得对待测的待评价终端的评价结果。
20.在一些实施例中,参考终端和待评价终端为物联网终端。
21.根据本发明一些实施例的第二个方面,提供一种终端评价模型的构建装置,包括:获取模块,被配置为获取参考终端对应的第一样本集合、以及待评价终端对应的第二样本集合;迁移函数确定模块,被配置为根据第一样本集合和第二样本集合中样本的分布情况,确定每个指标对应的、由参考终端迁移到待评价终端的迁移函数;迁移样本集合确定模块,被配置为将第一样本集合中的样本的各个指标值输入相应的迁移函数以获得迁移的指标值,并根据迁移的指标值确定第一样本集合的迁移样本集合;训练模块,被配置为基于迁移样本集合以及第二样本集合中的样本,训练待评价终端的评价模型。
22.根据本发明一些实施例的第三个方面,提供一种终端评价模型的构建装置,包括:存储器;以及耦接至存储器的处理器,处理器被配置为基于存储在存储器中的指令,执行前述任意一种终端评价模型的构建方法。
23.根据本发明一些实施例的第四个方面,提供一种计算机可读存储介质,其上存储有计算机程序,其中,该程序被处理器执行时实现前述任意一种终端评价模型的构建方法。
24.上述发明中的一些实施例具有如下优点或有益效果:本发明实施例的方法通过构建迁移函数,实现了第一终端的样本向第二终端的迁移,使得待评价终端的评价模型在构建时可以具备更多的训练样本。并且,样本的迁移过程不需要人工参数,使得样本的生成效率、准确率都得到了提高。此外,迁移过程中考虑了样本的分布情况,使得迁移后的样本更符合第二终端的样本的特点,进一步提高了样本的可用性。因此,能够提高模型构建的自动化程度,并且通过这些样本构建模型的准确率和效率也得到了提高。
25.通过以下参照附图对本发明的示例性实施例的详细描述,本发明的其它特征及其优点将会变得清楚。
附图说明
26.为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
27.图1示出了根据本发明一些实施例的终端评价模型的构建方法的流程示意图。
28.图2示出了根据本发明一些实施例的迁移函数确定方法的流程示意图。
29.图3示出了根据本发明一些实施例的评价模型构造方法的流程示意图。
30.图4示出了根据本发明一些实施例的终端评价方法的流程示意图。
31.图5示出了根据本发明一些实施例的终端评价模型的构建装置的结构示意图。
32.图6示出了根据本发明另一些实施例的终端评价模型的构建装置的结构示意图。
33.图7示出了根据本发明又一些实施例的终端评价模型的构建装置的结构示意图。
具体实施方式
34.下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。以下对至少一个示例性实施例的描述实际上仅仅是说明性的,决不作为对本发明及其应用或使用的任何限制。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
35.除非另外具体说明,否则在这些实施例中阐述的部件和步骤的相对布置、数字表达式和数值不限制本发明的范围。
36.同时,应当明白,为了便于描述,附图中所示出的各个部分的尺寸并不是按照实际的比例关系绘制的。
37.对于相关领域普通技术人员已知的技术、方法和设备可能不作详细讨论,但在适当情况下,所述技术、方法和设备应当被视为授权说明书的一部分。
38.在这里示出和讨论的所有示例中,任何具体值应被解释为仅仅是示例性的,而不是作为限制。因此,示例性实施例的其它示例可以具有不同的值。
39.应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步讨论。
40.图1示出了根据本发明一些实施例的终端评价模型的构建方法的流程示意图。如图1所示,该实施例的终端评价模型的构建方法包括步骤s102~s108。
41.在步骤s102中,获取参考终端对应的第一样本集合、以及待评价终端对应的第二样本集合。第一样本集合和第二样本集合分别包括采集的相应终端的若干样本。
42.待评价终端是需要使用其他终端的样本的终端。在一些实施例中,第一样本集合中的样本数大于第二样本集合中的样本数。即,参考终端具有较为充足的数据,但是待评价终端自身的数据相对较少。
43.在一些实施例中,参考终端和待评价终端为不同厂商、或者不同型号的终端,或者为相同厂商和型号、但是分别为升级前和升级后的终端。从而,这两类终端存在一定的差异性,需要通过样本迁移来使得待评价终端能够使用参考终端迁移后的样本。
44.在一些实施例中,参考终端和待评价终端为物联网终端,例如智能水表、智能电表等等。物联网终端的特征例如包括注册或激活特性指标(例如注册请求次数、注册平均请求时长等等)、下行控制特征指标(例如下行con成功次数、下行con平均成功响应时长、下行con流量等等,con表示需要被确认的请求)、终端上报特征指标(例如上行non请求次数、上行non心跳平均请求时长、上行non业务平均请求时长,non表示不需要被确认的请求)、平台响应特征指标(例如下行non请求次数、下行non平均请求时长等等)。
45.在一些实施例中,参考终端和待评价终端为具有同一用途的终端,例如都为智能水表、或者智能电表。从而,参考终端和待评价终端存在一定的相似性,使得迁移后的样本可用性更强。
46.在一些实施例中,第一样本集合和第二样本集合中各个样本的指标是原始样本中的关键指标。例如利用主成分分析、线性判别分析等方法,从原始样本的全部指标中提取关键指标,以确定由关键指标构成的第一样本集合和第二样本集合中的样本。从而,可以使得用于终端质量评价的样本能够更准确地反映终端的特点。
47.在步骤s104中,根据第一样本集合和第二样本集合中样本的分布情况,确定每个指标对应的、由参考终端迁移到待评价终端的迁移函数。
48.迁移函数用于描述迁移前和迁移后的数据之间的关系。在一些实施例中,迁移函数的输入为第一样本集合的指标的值,输出为相应指标的迁移后的值。
49.由于参考终端和待评价终端的样本存在差异,因此在构建迁移函数时,需要考虑二者的分布特点。在一些实施例中,分布情况为样本在采集时间的各个区间的分布情况、或者样本在指标的取值的各个区间的分布情况。
50.在步骤s106中,将第一样本集合中的样本的各个指标值输入相应的迁移函数以获得迁移的指标值,并根据迁移的指标值确定第一样本集合的迁移样本集合。迁移样本集合中的样本即根据第一样本集合生成的、模拟第二终端的样本的数据。
51.在步骤s108中,基于迁移样本集合以及第二样本集合中的样本,训练待评价终端的评价模型。
52.在一些实施例中,评价模型为分类模型,每个类别对应一种评价等级。
53.在一些实施例中,评价模型为终端质差评价模型。通过该模型,可以识别出质差终端和非质差终端,以便针对质差终端及时进行更换、修复等操作。
54.在一些实施例中,评价模型为支持向量机模型svm、基于决策树算法的轻量级梯度提升模型lightgbm、长短记忆网络lstm模型。根据需要,本领域技术人员还可以使用其他模型,这里不再赘述。
55.上述实施例的方法通过构建迁移函数,实现了第一终端的样本向第二终端的迁移,使得待评价终端的评价模型在构建时可以具备更多的训练样本。并且,样本的迁移过程不需要人工参数,使得样本的生成效率、准确率都得到了提高。此外,迁移过程中考虑了样本的分布情况,使得迁移后的样本更符合第二终端的样本的特点,进一步提高了样本的可用性。因此,能够提高模型构建的自动化程度,并且通过这些样本构建模型的准确率和效率也得到了提高。
56.下面参考图2描述本发明迁移函数确定方法的实施例。
57.图2示出了根据本发明一些实施例的迁移函数确定方法的流程示意图。如图2所示,对于每个指标,该实施例的迁移函数确定方法包括步骤s202~s206。
58.在步骤s202中,按照预设的维度,分别将第一样本集合和第二样本集合中样本的相应指标值划分为多个区间。
59.在一些实施例中,第一样本集合的区间数和第二样本集合的区间数相等,并且每个第一样本集合的区间都与一个第二样本集合的区间对应。
60.在一些实施例中,当预设的维度为采集时间时,将不同时间周期中同一时段作为相同的区间,相同的时段是指在不同时间周期中具有相同的时间偏移量的时段。例如,当第一样本集合覆盖10天时,对于中的数据,将10天中所有8:00-9:00采集的数据划分到区间1、将所有9:00-10:00采集的数据划分到区间2等等。当第二样本集合覆盖1天时,也按小时对数据进行划分。从而,虽然第一样本集合和第二样本集合中的数据量存在差异,但是通过这种划分方式,能够将同一区间的数据进行对应。
61.在一些实施例中,当预设的维度为数据量时,可以统计采集的数据的数据分布,该分布的横坐标表示数据的取值、纵坐标表示该取值下的数据量;然后,依据纵坐标划分区间、进而将采集的数据划分为多个区间。例如,在分别统计第一样本集合和第二样本集合的数据分布后,第一样本集合的纵坐标覆盖范围为0到100、第二样本集合的纵坐标覆盖范围为0到10。将第一样本集合和第二样本集合均划分为10个区间,则第一样本集合的纵坐标为[0,10)的区间对应第二样本集合的纵坐标为[0,1)的区间。
[0062]
在步骤s204中,在每个区间上,分别确定参考终端和待评价终端的、该指标的代表值。
[0063]
在一些实施例中,在每个区间上,指标的代表值为区间中的指标值的中位数。根据需要,也可以将平均值等其他统计值、或者数据分布特征值作为代表值。
[0064]
通过划分区间,可以将参考终端在相应指标和相应区间上的代表值进行对应。迁移的目标是使得参考终端的代表值经过迁移后,等于待评价终端在相应指标和相应区间上的代表值。当然,“等于”的情况是理想情况。迁移函数会使得迁移后的值最大限度地接近待评价终端在相应指标和相应区间上的代表值。
[0065]
在步骤s206中,根据参考终端和待评价终端分别对应的指标的代表值,确定该指标对应的、由参考终端迁移到待评价终端的迁移函数。
[0066]
在一些实施例中,指标的迁移函数是基于最小二乘法求解的。例如,为某个指标构建的迁移函数为f(x),损失函数为建的迁移函数为f(x),损失函数为则可以通过最小二乘法求解f(x),其中,i表示代表值的标识、n表示参考终端的代表值的数量、yi表示待评价终端的第i个代表值、xi表示参考终端的第i个代表值、f(xi)表示参考终端的第i个代表值的迁移值。参考终端和待评价终端的具有相同标识的代表值属于相对应的区间。
[0067]
在一些实施例中,考虑到采集的数据中存在噪点或异常值的情况,对于每个指标:指标对应的迁移函数的损失函数根据迁移偏差和偏差权重确定;迁移偏差根据迁移函数基于参考终端的代表值计算的输出值、以及待评价终端的在相应区间的代表值之间的差距确定;偏差权重根据参考终端和待评价终端在相应区间和相应指标上的代表值的差距确定。从而,通过引入偏差权重,可以迁移偏差的大小,使得损失函数的表示更合理。
[0068]
在一些实施例中,将参考终端和待评价终端在相应区间和相应指标上的代表值的差距作为波动值,在波动值不大于预设阈值的情况下,偏差权重根据迁移函数的输出值、以及待评价终端在相应区间和相应指标上的代表值之差确定;在波动值大于预设阈值的情况下,偏差权重根据波动值、以及预设阈值确定,其中,偏差权重与波动值成正相关关系。
[0069]
公式(1)和(2)示例性地示出了一种损失函数的表示方式。
[0070][0071][0072]
在公式(1)和(2)中,loss表示损失值;i表示代表值的标识、n表示参考终端的代表值的数量;yi表示待评价终端的第i个代表值、xi表示参考终端的第i个代表值、f(xi)表示参考终端的第i个代表值的迁移值;αi表示参考终端的第i个代表值对应的偏差权重;|x|=|y
i-xi|,表示波动值;k表示预设阈值,其具体数值可以通过多次实验来确定。
[0073]
上述实施例根据将偏差权重视为“噪点因子”,来调节异常点对迁移函数影响,更新后的优化函数。这种损失函数的构建方式根据参考终端和待评价终端样本的分布偏差来调节偏差权重,即,将在合理偏差区间内的样本点权重调大、将在偏离区间较大的权值调小甚至调负。从而,可以更有效地消除异常点的影响,提高了迁移函数的准确性。
[0074]
下面参考图3描述评价模型构造方法的实施例。
[0075]
图3示出了根据本发明一些实施例的评价模型构造方法的流程示意图。如图3所示,该实施例的构造方法包括步骤s302~s308。
[0076]
在步骤s302中,根据迁移样本集合以及第二样本集合中的样本、以及样本初始的权重,构建待评价终端的评价模型。
[0077]
在一些实施例中,根据每个集合中的样本数量,设置相应集合中样本初始的权重。例如,设迁移样本集合中样本的数量为m、第二样本集合中样本的数量为n,则迁移样本集合以及第二样本集合中样本的权重分别为1/m和1/n。
[0078]
在一些实施例中,通过样本的权重确定样本在训练的一次迭代过程中的使用次数,权重越大、使用次数越多。
[0079]
然后,重复步骤s304~s308,直到满足预设条件。预设条件例如为达到预设的迭代次数、或者计算的错误率小于预设值等等。如果满足预设条件,则停止训练过程。
[0080]
在步骤s304中,采用第二样本集合测试待评价终端的评价模型的测试错误率。
[0081]
在一些实施例中,测试错误率为预测错误的样本数和所有样本数的比值。
[0082]
在步骤s306中,根据测试错误率,对迁移样本集合以及第二样本集合中样本的权重进行调整。
[0083]
在一些实施例中,对于第二样本集合中的每个样本,在待评价终端的评价模型对样本预测错误的情况下,样本的调整后的权重与测试错误率成正相关关系;对于迁移样本集合中的每个样本,在待评价终端的评价模型对样本预测错误的情况下,样本的调整后的权重与测试错误率成负相关关系。而对于这两个集合中的样本,在待评价终端的评价模型对样本预测正确的情况下,则不对样本进行调整。
[0084]
从而,当前评价模型如果在迁移样本集合的某样本进行了错误的评估,说明迁移样本集合中的该样本在理论上会对模型产生不利的影响,因此弱化其权重。当模型对第二样本集合的某样本产生了错误的评估,说明该样本在模型构造中影响力较弱,需要增强其权重。通过这种调整方式,能够考虑到不同来源的数据特性,来调整训练过程中数据的重要性,从而提升了模型的预测准确率。
[0085]
在一些实施例中,利用计算的更新参数调整权重,其中,更新参数与测试错误率成正相关关系。对于第二样本集合中的每个样本,在待评价终端的评价模型对样本预测错误的情况下,将样本的权重调整为原权重与更新参数的乘积;对于迁移样本集合中的每个样本,在待评价终端的评价模型对样本预测错误的情况下,将样本的权重调整为原权重与更新参数的商。
[0086]
在一些实施例中,更新参数根据预测错误率、与1和预测错误率之差的比值确定。
[0087]
公式(3)示例性地示出了错误率的计算公式。
[0088][0089]
在公式(3)中,t表示训练的迭代次数,∈
t
表示第t次迭代的错误率;i表示样本的标识,其中,第1~n个样本为第一样本集合中的样本、第n 1~n m个样本为第二样本集合中的样本;表示第t次迭代中第i个样本的权重;h
t
(xi)表示第t次迭代中模型对第i个样本的分类结果,l(xi)表示第i个样本的标记值。
[0090]
基于公式(3)中各个参数的定义,公式(4)和(5)示例性地示出了权重的一种更新方式,其中,β
t
表示第t次迭代中的更新参数。
[0091]
β
t
=∈
t
/(1-∈
t
)
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(4)
[0092][0093]
在步骤s308中,根据调整权重后的样本更新待评价终端的评价模型。
[0094]
上述实施例的方法在训练过程中,根据预测的错误率来调整用于训练的样本的权重,从而可以降低样本的轻微偏差对模型造成的影响,提高了模型预测的准确率。
[0095]
在完成待评价终端的评价模型的训练后,可以进行预测过程。下面参考图4描述本发明终端评价方法的实施例。
[0096]
图4示出了根据本发明一些实施例的终端评价方法的流程示意图。如图4所示,该实施例的终端评价方法包括步骤s402~s404。
[0097]
在步骤s402中,将待测的待评价终端的数据输入到待评价终端的评价模型。
[0098]
在步骤s404中,获得待评价终端的评价模型输出的、对待测的待评价终端的评价结果。
[0099]
从而,当待评价终端的样本数据较少时,也能够通过前述各个实施例的方法获得准确的待评价终端的评价模型,并对待评价终端的质量进行更准确的评价。
[0100]
下面参考图5描述本发明评价模型的构建装置的实施例。
[0101]
图5示出了根据本发明一些实施例的终端评价模型的构建装置的结构示意图。如图5所示,该实施例的终端评价模型的构建装置50包括:获取模块510,被配置为获取参考终端对应的第一样本集合、以及待评价终端对应的第二样本集合;迁移函数确定模块520,被配置为根据第一样本集合和第二样本集合中样本的分布情况,确定每个指标对应的、由参考终端迁移到待评价终端的迁移函数;迁移样本集合确定模块530,被配置为将第一样本集合中的样本的各个指标值输入相应的迁移函数以获得迁移的指标值,并根据迁移的指标值确定第一样本集合的迁移样本集合;训练模块540,被配置为基于迁移样本集合以及第二样本集合中的样本,训练待评价终端的评价模型。
[0102]
在一些实施例中,迁移函数确定模块520进一步被配置为:对于每个指标,按照预设的维度,分别将第一样本集合和第二样本集合中样本的相应指标值划分为多个区间;在每个区间上,分别确定参考终端和待评价终端的指标的代表值;根据参考终端和待评价终端分别对应的指标的代表值,确定指标对应的、由参考终端迁移到待评价终端的迁移函数。
[0103]
在一些实施例中,每个指标对应的迁移函数的损失函数根据指标对应的迁移偏差和偏差权重确定;迁移偏差根据迁移函数基于参考终端的代表值计算的输出值、以及待评价终端的在相应区间的代表值之间的差距确定;偏差权重根据参考终端和待评价终端在相应区间和相应指标上的代表值的差距确定。
[0104]
在一些实施例中,在每个区间上,指标的代表值为区间中的指标值的中位数。
[0105]
在一些实施例中,指标的迁移函数是基于最小二乘法求解的。
[0106]
在一些实施例中,将参考终端和待评价终端在相应区间和相应指标上的代表值的差距作为波动值,在波动值不大于预设阈值的情况下,偏差权重根据迁移函数的输出值、以及待评价终端在相应区间和相应指标上的代表值之差确定;在波动值大于预设阈值的情况下,偏差权重根据波动值、以及预设阈值确定,其中,偏差权重与波动值成正相关关系。
[0107]
在一些实施例中,分布情况为样本在采集时间的各个区间的分布情况、或者样本在指标的取值的各个区间的分布情况。
[0108]
在一些实施例中,训练模块540进一步被配置为:根据迁移样本集合以及第二样本集合中的样本、以及样本初始的权重,构建待评价终端的评价模型;采用第二样本集合测试待评价终端的评价模型的测试错误率;根据测试错误率,对迁移样本集合以及第二样本集
合中样本的权重进行调整;根据调整权重后的样本更新待评价终端的评价模型;判断当前是否满足预设条件,如果不满足,重复执行采用第二样本集合测试待评价终端的评价模型的测试错误率。
[0109]
在一些实施例中,对于第二样本集合中的每个样本,在待评价终端的评价模型对样本预测错误的情况下,样本的调整后的权重与测试错误率成正相关关系;在待评价终端的评价模型对样本预测正确的情况下,不对样本进行调整;对于迁移样本集合中的每个样本,在待评价终端的评价模型对样本预测错误的情况下,样本的调整后的权重与测试错误率成负相关关系;在待评价终端的评价模型对样本预测正确的情况下,不对样本进行调整。
[0110]
在一些实施例中,训练模块540进一步被配置为:计算更新参数,其中,更新参数与测试错误率成正相关关系;对于第二样本集合中的每个样本,在待评价终端的评价模型对样本预测错误的情况下,将样本的权重调整为原权重与更新参数的乘积;对于迁移样本集合中的每个样本,在待评价终端的评价模型对样本预测错误的情况下,将样本的权重调整为原权重与更新参数的商。
[0111]
在一些实施例中,更新参数根据预测错误率、与1和预测错误率之差的比值确定。
[0112]
在一些实施例中,待评价终端的评价模型为支持向量机模型svm、基于决策树算法的轻量级梯度提升模型lightgbm、长短记忆网络lstm模型。
[0113]
在一些实施例中,终端评价模型的构建装置50还包括:预测模块550,被配置为将待测的待评价终端的数据输入到待评价终端的评价模型,获得对待测的待评价终端的评价结果。
[0114]
在一些实施例中,参考终端和待评价终端为物联网终端。
[0115]
图6示出了根据本发明另一些实施例的终端评价模型的构建装置的结构示意图。如图6所示,该实施例的终端评价模型的构建装置60包括:存储器610以及耦接至该存储器610的处理器620,处理器620被配置为基于存储在存储器610中的指令,执行前述任意一个实施例中的终端评价模型的构建方法。
[0116]
其中,存储器610例如可以包括系统存储器、固定非易失性存储介质等。系统存储器例如存储有操作系统、应用程序、引导装载程序(boot loader)以及其他程序等。
[0117]
图7示出了根据本发明又一些实施例的终端评价模型的构建装置的结构示意图。如图7所示,该实施例的终端评价模型的构建装置70包括:存储器710以及处理器720,还可以包括输入输出接口730、网络接口740、存储接口750等。这些接口730,740,750以及存储器710和处理器720之间例如可以通过总线760连接。其中,输入输出接口730为显示器、鼠标、键盘、触摸屏等输入输出设备提供连接接口。网络接口740为各种联网设备提供连接接口。存储接口750为sd卡、u盘等外置存储设备提供连接接口。
[0118]
本发明的实施例还提供一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现前述任意一种终端评价模型的构建方法。
[0119]
本领域内的技术人员应当明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用非瞬时性存储介质(包括但不限于磁盘存储器、cd-rom、光学存储器等)上实施的计算机程序产品的形式。
[0120]
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解为可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
[0121]
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
[0122]
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
[0123]
以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献