一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种权重确定方法、装置、设备及存储介质与流程

2021-11-26 23:53:00 来源:中国专利 TAG:


1.本技术涉及数据处理技术,尤其涉及人工智能技术,特别涉及一种权重确定方法、装置、设备及存储介质。


背景技术:

2.对象之间普遍存在着或多或少的联系,而部分对象会因为至少两种参考因素的影响,导致其属性数据,也即属性元素的属性值,产生显著差异。
3.由于不同参考因素对对象的属性数据的影响可能不同,而各参考因素之间还可能存在某种关联,使得不同参考因素对属性数据的影响程度无法确定。
4.如何使用计算机技术来量化各参考因素对对象的属性数据的影响程度,目前尚没有特别成熟的解决办法。


技术实现要素:

5.根据本技术第一方面,本技术实施例提供了一种权重确定方法,包括:
6.获取目标参考因素和各邻近参考因素之间的结构化表示的因素关联数据;其中,所述目标参考因素和所述邻近参考因素对目标对象的属性数据具有影响;
7.确定所述目标参考因素和目标场景之间的需求紧密度数据;其中,所述目标场景具有对所述目标参考因素的使用需求;
8.根据所述因素关联数据和所述需求紧密度数据,确定在所述目标场景下,所述目标参考因素在所述目标对象的各参考因素中的属性支配权重。
9.根据本技术第二方面,本技术实施例还提供了一种权重确定装置,包括:
10.因素关联数据获取模块,用于获取目标参考因素和各邻近参考因素之间的结构化表示的因素关联数据;其中,所述目标参考因素和所述邻近参考因素对目标对象的属性数据具有影响;
11.需求紧密度数据确定模块,用于确定所述目标参考因素和目标场景之间的需求紧密度数据;其中,所述目标场景具有对所述目标参考因素的使用需求;
12.属性支配权重确定模块,用于根据所述因素关联数据和所述需求紧密度数据,确定在所述目标场景下,所述目标参考因素在所述目标对象的各参考因素中的属性支配权重。
13.根据本技术第三方面,本技术实施例还提供了一种电子设备,包括:
14.至少一个处理器;以及
15.与所述至少一个处理器通信连接的存储器;其中,
16.所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行第一方面实施例所提供的一种权重确定方法。
17.根据本技术第四方面,本技术实施例还提供了一种存储有计算机指令的非瞬时计
算机可读存储介质,所述计算机指令用于使所述计算机执行第一方面实施例所提供的一种权重确定方法。
18.采用上述技术方案,确定了在目标场景下,目标参考因素在目标对象的各参考因素中的属性支配权重。
19.应当理解,本部分所描述的内容并非旨在标识本技术的实施例的关键或重要特征,也不用于限制本技术的范围。本技术的其它特征将通过以下的说明书而变得容易理解。
附图说明
20.附图用于更好地理解本方案,不构成对本技术的限定。其中:
21.图1是本技术实施例提供的一种权重确定方法的流程图;
22.图2a是本技术实施例提供的另一种权重确定方法的流程图;
23.图2b是本技术实施例提供的一种因素支配网络的结构图;
24.图3a是本技术实施例提供的另一种权重确定方法的流程图;
25.图3b是本技术实施例提供的一种场景感知网络的结构图;
26.图4a是本技术实施例提供的一种基于支配权重对技能价值数据处理的方法的流程图;
27.图4b是本技术实施例提供的一种技能图;
28.图4c本技术实施例提供的一种技能定价组合模型的结构示意图;
29.图4d本技术实施例提供的一种技能定价网络的结构示意图;
30.图4e本技术实施例提供的一种技能支配网络的结构示意图;
31.图5是本技术实施例提供的一种权重确定装置的结构图;
32.图6是用来实现本技术实施例的权重确定方法的电子设备的框图。
具体实施方式
33.以下结合附图对本技术的示范性实施例做出说明,其中包括本技术实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本技术的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
34.本技术实施例所提供的各权重确定方法,适用于在特定应用场景下,对影响目标对象的属性数据的各参考因素,对目标对象的属性数据的影响程度进行量化的情况,该方法由权重确定装置执行,该装置采用软件和/或硬件实现,并具体配置于电子设备中。
35.由于不同参考因素对相同目标对象的属性数据的影响可能不同,相同参考因素对不同目标对象的属性数据的影响也可能存在差异,因此,本技术所提供的权重确定方法尝试对各参考因素对目标对象的属性数据的影响程度进行量化确定。
36.示例性地,目标对象可以是职业岗位,目标对象的属性数据可以是岗位薪酬,参考因素可以是工作技能,例如可以是某职业岗位所需的职业技能中的至少一种,例如算法技能、编程语言技能等。
37.以职业岗位的岗位薪酬受至少两项工作技能的影响为例进行说明。例如,java工程师需要精通java语言,还可以需要具备mysql等数据库处理能力,那么java技能和mysql
技能对java工程师的岗位薪酬的影响程度不同。又如,同时具备java技能和c 技能的java工程师,与同时具备c 技能和java技能的c 工程师,java技能和c 技能分别对java工程师的岗位薪酬和对c 工程师的岗位薪酬的影响程度也不同。
38.示例性地,目标对象可以是旅游景点,目标对象可以是旅游景点的门票价格,参考因素可以包括景点位置、景点周边路况、景点周边车流量和景点历史收入等因素。而景点位置、景点周边路况、景点周边车流量和景点历史收入等至少两者之间相互影响,但不同参考因素对该旅游景点的门票价格的影响程度存在一定差异。
39.有鉴于此,本技术实施例提供了至少一种权重确定方法,用于对影响目标对象的属性数据的各参考因素,对目标对象的属性数据产生影响的影响程度进行量化。
40.图1是本技术实施例提供的一种权重确定方法的流程图,该方法包括:
41.s101、获取目标参考因素和各邻近参考因素之间的结构化表示的因素关联数据;其中,所述目标参考因素和所述邻近参考因素影响目标对象的属性数据。
42.其中,目标参考因素可以理解为待确定权重的参考因素,邻近参考因素可以理解为与目标参考因素具备关联,能够和目标参考因素共同影响目标对象的属性数据的参考因素。其中,因素关联数据,可以理解为能够表征目标参考因素与邻近参考因素之间关联关系的数据。
43.当影响目标对象的属性数据的参考因素为至少两个时,各参考因素之间可能存在一定关联,存在关联的各参考因素,互为邻近参考因素。仍以职业岗位的岗位薪酬受至少两项工作技能的影响为例进行说明。例如,java工程师不仅需要精通java语言,还需要具备mysql等数据库处理能力,java技能和mysql技能的技能价值相互之间存在一定的影响,此时,java技能和mysql技能在影响java工程师这一岗位的岗位薪酬时,互为邻近参考因素。又如,具备java技能的java工程师,同时具备c 技能,该java工程师的java技能和c 技能的技能价值也会相互影响又各自存在区别,此时,java技能和c 技能在影响java工程师这一岗位的岗位薪酬时,互为邻近参考因素。
44.在本技术实施例的一种可选实施方式中,可以在电子设备本地或与电子设备关联的存储设备中,预先针对各目标对象,存储对该目标对象的属性数据具备影响的互为邻近参考因素的参考因素之间的因素关联数据。相应的,在需要时,在电子设备本地或与电子设备关联的存储设备中,通过目标对象和目标参考因素以及邻近参考因素,进行因素关联数据的查找获取。
45.在本技术实施例的另一可选实施方式中,还可以预先获取大量的对目标对象的属性数据存在影响的参考因素,并统计不同参考因素的共现频率。相应的,根据目标参考因素和各邻近参考因素的共现频率构建矩阵,得到因素关联数据。
46.为了便于共现频率的查找获取,还可以在统计不同参考因素的共现频率之后,将各参考因素作为节点,将互为邻近参考因素的节点通过边相连接,并将共现频率作为连边的属性信息,生成参考因素图加以存储。后续通过对参考因素图中的数据进行增删改查,实现对参考因素图的更新。相应的,在获取因素关联数据时,通过查找参考因素图的方式,确定目标参考因素和各邻近参考因素的共现频率,进而生成包含各目标参考因素和邻近参考因素的共现频率的矩阵,将生成的矩阵作为因素关联数据。
47.可以理解的是,为了便于后续基于因素关联数据进行计算,通常会将非结构化的
因素关联数据,按照设定转化规则,转化为结构化的因素关联数据。其中,设定转化规则可以由技术人员根据需要或经验值进行确定。
48.s102、确定所述目标参考因素和目标场景之间的需求紧密度数据;其中,所述目标场景具有对所述目标参考因素的使用需求。
49.示例性地,若目标参考因素为工作技能,则目标场景可以是企事业单位等技能需求方,例如可以是公司、企业、事业单位、或科研实验室等。
50.示例性地,若目标参考因素为与旅游景点相关的因素,则目标场景可以是景区开放时段等。
51.示例性地,可以采用多层感知机、因子分解机或其他特征提取网络,对目标参考因素的属性数据和目标场景的属性数据进行特征提取,从而确定目标参考因素与目标场景之间的需求紧密度数据。
52.为了提高所提取需求紧密度数据的准确性和全面性,在本技术实施例的一种可选实施方式中,可以采用预先训练好的场景感知网络,对所述目标参考因素的属性数据和所述目标场景的属性数据进行特征抽取,得到所述需求紧密度数据。其中,场景感知网络可以采用大量样本参考因素的属性数据和样本参考因素所关联的样本场景的属性数据,作为训练样本输入至预先构建的第一神经网络模型中,并根据模型输出结果和样本参考因素对样本对象的属性数据产生影响的样本属性值的偏差,对第一神经网络模型的网络参数加以优化,从而得到训练好的场景感知网络。
53.其中,目标参考因素的属性数据和目标场景的属性数据,可以预先存储在电子设备本地或与电子设备关联的其他存储设备,并在需要时进行数据获取。
54.为了便于后续计算,所获取的目标参考因素的属性数据和目标场景的属性数据,可以是结构化表示的数据。可以理解的是,当获取到的目标参考因素的属性数据和目标场景的属性数据为非结构化表示的数据时,还可以将所获取数据进行格式转化后,得到结构化数据。
55.需要说明的是,目标场景的属性数据可以包括离散场景数据和/或连续场景数据。
56.其中,连续场景数据用于人为设定目标场景与参考因素之间的关联,以便在进行需求紧密度数据确定时,依据该关系进行设定维度特征的提取,也即从连续场景自身查找特征规律。以职业岗位的岗位薪酬受至少两项工作技能的影响为例,连续场景数据可以包括企事业单位自自身属性,如单位类型、年限、城市、详细地址等信息中的至少一种。连续场景数据还可以包括历史统计属性,如城市历史月薪统计数据,具体包括历史月薪的均值、方差、最大值和最小值等数据中的至少一种。例如,位于a市的已成立13年的上市公司互联网公司b,招聘算法工程师,该职位历史月薪的均值为10000元,方差为500元,最高月薪为12000元,最低月薪为8000元,那么该目标场景所对应的连续场景数据可以是{[10000,500,12000,8000],[a市,b公司,上市公司,13年,互联网类]}。
[0057]
其中,离散场景数据用于仅限定目标对象自身对参考因素的需求,以便后续基于该需求进行非设定维度特征的挖掘。仍以职业岗位的岗位薪酬受至少两项工作技能的影响为例,离散场景数据可以包括技能需求属性,具体包括工作经验和毕业年限等中的至少一种。例如,公司b招聘的算法工程师要求工作地点在c市,应届毕业生,那么该目标场景所对应的离散场景数据可以是[c市,应届毕业生]。
[0058]
s103、根据所述因素关联数据和所述需求紧密度数据,确定在所述目标场景下,所述目标参考因素在所述目标对象的各参考因素中的属性支配权重。
[0059]
示例性地,可以采用图网络,根据因素关联数据和需求紧密度数据,确定在目标场景下,目标参考因素在目标对象的各参考因素中的属性支配权重。示例性地,图网络可以是图卷积神经网络或其他神经网络。
[0060]
为了提高所确定的属性支配权重的确定效率和确定结果准确度,在本技术实施例的一种可选实施方式中,可以采用预先训练好的因素支配网络,根据所述因素关联数据和所述需求紧密度数据,确定在所述目标场景下,所述目标参考因素在所述目标对象的各参考因素中的属性支配权重。其中,因素支配网络采用如下方式进行训练:获取大量样本参考因素和样本邻近参考因素之间的样本因素关联数据,以及样本参考因素和样本场景之间的需求紧密度数据,作为训练样本输入至预先构建的图卷积神经网络中,并确定模型输出结果与各参考因素对应的样本属性值的加权和,根据该和值与样本薪酬的偏差,对图卷积神经网络的网络参数加以优化,从而得到训练好的因素支配网络。
[0061]
本技术实施例通过获取目标参考因素和各邻近参考因素之间的结构化表示的因素关联数据;其中目标参考因素和邻近参考因素对目标对象的属性数据具有影响;确定目标参考因素和目标场景之间的需求紧密度数据;其中目标场景具有对目标参考因素的使用需求;根据因素关联数据和需求紧密度数据,确定在所述目标场景下,目标参考因素在目标对象的各参考因素中的属性支配权重。上述技术方案通过引入目标参考因素和邻近参考因素之间的因素关联数据,进行属性支配权重确定,从而在目标场景下,将存在相互影响的参考因素,对目标对象的属性数据的影响程度进行剥离,从而实现了对单一参考因素,在目标场景下对目标对象的属性数据的影响程度的量化。同时,通过引入目标参考因素和目标场景之间的需求紧密度数据,使得在属性支配权重确定过程中,充分考量参考因素与目标场景之间的关系,为属性支配权重的准确度提供了保障。
[0062]
在上述各技术方案的基础上,还可以在根据所述因素关联数据和所述需求紧密度数据,确定所述目标参考因素在所述目标对象的各参考因素中的属性支配权重之后,确定目标参考因素在目标场景下,所产生的目标对象的目标属性值;采用属性支配权重对目标属性值进行加权,以更新目标属性值。
[0063]
可以理解的是,通过目标参考因素的属性支配权重,对未考虑邻近参考因素时确定的目标属性值进行更新,能够实现对目标对象的属性数据更细粒度的确定,提高了所确定的目标属性值的准确度。
[0064]
示例性地,确定目标参考因素在目标场景下,所产生的目标对象的属性数据的目标属性值,可以是:采用前述训练好的场景感知网络,对目标参考因素的属性数据和目标场景的属性数据进行特征抽取,得到需求紧密度数据;根据需求紧密度数据,确定目标参考因素在目标场景下,所产生的目标对象的目标属性值。
[0065]
示例性地,根据需求紧密度数据,确定目标参考因素在目标场景下,所产生的目标对象的目标属性值,可以是:可以采用预先训练好的第二神经网络模型,根据需求紧密度数据,确定目标参考因素在目标场景下,所产生的目标对象的目标属性值。其中,第二神经网络模型和第一神经网络模型的网络结构可以相同或不同。示例性地,该第二神经网络可以是全连接神经网络。
[0066]
当目标对象的属性数据为非负值时,可选的,可以通过在第二神经网络模型中引入非负激活函数,以保证所确定的目标属性值的非负性。
[0067]
可选的,当目标对象的属性数据为包含两个边界值的数值区间时,可选的,可以分别针对各边界值进行第二神经网络模型的训练,相应的,分别采用各自训练好的第二神经网络模型,进行目标属性值的确定。
[0068]
可以理解的是,目标参考因素的属性支配权重用于对目标属性值进行加权,从而进行目标属性值的更新。当目标属性值为包含两个边界值的数值区间时,相应的,目标参考因素的属性支配权重也可以是两个权重值,两权重值可以相同或不同。其中,权重值的不同可以通过在使用模型进行需求紧密度数据确定或使用模型进行属性支配权重确定过程中,所采用的模型的网络参数不同进行保证。
[0069]
图2a是本技术实施例提供的另一种权重确定方法的流程图,本技术实施例在上述各实施例的技术方案的基础上,进行了优化改进。
[0070]
进一步地,将操作“根据所述因素关联数据和所述需求紧密度数据,确定在所述目标场景下,所述目标参考因素在所述目标对象的各参考因素中的属性支配权重”,细化为“采用训练好的因素支配网络,根据所述因素关联数据和所述需求紧密度数据,确定在所述目标场景下,所述目标参考因素在所述目标对象的各参考因素中的属性支配权重”,以完善目标参考因素的属性支配权重确定机制。
[0071]
如图2a所示的一种权重确定方法,包括:
[0072]
s201、获取目标参考因素和各邻近参考因素之间的结构化表示的因素关联数据;其中,所述目标参考因素和所述邻近参考因素对目标对象的属性数据具有影响。
[0073]
s202、确定所述目标参考因素和目标场景之间的需求紧密度数据;其中,所述目标场景具有对所述目标参考因素的使用需求。
[0074]
s203、采用训练好的因素支配网络,根据所述因素关联数据和所述需求紧密度数据,确定在所述目标场景下,所述目标参考因素在所述目标对象的各参考因素中的属性支配权重。
[0075]
参见图2b所示的因素支配网络的结构图可知,所述因素支配网络包括自身影响力提取层、相互影响力提取层和支配权重激活层;所述自身影响力提取层,用于提取所述需求紧密度数据中与所述目标参考因素相关的自身影响力特征;所述相互影响力提取层,用于根据所述因素关联数据,提取所述需求紧密度数据中各参考因素之间的相互影响力特征;所述支配权重激活层,用于根据所述自身影响力特征和所述相互影响力特征,确定所述目标参考因素的属性支配权重。
[0076]
其中,自身影响力特征,表征目标参考因素和目标场景对目标参考因素自身重要性的影响;相互影响力特征,表征邻近参考因素对目标参考因素的重要性产生的影响。通过自身影响力特征和相互影响力特征进行目标参考因素的属性支配权重的确定,能够从目标参考因素自身、目标参考因素所处目标场景以及目标参考因素所关联的邻近参考因素这三个层面上进行目标参考因素的属性支配权重的确定,提高了属性支配权重的准确度。
[0077]
在本技术实施例的一种可选实施方式中,相互影响力提取层可以包括多层感知机,从而基于训练好的网络参数,提取需求紧密度数据中与目标参考因素相关的涉外影响力特征,并将涉外影响力特征作为相互影响力特征。其中,进行涉外影响力特征提取的多层
感知机,与进行自身影响力特征提取的多层感知机结构可以相同或不同。
[0078]
为了提高所提取的相互影响力特征的全面性和准确度,在本技术实施例的另一可选实施方式中,相互影响力提取层还可以包括图卷积神经网络,用于根据涉外影响力特征和因素关联数据,提取需求紧密度数据中目标参考因素与各邻近参考因素之间的局部影响力特征;将局部影响力特征作为相互影响力特征,或者将局部影响力特征和涉外影响力特征作为相互影响力特征。
[0079]
可选的,根据自身影响力特征和相互影响力特征,确定目标参考因素在目标对象的各参考因素中的属性支配权重,可以是:根据局部影响力特征和自身影响力特征,确定目标参考因素的属性支配权重。示例性地,可以采用注意力机制,对局部影响力特征和自身影响力特征进行处理,得到目标参考因素的属性支配权重。
[0080]
为了进一步提高所确定的属性支配权重的准确性,可选的,根据所述自身影响力特征和所述相互影响力特征,确定所述目标参考因素的属性支配权重,可以是:将所述局部影响力特征和所述自身影响力特征进行特征融合;采用注意力机制,对融合后的特征和所述涉外影响力特征的均值特征进行处理,得到所述目标参考因素的属性支配权重。
[0081]
需要说明的是,当属性支配权重包括上限属性支配权重和下限属性支配权重时,在因素支配网络的模型训练阶段,会针对上限属性支配权重和下限属性支配权重,分别训练两组不同的网络参数。相应的,在因素支配网络的模型使用阶段,分别采用上限属性支配权重对应的网络参数,以及下限属性支配权重对应的网络参数,进行上限属性支配权重和下限属性支配权重的确定。
[0082]
在本技术实施例的一种可选实施方式中,在确定属性支配权重之后,还可以:确定目标参考因素在目标场景下,所产生的目标对象的目标属性值;采用属性支配权重对目标属性值进行加权,以更新目标属性值。
[0083]
当属性支配权重包括上限属性支配权重和下限属性支配权重时,为了提高所确定的目标属性值的准确度,目标参考因素在目标场景下,所产生的目标对象的目标属性值,同样可以包括上限目标属性值和下限目标属性值。相应的,采用上限属性支配权重对上限目标属性值进行加权,以更新上限目标属性值;采用下限属性支配权重对下限目标属性值进行加权,以更新下限目标属性值。
[0084]
本技术实施例通过将属性支配权重的确定过程,细化为采用训练好的因素支配网络,根据因素关联数据和需求紧密度数据,确定在目标场景下,目标参考因素在目标对象的各参考因素中的属性支配权重,从而完善了属性支配权重的确定方式。同时,通过因素支配网络的使用,提高了属性支配权重的确定效率;另外,通过因素关联数据和需求紧密度数据进行确定,能够充分考量目标参考因素和邻近参考因素之间的关联关系,为目标参考因素在目标场景下的属性支配权重的准确度,提供了保障。
[0085]
图3a是本技术实施例提供的另一种权重确定方法的流程图,本技术实施例在上述各技术方案的基础上,进行了优化改进。
[0086]
进一步地,将操作“确定所述目标参考因素和目标场景之间的需求紧密度数据”细化为“采用训练好的场景感知网络,对所述目标参考因素的属性数据和所述目标场景的属性数据进行特征抽取,得到所述需求紧密度数据”,以完善需求紧密度数据的确定机制。
[0087]
如图3a所示的一种权重确定方法,包括:
[0088]
s301、获取目标参考因素和各邻近参考因素之间的结构化表示的因素关联数据;其中,所述目标参考因素和所述邻近参考因素对目标对象的属性数据具有影响。
[0089]
s302、采用训练好的场景感知网络,对所述目标参考因素的属性数据和所述目标场景的属性数据进行特征抽取,得到所述需求紧密度数据。其中,所述目标场景对具有所述目标参考因素的使用需求。
[0090]
为了清楚的介绍需求紧密度数据的确定过程,参见图3b所示的场景感知网络的结构图,对场景感知网络的模型训练过程,进行详细说明。
[0091]
其中,场景感知网络包括因素嵌入层、场景嵌入层和特征提取层。
[0092]
在模型训练阶段,技能嵌入层,用于对样本参考因素的属性数据进行降维处理,得到样本因素嵌入向量;场景嵌入层,用于对样本应用场景的属性数据进行降维处理,得到样本场景嵌入向量;特征提取层,用于对样本场景的属性数据数据、样本因素嵌入向量和样本场景嵌入向量中的至少一种进行特征抽取,得到样本需求紧密度数据。
[0093]
需要说明的是,为了实现对场景感知网络的有监督学习,还可以在场景感知网络中添加属性值确定网络,用于根据样本需求紧密度数据确定属性值预测结果。相应的,根据属性值预测结果和样本属性值,对场景感知网络和属性值确定网络的网络参数进行调整,从而间接提高了场景感知网络所抽取的样本需求紧密度数据的准确性。
[0094]
可以理解的是,通过因素嵌入层和场景嵌入层进行嵌入向量的确定,能够减少场景感知网络进行特征提取时的数据运算量。通过特征提取层基于样本场景的属性数据、样本因素嵌入向量和样本场景嵌入向量中的至少一种进行特征抽取,提高了所抽取特征的全面性和准确度,进而提高了模型性能。
[0095]
由于参考因素对目标场景的属性数据的影响随时间在演变。例如,2010年java工程师和2020年java工程师的薪资存在显著差异。又如,同一旅游景点的门票价格在节假日和非节假日也可能存在显著差异。因此,为了避免由于时间推移对属性值确定结果准确度的影响,进而避免时间推移对所提取的样本需求紧密度数据的准确性的影响,在模型训练阶段,技能嵌入层分别对各样本参考因素的属性数据分时段进行降维处理,得到样本因素嵌入向量。
[0096]
为了降低模型的复杂度,在本技术实施例的一种可选实施方式中,在针对某一时段的样本参考因素的属性数据进行样本因素嵌入向量的确定时,对该时段的样本参考因素的属性数据进行降维处理,分别得到样本因素低秩嵌入向量和共享潜在投影矩阵;根据样本因素低秩嵌入向量和共享潜在投影矩阵的乘积,确定样本因素嵌入向量。
[0097]
为了避免分时段确定样本因素嵌入向量带来更高的模型复杂度,进而避免模型过拟合情况的发生,在本技术实施例的一个可选实施方式中,在对场景感知网络和属性值确定网络的网络参数进行调整时,还可以根据相邻时段的样本因素嵌入向量之间的距离,构建损失函数;根据损失函数,对场景感知网络的网络参数进行优化。
[0098]
可以理解的是,通过相邻时段的样本因素嵌入向量之间的距离,对模型加以约束,限制了模型所提取的需求紧密度数据随时间产生的急剧变化,从而降低了模型复杂度,避免了模型过拟合情况的发生。
[0099]
示例性地,通过范数计算,确定相邻时段的样本因素嵌入向量之间的距离。可选的,所采用的范数可以是f-范数(frobenius norm,弗罗贝尼乌斯范数)。
[0100]
可选的,样本参考因素的样本场景的属性数据包括连续场景数据和/或离散场景数据,因此,场景嵌入层可以包括离散场景嵌入层,用于对离散场景数据进行降维处理,得到样本离散场景嵌入向量;场景嵌入层还可以包括连续场景嵌入层,用于对连续场景数据进行降维处理,得到样本连续场景嵌入向量。
[0101]
为了提高需求紧密度数据的全面性和准确度,进而提高模型精度,在本技术实施例的一种可选实施方式中,特征提取层可以同时进行样本参考因素和样本场景之间的不同层次的需求紧密度数据的提取。
[0102]
可选的,根据样本因素嵌入向量和样本场景的属性数据,确定一阶样本需求紧密度数据,以确定所输入数据的单一特征对样本对象的属性数据的直接联系;根据样本因素嵌入向量和样本场景嵌入向量,确定二阶样本需求紧密度数据,以确定所输入数据的二元特征组合对样本对象的属性数据的关联联系;以及根据样本目标场景的属性数据、样本场景嵌入向量和样本因素嵌入向量,确定高阶样本需求紧密度数据,以确定所输入数据的多元特征组合对样本对象的属性数据的高阶关联。
[0103]
示例性地,高阶样本需求紧密度数据的确定可以采用深度神经网络实现。例如,深度神经网络可以是mlp(multilayer perceptron,多层感知器)。
[0104]
可选的,采用mlp将样本目标场景的属性数据、样本场景嵌入向量和样本因素嵌入向量进行特征融合;采用多个顺次连接的激活层对融合后的特征进行激活处理,最终得到高阶样本需求紧密度数据。
[0105]
可选的,属性值确定网络可以设置有至少一个非负激活函数,并通过非负激活函数,对包括一阶样本需求紧密度数据、二阶样本需求紧密度数据和高阶样本需求紧密度数据中的至少一种的样本需求紧密度数据,进行激活处理,得到属性值预测结果。相应的,根据属性值预测结果和样本属性值之间的差异,对属性值确定网络和场景感知网络中的网络参数进行优化。
[0106]
可以理解的是,还可以采用一并训练的属性值确定网络,对各样本参考因素对样本对象的属性值进行预测。
[0107]
在本技术实施例的一种可选实施方式中,当样本对象的属性值为包含有两个边界值的数值区间时,为了保证属性值确定网络具备属性值区间预测功能,相应的,对不同边界值进行预测时,可以在属性值确定网络中设置两个非负激活函数,分别对样本需求紧密度数据进行激活处理,得到上限属性值预测结果和下限属性值预测结果。
[0108]
可选的,在属性值确定网络中设置两个非负激活函数,分别对样本需求紧密度数据进行激活处理,得到上限属性值预测结果和下限属性值预测结果,可以是:通过其中一个非负激活函数,对样本需求紧密度数据进行激活处理,得到下限属性值预测结果;通过另一个非负激活函数,对样本需求紧密度数据进行激活处理,得到区间长度;将区间长度和下限属性值预测结果的和值,作为上限属性值预测结果。
[0109]
相应的,根据上限属性值预测结果和样本属性值上限之间的差异,以及下限属性值预测结果和样本属性值下限之间的差异,对属性值确定网络和场景感知网络中的网络参数进行优化,后续可采用训练好的场景感知网络进行需求紧密度数据的提取。相应的,还可以采用训练好的属性值确定网络,预测各参考因素在目标场景下,所产生的目标对象的属性数据的样本属性值。
[0110]
需要说明的是,对场景感知网络和属性值确定网络的训练过程和使用过程可以采用相同或不同的电子设备加以实现。后续将会对场景感知网络和属性值确定网络的使用阶段,进行详细说明。
[0111]
在场景感知网络的使用阶段,场景感知网络包括嵌入层和特征抽取层;所述嵌入层,用于分别对所述目标参考因素的属性数据和所述目标场景的属性数据进行降维处理,得到因素嵌入向量和场景嵌入向量;所述特征抽取层,用于对所述目标场景的属性数据、所述因素嵌入向量和所述场景嵌入向量中的至少一种进行特征抽取,得到所述需求紧密度数据。
[0112]
具体的,嵌入层包括因素嵌入层,用于对目标参考因素的属性数据进行降维处理,得到因素嵌入向量;嵌入层还包括场景嵌入层,用于对目标场景的属性数据进行降维处理,得到场景嵌入向量。
[0113]
可以理解的是,通过嵌入层进行因素嵌入向量和场景嵌入的确定,能够减少场景感知网络进行特征提取时的数据运算量。通过特征提取层基于目标场景的属性数据、因素嵌入向量和场景嵌入向量中的至少一种进行特征抽取,提高了所抽取特征的全面性和准确度。
[0114]
示例性地,采用因素嵌入层中训练好的网络参数,对目标参考因素的属性数据进行降维处理,得到因素嵌入向量。可选的,可以对目标参考因素的属性数据进行降维处理,分别得到目标因素低秩嵌入向量和目标共享潜在投影矩阵;根据目标因素低秩嵌入向量和目标共享潜在投影矩阵的乘积,确定因素嵌入向量。
[0115]
示例性地,若目标场景的属性数据包括目标离散场景数据,则采用离散场景嵌入层中训练好的网络参数,对目标离散场景数据进行降维处理,得到离散场景嵌入向量;若目标场景的属性数据包括目标连续场景数据,则采用连续场景嵌入层中训练好的网络参数,对目标连续场景数据进行降维处理,得到连续场景嵌入向量。
[0116]
示例性地,采用特征抽取层中训练好的网络参数,对目标离散场景数据、目标连续场景数据、因素嵌入向量、离散场景嵌入向量和连续场景嵌入向量中的至少一种进行特征抽取,得到需求紧密度数据。其中,特征提取层中的网络参数为模型训练完成后的参数。
[0117]
为了提高需求紧密度数据的全面性和准确度,在本技术实施例的一种可选实施方式中,特征提取层可以同时进行目标参考因素和目标场景之间的不同层次的需求紧密度数据的提取。
[0118]
示例性地,需求紧密度数据包括一阶需求紧密度数据、二阶需求紧密度数据和高阶需求紧密度数据中的至少一种。
[0119]
可选的,根据目标离散场景数据和/或目标连续场景数据,以及因素嵌入向量,确定一阶需求紧密度数据,用于表征目标场景和目标参考因素的单一特征对目标对象的属性数据的直接联系;根据离散场景嵌入向量和/或连续场景嵌入向量,以及因素嵌入向量,确定二阶需求紧密度数据,用于表征目标场景和目标参考因素的二元特征组合对目标对象的属性数据的关联联系;根据目标连续场景数据和连续场景嵌入向量,和/或,目标离散场景数据和离散场景嵌入向量,以及因素嵌入向量,确定高阶需求紧密度数据,用于表征目标参考因素和目标场景的多元特征组合对目标对象的属性数据的高阶关联。
[0120]
在属性值确定网络的使用阶段,可选的,根据属性值确定网络中设置的至少一个
非负激活函数,对需求紧密度数据进行激活处理,得到目标参考因素在目标场景下,产生的目标对象的目标属性值。其中,非负激活函数中的网络参数为模型训练完成后所对应的参数。
[0121]
在本技术实施例的一种可选实施方式中,若属性值确定网络具备价值区间预测功能,相应的,还可以根据属性值确定网络中设置的两个非负激活函数,分别对需求紧密度数据进行激活处理,得到目标参考因素在目标场景下,产生的目标对象的上限目标属性值和下限目标属性值。
[0122]
可选的,若属性值确定网络中设置有两个非负激活函数,可以通过其中一个非负激活函数,对需求紧密度数据进行激活处理,得到目标参考因素在目标场景下的下限目标属性值;通过另一个非负激活函数,对需求紧密度数据进行激活处理,得到区间长度;将区间长度和下限目标属性值的和值,作为目标参考因素在目标场景下,产生的目标对象的上限目标属性值。
[0123]
s303、根据所述因素关联数据和所述需求紧密度数据,确定在所述目标场景下,所述目标参考因素在所述目标对象的各参考因素中的属性支配权重。
[0124]
在本技术实施例的一种可选实施方式中,还可以采用属性支配权重对目标属性值进行加权,以更新目标属性值,从而实现对单一影响因素在目标场景下,所产生的目标对象的目标属性值的更细粒度的确定。
[0125]
其中,属性支配权重的数量至少为1。可以理解的是,为了保证属性支配权重的准确度,通常,属性支配权重的数量与目标属性值的数量一一对应。
[0126]
可选的,当目标属性值为单一属性值时,直接采用确定的单一属性支配权重,对该目标属性值进行加权,以更新目标属性值。
[0127]
可选的,当目标属性值包括上限目标属性值和下限目标属性值时,相应的,属性支配权重包括上限属性支配权重和下限属性支配权重。相应的,采用上限属性支配权重对上限目标属性值进行加权,以更新上限目标属性值;采用下限属性支配权重对下限目标属性值进行加权,以更新下限目标属性值。
[0128]
本技术实施例通过将紧密度数据确定操作,细化为采用训练好的场景感知网络,对目标参考因素的属性数据和目标场景的属性数据进行特征提取,得到需求紧密度数据,完善了需求紧密度数据的确定机制,并通过机器学习模型的使用,提高了需求紧密度数据的提取效率,同时提高了所提取的需求紧密度数据的准确性和全面度。
[0129]
图4a是本技术实施例提供的一种基于支配权重对技能价值数据处理的方法的流程图,本技术实施例在上述各技术方案的基础上,提供了一种优选实施方式,用于对一条企事业单位发布的招聘数据中,各工作技能对岗位薪酬的影响进行确定,从而剥离出不同工作技能的技能价值,进而实现对包含多工作技能的招聘数据中的综合岗位薪酬进行预测,或对掌握多工作技能的用户的个人价值进行量化。
[0130]
如图4a所示的一种技能价值数据处理方法,包括:数据预处理阶段410、模型训练阶段420和模型使用阶段430。
[0131]
其中,数据预处理阶段410,包括:
[0132]
s411、获取多条招聘数据;其中,招聘数据包括技能数据、工作场景数据和监督数据。
[0133]
其中,技能数据包括技能名称、相同工作场景下的技能共现频率和技能熟练程度。其中,技能熟练程度可以是精通、熟练和了解等。
[0134]
其中,工作场景数据包括技能需求方的自身属性、历史统计属性和技能需求属性,例如企事业单位的自身属性,例如包括上市情况、从业类型、成立年限等中的至少一种。其中,历史统计属性为该技能需求方所在城市历史月薪统计数据,包括均值、方差、最大值和最小值中的至少一种。其中,技能需求属性,包括工作经验和毕业年限等中的至少一种。
[0135]
其中,监督数据,包括薪酬上限和薪酬下限。
[0136]
s412、根据技能数据生成技能图。
[0137]
参见图4b所示的技能图,通过节点表示技能;将在同一条招聘数据中同时出现的技能通过边连接;将各技能的技能熟练程度作为该技能对应节点的描述数据;将通过边连接的技能在所有招聘数据的共现频率作为边的描述数据。
[0138]
s413、将工作场景数据中的技能需求属性和技能需求方的城市编码,通过独热编码,得到结构化的离散场景向量。
[0139]
示例性地,若某条招聘数据中城市编码为xxx,要求工作经验为3年,则形成的离散场景向量可以是[xxx,1]。在该示例中,招聘应届毕业生,则工作经验用“0”表示;1-3年,则工作经验用“1”表示;3-4年,则工作经验用“2”表示。
[0140]
s414、将工作场景数据中的技能需求方的自身属性和历史统计属性,分别生成两个结构化的连续场景向量。
[0141]
示例性地,若某条招聘数据如下:位于a市的已成立13年的上市公司互联网公司b,招聘算法工程师,而该职位的历史月薪统计情况如下:均值为10000元,方差为500元,最高月薪为12000元,最低月薪为8000元,那么确定的与技能需求方的自身属性对应的连续场景向量可以是[a市,b公司,上市公司,13年,互联网类];确定的与历史统计属性对应的连续场景向量可以是[10000,500,12000,8000]。当然连续场景向量中的向量元素,还可以采用其他编码方式加以确定,具体所采用编码方式可以由技术人员根据需要或经验值加以确定。
[0142]
s415、将监督数据生成结构化的监督向量。
[0143]
若某条招聘数据中提供的薪酬范围为8000-10000,则所生成的监督向量可以是[8000,10000]。
[0144]
参见图4c所示的一种技能定价组合模型的结构示意图,该技能定价组合模型为一个二部神经网络,包括用于场景感知和技能定价的技能定价网络,以及用于进行技能权重支配和薪酬确定的薪酬预测网络。
[0145]
其中,模型训练阶段420,包括:
[0146]
s421、根据技能图,生成包括样本技能的技能名称和技能熟练程度的样本技能向量;
[0147]
s422、将样本技能的样本技能向量和样本场景的样本场景数据,作为训练样本输入至场景感知网络,得到样本技能与样本场景的交互数据。
[0148]
具体的,根据以下公式,确定样本技能与样本场景的交互数据:
[0149]
x=f(c,s,l|θ);
[0150]
其中,x为交互数据,c为样本场景数据,包括离散场景向量和连续场景向量,s为技能名称,l为技能熟练程度,θ为待训练参数。其中,f()为信息抽取函数,采用场景感知网
络加以实现。
[0151]
s423、根据交互数据,输入至定价网络对样本技能的价值区间进行预测,得到样本预测价值区间。
[0152]
具体的,根据以下公式,确定样本预测价值区间:
[0153][0154]
其中,[v
l
,v
u
]为样本预测价值区间,φ
l
和φ
u
为待训练参数,gl()和gu()为非负激活函数,采用定价网络加以实现。
[0155]
其中,预测的价值下限v
l
和价值上限v
u
满足以下条件:v
l
≥0,v
u
≥0,并且v
l
≤v
u

[0156]
s424、根据技能图,获取样本技能与样本邻近技能的共现频率,并根据获取的各共现频率生成邻接矩阵。
[0157]
s425、将邻接矩阵和交互数据输入至技能支配网络,得到样本技能的技能权重区间。
[0158]
具体的,采用以下公式,确定样本技能的技能权重区间:
[0159][0160]
其中,[d
l
,d
u
]为技能权重区间,a为邻接矩阵,x为部分或全部交互数据,或生成交互数据时的隐层向量,ψ
l
和ψ
u
为两组待训练参数。h()为权重计算函数,采用技能支配网络加以实现。
[0161]
s426、将同一招聘数据中的各样本技能的技能权重区间中的上下限,对样本预测价值区间中的价值上下限进行加权,得到各样本技能的最终预测价值区间。
[0162]
s427、针对每条招聘数据,将数据中各样本技能的最终预测价值区间求和,得到预测薪酬区间。
[0163]
具体的,根据以下公式确定各样本技能的预测薪酬区间:
[0164][0165]
其中,为某条招聘数据对应的预测薪酬区间,为该条招聘数据中第i个样本技能的技能权重区间;为该条招聘数据中第i个样本技能的样本预测价值区间,n为该条招聘数据中所包含的技能数量。
[0166]
s428、根据预测薪酬区间与该条招聘数据的监督向量对应的实际薪酬区间的区间差异,对技能定价组合模型中各网络的网络参数进行优化。
[0167]
根据以下损失函数,对技能定价组合模型中各网络的网络参数进行优化:
[0168]
[0169]
其中,l
s
为本次模型训练的损失函数值,|j|为本次模型训练招聘数据的条数,为第j条招聘数据对应的预测薪酬区间,为第j条招聘数据对应的实际薪酬区间,λ
l
和λ
u
为超参数。
[0170]
在对技能定价组合模型中各网络的网络参数进行优化是,可以采用优化方法找到使损失函数的函数值达到局部最小值的参数,该优化方法包括但不限于随机梯度下降等优化方法。
[0171]
结合图4d所示的技能定价网络的结构示意图和图4e所示的技能支配网络的结构示意图,对模型训练过程进行详细说明。
[0172]
参见图4d,其中,技能定价网络包括场景感知网络和定价网络。其中,场景感知网络,包括:技能嵌入层、离散场景嵌入层、连续场景嵌入层和特征提取层。
[0173]
具体的,技能嵌入层,提取技能在不同时段的嵌入特征,为了降低模型复杂性,假设技能嵌入由低秩嵌入和潜在的投影矩阵组合,写作:
[0174][0175]
其中,中存储第t个时间段的技能嵌入向量,t是时间段的数量,n
s
表示样本技能的数量;是低秩嵌入,w
vs
∈r
dl
×
de
表示所有时间段共享的潜在投影矩阵,de表示嵌入的维度,dl是隐变量的数量。其中,时间段的长度有技术人员根据需要或经验值确定。
[0176]
通过上述针对不同时段动态建模的方式,提升了技能定价模型对技能在不同时间段的技能价值进行建模评估的能力,但带来了更高的模型复杂度,容易导致模型过拟合。
[0177]
为了避免模型过拟合,在技能定价组合模型的训练过程中,在损失函数中引入时间维度的正则化项,具体如下:
[0178][0179]
其中,|| ||
f
表示f-范数,这个正则化项约束技能的表征不会随时间产生急剧的变化。
[0180]
具体的,离散场景嵌入层,根据以下公式,为每个离散场景向量分配一个嵌入,得到离散场景嵌入:
[0181][0182]
其中,为离散场景嵌入,为离散场景向量,m
i
为离散场景向量的向量维度,待训练参数;其中,i∈d,其中d表示离散场景向量的集合。
[0183]
具体的,连续场景嵌入层,根据以下公式,为每个连续场景向量分配一个嵌入,得到连续场景嵌入:
[0184][0185]
其中,为连续场景嵌入,为连续场景向量,d
i
为连续场景向量的向量维度,和为待训练参数;其中,i∈c,其中c表示连续场景向量的集合。
[0186]
为了提取尽可能多的信息,技能定价模型通过特征提取层,提取样本场景和样本技能之间的深层和浅层交互,首先以不同的方式处理离散场景向量和连续场景向量,并通过线性投影、乘法运算和mlp来提取各层面的交互数据。其中,交互数据包括一阶交互数据、二阶交互数据和高阶交互数据。
[0187]
具体的,一阶交互数据,根据如下公式计算确定:
[0188][0189]
其中,h1为一阶交互数据,e
s
∈r
de
表示样本技能的技能嵌入向量,为中该样本技能对应的行向量,和为待训练参数,d
o1
为输出维度。
[0190]
具体的,二阶交互数据,根据如下公式计算确定:
[0191][0192]
其中,

表示逐元素乘法,h2为二阶交互数据。
[0193]
具体的,高阶交互数据,根据如下公式计算确定:
[0194][0195]
其中,k是mlp深度,为待训练参数,x
(k)
表示第k层的输出,σ()表示激活函数,*|*表示连接两个向量,我们将最终输出的x
(k)
作为高阶交互数据h3。
[0196]
将一阶交互数据h1,二阶交互数据h2,以及高阶交互数据h3中的组合得到交互数据x。
[0197]
将x输入至定价网络,根据前述v
l
和v
u
相关公式确定样本预测价值区间,在此不再赘述。
[0198]
参见图4e,其中,技能支配网络,包括:自身影响力提取层、涉外影响力提取层、局部影响力提取层和支配权重激活层。
[0199]
具体的,自身影响力提取层,用一个多层感知机为每种技能提取其自身与重要性相关的特征表示,得到自身影响力特征x
imp
∈r
n
×
dp
。其中,n表示涉及的技能数,dp为超参数,表示所提取特征维度。其中,多层感知机包括多个顺序连接的线性处理层和非线性处理层。
[0200]
具体的,涉外影响力提取层,用另一个多层感知机为每种技能提取其自身与重要性相关的特征表示,得到自身影响力特征x
inf
∈r
n
×
di
。其中,dp为超参数,表示所提取特征维度。其中,多层感知机包括多个顺序连接的线性处理层和非线性处理层。其中,确定x
imp
和确定x
inf
的多层感知机的结构可以相同或不同。
[0201]
具体的,局部影响力提取层,通过图卷积神经网络提取每个技能受邻近技能的影响大小,得到局部影响力特征,具体采用以下公式实现:
[0202]
u=gcn(x
inf
,a);
[0203]
其中,u为局部影响力特征,a为样本技能的邻接矩阵,gcn()为图卷积神经网络对
应的函数。
[0204]
具体的,支配权重激活层,引入注意力机制,并具体采用如下公式确定各样本技能的技能权重区间:
[0205][0206][0207]
其中,q为涉外影响力特征x
inf
的均值特征,作为涉外影响力特征的全局表征;[d
l
,d
u
]为预测的样本技能的技能权重区间,w
ql
、w
kl
和w
vl
为下限技能权重d
l
所对应的模型的待训练参数;w
qu
、w
ku
和w
vu
为上限技能权重d
u
所对应的模型的待训练参数,两组待训练参数采用相同的技能支配网络分别训练得到;softmax()为激活函数。
[0208]
其中,模型使用阶段430,包括:
[0209]
s431、获取招聘数据中的其中一个技能作为目标技能;
[0210]
s432、将目标技能的技能数据和该目标技能关联的目标场景的工作场景数据输入至技能定价网络,得到目标技能的价值区间和交互数据。
[0211]
s433、将招聘数据中除目标技能之外的其他技能作为邻近技能,确定目标技能的邻接矩阵。
[0212]
s434、将目标技能的邻接矩阵和交互数据输入至薪酬预测网络,得到目标技能的薪酬区间。
[0213]
s435、将招聘数据中各技能分别对应的薪酬区间加和,得到招聘数据对应的综合薪酬。
[0214]
图5是本技术实施例提供的一种权重确定装置的结构图,该权重确定装置500,包括:因素关联数据获取模块501、需求紧密度数据确定模块502和属性支配权重确定模块503。其中,
[0215]
因素关联数据获取模块501,用于获取目标参考因素和各邻近参考因素之间的结构化表示的因素关联数据;其中,所述目标参考因素和所述邻近参考因素对目标对象的属性数据具有影响;
[0216]
需求紧密度数据确定模块502,用于确定所述目标参考因素和目标场景之间的需求紧密度数据;其中,所述目标场景具有对所述目标参考因素的使用需求;
[0217]
属性支配权重确定模块503,用于根据所述因素关联数据和所述需求紧密度数据,确定在所述目标场景下,所述目标参考因素在所述目标对象的各参考因素中的属性支配权重。
[0218]
本技术实施例通过因素关联数据获取模块获取目标参考因素和各邻近参考因素之间的结构化表示的因素关联数据;其中目标参考因素和邻近参考因素对目标对象的属性数据具有影响;通过需求紧密度数据确定模块确定目标参考因素和目标场景之间的需求紧密度数据;其中目标场景具有对目标参考因素的使用需求;通过属性支配权重确定模块根据因素关联数据和需求紧密度数据,确定在所述目标场景下,目标参考因素在目标对象的
各参考因素中的属性支配权重。上述技术方案通过引入目标参考因素和邻近参考因素之间的因素关联数据,进行属性支配权重确定,从而在目标场景下,将存在相互影响的参考因素,对目标对象的属性数据的影响程度进行剥离,从而实现了对单一参考因素在目标场景下对目标对象的属性数据的影响程度的量化。同时,通过引入目标参考因素和目标场景之间的需求紧密度数据,使得在属性支配权重确定过程中充分考量参考因素与目标场景之间的关系,为属性支配权重的准确度提供了保障。
[0219]
进一步地,所述属性支配权重确定模块503,包括:
[0220]
属性支配权重确定单元,用于采用训练好的因素支配网络,根据所述因素关联数据和所述需求紧密度数据,确定在所述目标场景下,所述目标参考因素在所述目标对象的各参考因素中的属性支配权重。
[0221]
进一步地,所述因素支配网络包括自身影响力提取层、相互影响力提取层和属性支配权重激活层;
[0222]
所述自身影响力提取层,用于提取所述需求紧密度数据中与所述目标参考因素相关的自身影响力特征;
[0223]
所述相互影响力提取层,用于根据所述因素关联数据,提取所述需求紧密度数据中各参考因素之间的相互影响力特征;
[0224]
所述支配权重激活层,用于根据所述自身影响力特征和所述相互影响力特征,确定所述目标参考因素的属性支配权重。
[0225]
进一步地,所述相互影响力提取层,包括:
[0226]
涉外影响力特征提取单元,用于提取所述需求紧密度数据中与所述目标参考因素相关的涉外影响力特征;
[0227]
局部影响力特征提取单元,用于根据所述涉外影响力特征和所述因素关联数据,提取所述需求紧密度数据中所述目标参考因素与各所述邻近参考因素之间的局部影响力特征;
[0228]
相互影响力特征提取单元,用于所述局部影响力特征和/或所述涉外影响力特征,作为所述相互影响力特征。
[0229]
进一步地,所述支配权重激活层,包括:
[0230]
特征融合单元,用于将所述局部影响力特征和所述自身影响力特征进行特征融合;
[0231]
属性支配权重确定单元,用于采用注意力机制,对融合后的特征和所述涉外影响力特征的均值特征进行处理,得到所述目标参考因素的属性支配权重。
[0232]
进一步地,所述需求紧密度数据确定模块502,包括:
[0233]
需求紧密度数据确定单元,用于采用训练好的场景感知网络,对所述目标参考因素的属性数据和所述目标场景的属性数据进行特征抽取,得到所述需求紧密度数据。
[0234]
进一步地,所述场景感知网络包括嵌入层和特征抽取层;
[0235]
所述嵌入层,用于分别对所述目标参考因素的属性数据和所述目标场景的属性数据进行降维处理,得到因素嵌入向量和场景嵌入向量;
[0236]
所述特征抽取层,用于对所述目标场景的属性数据、所述因素嵌入向量和所述场景嵌入向量中的至少一种进行特征抽取,得到所述需求紧密度数据。
[0237]
进一步地,所述需求紧密度数据包括一阶需求紧密度数据、二阶需求紧密度数据和高阶需求紧密度数据中的至少一种;
[0238]
相应的,所述特征提取层,包括:
[0239]
一阶需求紧密度数据确定单元,用于根据所述因素嵌入向量和所述目标场景的属性数据,确定所述一阶需求紧密度数据;
[0240]
二阶需求紧密度数据确定单元,用于根据所述因素嵌入向量和所述场景嵌入向量,确定所述二阶需求紧密度数据;
[0241]
高阶需求紧密度数据确定单元,用于根据所述目标场景的属性数据、所述场景嵌入向量和所述因素嵌入向量,确定所述高阶需求紧密度数据。
[0242]
进一步地,所述装置还包括,模型训练模块,用于对场景感知网络进行模型训练;
[0243]
其中,所述模型训练模块,包括:
[0244]
样本因素嵌入向量确定单元,用于分别对各所述样本参考因素的属性数据分时段进行降维处理,得到所述样本因素嵌入向量。
[0245]
进一步地,所述模型训练模块,包括:
[0246]
损失函数构建单元,用于根据相邻时段的样本因素嵌入向量之间的距离,构建损失函数;
[0247]
模型训练单元,用于根据所述损失函数,对所述场景感知网络的网络参数进行优化。
[0248]
进一步地,所述因素关联数据为根据所述目标参考因素和所述邻近参考因素的共现频率构建的矩阵。
[0249]
进一步地,所述装置还包括:
[0250]
目标属性值确定模块,用于在根据所述因素关联数据和所述需求紧密度数据,确定所述目标参考因素在所述目标对象的各参考因素中的属性支配权重之后,确定目标参考因素在目标场景下,所产生的目标对象的目标属性值;
[0251]
目标属性值更新模块,用于采用所述属性支配权重对所述目标属性值进行加权,以更新所述目标属性值。
[0252]
进一步地,所述参考因素为工作技能,所述目标对象的属性数据为岗位薪酬,所述目标场景为企事业单位。
[0253]
上述权重确定装置可执行本技术实施例提供的任一权重确定方法,具备执行权重确定方法的功能模块和有益效果。
[0254]
根据本技术的实施例,本技术还提供了一种电子设备和一种可读存储介质。
[0255]
如图6所示,是实现本技术实施例的权重确定方法的电子设备的框图。电子设备旨在表示各种形式的数字计算机,诸如,膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置,诸如,个人数字处理、蜂窝电话、智能电话、可穿戴设备和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例,并且不意在限制本文中描述的和/或者要求的本技术的实现。
[0256]
如图6所示,该电子设备包括:一个或多个处理器601、存储器602,以及用于连接各部件的接口,包括高速接口和低速接口。各个部件利用不同的总线互相连接,并且可以被安
装在公共主板上或者根据需要以其它方式安装。处理器可以对在电子设备内执行的指令进行处理,包括存储在存储器中或者存储器上以在外部输入/输出装置(诸如,耦合至接口的显示设备)上显示gui的图形信息的指令。在其它实施方式中,若需要,可以将多个处理器和/或多条总线与多个存储器和多个存储器一起使用。同样,可以连接多个电子设备,各个设备提供部分必要的操作(例如,作为服务器阵列、一组刀片式服务器、或者多处理器系统)。图6中以一个处理器601为例。
[0257]
存储器602即为本技术所提供的非瞬时计算机可读存储介质。其中,所述存储器存储有可由至少一个处理器执行的指令,以使所述至少一个处理器执行本技术所提供的权重确定方法。本技术的非瞬时计算机可读存储介质存储计算机指令,该计算机指令用于使计算机执行本技术所提供的权重确定方法。
[0258]
存储器602作为一种非瞬时计算机可读存储介质,可用于存储非瞬时软件程序、非瞬时计算机可执行程序以及模块,如本技术实施例中的权重确定方法对应的程序指令/模块(例如,附图5所示的因素关联数据获取模块501、需求紧密度数据确定模块502和属性支配权重确定模块503)。处理器601通过运行存储在存储器602中的非瞬时软件程序、指令以及模块,从而执行服务器的各种功能应用以及数据处理,即实现上述方法实施例中的权重确定方法。
[0259]
存储器602可以包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需要的应用程序;存储数据区可存储实现权重确定方法的电子设备的使用所创建的数据等。此外,存储器602可以包括高速随机存取存储器,还可以包括非瞬时存储器,例如至少一个磁盘存储器件、闪存器件、或其他非瞬时固态存储器件。在一些实施例中,存储器602可选包括相对于处理器601远程设置的存储器,这些远程存储器可以通过网络连接至实现权重确定方法的电子设备。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
[0260]
实现权重确定方法的电子设备还可以包括:输入装置603和输出装置604。处理器601、存储器602、输入装置603和输出装置604可以通过总线或者其他方式连接,图6中以通过总线连接为例。
[0261]
输入装置603可接收输入的数字或字符信息,以及产生与实现权重确定方法的电子设备的用户设置以及功能控制有关的键信号输入,例如触摸屏、小键盘、鼠标、轨迹板、触摸板、指示杆、一个或者多个鼠标按钮、轨迹球、操纵杆等输入装置。输出装置604可以包括显示设备、辅助照明装置(例如,led)和触觉反馈装置(例如,振动电机)等。该显示设备可以包括但不限于,液晶显示器(lcd)、发光二极管(led)显示器和等离子体显示器。在一些实施方式中,显示设备可以是触摸屏。
[0262]
此处描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、专用asic(专用集成电路)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括:实施在一个或者多个计算机程序中,该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释,该可编程处理器可以是专用或者通用可编程处理器,可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令,并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。
[0263]
这些计算程序(也称作程序、软件、软件应用、或者代码)包括可编程处理器的机器指令,并且可以利用高级过程和/或面向对象的编程语言、和/或汇编/机器语言来实施这些计算程序。如本文使用的,术语“机器可读介质”和“计算机可读介质”指的是用于将机器指令和/或数据提供给可编程处理器的任何计算机程序产品、设备、和/或装置(例如,磁盘、光盘、存储器、可编程逻辑装置(pld)),包括,接收作为机器可读信号的机器指令的机器可读介质。术语“机器可读信号”指的是用于将机器指令和/或数据提供给可编程处理器的任何信号。
[0264]
为了提供与用户的交互,可以在计算机上实施此处描述的系统和技术,该计算机具有:用于向用户显示信息的显示装置(例如,crt(阴极射线管)或者lcd(液晶显示器)监视器);以及键盘和指向装置(例如,鼠标或者轨迹球),用户可以通过该键盘和该指向装置来将输入提供给计算机。其它种类的装置还可以用于提供与用户的交互;例如,提供给用户的反馈可以是任何形式的传感反馈(例如,视觉反馈、听觉反馈、或者触觉反馈);并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。
[0265]
可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如,作为数据服务器)、或者包括中间件部件的计算系统(例如,应用服务器)、或者包括前端部件的计算系统(例如,具有图形用户界面或者网络浏览器的用户计算机,用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如,通信网络)来将系统的部件相互连接。通信网络的示例包括:局域网(lan)、广域网(wan)和互联网。
[0266]
计算机系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。
[0267]
根据本技术实施例的技术方案,通过获取目标参考因素和各邻近参考因素之间的结构化表示的因素关联数据;其中目标参考因素和邻近参考因素对目标对象的属性数据具有影响;确定目标参考因素和目标场景之间的需求紧密度数据;其中目标场景具有对目标参考因素的使用需求;根据因素关联数据和需求紧密度数据,确定在所述目标场景下,目标参考因素在目标对象的各参考因素中的属性支配权重。上述技术方案通过引入目标参考因素和邻近参考因素之间的因素关联数据,进行属性支配权重确定,从而在目标场景下,将存在相互影响的参考因素,对目标对象的属性数据的影响程度进行剥离,从而实现了对单一参考因素,在目标场景下对目标对象的属性数据的影响程度的量化。同时,通过引入目标参考因素和目标场景之间的需求紧密度数据,使得在属性支配权重确定过程中充分考量参考因素与目标场景之间的关系,为属性支配权重的准确度提供了保障。
[0268]
应该理解,可以使用上面所示的各种形式的流程,重新排序、增加或删除步骤。例如,本技术中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行,只要能够实现本技术公开的技术方案所期望的结果,本文在此不进行限制。
[0269]
上述具体实施方式,并不构成对本技术保护范围的限制。本领域技术人员应该明白的是,根据设计要求和其他因素,可以进行各种修改、组合、子组合和替代。任何在本技术的精神和原则之内所作的修改、等同替换和改进等,均应包含在本技术保护范围之内。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献