一种数据处理方法、装置、设备及存储介质与流程

2021-11-30 21:19:00 来源：中国专利 TAG：

1.本技术涉及数据处理技术，尤其涉及人工智能技术，特别涉及一种用于确定技能价值的数据处理方法、装置、设备及存储介质。

背景技术：

2.在知识经济时代，人们不停地在进行技能投资，以提升自身能力，更好地实现自我价值。而通过对工作技能定价的方式，可以帮助个人有效评估自己的能力，指导个人进行短期或长期的职业规划。另外，通过对工作技能定价，还可以帮助技能需求方针对技能需求，设计更加合理的薪资结构。
3.因此，如何使用计算机手段对复杂因素的数据进行处理来实现工作技能定价成为亟待解决的技术问题。

技术实现要素：

4.本技术实施例提供了一种数据处理方法、装置、设备及存储介质，以实现对单一工作技能的定价。
5.根据第一方面，本技术实施例提供了一种数据处理方法，包括：
6.获取结构化表示的目标技能的目标技能数据，以及目标场景的目标场景数据；其中，所述目标场景具有对所述目标技能的使用需求；
7.确定所述目标技能数据与所述目标场景数据之间的需求紧密度数据；
8.根据所述需求紧密度数据，确定所述目标技能在所述目标场景下的技能价值。
9.根据第二方面，本技术实施例还提供了一种数据处理装置，包括：
10.结构化数据获取模块，用于获取结构化表示的目标技能的目标技能数据，以及目标场景的目标场景数据；其中，所述目标场景具有对所述目标技能的使用需求；
11.需求紧密度数据确定模块，用于确定所述目标技能数据与所述目标场景数据之间的需求紧密度数据；
12.技能价值确定模块，用于根据所述需求紧密度数据，确定所述目标技能在所述目标场景下的技能价值。
13.根据第三方面，本技术实施例还提供了一种电子设备，包括：
14.至少一个处理器；以及
15.与所述至少一个处理器通信连接的存储器；其中，
16.所述存储器存储有可被所述至少一个处理器执行的指令，所述指令被所述至少一个处理器执行，以使所述至少一个处理器能够执行第一方面提供的一种数据处理方法。
17.根据第四方面，本技术实施例还提供了一种存储有计算机指令的非瞬时计算机可读存储介质，所述计算机指令用于使所述计算机执行第一方面提供的一种数据处理方法。
18.本技术实施例通过获取结构化表示的目标技能的目标技能数据，以及目标场景的目标场景数据；其中，目标场景具有对目标技能的使用需求；确定目标技能数据与目标场景
数据之间的需求紧密度数据；根据需求紧密度数据，确定目标技能在目标场景下的技能价值。本技术实施例采用上述技术方案实现了对目标技能的技能定价。
19.应当理解，本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征，也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。
附图说明
20.附图用于更好地理解本方案，不构成对本技术的限定。其中：
21.图1是本技术实施例提供的一种数据处理方法的流程图；
22.图2a是本技术实施例提供的另一种数据处理方法的流程图；
23.图2b是本技术实施例提供的一种技能定价网络的结构图；
24.图3是本技术实施例提供的另一种数据处理方法的流程图；
25.图4a是本技术实施例提供的另一种数据处理方法的流程图；
26.图4b是本技术实施例提供的一种技能图的示意图；
27.图4c是本技术实施例提供的一种技能支配网络的结构图；
28.图5a是本技术实施例提供的另一种数据处理方法的流程图；
29.图5b是本技术实施例提供的另一种技能图的示意图；
30.图5c是本技术实施例提供的一种技能定价组合模型的结构图；
31.图5d是本技术实施例提供的另一种技能定价网络的结构图；
32.图5e是本技术实施例提供的另一种技能支配网络的结构图；
33.图6是本技术实施例提供的一种数据处理装置的结构图；
34.图7是用来实现本技术实施例的数据处理方法的电子设备的框图。
具体实施方式
35.以下结合附图对本技术的示范性实施例做出说明，其中包括本技术实施例的各种细节以助于理解，应当将它们认为仅仅是示范性的。因此，本领域普通技术人员应当认识到，可以对这里描述的实施例做出各种改变和修改，而不会背离本技术的范围和精神。同样，为了清楚和简明，以下的描述中省略了对公知功能和结构的描述。
36.本技术实施例适用于对职业技能在技能需求方的技能价值进行确定的情况。其中，职业技能可以包括工程类职业对应的算法技能、编程语言技能、硬件搭建技能等；其中，技能价值可以是薪酬或部分薪酬。本技术实施例所提供的各数据处理方法可以由数据处理装置执行，该装置可以采用软件和/或硬件实现，并具体配置于电子设备中。
37.图1是本技术实施例提供的一种数据处理方法的流程图，该方法包括：
38.s101、获取结构化表示的目标技能的目标技能数据，以及目标场景的目标场景数据；其中，所述目标场景具有对所述目标技能的使用需求。
39.目标技能可以是某职业岗位所需的职业技能中的至少一种，例如，目标技能可以包括算法技能和/或编程语言技能等。其中，目标场景可以是企事业单位等技能需求方所设置的特定岗位，例如可以是具有特定属性的公司、企业、事业单位、或科研实验室等设置的特定岗位。
40.目标技能数据可以理解为对目标技能的属性数据进行格式转化后，所得到的结构
化数据。例如，目标技能的属性数据可以包括技能名称，以及熟悉程度、代码开发行数、应用项目数目等中的至少一种。
41.为了便于后续进行数据运算，通常将目标技能数据以向量的方式加以表示。举例说明，当目标技能名称为java，熟练程度为精通时，一个二维结构的目标技能数据可以是[java，精通]。
[0042]
目标场景数据可以理解为对目标技能的需求方的属性数据进行格式转化后得到的结构化数据。例如，目标场景的属性数据可以包括企事业单位自身属性、历史统计属性和技能需求属性等中的至少一种。企事业单位自身属性可以包括例如单位类型、年限、城市、详细地址等信息中的至少一种。历史统计属性可以包括所在城市历史月薪统计数据，例如，可以包括历史月薪的均值、方差、最大值和最小值等统计值中的至少一种。技能需求属性可以包括例如工作经验和毕业年限等信息中的至少一种。
[0043]
目标场景数据可以包括离散场景数据和/或连续场景数据。连续场景数据用于人为设定场景与技能之间的关系，以便后续依据该关系进行设定维度特征的提取，也即从该连续场景数据自身查找特征规律。例如，位于a市的已成立13年的上市公司互联网公司b，招聘算法工程师，该职位历史月薪的均值为10000元，方差为500元，最高月薪为12000元，最低月薪为8000元，那么该目标场景所对应的连续场景数据可以是{[10000,500,12000,8000],[a市，b公司,上市公司,13年,互联网类]}。离散场景数据用于仅限定职位自身的技能需求，以便后续基于该需求进行非设定维度特征的挖掘。例如，公司b招聘的算法工程师要求工作地点在c市，应届毕业生，那么该目标场景所对应的离散场景数据可以是[c市,应届毕业生]。
[0044]
示例性地，目标技能和目标场景可以从招聘数据中提取得到，也可以由待测用户的个人能力和技能提升需求确定。举例说明，用户甲想要应聘公司a中的岗位b，自身具备与该岗位相关的技能a和技能b，则可以根据通过上述方式生成目标技能和目标场景，从而采用本技术所涉及的数据处理方法，实现对个人能力的价值评估。进一步地，用户甲目前有学习与该岗位相关的技能c和技能d的计划，还可以结合待学习的技能c和技能d，生成目标技能和目标场景，进而采用本技术所涉及的数据处理方法，实现对未来个人能力的价值评估，并根据价值评估结果，反向指导自己进行哪些技能的学习。
[0045]
需要说明的是，上述示例仅通过示例方式对目标技能数据和目标场景数据加以说明，不能作为对目标技能数据和目标场景数据的限定。例如，目标技能数据和目标场景数据可以采用其他方式加以呈现，数据内容也可以不限于内容本身，例如，还可以采用代码标识的方式呈现。
[0046]
可以理解的是，为了提高后续所确定的需求亲密度数据的准确度和全面性，通常目标场景数据包括离散场景数据和连续场景数据。
[0047]
在一个可选实施例中，可以预先存储有各场景下的不同技能对应的技能场景数据表。相应的，获取结构化表示的目标技能的目标技能数据，以及目标场景的目标场景数据，可以是在技能场景数据表中，查找与目标技能和目标场景分别对应的目标技能数据和目标场景数据。技能场景数据表可以存储在电子设备本地、或者与电子设备相关联的其他存储设备中，并在需要时进行技能场景数据表的查找获取。
[0048]
在另一个可选实施例中，可以按照设定数据转化规则，将非结构化的目标技能的
属性数据和目标场景的属性数据，分别转化为结构化的目标技能数据和目标场景数据。设定数据转化规则可以是编码规则，可以由技术人员根据需要或经验进行设定，或通过大量试验加以确定，包括但不限于独热(one-hot)编码。
[0049]
s102、确定所述目标技能数据与所述目标场景数据之间的需求紧密度数据。
[0050]
示例性地，可以采用多层感知机、因子分解机或其他特征提取网络，对目标技能数据与目标场景数据进行特征提取，从而确定目标技能数据与目标场景数据之间的需求紧密度数据。
[0051]
在一个可选实施例中，为了提高价值技能的确定效率和确定结果准确度，可以采用预先训练好的场景感知网络，对目标技能数据和目标场景数据进行特征抽取，得到需求紧密度数据。例如，可以采用大量样本技能的样本技能数据、和样本技能所关联的样本场景的样本场景数据，作为训练样本输入至预先构建的第一神经网络模型中，并根据模型输出结果与样本技能对应的实际薪酬之间的偏差，对第一神经网络模型的网络参数加以优化，从而得到训练好的场景感知网络。
[0052]
s103、根据所述需求紧密度数据，确定所述目标技能在所述目标场景下的技能价值。
[0053]
技能价值可以是目标技能的金钱价值，例如可以是招聘数据中的薪酬，或薪酬中的一部分。
[0054]
技能价值可以是单一数值，还可以是由价值上限和价值下限组合得到的价值区间，用于限定价值范围，以实现对技能的区间定价。价值上限不小于价值下限，价值上限和价值下限均为非负数据。
[0055]
示例性地，可以采用预先训练好的第二神经网络模型，根据需求紧密度数据，确定目标技能在目标场景下的技能价值。第二神经网络模型和第一神经网络模型的网络结构可以相同或不同。示例性地，该第二神经网络模型可以是全连接神经网络。可选的，可以通过在第二神经网络模型中引入非负激活函数，以保证所确定的技能价值的非负性。
[0056]
本技术实施例通过获取结构化表示的目标技能的目标技能数据，以及目标场景的目标场景数据；目标场景具有对目标技能的使用需求；确定目标技能数据与目标场景数据之间的需求紧密度数据；根据需求紧密度数据，确定目标技能在目标场景下的技能价值。上述技术方案，通过引入目标技能数据和目标场景数据的需求紧密度数据，作为技能价值确定的参照依据，从而实现对目标技能的技能价值的定量计算，实现了对单一技能的价值量化，进而为用户个人能力测评或职业规划，以及为技能需求方针对技能需求进行薪资结构的优化，提供了数据支撑。
[0057]
图2a是本技术实施例提供的另一种数据处理方法的流程图，该方法在上述各技术方案的基础上，进行了优化改进。
[0058]
进一步地，将操作“确定所述目标技能数据与所述目标场景数据之间的需求紧密度数据”细化为“采用训练好的场景感知网络，对所述目标技能数据和所述目标场景数据进行特征抽取，得到所述需求紧密度数据”，以完善需求紧密度数据的确定机制。
[0059]
如图2a所示的一种数据处理方法，包括：
[0060]
s201、获取结构化表示的目标技能的目标技能数据，以及目标场景的目标场景数据；所述目标场景具有对所述目标技能的使用需求。
[0061]
s202、采用训练好的场景感知网络，对所述目标技能数据和所述目标场景数据进行特征抽取，得到所述需求紧密度数据。
[0062]
s203、根据所述需求紧密度数据，确定所述目标技能在所述目标场景下的技能价值。
[0063]
可选的，场景感知网络基于第一神经网络模型构建。
[0064]
可选的，目标技能在目标场景下的技能价值，采用训练好的定价网络，也即前述第二神经网络，根据需求紧密度数据加以确定。
[0065]
为了清楚的介绍需求紧密度数据的确定过程和技能价值的确定过程，参见图2b所示的技能定价网络的结构图，首先，对包括场景感知网络和定价网络的技能定价网络的模型训练过程，进行详细说明。
[0066]
场景感知网络包括技能嵌入层、场景嵌入层和特征提取层。
[0067]
在模型训练阶段，技能嵌入层，用于对样本技能数据进行降维处理，得到样本技能嵌入向量；场景嵌入层，用于对样本场景数据进行降维处理，得到样本场景嵌入向量；特征提取层，用于对样本场景数据、样本技能嵌入向量和样本场景嵌入向量中的至少一种进行特征抽取，得到样本需求紧密度数据。定价网络，用于根据样本需求紧密度数据确定价值预测结果。相应的，根据价值预测结果和样本薪酬，对场景感知网络和定价网络的网络参数进行调整。
[0068]
可以理解的是，通过技能嵌入层和场景嵌入层进行嵌入向量的确定，能够减少场景感知网络进行特征提取时的数据运算量。通过特征提取层基于样本场景数据、样本技能嵌入向量和样本场景嵌入向量中的至少一种进行特征抽取，提高了所抽取特征的全面性和准确度，进而提高了模型性能。
[0069]
由于技能对应的价值随时间在演变，例如2010年java工程师和2020年java工程师的薪资存在显著差异，因此，为了避免由于时间推移对定价结果准确度的影响，在模型训练阶段，技能嵌入层分别对各样本技能数据分时段进行降维处理，得到样本技能嵌入向量。
[0070]
为了降低模型的复杂度，在一个可选实施例中，在针对某一时段的样本技能数据进行样本技能嵌入向量的确定时，对该时段的样本技能数据进行降维处理，分别得到样本技能低秩嵌入向量和共享潜在投影矩阵；根据样本技能低秩嵌入向量和共享潜在投影矩阵的乘积，确定样本技能嵌入向量。
[0071]
为了避免分时段确定的样本技能嵌入向量带来更高的模型复杂度，进而避免模型过拟合情况的发生，在一个可选实施例中，在对场景感知网络和定价网络的网络参数进行调整时，还可以根据相邻时段的样本技能嵌入向量之间的距离，构建损失函数；根据损失函数，对场景感知网络的网络参数进行优化。
[0072]
可以理解的是，通过相邻时段的样本技能嵌入向量之间的距离，对模型加以约束，限制了模型所提取的需求紧密度数据随时间产生的急剧变化，从而降低了模型复杂度，避免了模型过拟合情况的发生。
[0073]
示例性地，通过范数计算，确定相邻时段的样本技能嵌入向量之间的距离。可选的，所采用的范数可以是f-范数(frobenius norm，弗罗贝尼乌斯范数)。
[0074]
可选的，技能的场景数据包括连续场景数据和/和离散场景数据，因此，场景嵌入层可以包括离散场景嵌入层，用于对离散场景数据进行降维处理，得到样本离散场景嵌入
向量；场景嵌入层还可以包括连续场景嵌入层，用于对连续场景数据进行降维处理，得到样本连续场景嵌入向量。
[0075]
为了提高需求紧密度数据的全面性和准确度，进而提高模型精度，在一个可选实施例中，特征提取层可以同时进行样本技能和样本场景之间的不同层次的需求紧密度数据的提取。
[0076]
可选的，根据样本技能嵌入向量和样本场景数据，确定一阶样本需求紧密度数据，以确定所输入数据的单一特征对技能价值的直接联系；根据样本技能嵌入向量和样本场景嵌入向量，确定二阶样本需求紧密度数据，以确定所输入数据的二元特征组合对技能价值的关联联系；以及根据样本场景数据、样本场景嵌入向量和样本技能嵌入向量，确定高阶样本需求紧密度数据，以确定所输入数据的多元特征组合对技能价值的高阶关联。
[0077]
示例性地，高阶样本需求紧密度数据的确定可以采用深度神经网络实现。例如，深度神经网络可以是mlp(multilayer perceptron，多层感知器)。
[0078]
可选的，采用mlp将样本场景数据、样本场景嵌入向量和样本技能嵌入向量进行特征融合；采用多个顺次连接激活层对融合后的特征进行激活处理，最终得到高阶样本需求紧密度数据。
[0079]
可选的，定价网络可以设置有至少一个非负激活函数，并通过非负激活函数，对包括一阶样本需求紧密度数据、二阶样本需求紧密度数据和高阶样本需求紧密度数据中的至少一种的样本需求紧密度数据进行激活处理，得到价值预测结果。相应的，根据价值预测结果和样本薪酬之间的差异，对定价网络和场景感知网络中的网络参数进行优化。
[0080]
在一个可选实施例中，为了保证技能价值网络具备价值区间预测功能，可以在定价网络中设置两个非负激活函数，分别对样本需求紧密度数据进行激活处理，得到价值上限预测结果和价值下限预测结果。
[0081]
可选的，在定价网络中设置两个非负激活函数，分别对样本需求紧密度数据进行激活处理，得到价值上限预测结果和价值下限预测结果，可以是：通过其中一个非负激活函数，对样本需求紧密度数据进行激活处理，得到价值下限预测结果；通过另一个非负激活函数，对样本需求紧密度数据进行激活处理，得到价值区间长度；将价值区间长度和价值下限预测结果的和值，作为价值上限预测结果。
[0082]
相应的，根据价值上限预测结果和样本薪酬上限之间的差异，以及价值下限预测结果和样本薪酬下限之间的差异，对定价网络和场景感知网络中的网络参数进行优化，后续可采用训练好的技能价值网络对目标技能在目标场景下的技能价值进行预测。
[0083]
需要说明的是，对技能价值网络的训练过程和使用过程可以采用相同或不同的电子设备加以实现。
[0084]
在技能价值网络的使用阶段，技能价值网络中的场景感知网络包括嵌入层和特征抽取层；所述嵌入层，用于分别对所述目标技能数据和所述目标场景数据进行降维处理，得到技能嵌入向量和场景嵌入向量；所述特征抽取层，用于对所述目标场景数据、所述技能嵌入向量和所述场景嵌入向量中的至少一种进行特征抽取，得到所述需求紧密度数据。
[0085]
具体的，嵌入层包括技能嵌入层，用于对目标技能数据进行降维处理，得到技能嵌入向量；以及，场景嵌入层，用于对目标场景数据进行降维处理，得到场景嵌入向量。
[0086]
可以理解的是，通过技能嵌入层和场景嵌入层进行嵌入向量的确定，能够减少场
景感知网络进行特征提取时的数据运算量。通过特征提取层基于目标场景数据、技能嵌入向量和场景嵌入向量中的至少一种进行特征抽取，提高了所抽取特征的全面性和准确度，为技能价值确定结果的确定提供了数据支撑，同时为技能价值确定结果的准确度提供了保障。
[0087]
示例性地，采用技能嵌入层中训练好的网络参数，对目标技能数据进行降维处理，得到技能嵌入向量。可选的，可以对目标技能数据进行降维处理，分别得到目标技能低秩嵌入向量和目标共享潜在投影矩阵；根据目标技能低秩嵌入向量和目标共享潜在投影矩阵的乘积，确定技能嵌入向量。
[0088]
示例性地，若目标场景数据包括目标离散场景数据，则采用离散场景嵌入层中训练好的网络参数，对目标离散场景数据进行降维处理，得到离散场景嵌入向量；若目标场景数据包括目标连续场景数据，则采用连续场景嵌入层中训练好的网络参数，对目标连续场景数据进行降维处理，得到连续场景嵌入向量。
[0089]
示例性地，采用特征抽取层中训练好的网络参数，对目标离散场景数据、目标连续场景数据、技能嵌入向量、离散场景嵌入向量和连续场景嵌入向量中的至少一种进行特征抽取，得到需求紧密度数据。特征提取层中的网络参数为模型训练完成后的参数。
[0090]
为了提高需求紧密度数据的全面性和准确度，进而提高技能价值确定结果的准确度，在一个可选实施例中，特征提取层可以同时进行目标技能和目标场景之间的不同层次的需求紧密度数据的提取。
[0091]
示例性地，需求紧密度数据包括一阶需求紧密度数据、二阶需求紧密度数据和高阶需求紧密度数据中的至少一种。
[0092]
可选的，根据目标离散场景数据和/或目标连续场景数据，以及技能嵌入向量，确定一阶需求紧密度数据，用于表征目标场景和目标技能的单一特征对技能价值的直接联系；根据离散场景嵌入向量和/或连续场景嵌入向量，以及技能嵌入向量，确定二阶需求紧密度数据，用于表征目标场景和目标技能的二元特征组合对价值技能的关联联系；根据目标连续场景数据和连续场景嵌入向量，和/或，目标离散场景数据和离散场景嵌入向量，以及技能嵌入向量，确定高阶需求紧密度数据，用于表征目标技能和目标场景的多元特征组合对技能价值的高阶关联。可选的，根据定价网络中设置的至少一个非负激活函数，对需求紧密度数据进行激活处理，得到目标技能在目标场景下的技能价值。非负激活函数中的网络参数为模型训练完成后所对应的参数。
[0093]
在一个可选实施例中，若技能价值网络具备价值区间预测功能，相应的，还可以根据定价网络中设置的两个非负激活函数，分别对需求紧密度数据进行激活处理，得到目标技能在目标场景下的技能价值的价值上限和价值下限。
[0094]
可选的，若定价网络中设置有两个非负激活函数，可以通过其中一个非负激活函数，对需求紧密度数据进行激活处理，得到目标技能在目标场景下的价值下限；通过另一个非负激活函数，对需求紧密度数据进行激活处理，得到价值区间长度；将价值区间长度和价值下限的和值，作为目标技能在目标场景下的价值上限。
[0095]
本技术实施例通过将紧密度数据确定操作，细化为采用训练好的场景感知网络，对目标技能数据和目标场景数据进行特征提取，得到需求紧密度数据，完善了需求紧密度数据的确定机制，并通过机器学习模型的使用，提高了需求紧密度数据的提取效率，同时提
高了所提取的需求紧密度数据的准确性和全面度。
[0096]
图3是本技术实施例提供的另一种数据处理方法的流程图，该方法在上述各技术方案的基础上，进行了优化改进。
[0097]
进一步地，将操作“根据所述需求紧密度数据，确定目标技能在目标场景下的技能价值”之后，追加“确定所述目标技能在所述目标技能的各邻近技能中的支配权重；所述支配权重表示所述目标技能在各所述邻近技能中的重要性；根据所述支配权重对所述技能价值进行加权，以更新所述技能价值”，以实现对目标技能的更细粒度的定价。
[0098]
如图3所示的一种数据处理方法，包括：
[0099]
s301、获取结构化表示的目标技能的目标技能数据，以及目标场景的目标场景数据；所述目标场景具有对所述目标技能的使用需求。
[0100]
s302、确定所述目标技能数据与所述目标场景数据之间的需求紧密度数据。
[0101]
s303、根据所述需求紧密度数据，确定所述目标技能在所述目标场景下的技能价值。
[0102]
s304、确定所述目标技能在所述目标技能的各邻近技能中的支配权重；所述支配权重表示所述目标技能在各所述邻近技能中的重要性。
[0103]
需要说明的是，一般情况下，技能需求方所需求技能可能不止一个，各技能之间存在一定关联。例如，java工程师不仅需要精通java语言，还需要具备mysql等数据库处理能力，那么java技能和mysql技能的技能价值相互之间存在一定的影响。又如，具备java技能的java工程师，同时具备c 技能，那么该java工程师的java技能和c 技能的技能价值也会相互影响又各自存在区别。再如，同时具备java技能和c 技能的java工程师，与同时具备c 技能和java技能的c 工程师，相同技能所对应的技能价值也存在差别。
[0104]
为了将存在相互影响的技能的价值进行剥离，从而实现单一技能的价值确定，还可以对不同技能的支配权重加以确定，以根据各技能的支配权重，实现对相应技能更细粒度的技能定价。
[0105]
在一个可选实施例中，可以预先通过获取大量的招聘数据，统计相同职位的招聘数据中各技能的出现频率；相应的，确定目标技能在目标技能的各邻近技能中的支配权重，可以是将各技能的出现频率作为该目标技能的支配权重。
[0106]
由于目标技能的邻近技能的数量可能远小于统计时该技能的共现技能的数量，因此，在统计出相同职位的招聘数据中各技能的出现频率之后，还可以将查找到的目标技能的出现频率，除以与目标技能和邻近技能的出现频率的和值，得到目标技能的支配权重。
[0107]
为了进一步提高所确定的支配权重的准确度，在一个可选实施例中，还可以引入目标技能在目标场景下的需求紧密度数据，来辅助确定支配权重。示例性地，根据目标技能和目标技能的各邻近技能的技能关联数据，以及需求紧密度数据，确定目标技能的支配权重。技能关联数据可以根据目标技能和邻近技能的共现频率确定。
[0108]
需要说明的是，目标技能的邻近技能可以确定支配权重之前预先获取，例如可以在获取结构化表示的目标技能的目标技能数据的过程中，一并获取。
[0109]
s305、根据所述支配权重对所述技能价值进行加权，以更新所述技能价值。
[0110]
示例性地，根据支配权重，对目标技能在目标场景下的技能价值进行加权，从而剥离邻近技能对目标技能的影响，提高所确定的技能价值的准确度。
[0111]
当技能价值包括价值上限和价值下限时，可以通过该支配权重分别对价值上限和价值下限进行加权，用于更新技能价值的价值上限和价值下限，从而为技能价值确定结果的准确度奠定基础。
[0112]
可以理解的是，在一条招聘需求中，部分技能能够提高招聘薪酬的下限，部分技能能够提高招聘薪酬的上限，因此，在单一技能的技能价值中，同一技能的价值上限和价值下限的重要性可能不同，也即价值上限的上限支配权重和价值下限的下限支配权重也可能存在一定差异。
[0113]
为了提高所确定的支配权重的准确度，当目标技能在目标场景下的技能价值包括价值上限和价值下限时，所确定的目标价值同样包括上限支配权重和下限支配权重。上限支配权重和下限支配权重相同或不同。
[0114]
在一个可选实施例中，可以在统计出相同职位的招聘数据中各技能的出现频率时，统计包括目标技能和邻近技能的薪酬下限的最大值和最小值，以及薪酬上限的最大值和最小值；根据薪酬下限的最大值和最小值，根据薪酬下限的最大值和最小值的差值，与薪酬下限最小值或最大值的比值，确定下限调节比例；根据薪酬上限的最大值和最小值的差值，与最大值或最小值的比值，与薪酬上限最大值或最小值的比值，确定上限调节比例；根据下限调节比例和目标技能的出现频率的乘积，确定目标技能的下限支配权重；根据上限调节比例和目标技能的出现频率的乘积，确定目标技能的上限支配权重。
[0115]
为了进一步将提高所确定的支配权重的准确度，在另一可选实施例中，还可以根据目标技能和目标技能的各邻近技能的技能关联数据，以及需求紧密度数据，分别确定目标技能的上限支配权重和下限支配权重。技能关联数据可以根据目标技能和邻近技能的共现频率确定。
[0116]
相应的，根据支配权重对技能价值进行加权，以更新技能价值，可以是采用上限支配权重对技能价值的价值上限进行加权，以更新价值上限；以及，采用下限支配权重对技能价值的价值下限进行加权，以更新价值下限。
[0117]
在一个可选实施例中，还可以在分别确定多个目标技能在同一目标场景下的技能价值之后，针对其中一个目标技能，将其他目标技能作为该目标技能的邻近技能，确定该目标技能的支配权重；根据各目标技能的支配权重对相应的技能价值进行加权求和，并将最终结果作为该多个目标技能对应的综合薪酬。
[0118]
可以理解的是，采用综合薪酬确定的方式，能够针对某条包含有至少两个技能需求的招聘数据，进行岗位薪酬确定，从而为技能需求方发布招聘数据时的薪资标准提供了参考。另外，针对个人技能提升方面，还可以根据个人技能需求和入职意向(对应技能场景)，对自身价值进行有效评估，实现自身技能价值的综合量化，从而指导个人进行短期或长期的职业规划。
[0119]
本技术实施例通过确定目标技能在目标技能的邻近技能中的支配权重；支配权重表示目标技能在各邻近技能中的重要性；根据支配权重对技能价值进行加权，以更新技能价值。上述技术方案通过引入目标技能的支配权重，能够将目标技能的技能价值从对目标技能产生相互影响的其他技能中进行剥离，从而实现对单一技能更细粒度的技能定价，提高了所确定技能价值的准确度。
[0120]
图4a是本技术实施例提供的另一种数据处理方法的流程图，该方法在上述各技术
方案的基础上，进行了优化改进。
[0121]
进一步地，将操作“确定所述目标技能在所述目标技能的各邻近技能中的支配权重”细化为“根据所述目标技能和所述目标技能的各邻近技能的技能关联数据，以及所述需求紧密度数据，确定所述目标技能的支配权重”，以完善支配权重的确定机制。
[0122]
如图4a所示的一种数据处理方法，包括：
[0123]
s401、获取结构化表示的目标技能的目标技能数据，以及目标场景的目标场景数据；所述目标场景具有对所述目标技能的使用需求。
[0124]
s402、确定所述目标技能数据与所述目标场景数据之间的需求紧密度数据。
[0125]
s403、根据所述需求紧密度数据，确定所述目标技能在所述目标场景下的技能价值。
[0126]
s404、根据所述目标技能和所述目标技能的各邻近技能的技能关联数据，以及所述需求紧密度数据，确定所述目标技能的支配权重。
[0127]
所述支配权重表示所述目标技能在各所述邻近技能中的重要性。
[0128]
邻近技能表征能够与目标技能同时出现在同一招聘数据的技能，或者在同一技能场景下，与目标技能同时具备需求的其他技能。
[0129]
技能关联数据可以是根据目标技能和邻近技能的共现频率构建的矩阵。
[0130]
示例性地，预先针对获取大量的招聘数据，并构建技能图。参见图4b所示的一种技能图结构示意图对技能图进行详细说明。
[0131]
参见图4b中的技能图，包括节点(对应图中圆圈)、边和属性描述。每个节点对应一项技能；两个节点的连边表示两个节点对应的技能会在同一招聘数据中出现，表征两个节点对应的技能互为邻近技能。每个节点对应有节点的属性描述，用于表征该节点对应技能的熟悉程度，例如精通、熟练、了解等。每个边对应有边的属性描述，用于表征所连接的两个节点对应技能在大量招聘数据中的共现频率。共现频率即为在同时出现两个技能的招聘数据的数量与总招聘数据数量的比值。
[0132]
示例性地，可以预先将技能图进行存储，相应的，获取目标技能和目标技能的邻近技能之后，可以通过查找技能图的方式，确定目标技能与各邻近技能的共现频率，进而得到包含各目标技能和邻近技能的共现频率的矩阵。
[0133]
示例性地，可以采用图网络，根据目标技能和目标技能的各邻近技能的技能关联数据，以及需求紧密度数据，确定目标技能的支配权重。示例性地，图网络可以是图卷积神经网络或其他神经网络。
[0134]
为了提高支配权重确定结果的确定效率和确定结果准确度，在一个可选实施例中，可以采用预先训练好的技能支配网络，根据目标技能和目标技能的各邻近技能的技能关联数据，以及需求紧密度数据，确定目标技能的支配权重。技能支配网络采用大量样本技能和样本技能的各邻近技能的样本技能关联数据，以及样本技能和样本场景之间的需求紧密度数据，作为训练样本输入至预先构建的图卷积神经网络模中，并根据模型输出结果和技能价值的加权和，与样本薪酬的偏差，对图卷积神经网络模型和前述各神经网络模型的网络参数加以优化，从而得到训练好的技能支配网络和训练好的场景感知网络。
[0135]
参见图4c所示的技能支配网络的结构图可知，技能支配网络包括自身影响力提取层、相互影响力提取层和支配权重激活层；所述自身影响力提取层，用于提取所述需求紧密
度数据中与所述目标技能相关的自身影响力特征；所述相互影响力提取层，用于根据所述技能关联数据，提取所述需求紧密度数据中各技能之间的相互影响力特征；所述支配权重激活层，用于根据所述自身影响力特征和所述相互影响力特征，确定所述目标技能的支配权重。
[0136]
自身影响力特征，表征目标技能和目标场景对目标技能自身重要性的影响；相互影响力特征，表征邻近技能对目标技能的重要性产生的影响。通过自身影响力特征和相互影响力特征进行目标技能的支配权重的确定，能够从目标技能自身、目标技能所处目标场景以及目标技能所关联邻近技能这三个层面上进行目标技能的支配权重的确定，提高了支配权重确定结果的准确度，进而提高了最终确定的技能价值的准确度。
[0137]
在一个可选实施例中，自身影响力提取层可以包括多层感知机，从而基于训练好的网络参数，提取需求紧密度数据中与目标技能相关的自身影响力特征。
[0138]
在另一可选实施例中，相互影响力提取层可以包括多层感知机，从而基于训练好的网络参数，提取需求紧密度数据中与目标技能相关的涉外影响力特征，并将涉外影响力特征作为相互影响力特征。其中进行涉外影响力特征提取的多层感知机，与进行自身影响力特征提取的多层感知机结构可以相同或不同。
[0139]
为了提高所提取的相互影响力特征的全面性和准确度，在又一可选实施例中，相互影响力提取层还可以包括图卷积神经网络，用于根据涉外影响力特征和技能关联数据，提取需求紧密度数据中目标技能与各邻近技能之间的局部影响力特征；将局部影响力特征作为相互影响力特征，或者将局部影响力特征和涉外影响力特征作为相互影响力特征。
[0140]
可选的，根据自身影响力特征和相互影响力特征，确定目标技能的支配权重，可以是：根据局部影响力特征和自身影响力特征，确定目标技能的支配权重。示例性地，可以采用注意力机制，对局部影响力特征和自身影响力特征进行处理，得到目标技能的支配权重。
[0141]
为了进一步提高所确定的支配权重的准确性，可选的，根据自身影响力特征和相互影响力特征，确定目标技能的支配权重，可以是：根据局部影响力特征、涉外影响力特征和自身影响力特征，确定目标技能的支配权重。示例性地，可以将局部影响力特征和自身影响力特征进行特征融合；采用注意力机制，对融合后的特征和涉外影响力特征的均值特征进行处理，得到目标技能的支配权重。
[0142]
需要说明的是，当支配权重包括上限支配权重和下限支配权重时，在技能支配网络的模型训练阶段，会针对上限支配权重和下限支配权重分别训练两组不同的网络参数，相应的，在技能支配网络的模型使用阶段，分别采用上限支配权重对应的网络参数，以及下限支配权重对应的网络参数，进行上限支配权重和下限支配权重的确定。
[0143]
s405、根据所述支配权重对所述技能价值进行加权，以更新所述技能价值。
[0144]
本技术实施例通过将支配权重的确定操作，细化为根据目标技能和目标技能的各邻近技能的技能关联数据，以及需求紧密度数据，确定目标技能的支配权重，从而完善了支配权重的确定机制，并通过引入技能关联数据和需求紧密度数据，充分考量目标技能自身、目标技能与目标场景的需求关系以及邻近技能对目标技能的相互影响等因素，对目标技能的支配权重的影响，从而提高了所确定的支配权重的准确度，为同一目标场景下多技能的价值剥离提供了保证，为提高最终所确定的技能价值的准确度奠定了基础。
[0145]
图5a是本技术实施例提供的另一种数据处理方法的流程图，该方法在上述各技术
方案的基础上，提供了一种优选实施方式。
[0146]
如图5a所示的一种数据处理方法，包括：数据预处理阶段510、模型训练阶段520和模型使用阶段530。
[0147]
数据预处理阶段510，包括：
[0148]
s511、获取多条招聘数据；招聘数据包括技能数据、工作场景数据和监督数据。
[0149]
技能数据包括技能名称、相同工作场景下的技能共现频率和技能熟练程度。技能熟练程度可以是精通、熟练和了解等。
[0150]
工作场景数据包括技能需求方的自身属性、历史统计属性和技能需求属性，例如企事业单位的自身属性，例如包括上市情况、从业类型、成立年限等中的至少一种。历史统计属性为该技能需求方所在城市历史月薪统计数据，包括均值、方差、最大值和最小值中的至少一种。技能需求属性，包括工作经验和毕业年限等中的至少一种。
[0151]
监督数据，包括薪酬上限和薪酬下限。
[0152]
s512、根据技能数据生成技能图。
[0153]
参见图5b所示的技能图，通过节点表示技能；将在同一条招聘数据中同时出现的技能通过边连接；将各技能的技能熟练程度作为该技能对应节点的描述数据；将通过边连接的技能在所有招聘数据的共现频率作为边的描述数据。
[0154]
s513、将工作场景数据中的技能需求属性和技能需求方的城市编码，通过独热编码，得到结构化的离散场景向量。
[0155]
示例性地，若某条招聘数据中城市编码为xxx，要求工作经验为3年，则形成的离散场景向量可以是[xxx,1]。在该示例中，招聘应届毕业生，则工作经验用“0”表示；1-3年，则工作经验用“1”表示；3-5年，则工作经验用“2”表示。
[0156]
s514、将工作场景数据中的技能需求方的自身属性和历史统计属性，分别生成两个结构化的连续场景向量。
[0157]
示例性地，若某条招聘数据如下：位于a市的已成立13年的上市公司互联网公司b，招聘算法工程师，而该职位的历史月薪统计情况如下：均值为10000元，方差为500元，最高月薪为12000元，最低月薪为8000元，那么确定的与技能需求方的自身属性对应的连续场景向量可以是[a市，b公司,上市公司,13年,互联网类]；确定的与历史统计属性对应的连续场景向量可以是[10000,500,12000,8000]。当然连续场景向量中的向量元素，还可以采用其他编码方式加以确定，具体所采用编码方式可以由技术人员根据需要或经验值加以确定。
[0158]
s515、将监督数据生成结构化的监督向量。
[0159]
若某条招聘数据中提供的薪酬范围为8000-10000，则所生成的监督向量可以是[8000,10000]。
[0160]
参见图5c所示的一种技能定价组合模型的结构示意图，该技能定价组合模型为一个二部神经网络，包括用于场景感知和技能定价的技能定价网络，以及用于进行技能权重支配和薪酬确定的薪酬预测网络。
[0161]
模型训练阶段520，包括：
[0162]
s521、根据技能图，生成包括样本技能的技能名称和技能熟练程度的样本技能向量；
[0163]
s522、将样本技能的样本技能向量和样本场景的样本场景数据，作为训练样本输
入至场景感知网络，得到样本技能与样本场景的交互数据。
[0164]
具体的，根据以下公式，确定样本技能与样本场景的交互数据：
[0165]
x＝f(c,s,l|θ)；
[0166]
其中，x为交互数据，c为样本场景数据，包括离散场景向量和连续场景向量，s为技能名称，l为技能熟练程度，θ为待训练参数。其中，f()为信息抽取函数，采用场景感知网络加以实现。
[0167]
s523、根据交互数据，输入至定价网络对样本技能的价值区间进行预测，得到样本预测价值区间。
[0168]
具体的，根据以下公式，确定样本预测价值区间：
[0169][0170]
其中，[v
l
,v
u
]为样本预测价值区间，φ
l
和φ
u
为待训练参数，gl()和gu()为非负激活函数，采用定价网络加以实现。
[0171]
其中，预测的价值下限v
l
和价值上限v
u
满足以下条件：v
l
≥0，v
u
≥0，并且v
l
≤v
u
。
[0172]
s524、根据技能图，获取样本技能与样本邻近技能的共现频率，并根据获取的各共现频率生成邻接矩阵。
[0173]
s525、将邻接矩阵和交互数据输入至技能支配网络，得到样本技能的技能权重区间。
[0174]
具体的，采用以下公式，确定样本技能的技能权重区间：
[0175][0176]
其中，[d
l
,d
u
]为技能权重区间，a为邻接矩阵，x为部分或全部交互数据，或生成交互数据时的隐层向量，ψ
l
和ψ
u
为两组待训练参数。h()为权重计算函数，采用技能支配网络加以实现。
[0177]
s526、将同一招聘数据中的各样本技能的技能权重区间中的上下限，对样本预测价值区间中的价值上下限进行加权，得到各样本技能的最终预测价值区间。
[0178]
s527、针对每条招聘数据，将数据中各样本技能的最终预测价值区间求和，得到预测薪酬区间。
[0179]
具体的，根据以下公式确定各样本技能的预测薪酬区间：
[0180][0181]
其中，为某条招聘数据对应的预测薪酬区间，为该条招聘数据中第i个样本技能的技能权重区间；为该条招聘数据中第i个样本技能的样本预测价值区间，n为该条招聘数据中所包含的技能数量。
[0182]
s528、根据预测薪酬区间与该条招聘数据的监督向量对应的实际薪酬区间的区间
差异，对技能定价组合模型中各网络的网络参数进行优化。
[0183]
根据以下损失函数，对技能定价组合模型中各网络的网络参数进行优化：
[0184][0185]
其中，l
s
为本次模型训练的损失函数值，|j|为本次模型训练招聘数据的条数，为第j条招聘数据对应的预测薪酬区间，为第j条招聘数据对应的实际薪酬区间，λ
l
和λ
u
为超参数。
[0186]
在对技能定价组合模型中各网络的网络参数进行优化是，可以采用优化方法找到使损失函数的函数值达到局部最小值的参数，该优化方法包括但不限于随机梯度下降等优化方法。
[0187]
结合图5d所示的技能定价网络的结构示意图和图5e所示的技能支配网络的结构示意图，对模型训练过程进行详细说明。
[0188]
参见图5d，技能定价网络包括场景感知网络和定价网络。场景感知网络，包括：技能嵌入层、离散场景嵌入层、连续场景嵌入层和特征提取层。
[0189]
具体的，技能嵌入层，提取技能在不同时段的嵌入特征，为了降低模型复杂性，假设技能嵌入由低秩嵌入和潜在的投影矩阵组合，写作：
[0190][0191]
其中，中存储第t个时间段的技能嵌入向量，t是时间段的数量，n
s
表示样本技能的数量；是低秩嵌入，w
vs
∈r
dl
×
de
表示所有时间段共享的潜在投影矩阵，de表示嵌入的维度，dl是隐变量的数量。时间段的长度有技术人员根据需要或经验值确定。
[0192]
通过上述针对不同时段动态建模的方式，提升了技能定价模型对技能在不同时间段的技能价值进行建模评估的能力，但带来了更高的模型复杂度，容易导致模型过拟合。
[0193]
为了避免模型过拟合，在技能定价组合模型的训练过程中，在损失函数中引入时间维度的正则化项，具体如下：
[0194][0195]
其中，||||
f
表示f-范数，这个正则化项约束技能的表征不会随时间产生急剧的变化。
[0196]
具体的，离散场景嵌入层，根据以下公式，为每个离散场景向量分配一个嵌入，得到离散场景嵌入：
[0197][0198]
其中，为离散场景嵌入，为离散场景向量，m
i
为离散场景向量的向量维度，为待训练参数；其中，i∈d，其中d表示离散场景向量的集合。
[0199]
具体的，连续场景嵌入层，根据以下公式，为每个连续场景向量分配一个嵌入，得到连续场景嵌入：
[0200][0201]
其中，为连续场景嵌入，为连续场景向量，d
i
为连续场景向量的向量维度，和为待训练参数；其中，i∈c，其中c表示连续场景向量的集合。
[0202]
为了提取尽可能多的信息，技能定价模型通过特征提取层，提取样本场景和样本技能之间的深层和浅层交互，首先以不同的方式处理离散场景向量和连续场景向量，并通过线性投影、乘法运算和mlp来提取各层面的交互数据。交互数据包括一阶交互数据、二阶交互数据和高阶交互数据。
[0203]
具体的，一阶交互数据，根据如下公式计算确定：
[0204][0205]
其中，h1为一阶交互数据，e
s
∈r
de
表示样本技能的技能嵌入向量，为中该样本技能对应的行向量，和为待训练参数，d
o1
为输出维度。
[0206]
具体的，二阶交互数据，根据如下公式计算确定：
[0207][0208]
其中，
⊙
表示逐元素乘法，h2为二阶交互数据。
[0209]
具体的，高阶交互数据，根据如下公式计算确定：
[0210][0211]
其中，k是mlp深度，为待训练参数，x
(k)
表示第k层的输出，σ()表示激活函数，*|*表示连接两个向量，我们将最终输出的x
(k)
作为高阶交互数据h3。
[0212]
将一阶交互数据h1，二阶交互数据h2，以及高阶交互数据h3中的组合得到交互数据x。
[0213]
将x输入至定价网络，根据前述v
l
和v
u
相关公式确定样本预测价值区间，在此不再赘述。
[0214]
参见图5e，技能支配网络，包括：自身影响力提取层、涉外影响力提取层、局部影响力提取层和支配权重激活层。
[0215]
具体的，自身影响力提取层，用一个多层感知机为每种技能提取其自身与重要性相关的特征表示，得到自身影响力特征x
imp
∈r
n
×
dp
。其中，n表示涉及的技能数，dp为超参数，表示所提取特征维度。多层感知机包括多个顺序连接的线性处理层和非线性处理层。
[0216]
具体的，涉外影响力提取层，用另一个多层感知机为每种技能提取其自身与重要性相关的特征表示，得到自身影响力特征x
inf
∈r
n
×
di
。其中，dp为超参数，表示所提取特征维度。多层感知机包括多个顺序连接的线性处理层和非线性处理层。确定x
imp
和确定x
inf
的多层感知机的结构可以相同或不同。
[0217]
具体的，局部影响力提取层，通过图卷积神经网络提取每个技能受邻近技能的影
响大小，得到局部影响力特征，具体采用以下公式实现：
[0218]
u＝gcn(x
inf
,a)；
[0219]
u为局部影响力特征，a为样本技能的邻接矩阵，gcn()为图卷积神经网络对应的函数。
[0220]
具体的，支配权重激活层，引入注意力机制，并具体采用如下公式确定各样本技能的技能权重区间：
[0221][0222]
其中，q为涉外影响力特征x
inf
的均值特征，作为涉外影响力特征的全局表征；[d
l
,d
u
]为预测的样本技能的技能权重区间，w
ql
、w
kl
和w
vl
为下限技能权重d
l
所对应的模型的待训练参数；w
qu
、w
ku
和w
vu
为上限技能权重d
u
所对应的模型的待训练参数，两组待训练参数采用相同的技能支配网络分别训练得到；softmax()为激活函数。
[0223]
模型使用阶段530，包括：
[0224]
s531、获取招聘数据中的其中一个技能作为目标技能；
[0225]
s532、将目标技能的技能数据和该目标技能关联的目标场景的工作场景数据输入至技能定价网络，得到目标技能的价值区间和交互数据。
[0226]
s533、将招聘数据中除目标技能之外的其他技能作为邻近技能，确定目标技能的邻接矩阵。
[0227]
s534、将目标技能的邻接矩阵和交互数据输入至薪酬预测网络，得到目标技能的薪酬区间。
[0228]
s535、将招聘数据中各技能分别对应的薪酬区间加和，得到招聘数据对应的综合薪酬。
[0229]
图6是本技术实施例提供的一种数据处理装置的结构图，该数据处理装置600，包括：结构化数据获取模块601、需求紧密度数据确定模块602和技能价值确定模块603。
[0230]
结构化数据获取模块601，用于获取结构化表示的目标技能的目标技能数据，以及目标场景的目标场景数据；所述目标场景具有对所述目标技能的使用需求；
[0231]
需求紧密度数据确定模块602，用于确定所述目标技能数据与所述目标场景数据之间的需求紧密度数据；
[0232]
技能价值确定模块603，用于根据所述需求紧密度数据，确定所述目标技能在所述目标场景下的技能价值。
[0233]
本技术实施例通过结构化数据获取模块获取结构化表示的目标技能的目标技能数据，以及目标场景的目标场景数据；目标场景具有对目标技能的使用需求；通过需求紧密度数据确定模块确定目标技能数据与目标场景数据之间的需求紧密度数据；通过技能价值确定模块根据需求紧密度数据，确定目标技能在目标场景下的技能价值。采用上述技术方案，通过引入目标技能数据和目标场景数据的需求紧密度数据作为技能价值确定的参照依
据，从而实现对目标技能的技能价值的定量计算，实现了对单一技能的价值量化，进而为用户个人能力测评或职业规划，以及为技能需求方针对技能需求进行薪资结构的优化，提供了数据支撑。
[0234]
进一步地，需求紧密度数据确定模块602，包括：
[0235]
需求紧密度数据确定单元，用于采用训练好的场景感知网络，对所述目标技能数据和所述目标场景数据进行特征抽取，得到所述需求紧密度数据。
[0236]
进一步地，所述场景感知网络包括嵌入层和特征抽取层；
[0237]
所述嵌入层，用于分别对所述目标技能数据和所述目标场景数据进行降维处理，得到技能嵌入向量和场景嵌入向量；
[0238]
所述特征抽取层，用于对所述目标场景数据、所述技能嵌入向量和所述场景嵌入向量中的至少一种进行特征抽取，得到所述需求紧密度数据。
[0239]
进一步地，所述需求紧密度数据包括一阶需求紧密度数据、二阶需求紧密度数据和高阶需求紧密度数据中的至少一种；
[0240]
相应的，所述特征抽取层，包括：
[0241]
一阶需求紧密度数据确定单元，用于根据所述技能嵌入向量和所述目标场景数据，确定所述一阶需求紧密度数据；
[0242]
二阶需求紧密度数据确定单元，用于根据所述技能嵌入向量和所述场景嵌入向量，确定所述二阶需求紧密度数据；
[0243]
高阶需求紧密度数据确定单元，用于根据所述目标场景数据、所述场景嵌入向量和所述技能嵌入向量，确定所述高阶需求紧密度数据。
[0244]
所述装置还包括，模型训练模块，用于对场景感知网络进行模型训练；
[0245]
所述模型训练模块，包括：
[0246]
样本技能嵌入向量确定单元，用于在对样本技能数据进行降维处理，得到样本技能嵌入向量时，分别对各所述样本技能数据分时段进行降维处理，得到所述样本技能嵌入向量。
[0247]
进一步地，所述模型训练模块，包括：
[0248]
损失函数构建单元，用于根据相邻时段的样本技能嵌入向量之间的距离，构建损失函数；
[0249]
模型训练单元，用于根据所述损失函数，对所述场景感知网络的网络参数进行优化。
[0250]
进一步地，技能价值确定模块603，包括：
[0251]
技能价值确定单元，用于采用预先训练好的神经网络模型，根据所述需求紧密度数据，确定所述目标技能在所述目标场景下的技能价值。
[0252]
进一步地，所述技能价值包括价值上限和价值下限；
[0253]
所述价值上限不小于所述价值下限。
[0254]
进一步地，该装置还包括：
[0255]
支配权重确定模块，用于在根据所述需求紧密度数据，确定目标技能在目标场景下的技能价值之后，确定所述目标技能在所述目标技能的各邻近技能中的支配权重；所述支配权重表示所述目标技能在各所述邻近技能中的重要性；
[0256]
技能价值更新模块，用于根据所述支配权重对所述技能价值进行加权，以更新所述技能价值。
[0257]
进一步地，支配权重确定模块，包括：
[0258]
支配权重确定单元，用于根据所述目标技能和所述目标技能的各邻近技能的技能关联数据，以及所述需求紧密度数据，确定所述目标技能的支配权重。
[0259]
进一步地，支配权重确定单元，包括：
[0260]
支配权重确定子单元，用于采用训练好的技能支配网络，根据所述目标技能和所述目标技能的各邻近技能的技能关联数据，以及所述需求紧密度数据，确定所述目标技能的支配权重。
[0261]
进一步地，所述技能支配网络包括自身影响力提取层、相互影响力提取层和支配权重激活层；
[0262]
所述自身影响力提取层，用于根据所述技能关联数据，提取所述需求紧密度数据中与所述目标技能相关的自身影响力特征；
[0263]
所述相互影响力提取层，用于提取所述需求紧密度数据中各技能之间的相互影响力特征；
[0264]
所述支配权重激活层，用于根据所述自身影响力特征和所述相互影响力特征，确定所述目标技能的支配权重。
[0265]
进一步地，所述相互影响力提取层，包括：
[0266]
涉外影响力特征提取单元，用于提取所述需求紧密度数据中与所述目标技能相关的涉外影响力特征；
[0267]
局部影响力特征提取单元，用于根据所述涉外影响力特征和所述技能关联数据，提取所述需求紧密度数据中所述目标技能与各所述邻近技能之间的局部影响力特征；
[0268]
相互影响力特征提取单元，用于将所述局部影响力特征和/或所述涉外影响力特征，作为所述相互影响力特征。
[0269]
进一步地，支配权重激活层，包括：
[0270]
特征融合单元，用一个将所述局部影响力特征和所述自身影响力特征进行特征融合；
[0271]
支配权重确定单元，用于采用注意力机制，对融合后的特征和所述涉外影响力特征的均值特征进行处理，得到所述目标技能的支配权重。
[0272]
进一步地，所述技能关联数据为根据所述目标技能和所述邻近技能的共现频率构建的矩阵。
[0273]
进一步地，若所述技能价值包括价值上限和价值下限，则所述支配权重包括上限支配权重和下限支配权重；
[0274]
所述上限支配权重和所述下限支配权重相同或不同。
[0275]
进一步地，所述目标技能包括算法技能和/或编程语言技能；所述目标场景包括企事业单位；所述技能价值为薪酬。
[0276]
上述数据处理装置用于执行本技术实施例提供的任一数据处理方法，具备执行数据处理方法相应的功能模块和有益效果。
[0277]
根据本技术的实施例，本技术还提供了一种电子设备和一种可读存储介质。
[0278]
如图7所示，是实现本技术实施例的数据处理方法的电子设备的框图。电子设备旨在表示各种形式的数字计算机，诸如，膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置，诸如，个人数字处理、蜂窝电话、智能电话、可穿戴设备和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例，并且不意在限制本文中描述的和/或者要求的本技术的实现。
[0279]
如图7所示，该电子设备包括：一个或多个处理器701、存储器702，以及用于连接各部件的接口，包括高速接口和低速接口。各个部件利用不同的总线互相连接，并且可以被安装在公共主板上或者根据需要以其它方式安装。处理器可以对在电子设备内执行的指令进行处理，包括存储在存储器中或者存储器上以在外部输入/输出装置(诸如，耦合至接口的显示设备)上显示gui的图形信息的指令。在其它实施方式中，若需要，可以将多个处理器和/或多条总线与多个存储器和多个存储器一起使用。同样，可以连接多个电子设备，各个设备提供部分必要的操作(例如，作为服务器阵列、一组刀片式服务器、或者多处理器系统)。图7中以一个处理器701为例。
[0280]
存储器702即为本技术所提供的非瞬时计算机可读存储介质。所述存储器存储有可由至少一个处理器执行的指令，以使所述至少一个处理器执行本技术所提供的数据处理方法。本技术的非瞬时计算机可读存储介质存储计算机指令，该计算机指令用于使计算机执行本技术所提供的数据处理方法。
[0281]
存储器702作为一种非瞬时计算机可读存储介质，可用于存储非瞬时软件程序、非瞬时计算机可执行程序以及模块，如本技术实施例中的数据处理方法对应的程序指令/模块(例如，附图6所示的结构化数据获取模块601、需求紧密度数据确定模块602和技能价值确定模块603)。处理器701通过运行存储在存储器702中的非瞬时软件程序、指令以及模块，从而执行服务器的各种功能应用以及数据处理，即实现上述方法实施例中的数据处理方法。
[0282]
存储器702可以包括存储程序区和存储数据区，存储程序区可存储操作系统、至少一个功能所需要的应用程序；存储数据区可存储实现数据处理方法的电子设备的使用所创建的数据等。此外，存储器702可以包括高速随机存取存储器，还可以包括非瞬时存储器，例如至少一个磁盘存储器件、闪存器件、或其他非瞬时固态存储器件。在一些实施例中，存储器702可选包括相对于处理器701远程设置的存储器，这些远程存储器可以通过网络连接至实现数据处理方法的电子设备。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
[0283]
实现数据处理方法的电子设备还可以包括：输入装置703和输出装置704。处理器701、存储器702、输入装置703和输出装置704可以通过总线或者其他方式连接，图7中以通过总线连接为例。
[0284]
输入装置703可接收输入的数字或字符信息，以及产生与实现数据处理方法的电子设备的用户设置以及功能控制有关的键信号输入，例如触摸屏、小键盘、鼠标、轨迹板、触摸板、指示杆、一个或者多个鼠标按钮、轨迹球、操纵杆等输入装置。输出装置704可以包括显示设备、辅助照明装置(例如，led)和触觉反馈装置(例如，振动电机)等。该显示设备可以包括但不限于，液晶显示器(lcd)、发光二极管(led)显示器和等离子体显示器。在一些实施
方式中，显示设备可以是触摸屏。
[0285]
此处描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、专用asic(专用集成电路)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括：实施在一个或者多个计算机程序中，该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释，该可编程处理器可以是专用或者通用可编程处理器，可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令，并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。
[0286]
这些计算程序(也称作程序、软件、软件应用、或者代码)包括可编程处理器的机器指令，并且可以利用高级过程和/或面向对象的编程语言、和/或汇编/机器语言来实施这些计算程序。如本文使用的，术语“机器可读介质”和“计算机可读介质”指的是用于将机器指令和/或数据提供给可编程处理器的任何计算机程序产品、设备、和/或装置(例如，磁盘、光盘、存储器、可编程逻辑装置(pld))，包括，接收作为机器可读信号的机器指令的机器可读介质。术语“机器可读信号”指的是用于将机器指令和/或数据提供给可编程处理器的任何信号。
[0287]
为了提供与用户的交互，可以在计算机上实施此处描述的系统和技术，该计算机具有：用于向用户显示信息的显示装置(例如，crt(阴极射线管)或者lcd(液晶显示器)监视器)；以及键盘和指向装置(例如，鼠标或者轨迹球)，用户可以通过该键盘和该指向装置来将输入提供给计算机。其它种类的装置还可以用于提供与用户的交互；例如，提供给用户的反馈可以是任何形式的传感反馈(例如，视觉反馈、听觉反馈、或者触觉反馈)；并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。
[0288]
可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如，作为数据服务器)、或者包括中间件部件的计算系统(例如，应用服务器)、或者包括前端部件的计算系统(例如，具有图形用户界面或者网络浏览器的用户计算机，用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如，通信网络)来将系统的部件相互连接。通信网络的示例包括：局域网(lan)、广域网(wan)和互联网。
[0289]
计算机系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。
[0290]
根据本技术实施例的技术方案，通过获取结构化表示的目标技能的目标技能数据，以及目标场景的目标场景数据；目标场景具有对目标技能的使用需求；确定目标技能数据与目标场景数据之间的需求紧密度数据；根据需求紧密度数据，确定目标技能在目标场景下的技能价值。采用上述技术方案，通过引入目标技能数据和目标场景数据的需求紧密度数据作为技能价值确定的参照依据，从而实现对目标技能的技能价值的定量计算，实现了对单一技能的价值量化，进而为用户个人能力测评或职业规划，以及为技能需求方针对技能需求进行薪资结构的优化，提供了数据支撑。
[0291]
应该理解，可以使用上面所示的各种形式的流程，重新排序、增加或删除步骤。例
如，本发申请中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行，只要能够实现本技术公开的技术方案所期望的结果，本文在此不进行限制。
[0292]
上述具体实施方式，并不构成对本技术保护范围的限制。本领域技术人员应该明白的是，根据设计要求和其他因素，可以进行各种修改、组合、子组合和替代。任何在本技术的精神和原则之内所作的修改、等同替换和改进等，均应包含在本技术保护范围之内。

再多了解一些

1/2 1 2 下一页尾页

本文用于企业家、创业者技术爱好者查询，结果仅供参考。

上一篇：返回列表
下一篇：物联网保障评估方法和装置、电子设备和可读存储介质与流程

一种数据处理方法、装置、设备及存储介质与流程

相关文献

最热文献