入职员工画像生成方法、装置、计算机设备及存储介质与流程

2021-11-09 22:37:00 来源：中国专利 TAG：

1.本技术涉及大数据技术领域，尤其涉及入职员工画像生成方法、装置、计算机设备及存储介质。

背景技术：

2.传统的人力资源管理系统在人员入职时，大多是采用线下或者线上的固定模板来进行个人资料的填写，所有入职人员需要填入的资料都是固定的。公司通过入职人员填写的资料来对人员进行了解和定位。
3.但是，线上固定单一的模版格式的填写，不仅对入职人员来说毫无新意，而且对于公司来说，公司较难去挖掘员工的特性，难以对员工做出一个全方位的定位，无法为员工准确的分配更加合适、合理的岗位，更不用说来构建出完整全面，符合人员特点的用户画像。

技术实现要素：

4.本技术实施例的目的在于提出一种入职员工画像生成方法、装置、计算机设备及存储介质，构建出更加精准的员工画像。
5.为了解决上述技术问题，本技术实施例提供一种入职员工画像生成方法，采用了如下所述的技术方案：
6.一种入职员工画像生成方法，包括下述步骤：
7.接收历史简历数据，清洗所述历史简历数据，获得历史维度因子、历史维度因子权重、历史维度因子标签和历史维度因子标签权重，其中，所述历史维度因子与所述历史维度因子权重为一一对应关系，历史维度因子标签和历史维度因子标签权重为一一对应关系；
8.获取待入职人员的简历，提取所述当前入职人员的简历中的关键词，获得初始维度因子，基于所述历史维度因子对所述初始维度因子进行筛选，获得目标维度因子；
9.根据所述目标维度因子，从所述当前入职人员的简历中获取目标维度标签，并基于所述目标维度因子、所述历史维度因子权重、所述目标维度标签和所述历史维度因子标签权重计算获得个人因子分数；
10.将所述个人因子分数分别与预设分类的分数相减，获得差值，将所述差值的绝对值小于分数阈值所对应的分类，作为候选分类，并将与所述候选分类关联的部门作为候选部门，基于所述候选部门和所述个人因子分数确定候选职位；
11.获取所述候选职位对应的职位维度因子，基于所述职位维度因子生成当前入职人员的目标画像。
12.进一步的，所述接收历史简历数据，清洗所述历史简历数据，获得历史维度因子、历史维度因子权重、历史维度因子标签和历史维度因子标签权重的步骤包括：
13.通过opennlp工具包对所述历史简历数据进行文本分类，获得多个文本模块；
14.分别计算每个文本模块中每个词语出现的频次，作为所述词语的权重；
15.确定权重大于权重阈值的词语，作为所述历史维度因子，将所述历史维度因子对
应的权重作为所述历史维度因子权重；
16.分析所述历史维度因子的上下文，将所述历史维度因子的下文词语作为所述历史维度因子标签，将所述历史维度因子标签在所述历史维度因子下的比例作为所述历史维度因子标签权重。
17.进一步的，所述获取待入职人员的简历，提取所述当前入职人员的简历中的关键词的步骤包括：
18.通过opennlp工具包对所述当前入职人员的简历进行文本分类，获得多个目标文本内容；
19.分别对每个目标文本内容中的文本进行切词和词性标注，获得第一词语；
20.基于预设的目标词性，对所述第一词语进行过滤，获得第二词语；
21.计算所有所述第二词语之间的相似度，获得词语相似度；
22.去掉在任意两个第二词语之间、词语相似度大于相似度阈值的任一所述第二词语，获得所述关键词。
23.进一步的，所述计算所有所述第二词语之间的相似度，获得词语相似度的步骤包括：
24.将所述第二词语转化为词向量、词性向量和拼音向量；
25.基于所述词向量、词性向量和拼音向量综合计算所述第二词语之间的相似度，获得所述词语相似度。
26.进一步的，所述基于所述词向量、词性向量和拼音向量综合计算所述第二词语之间的相似度，获得所述词语相似度的步骤包括：
27.将当前第二词语的所述词向量、词性向量和拼音向量的对应维度相加或分别在对应维度上取平均值，获得综合向量；
28.基于所述综合向量计算所有的第二词语之间的余弦相似度，作为所述词语相似度。
29.进一步的，所述基于所述目标维度因子、目标权重和目标维度标签获得个人因子分数的步骤包括：
30.将与所述目标维度因子相同的所述历史维度因子所对应的历史维度因子权重，作为目标维度因子权重；
31.将与所述目标维度标签相同的所述历史维度标签所对应的历史维度因子标签权重，作为目标维度因子标签权重；
32.所述个人因子分数的特征为：
33.个人因子分数＝∑(i j)/n，
34.其中，i为目标维度因子权重，j为所述目标维度因子标签权重，n为所述目标维度因子的个数。
35.进一步的，所述将所述个人因子分数分别与预设分类的分数相减，获得差值的步骤包括：
36.获取预设的分类下的分类标签，所述分类标签包括一一关联的部门维度因子和部门维度标签；
37.将与所述部门维度因子相同的所述历史维度因子所对应的所述历史维度因子权
重作为部门维度权重，并将与所述部门维度标签相同的所述历史维度因子标签所对应的所述历史维度因子标签权重作为部门标签权重；
38.基于所述部门维度权重和部门标签权重计算获得所述预设分类的分数；
39.将所述个人因子分数分别与预设分类的分数相减，获得所述差值。
40.进一步的，所述基于所述职位维度因子生成当前入职人员的目标画像的步骤包括：
41.基于所述职位维度因子在所述当前入职人员的简历中进行查找，获取与所述职位维度因子相同的字段，作为目标字段；
42.确定所述目标字段在所述当前入职人员的简历中所对应的标签字段，作为所述目标标签；
43.基于所述目标字段和所述目标标签生成所述目标画像。
44.为了解决上述技术问题，本技术实施例还提供一种入职员工画像生成装置，采用了如下所述的技术方案：
45.一种入职员工画像生成装置，包括：
46.接收模块，用于接收历史简历数据，清洗所述历史简历数据，获得历史维度因子、历史维度因子权重、历史维度因子标签和历史维度因子标签权重，其中，所述历史维度因子与所述历史维度因子权重为一一对应关系，历史维度因子标签和历史维度因子标签权重为一一对应关系；
47.获取模块，用于获取待入职人员的简历，提取所述当前入职人员的简历中的关键词，获得初始维度因子，基于所述历史维度因子对所述初始维度因子进行筛选，获得目标维度因子；
48.计算模块，用于根据所述目标维度因子，从所述当前入职人员的简历中获取目标维度标签，并基于所述目标维度因子、所述历史维度因子权重、所述目标维度标签和所述历史维度因子标签权重计算获得个人因子分数；
49.确定模块，用于将所述个人因子分数分别与预设分类的分数相减，获得差值，将所述差值的绝对值小于分数阈值所对应的分类，作为候选分类，并将与所述候选分类关联的部门作为候选部门，基于所述候选部门和所述个人因子分数确定候选职位；
50.生成模块，用于获取所述候选职位对应的职位维度因子，基于所述职位维度因子生成当前入职人员的目标画像。
51.为了解决上述技术问题，本技术实施例还提供一种计算机设备，采用了如下所述的技术方案：
52.一种计算机设备，包括存储器和处理器，所述存储器中存储有计算机可读指令，所述处理器执行所述计算机可读指令时实现上述的入职员工画像生成方法的步骤。
53.为了解决上述技术问题，本技术实施例还提供一种计算机可读存储介质，采用了如下所述的技术方案：
54.一种计算机可读存储介质，所述计算机可读存储介质上存储有计算机可读指令，所述计算机可读指令被处理器执行时实现上述的入职员工画像生成方法的步骤。
55.与现有技术相比，本技术实施例主要有以下有益效果：
56.本技术不仅实现了无纸化的线上系统，解放hr了的工作量，将繁琐而且重复的事
experts group audio layer iv，动态影像专家压缩标准音频层面4)播放器、膝上型便携计算机和台式计算机等等。
69.服务器105可以是提供各种服务的服务器，例如对终端设备101、102、103上显示的页面提供支持的后台服务器。
70.需要说明的是，本技术实施例所提供的入职员工画像生成方法一般由服务器/终端设备执行，相应地，入职员工画像生成装置一般设置于服务器/终端设备中。
71.应该理解，图1中的终端设备、网络和服务器的数目仅仅是示意性的。根据实现需要，可以具有任意数目的终端设备、网络和服务器。
72.继续参考图2，示出了根据本技术的入职员工画像生成方法的一个实施例的流程图。所述的入职员工画像生成方法，包括以下步骤：
73.s1：接收历史简历数据，清洗所述历史简历数据，获得历史维度因子、历史维度因子权重、历史维度因子标签和历史维度因子标签权重，其中，所述历史维度因子与所述历史维度因子权重为一一对应关系，历史维度因子标签和历史维度因子标签权重为一一对应关系。
74.在本实施例中，根据历史招聘所获取的历史简历数据，清洗和筛选合适数据，作为历史维度因子和历史维度因子标签，生成维度因子库和维度因子标签库。并通过分析操作，获得历史维度因子对应的历史维度因子权重，以及历史维度因子标签对应的历史维度因子标签权重。其中，历史维度因子权重随历史维度因子共同存储在维度因子库中；历史维度因子标签权重随历史维度因子标签共同存储在维度因子标签库中。所述在后续对历史维度因子和历史维度因子标签进行使用时，可以直接在维度因子库和维度因子标签库查找，便于对历史维度因子和历史维度因子标签的管理。
75.在本实施例中，入职员工画像生成方法运行于其上的电子设备(例如图1所示的服务器/终端设备)可以通过有线连接方式或者无线连接方式接收历史简历数据。需要指出的是，上述无线连接方式可以包括但不限于3g/4g连接、wifi连接、蓝牙连接、wimax连接、zigbee连接、uwb(ultra wideband)连接、以及其他现在已知或将来开发的无线连接方式。
76.具体的，所述接收历史简历数据，清洗所述历史简历数据，获得历史维度因子、历史维度因子权重、历史维度因子标签和历史维度因子标签权重的步骤包括：
77.通过opennlp工具包对所述历史简历数据进行文本分类，获得多个文本模块；
78.分别计算每个文本模块中每个词语出现的频次，作为所述词语的权重；
79.确定权重大于权重阈值的词语，作为所述历史维度因子，将所述历史维度因子对应的权重作为所述历史维度因子权重；
80.分析所述历史维度因子的上下文，将所述历史维度因子的下文词语作为所述历史维度因子标签，将所述历史维度因子标签在所述历史维度因子下的比例作为所述历史维度因子标签权重。
81.在本实施例中，采用opennlp对历史简历数据进行文本分类，将文本内容分为基本信息，工作经历，项目经历，教育信息等。opennlp是一种基于机器学习的工具包，用于处理自然语言文本。它支持最常见的nlp任务，如标记化，句子分割，词性标记，命名实体提取，分块，解析和参考解析。计算文本中所有词语出现的频次，从而得到每个词语的权重，以这样的方式清洗简历，这样就从庞大的简历库中得到了对应的词库，根据词的权重排名，将排名
靠前的词语，即权重大于权重阈值的词语，作为历史维度因子，基于历史维度因子组成维度因子库。历史维度因子可以为：姓名，性别，年龄，学历，专业，学位，工作行业，工作年限，技能，技能熟练度，性格偏向，爱好等。每个历史维度因子对应的具体数据作为该历史维度因子对应的历史维度标签，例如：性别这个历史维度因子，它的历史维度标签可以是男或者是女，其中，男或女的比例所述历史维度因子标签权重。这样就可以从历史简历数据库中构建出了维度因子库与维度标签库。
82.s2：获取待入职人员的简历，提取所述当前入职人员的简历中的关键词，将所述关键词与所述维度因子库进行对比，获得当前入职人员的维度因子，作为目标维度因子。
83.在本实施例中，根据入职人员的简历，通过语义分析与词法分析，提取到个人简历中的关键词，与维度因子库进行对比，提取每个人员对应的维度因子。
84.具体的，所述获取待入职人员的简历，提取所述当前入职人员的简历中的关键词的步骤包括：
85.通过opennlp工具包对所述当前入职人员的简历进行文本分类，获得多个目标文本内容；
86.分别对每个目标文本内容中的文本进行切词和词性标注，获得第一词语；
87.基于预设的目标词性，对所述第一词语进行过滤，获得第二词语；
88.计算所有所述第二词语之间的相似度，获得词语相似度；
89.去掉在任意两个第二词语之间、词语相似度大于相似度阈值的任一所述第二词语，获得所述关键词。
90.在本实施例中，采用opennlp对历史简历数据进行文本分类，将文本内容分为基本信息，工作经历，项目经历，教育信息等。并通过切词和词性标注的操作，获得第一词语。其中，切词可以调用jieba(结巴)分词工具进行操作。例如：我喜欢篮球，进行切词和词性标注之后获得：我/喜欢/篮球。其中，我和篮球均属于名词(n.)词性,喜欢属于动词(v.)词性。基于预设的目标词性，即本技术中预设的目标词性为名词，对第一词语进行过滤，获得第二词语。继续接上例，基于名词词性，对我(名词)/喜欢(动词)/篮球(名词)，进行过滤后，获得的第二词语只为名词词语，即我、篮球。而后通过后续的相似度对比操作，去掉相似度相近的词语，从而实现保留最具有代表性的关键词。对于去掉在任意两个第二词语之间、词语相似度大于相似度阈值的任一所述第二词语，获得所述关键词的步骤，具体为：在任意两个第二词语之间的词语相似度大于相似度阈值时，确定这个两个第二词语相似，则此时去掉其中的任意一个第二词语，即为词语的去重操作。在完成对所有的第二词语之间的两两相似度计算和去重操作后，剩下的第二词语即为所述关键词。例如，当前的两个第二词语为职业、职位，通过相似度的计算，确定职业和职位的词语相似度为70％，大于相似度阈值60％，则此时去掉职业或者职位。在去掉的是职业后，职位依然进行与其他的第二词语之间的相似度计算和词语的去重操作的过程，直至剩余的第二词语之间的词语相似度均大于相似度阈值，即获得关键词。
91.其中，所述计算所有所述第二词语之间的相似度，获得词语相似度的步骤包括：
92.将所述第二词语转化为词向量、词性向量和拼音向量；
93.基于所述词向量、词性向量和拼音向量综合计算所述第二词语之间的相似度，获得所述词语相似度。
94.在本实施例中，词向量指把每个词用一个多维的向量单独表示。词性向量指把每个词的词性用一个多维的向量表示。拼音向量指把每个词的拼音用一个多维的向量表示。词语相似度可以根据词向量、所述第二词语的词性向量和所述第二词语的拼音向量进行综合计算获得。其中，词性指名词、副词、形容词、动词等。词性向量即为该第二词语的词性转化为的向量。对于每个第二词语来说，其均由至少一个字构成，每个字均具有其汉语拼音，将第二词语的汉语拼音转化为拼音向量。词向量、词性向量和拼音向量的转化过程基于预先训练好的向量转换模型，向量转换模型中包括三个不同的子模型，分别为词向量转换子模型、词性向量转换子模型和拼音向量转换子模型。将第二词语输入至向量转换模型中，获得向量转换模型输出的词向量、词性向量和拼音向量。其中，拼音向量转换子模型将词中每个字的拼音分别进行转化，获得对应单字的单字拼音向量，将所述单字拼音向量的对应维度相加，获得第二词语的拼音向量。在本技术中可以使用one
‑
hot vector(独热编码)模型作为初始模型，通过不同的训练语料分别训练one
‑
hot vector模型，以分别获得词向量转换子模型、词性向量转换子模型和拼音向量转换子模型。one
‑
hot vector(独热编码)是一种词袋模型，可以对词进行编码，得到的特征是离散的，适用于本技术。同时，在实际应用的过程中，也可以根据实际需要选取其他的模型，适用本技术即可。本技术在预先对模型设置时，设置不同的模型所输出的词向量、词性向量和拼音向量的维度数相同，便于计算。
95.其中，所述基于所述词向量、词性向量和拼音向量综合计算所述第二词语之间的相似度，获得所述词语相似度的步骤包括：
96.将当前第二词语的所述词向量、词性向量和拼音向量的对应维度相加或分别在对应维度上取平均值，获得综合向量；
97.基于所述综合向量计算所有的第二词语之间的余弦相似度，作为所述词语相似度。
98.在本实施例中，将第二词语转化为词向量、词性向量和拼音向量的对应维度相加，或者分别在对应的维度上取平均值，获得综合向量。基于综合向量计算所有的第二词语之间的余弦相似度，作为所述词语相似度。通过在对应维度上的加和或取平均值，本技术实现充分考虑了词、词性和拼音之间的对比，使得获得的综合结果，即词语相似度更加准确。
99.s3：根据所述目标维度因子，从所述当前入职人员的简历中获取目标维度标签，并基于所述目标维度因子、所述历史维度因子权重、所述目标维度标签和所述历史维度因子标签权重计算获得个人因子分数。
100.在本实施例中，根据提取到的个人的目标维度因子，打上对应的目标维度标签。初始的目标维度因子的权重，即为字段相同的历史维度因子的权重；初始的目标维度标签的权重，即为字段相同的历史维度因子标签的权重。后续因为不同时期招聘的需求可能需要对因子标签权重进行人为调整，所以可以采用规则引擎drools实时维护修改目标维度因子和目标维度标签的权重。
101.具体的，所述基于所述目标维度因子、目标权重和目标维度标签获得个人因子分数的步骤包括：
102.将与所述目标维度因子相同的所述历史维度因子所对应的历史维度因子权重，作为目标维度因子权重；
103.将与所述目标维度标签相同的所述历史维度标签所对应的历史维度因子标签权
重，作为目标维度因子标签权重；
104.所述个人因子分数的特征为：
105.个人因子分数＝∑(i j)/n，
106.其中，i为所述目标维度因子权重，j为所述目标维度因子标签权重，n为所述目标维度因子的个数。
107.在本实施例中，根据目标维度因子获取相同的历史维度因子所对应的权重，根据目标维度标签获取相同的所述历史维度标签所对应的权重，从而确定出目标维度因子权重和目标维度因子标签权重，进行个人因子分数的计算。
108.s4：将所述个人因子分数分别与预设分类的分数相减，获得差值，将所述差值的绝对值小于分数阈值所对应的分类，作为候选分类，并将与所述候选分类关联的部门作为候选部门，基于所述候选部门和所述个人因子分数确定候选职位。
109.在本实施例中，根据个人因子评分数值，用人部门自身预设的维度因子参数，岗位本身关联的维度因子与因子标签，找到相似维度因子的部门与岗位。根据个人因子评分数值，对比标签分类中每一种分类的评分，找到与个人评分最相似的前10个分类，因为分类是来源用入部门各种阶段的用人要求，因此最后得到的分类是对应不同的部门与岗位。其中，本技术的基于候选部门和所述个人因子分数确定候选职位的步骤包括：获取所述候选部门下属的职位的信息，基于所述职位的信息获取职位维度因子和职位维度标签，例如，职位的信息为研究生以上学历的计算机专业。则职位维度因子为学历和专业；其职位维度因子对应的职位维度标签为研究生和计算机。基于所述职位维度因子和职位维度标签计算获得职位分数。职位分数的计算过程与个人因子分数计算公式相同，其中，i替换为所述职位维度因子的权重，j替换为所述职位维度标签的权重，n为所述目职位维度因子的个数，此处不再赘述。根据职位分数与个人因子分数做差，获得职位差值，将职位差值最小的职位作为所述候选职位，并将所述候选职位反馈给指定人员，即反馈给hr(人力资源)。hr会根据候选部门和候选职位对入职的人员进行最终的部门和部门下属的职位分配，并将最终分配的实际部门和实际职位输入计算机中，对比hr输入的实际部门和候选部门、实际职位和候选职位，在所述实际部门和候选部门，和/或者实际职位和候选职位不同时，生成错误报告，并发送给相关人员，以提醒相关人员进一步完善对于生成维度因子库的标签的分类方式。
110.具体的，所述将所述个人因子分数分别与预设分类的分数相减，获得差值的步骤包括：
111.获取预设的分类下的分类标签，所述分类标签包括一一关联的部门维度因子和部门维度标签；
112.将与所述部门维度因子相同的所述历史维度因子所对应的所述历史维度因子权重作为部门维度权重，并将与所述部门维度标签相同的所述历史维度因子标签所对应的所述历史维度因子标签权重作为部门标签权重；
113.基于所述部门维度权重和部门标签权重计算获得所述预设分类的分数；
114.将所述个人因子分数分别与预设分类的分数相减，获得所述差值。
115.在本实施例中，分类下的分类标签为用人部门设置的，例如，分类1中的分类标签可以包括：学历：本科，年龄：20
‑
25等。其中，学历、年龄均为部门维度因子；本科、20
‑
25均为部门维度标签。所述预设分类的分数计算过程与个人因子分数计算公式相同，其中，i替换
为所述部门维度权重，j替换为所述部门标签权重，n为所述部门维度因子的个数，本技术不再赘述。
116.s5：获取所述候选职位对应的职位维度因子，基于所述职位维度因子生成当前入职人员的目标画像。
117.在本实施例中，最终确定出候选职位，根据候选职位中的职位维度因子，在当前入职人员的简历中查找到对应的标签内容，从而基于职位维度因子和对应的标签内容生成更加具有针对性的目标画像，即生成当前入职人员的卡片，最终使得每个人都有自己特有的资料卡片。
118.本技术实际应用过程中一个不断矫正，不断学习的过程，特别选取个人维度因子与计算个人因子评分这个两个环节，维度因子会因为简历的数量的增加而增加，权重也会因为因子库的变化会重新分配权重，计算的规则为因为业务变更实时调整。
119.具体的，所述基于所述职位维度因子生成当前入职人员的目标画像的步骤包括：
120.基于所述职位维度因子在所述当前入职人员的简历中进行查找，获取与所述职位维度因子相同的字段，作为目标字段；
121.确定所述目标字段在所述当前入职人员的简历中所对应的标签字段，作为所述目标标签；
122.基于所述目标字段和所述目标标签生成所述目标画像。
123.在本实施例中，本技术同时可以将未查找到相同的字段的所述职位维度因子，作为待填写因子；基于所述待填写因子、所述目标字段和所述目标标签生成待填写画像；将所述待填写画像展示在前端页面中；当检测到用户在所述待填写画像中对所述待填写因子的标签进行填写时，将用户填写的内容填入所述待填写画像中，所述待填写因子所对应的标签位置，生成所述目标画像。
124.需要强调的是，为进一步保证上述历史维度因子、历史维度因子权重、历史维度因子标签和历史维度因子标签权重信息的私密和安全性，上述历史维度因子、历史维度因子权重、历史维度因子标签和历史维度因子标签权重信息还可以存储于一区块链的节点中。
125.本技术所指区块链是分布式数据存储、点对点传输、共识机制、加密算法等计算机技术的新型应用模式。区块链(blockchain)，本质上是一个去中心化的数据库，是一串使用密码学方法相关联产生的数据块，每一个数据块中包含了一批次网络交易的信息，用于验证其信息的有效性(防伪)和生成下一个区块。区块链可以包括区块链底层平台、平台产品服务层以及应用服务层等。
126.本技术可应用于智慧政务领域中，具体用于智慧政务中人员的工作职位的分配，从而推动智慧城市的建设。
127.本技术不仅实现了无纸化的线上系统，解放hr了的工作量，将繁琐而且重复的事务交由机器自动处理，节省了公司的人力成本又提高了hr的工作效率。而且根据历史维度因子和目标维度因子的匹配和计算，以及将个人因子分数与部门关联的分类之间的分数进行计算，最终为入职人员匹配更加合适的岗位。根据匹配到的合适的候选职位，构建出了更加精准的员工画像。
128.本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程，是可以通过计算机可读指令来指令相关的硬件来完成，该计算机可读指令可存储于一计算机可读
取存储介质中，该计算机可读指令在执行时，可包括如上述各方法的实施例的流程。其中，前述的存储介质可为磁碟、光盘、只读存储记忆体(read
‑
only memory，rom)等非易失性存储介质，或随机存储记忆体(random access memory，ram)等。
129.应该理解的是，虽然附图的流程图中的各个步骤按照箭头的指示依次显示，但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明，这些步骤的执行并没有严格的顺序限制，其可以以其他的顺序执行。而且，附图的流程图中的至少一部分步骤可以包括多个子步骤或者多个阶段，这些子步骤或者阶段并不必然是在同一时刻执行完成，而是可以在不同的时刻执行，其执行顺序也不必然是依次进行，而是可以与其他步骤或者其他步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。
130.进一步参考图3，作为对上述图2所示方法的实现，本技术提供了一种入职员工画像生成装置的一个实施例，该装置实施例与图2所示的方法实施例相对应，该装置具体可以应用于各种电子设备中。
131.如图3所示，本实施例所述的入职员工画像生成装置300包括：接收模块301、获取模块302、计算模块303、确定模块304以及生成模块305。其中，接收模块301，用于接收历史简历数据，清洗所述历史简历数据，获得历史维度因子、历史维度因子权重、历史维度因子标签和历史维度因子标签权重，其中，所述历史维度因子与所述历史维度因子权重为一一对应关系，历史维度因子标签和历史维度因子标签权重为一一对应关系；获取模块302，用于获取待入职人员的简历，提取所述当前入职人员的简历中的关键词，获得初始维度因子，基于所述历史维度因子对所述初始维度因子进行筛选，获得目标维度因子；计算模块303，用于根据所述目标维度因子，从所述当前入职人员的简历中获取目标维度标签，并基于所述目标维度因子、所述历史维度因子权重、所述目标维度标签和所述历史维度因子标签权重计算获得个人因子分数；确定模块304，用于将所述个人因子分数分别与预设分类的分数相减，获得差值，将所述差值的绝对值小于分数阈值所对应的分类，作为候选分类，并将与所述候选分类关联的部门作为候选部门，基于所述候选部门和所述个人因子分数确定候选职位；生成模块305，用于获取所述候选职位对应的职位维度因子，基于所述职位维度因子生成当前入职人员的目标画像。
132.在本实施例中，本技术不仅实现了无纸化的线上系统，解放hr了的工作量，将繁琐而且重复的事务交由机器自动处理，节省了公司的人力成本又提高了hr的工作效率。而且根据历史维度因子和目标维度因子的匹配和计算，以及将个人因子分数与部门关联的分类之间的分数进行计算，最终为入职人员匹配更加合适的岗位。根据匹配到的合适的候选职位，构建出了更加精准的员工画像。
133.所述接收模块301还包括：分类子模块、计算子模块、确定子模块和分析子模块。分类子模块用于通过opennlp工具包对所述历史简历数据进行文本分类，获得多个文本模块；计算子模块用于分别计算每个文本模块中每个词语出现的频次，作为所述词语的权重；确定子模块用于确定权重大于权重阈值的词语，作为所述历史维度因子，将所述历史维度因子对应的权重作为所述历史维度因子权重；分析子模块用于分析所述历史维度因子的上下文，将所述历史维度因子的下文词语作为所述历史维度因子标签，将所述历史维度因子标签在所述历史维度因子下的比例作为所述历史维度因子标签权重。
134.获取模块302包括文本分类子模块、词性标注子模块、过滤子模块、相似度计算子
模块、获取子模块。文本分类子模块用于通过opennlp工具包对所述当前入职人员的简历进行文本分类，获得多个目标文本内容；词性标注子模块用于分别对每个目标文本内容中的文本进行切词和词性标注，获得第一词语；过滤子模块用于基于预设的目标词性，对所述第一词语进行过滤，获得第二词语；相似度计算子模块用于计算所有所述第二词语之间的相似度，获得词语相似度；获取子模块用于去掉在任意两个第二词语之间、词语相似度大于相似度阈值的任一所述第二词语，获得所述关键词。
135.相似度计算子模块包括转化单元和综合计算单元。转化单元用于将所述第二词语转化为词向量、词性向量和拼音向量；综合计算单元用于基于所述词向量、词性向量和拼音向量综合计算所述第二词语之间的相似度，获得所述词语相似度。
136.所述综合计算单元包括综合计算子单元和相似度计算子单元。其中，综合计算子单元用于将当前第二词语的所述词向量、词性向量和拼音向量的对应维度相加或分别在对应维度上取平均值，获得综合向量；相似度计算子单元用于基于所述综合向量计算所有的第二词语之间的余弦相似度，作为所述词语相似度。
137.计算模块303包括第一权重确定模块、第二权重确定模块和个人因子分数计算模块。第一权重确定模块用于将与所述目标维度因子相同的所述历史维度因子所对应的历史维度因子权重，作为目标维度因子权重；第二权重确定模块用于将与所述目标维度标签相同的所述历史维度标签所对应的历史维度因子标签权重，作为目标维度因子标签权重；个人因子分数计算模块用于计算个人因子分数，其中，所述个人因子分数的特征为：个人因子分数＝∑(i j)/n，其中，i为所述目标维度因子权重，j为所述目标维度因子标签权重，n为所述目标维度因子的个数。
138.确定模块304包括分类标签获取子模块、部门维度权重确定子模块、分类分数计算子模块和差值子模块。分类标签获取子模块用于获取预设的分类下的分类标签，所述分类标签包括一一关联的部门维度因子和部门维度标签；部门维度权重确定子模块用于将与所述部门维度因子相同的所述历史维度因子所对应的所述历史维度因子权重作为部门维度权重，并将与所述部门维度标签相同的所述历史维度因子标签所对应的所述历史维度因子标签权重作为部门标签权重；分类分数计算子模块用于基于所述部门维度权重和部门标签权重计算获得所述预设分类的分数；差值子模块用于将所述个人因子分数分别与预设分类的分数相减，获得所述差值。
139.生成模块305包括查找子模块、标签字段确定子模块和生成子模块。查找子模块用于基于所述职位维度因子在所述当前入职人员的简历中进行查找，获取与所述职位维度因子相同的字段，作为目标字段；标签字段确定子模块用于确定所述目标字段在所述当前入职人员的简历中所对应的标签字段，作为所述目标标签；生成子模块用于基于所述目标字段和所述目标标签生成所述目标画像。
140.本技术不仅实现了无纸化的线上系统，解放hr了的工作量，将繁琐而且重复的事务交由机器自动处理，节省了公司的人力成本又提高了hr的工作效率。而且根据历史维度因子和目标维度因子的匹配和计算，以及将个人因子分数与部门关联的分类之间的分数进行计算，最终为入职人员匹配更加合适的岗位。根据匹配到的合适的候选职位，构建出了更加精准的员工画像。
141.为解决上述技术问题，本技术实施例还提供计算机设备。具体请参阅图4，图4为本
实施例计算机设备基本结构框图。
142.所述计算机设备200包括通过系统总线相互通信连接存储器201、处理器202、网络接口203。需要指出的是，图中仅示出了具有组件201
‑
203的计算机设备200，但是应理解的是，并不要求实施所有示出的组件，可以替代的实施更多或者更少的组件。其中，本技术领域技术人员可以理解，这里的计算机设备是一种能够按照事先设定或存储的指令，自动进行数值计算和/或信息处理的设备，其硬件包括但不限于微处理器、专用集成电路(application specific integrated circuit，asic)、可编程门阵列(field－programmable gate array，fpga)、数字处理器(digital signal processor，dsp)、嵌入式设备等。
143.所述计算机设备可以是桌上型计算机、笔记本、掌上电脑及云端服务器等计算设备。所述计算机设备可以与用户通过键盘、鼠标、遥控器、触摸板或声控设备等方式进行人机交互。
144.所述存储器201至少包括一种类型的可读存储介质，所述可读存储介质包括闪存、硬盘、多媒体卡、卡型存储器(例如，sd或dx存储器等)、随机访问存储器(ram)、静态随机访问存储器(sram)、只读存储器(rom)、电可擦除可编程只读存储器(eeprom)、可编程只读存储器(prom)、磁性存储器、磁盘、光盘等。在一些实施例中，所述存储器201可以是所述计算机设备200的内部存储单元，例如该计算机设备200的硬盘或内存。在另一些实施例中，所述存储器201也可以是所述计算机设备200的外部存储设备，例如该计算机设备200上配备的插接式硬盘，智能存储卡(smart media card,smc)，安全数字(secure digital,sd)卡，闪存卡(flash card)等。当然，所述存储器201还可以既包括所述计算机设备200的内部存储单元也包括其外部存储设备。本实施例中，所述存储器201通常用于存储安装于所述计算机设备200的操作系统和各类应用软件，例如入职员工画像生成方法的计算机可读指令等。此外，所述存储器201还可以用于暂时地存储已经输出或者将要输出的各类数据。
145.所述处理器202在一些实施例中可以是中央处理器(central processing unit，cpu)、控制器、微控制器、微处理器、或其他数据处理芯片。该处理器202通常用于控制所述计算机设备200的总体操作。本实施例中，所述处理器202用于运行所述存储器201中存储的计算机可读指令或者处理数据，例如运行所述入职员工画像生成方法的计算机可读指令。
146.所述网络接口203可包括无线网络接口或有线网络接口，该网络接口203通常用于在所述计算机设备200与其他电子设备之间建立通信连接。
147.在本实施例中，为入职人员匹配更加合适的岗位。根据匹配到的合适的候选职位，构建出了更加精准的员工画像。
148.本技术还提供了另一种实施方式，即提供一种计算机可读存储介质，所述计算机可读存储介质存储有计算机可读指令，所述计算机可读指令可被至少一个处理器执行，以使所述至少一个处理器执行如上述的入职员工画像生成方法的步骤。
149.在本实施例中，为入职人员匹配更加合适的岗位。根据匹配到的合适的候选职位，构建出了更加精准的员工画像。
150.通过以上的实施方式的描述，本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现，当然也可以通过硬件，但很多情况下前者是更佳的实施方式。基于这样的理解，本技术的技术方案本质上或者说对现有技术做
出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质(如rom/ram、磁碟、光盘)中，包括若干指令用以使得一台终端设备(可以是手机，计算机，服务器，空调器，或者网络设备等)执行本技术各个实施例所述的方法。
151.显然，以上所描述的实施例仅仅是本技术一部分实施例，而不是全部的实施例，附图中给出了本技术的较佳实施例，但并不限制本技术的专利范围。本技术可以以许多不同的形式来实现，相反地，提供这些实施例的目的是使对本技术的公开内容的理解更加透彻全面。尽管参照前述实施例对本技术进行了详细的说明，对于本领域的技术人员来而言，其依然可以对前述各具体实施方式所记载的技术方案进行修改，或者对其中部分技术特征进行等效替换。凡是利用本技术说明书及附图内容所做的等效结构，直接或间接运用在其他相关的技术领域，均同理在本技术专利保护范围之内。

再多了解一些

1/2 1 2 下一页尾页

本文用于企业家、创业者技术爱好者查询，结果仅供参考。

上一篇：返回列表
下一篇：陈列场景识别方法、装置、设备以及存储介质与流程

入职员工画像生成方法、装置、计算机设备及存储介质与流程

相关文献

最热文献