一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种基于评分模型的劳务匹配方法、系统及设备与流程

2022-09-07 21:45:44 来源:中国专利 TAG:


1.本发明涉及数据处理技术领域,具体地,涉及一种基于评分模型的劳务匹配方法、系统及设备。


背景技术:

2.对于传统的建筑行业来说各种工程项目普遍存在“用工难”的现象,用工方通常需要耗费非常多的时间和人力去寻找劳务单位或个人,对于找到的劳务单位或个人也很难判断出是否有能力胜任该项工作,是否会存在合作风险等等。
3.随着建筑行业的迅速发展,如何实现劳务岗位供需的精准匹配也成为急需解决的难点问题,现有的关于劳务匹配的方法或者系统大部分仅仅是针对需求方和劳务个人的匹配,但实际上对于建筑工程方而言,很多时候需要选取具备资质资格、符合用工需求及具备良好信誉等等的劳务单位,而现有的对于劳务个人的评价维度和评价方法则不适用于评价劳务单位;另一方面,在进行劳务匹配时忽略了一些会影响匹配精确度的因素,比如:建筑工程项目细分了很多的施工类型,每种施工类型的用工需求、劳务选择标准等均有所区别;并且,对于行业内劳务单位或者个人的数据没有统一的数据管理平台和机制,造成数据孤岛、数据分析困难等问题,影响了劳务供需的匹配精度。


技术实现要素:

4.本发明的目的是提供一种基于评分模型的劳务匹配方法、系统及设备,解决了现有技术中存在的问题,能够为劳务需求方智能推送最优劳务单位或个人,实现精确的劳务匹配。
5.为了实现上述目的,本发明第一方面提供一种基于评分模型的劳务匹配方法,将劳务方的多个评价维度向量化以得到评分模型中的多个模型变量参数,所述评价维度至少包括:企业信息、招中标信息、协作范围、市场区域、合作背景和信誉评价;获取第一变量数据;对所述第一变量数据进行数据清洗以形成第二变量数据;计算每个模型变量参数的证据权重转换值;运用逻辑回归模型建立所述评分模型;将所述第二变量数据输入评分模型进行预测以得到第三变量数据;根据所述第三变量数据和所述每一模型变量参数的证据权重转换值构建劳务评分卡;按照劳务需求方不同的评价标准和需求进行劳务方的匹配。
6.进一步地,获取第一变量数据的步骤之前,还包括:建立劳务方数据库;采集第一劳务方数据;对所述第一劳务方数据进行预处理以得到第二劳务方数据,所述第二劳务方数据包括所述第一变量数据。
7.进一步地,第一劳务方数据的数据源至少包括:政府网站、公共资源交易中心、建筑企业协作队伍数据和全国工程招中标信息。
8.进一步地,所述预处理包括:建立劳务方画像标签,所述劳务方画像标签至少包括:协作范围标签、市场区域标签、合作背景分析标签和信誉标签,所述协作范围标签通过对劳务方的业绩数据进行提取分析确定施工类型,然后结合该劳务方所具备的资质信息、
施工总承包及专业承包资质确定其具备的协作范围;所述市场区域标签依托中标数据项目的所属区域提炼出劳务方的市场区域分布,同时结合劳务方的备案信息进一步对区域分布进行完善;所述合作背景分析标签是通过结合劳务中标数据中发包人信息,整理出该劳务合作单位尤其是多次合作的上游单位,编制出该劳务的关系拓扑图,结合建筑企业发布的优秀协作队伍及信誉黑名单数据,综合绘制出该劳务的背景关系图谱;所述信誉标签是依托供应商的司法涉诉信息、建筑企业内部劳务评价名录建立信誉白名单/黑名单标签。
9.进一步地,所述模型变量参数至少包括:财报数据、企业中标业绩、活跃度、资质分析、是否跟央企的优质供应商、是否是央企通报黑名单、公司裁判文书、法院公告、开庭公告、失信信息、被执行信息、交叉持股情况、股权分析、股权出质、动产抵押、是否信用平台黑名单和是否有行政处罚。
10.进一步地,所述数据清洗至少包括:缺失值处理、异常值处理、数据分桶和特征归一化/标准化。
11.进一步地,训练评分模型的方法包括建立先验评分模型,并通过所述先验评分模型训练评分模型;再对评分模型训练的预测结果进行人工纠错。
12.进一步地,还包括:对劳务方入库资质资格进行审核,主要步骤包括:劳务方提出入库申请;第一判断步骤,所述第一判断步骤为:对劳务方入库资质资格进行审核,在审核通过的情况下采集第一劳务方数据,在审核不通过的情况下则不准予该劳务方入库。
13.本发明第二方面提供一种基于评分模型的劳务匹配系统,包括:入库申请模块,所述入库申请模块被配置为接收劳务方的入库申请;资格审核模块,所述资格审核模块被配置为对劳务方的入库资格进行审核;信息发布模块,所述信息发布模块被配置为发布劳务方信息;数据采集模块,被配置为采集准予入库的劳务方的数据;数据预处理模块,被配置为对采集到的准予入库的劳务方的数据进行预处理;评分模块,所述评分模块被配置为对所述符合要求的劳务方的综合实力进行评定分析;匹配模块,所述匹配模块被配置为根据不同的评价标准进行劳务方的排序和匹配;数据通信模块,被配置为在各模块之间传输数据;数据存储模块,被配置为存储已入库的劳务方的数据。
14.本发明第三方面提供一种基于评分模型的劳务匹配设备,其特征在于,包括存储器和处理器,所述存储器上存储有计算机程序,所述存储器和所述处理器之间互相通信连接,该计算机程序被所述处理器执行时,执行前述任意一项所述的基于评分模型的劳务匹配方法。
15.上述技术方案中,通过将劳务方的企业信息、招中标信息、协作范围、市场区域、合作背景和信誉评价等多个评价维度向量化得到了评分模型中的多个模型变量参数,依据上述变量参数建立的评分模型充分考虑了劳务方的多维评价因素,基于该评分模型可以实现更为精确的劳务方评分预测;建立的劳务方数据库可打通劳务方的数据孤岛,实现数据的平台化和统一化管理;基于劳务方数据库还提供了劳务方的信息发布接口,在劳务方通过审核后可入库,并进行寻岗信息发布,解决了劳务方找岗位难的问题,引入的审核机制可保证劳务方信息的真实性和有效性;通过建立劳务方画像标签可以深度掌握该劳务方的综合情况,为该劳务方的综合评定分析提供可靠、全面的数据支撑;预处理后形成的第二劳务方数据可以作为劳务方的入库审核依据,还可以作为已入库劳务方的档案管理依据,通过第二劳务方数据可以深度掌握劳务方的背景情况,为劳务方的综合评定提供有效支撑;对采
集到的行业数据进行针对性的数据清洗,使数据集中的各种问题对建模的影响最小化,有效地提升了数据质量;根据第三变量数据和每一模型变量参数的证据权重转换值构建劳务评分卡,直观地显示劳务方的评分;采用先验评分模型可达到快速训练模型的效果,并且先验评分模型充分考虑了实际应用中劳务需求方选取劳务方的多种因素,模型的设计科学、合理,再根据预训练预测的结果进行人为的纠正极端错误完成模型的二次训练,从而建立高效的数学模型,有效地提升了评分模型的预测精度和准确度;可按照劳务需求方不同的评价标准和需求进行劳务方的匹配,能够为劳务需求方智能推送最优劳务单位或个人,实现精确的劳务匹配。
附图说明
16.附图是用来提供对本发明的进一步理解,并且构成说明书的一部分,与下面的具体实施方式一起用于解释本发明,但并不构成对本发明的限制。在附图中:
17.图1是本发明基于评分模型的劳务匹配方法的流程示意图;
18.图2是本发明在获取第一变量数据之前的步骤示意图;
19.图3本发明劳务匹配效果图;
20.图4是本发明材料供应商匹配系统的结构图。
具体实施方式
21.以下结合附图对本发明的具体实施方式进行详细说明。应当理解的是,此处所描述的具体实施方式仅用于说明和解释本发明,并不用于限制本发明。
22.实施例1:
23.参照图1所示,本发明实施例提供一种基于评分模型的劳务匹配方法,包括:
24.s1:将劳务方的多个评价维度向量化以得到评分模型中的多个模型变量参数,所述评价维度至少包括:企业信息、招中标信息、协作范围、市场区域、合作背景和信誉评价;
25.s2:获取第一变量数据;
26.s3:对所述第一变量数据进行数据清洗以形成第二变量数据;
27.s4:计算每个模型变量参数的证据权重转换值;
28.s5:运用逻辑回归模型建立所述评分模型;
29.s6:将所述第二变量数据输入评分模型进行预测以得到第三变量数据;
30.s7:根据所述第三变量数据和所述每一模型变量参数的证据权重转换值构建劳务评分卡;
31.s8:按照劳务需求方不同的评价标准和需求进行劳务方的匹配。
32.在本实施例中,对影响劳务匹配准确度的劳务方的多个评价维度进行了研究分析,选取了企业信息、招中标信息、协作范围、市场区域、合作背景和信誉评价等六个评价维度,将其向量化得到模型的多个变量参数,模型变量参数至少包括:财报数据、企业中标业绩、活跃度、资质分析、是否跟央企的优质供应商、是否是央企通报黑名单、公司裁判文书、法院公告、开庭公告、失信信息、被执行信息、交叉持股情况、股权分析、股权出质、动产抵押、是否信用平台黑名单和是否有行政处罚,其中模型的变量参数可根据实际需求进行适应性调整。依据上述变量参数建立的评分模型充分考虑了劳务方的多维评价因素,基于该
评分模型可以实现更为精确的劳务方评分预测。
33.如图2所示,步骤s2中的第一变量数据指的是劳务方在评分模型中的每一模型变量值,在获取第一变量数据的步骤之前,还包括:
34.s91:建立劳务方数据库;
35.s92:采集第一劳务方数据;
36.s93:对所述第一劳务方数据进行预处理以得到第二劳务方数据,所述第二劳务方数据包括所述第一变量数据。
37.目前,建筑行业中的具备资质资格的劳务方数据分散在住建、交通等相关政府部门或者各个建筑企业间的内部数据,对其没有统一的数据管理平台,造成数据孤岛、数据分析困难等问题,影响了劳务供需的匹配精度,针对此问题本实施例建立了劳务方数据库,劳务方数据库的数据源架构为:(1)基本信息,包括公司名称、法人、所在地、纳税类型、注册资本、组织机构代码、联系人、公司类型等;(2)经营信息,包括中标公示、竞争分析、企业荣誉、资质信息和经营风险等,其中:中标公示是材料供应商历史物资或劳务中标数据,包括中标项目名称、中标地区、建设单位名称、中标金额、中标时间等;竞争分析是该材料供应商参与的投标项目及作为第二、第三名中标候选人的数据,可用于分析该目标企业所涉及的市场区域、经营范围、业主单位、市场竞争力等要素的分析;企业荣誉主要为央企评定的“优秀供应商”“优秀分包商”等荣誉奖项;资质信息是住建部内总承包、专业承包的资质信息;经营风险包括目标企业质监局质检信息、被列入建筑企业黑名单数据、服务履约记录等;(3)司法信息包括公司裁判文书、法院公告、开庭公告、失信信息和被执行信息等;(4)企业画像标签,包括协作范围标签、市场区域标签、合作背景标签和信誉标签等。基于建立的劳务方数据库可打通数据孤岛,实现数据的平台化和统一化管理。
38.本实施例的第一劳务方数据通过政府网站、公共资源交易中心、建筑企业协作队伍数据和全国工程招中标信息等多渠道获取;对第一劳务方数据进行的预处理主要是按照工程项目的施工类型对劳务单位或个人进行分类整理,同时对劳务数据进行关联补充,完善劳务经营信息(人员信息、业绩信息、资质信息、诚信数据、备案信息、信用评价等)、工商信息、法律诉讼信息、招中标信息、业绩荣誉信息等众多要素信息。预处理后形成的第二劳务方数据可以作为劳务方的入库审核依据,还可以作为已入库劳务方的档案管理依据,为该劳务方的综合评定分析提供可靠、全面的多维数据支撑。
39.本实施例运用逻辑回归模型建立所述评分模型,通过评分模型对第二劳务方数据进行评定分析得到劳务方的评分预测值,根据所述第三变量数据和所述每一模型变量参数的证据权重转换值构建劳务评分卡,直观地显示劳务方的评分;按照劳务需求方不同的评价标准和需求在劳务方数据库中筛选出符合条件的劳务方,按照不同的评价标准进行劳务方的排序并匹配给劳务需求单位,比如:有些劳务需求方在选取劳务方时偏重于信誉,而有些则偏重于历史协作范围或者地理区域等等,本实施例劳务匹配的效果如图3所示。
40.实施例2:
41.基于本发明的第一个实施例,步骤s93中所述的预处理还包括:建立劳务方画像标签,所述劳务方画像标签至少包括:协作范围标签、市场区域标签、合作背景分析标签和信誉标签,所述协作范围标签通过对劳务方的业绩数据进行提取分析确定施工类型,然后结合该劳务方所具备的资质信息、施工总承包及专业承包资质确定其具备的协作范围;所述
市场区域标签依托中标数据项目的所属区域提炼出劳务方的市场区域分布,同时结合劳务方的备案信息进一步对区域分布进行完善;所述合作背景分析标签是通过结合劳务中标数据中发包人信息,整理出该劳务合作单位尤其是多次合作的上游单位,编制出该劳务的关系拓扑图,结合建筑企业发布的优秀协作队伍及信誉黑名单数据,综合绘制出该劳务的背景关系图谱;所述信誉标签是依托供应商的司法涉诉信息、建筑企业内部劳务评价名录建立信誉白名单/黑名单标签。
42.本实施例中的协作范围标签是通过es索引对“全国建筑市场监管公共服务平台”、“全国公路建设市场信用信息管理系统”、“重庆市公路建设市场信用信息管理系统”、“浙江交通诚信系统”、“江西省公共资源交易中心”及“江西省公路水路建设市场信用信息服务系统”内该劳务方的业绩数据进行提取,对中标项目关键字进行提炼分析,划分为对应的施工类型,为劳务需求方附加协作范围标签,如土建工程、绿化工程、机电工程、路面工程、交安工程等。通过建立劳务方画像标签可以深度掌握该劳务方的综合情况,为该劳务方的综合评定分析提供可靠、全面的数据支撑。
43.进一步地,本实施例还包括对劳务方入库资质资格进行审核,主要步骤包括:劳务方提出入库申请;第一判断步骤,所述第一判断步骤为:对劳务方入库资质资格进行审核,在审核通过的情况下采集第一劳务方数据,在审核不通过的情况下则不准予该劳务方入库。
44.进一步地,本实施例基于劳务方数据库还提供了劳务方的信息发布接口,不管是劳务单位或者个人都可提交入库申请,在审核通过后可入库,并进行寻岗信息发布,解决了劳务方找岗位难的问题,引入的审核机制可保证劳务方信息的真实性和有效性;对采集到的第一劳务方数据进行预处理后形成的第二劳务方数据可以作为劳务方的入库审核依据,还可以作为已入库劳务方的档案管理依据,通过第二劳务方数据可以深度掌握劳务方的背景情况,为劳务方的综合评定提供有效支撑。
45.实施例3:
46.基于本发明的第二个实施例,所述数据清洗至少包括:缺失值处理、异常值处理、数据分桶和特征归一化/标准化。
47.得到的数据集中,数据通常会存在缺失,且产生原因多种多样,先对数据进行观察,在分析前,通过对数据本身的删除、建模、差值补全等方式进行一个全面的直观感受;进而对缺失数据进行有效的处理,本实施例采用的差值补全的方式进行缺失值处理,可在保留原数据的同时,通过高计算方式(高维映射、多重插补等)达到数据的完整性,应用时也可根据需求选取其他缺失值处理方式;对于异常值的处理是通过数据生成箱线图(或3-sigma)将其隔离,对在箱线图中出现的数据异常进行box-cox转换和长尾截断,比如:根据数据发现其本身是材料/设备供应商,但数据却入到了劳务单位,对于箱外数据就要认定数据的真实性问题,对于不确定和错误的数据要给予删除;而数据分桶主要是通过分桶对连续数据的离散化的规类整合,比如:建筑行业的劳务方会根据岗位不同分为开挖班组、支护班组和二衬班组等等,通过对其编号1、2、3进行数据的规整;在本实施例中的数据清洗还包括对数据进行归一化/标准化处理,比如:对数据中的劳务单位进行统一区分至0区间,而个人劳务进行统一区分至1区间,通过数据归一化/标准化处理可以进一步提升数据质量;通过上述的数据清洗使数据集中的各种问题对建模的影响最小化,有效地提升了数据质量。
48.本实施例建立了先验评分模型用以训练评分模型,先验评分模型主要包括:司法风险,包括开庭公告、失信信息和被执行信息,均根据次数区间进行阶梯评分,比如:开庭公告次数为81至90之间的评分为80,71至80之间的评分为60,61至70之间的评分为40,60分以下的为20分;经营风险,包括交叉持股情况、股权分析、股权出质、动产抵押、是否信用平台黑名单和是否有行政处罚,其中交叉持股情况、股权分析、股权出质和动产抵押是按照评估的区间值进行阶梯评分;是否信用平台黑名单和是否有行政处罚则是有0和100两个分值;应用时,先验评分模型的结构、评价指标及分值等均可根据实际需求做适应性调整;本实施例中的先验评分模型是在充分收集及严格评估了建筑行业内选取劳务方时的多个影响因素后确定的,模型的设计科学、合理,通过建立的先验评分模型进行标签的预打可完成评分模型的快速训练,再根据预训练预测的结果进行人为的纠正极端错误完成评分模型的二次训练,从而建立高效的评分模型。
49.进一步地,本实施例通过accuracy、roc-auc曲线(rerceiver operating characteristic曲线面积)、pr曲线(precision,recall)来评估模型的优劣,以准确率(accuracy)为例,它表示预测正确的结果占总样本的半分比,在评估模型过程中,假设能接受的准确率阈值为95%,那么如果训练的模型的准确率低于95%则不采用,当经过参数调整或数据扩充或标注数据质量提升后,模型准确率大于95%时,就采用当前训练的模型。
50.本实施例中评分模型的变量参数主要包括:财报数据、企业中标业绩、活跃度、资质分析、是否跟央企的优质供应商、是否是央企通报黑名单、公司裁判文书、法院公告、开庭公告、失信信息、被执行信息、交叉持股情况、股权分析、股权出质、动产抵押、是否信用平台黑名单和是否有行政处罚等;根据评分模型的输出和每一模型变量参数的证据权重转换值构建劳务评分卡,得到第三变量数据,即综合实力分值,表1示出了财报数据、企业中标业绩、资质分析、开庭公告、是否信用平台黑名单和法院公告等变量参数的评分。本发明根据劳务需求方选取劳务方时关注的多个维度确定了学习模型的变量参数,可以将劳务方选取时需考虑的众多因素进行简化提取,将先验评分模型和逻辑回归分析法结合,可以提高综合实力评分预测的精度和准确度。
[0051][0052]
表1
[0053]
如图4所示,本发明还提供一种基于评分模型的劳务匹配系统,包括入库申请模块1,所述入库申请模块1被配置为接收劳务方的入库申请;资格审核模块2,所述资格审核模块2被配置为对劳务方的入库资格进行审核;信息发布模块3,所述信息发布模块3被配置为发布劳务方信息;数据采集模块4,被配置为采集准予入库的劳务方的数据;数据预处理模块5,被配置为对采集到的准予入库的劳务方的数据进行预处理;评分模块6,所述评分模块6被配置为对所述符合要求的劳务方的综合实力进行评定分析;匹配模块7,所述匹配模块7
被配置为根据不同的评价标准进行劳务方的排序和匹配;数据通信模块,被配置为在各模块之间传输数据;数据存储模块8,被配置为存储已入库的劳务方的数据。
[0054]
本发明基于评分模型的劳务匹配系统的具体实施方式与上述基于评分模型的劳务匹配方法各实施例基本相同,在此不再赘述。
[0055]
本发明还提供一种材料供应商匹配设备,包括存储器和处理器,所述存储器上存储有计算机程序,所述存储器和所述处理器之间互相通信连接,该计算机程序被所述处理器执行时,执行前述的基于评分模型的劳务匹配方法。
[0056]
本发明项目基于评分模型的劳务匹配设备的具体实施方式与上述基于评分模型的劳务匹配方法各实施例基本相同,在此不再赘述。
[0057]
以上结合附图详细描述了本发明的优选实施方式,但是,本发明并不限于上述实施方式中的具体细节,在本发明的技术构思范围内,可以对本发明的技术方案进行多种简单变型,这些简单变型均属于本发明的保护范围。
[0058]
另外需要说明的是,在上述具体实施方式中所描述的各个具体技术特征,在不矛盾的情况下,可以通过任何合适的方式进行组合,为了避免不必要的重复,本发明对各种可能的组合方式不再另行说明。
[0059]
此外,本发明的各种不同的实施方式之间也可以进行任意组合,只要其不违背本发明的思想,其同样应当视为本发明所公开的内容。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献