一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

网约车司机离职预测方法及系统与流程

2021-12-07 21:46:00 来源:中国专利 TAG:


1.本发明涉及离职预测技术领域,尤其涉及一种网约车司机离职预测方法及系统。


背景技术:

2.随着移动互联网的不断发展,网约车产业出现了规模化,从而形成网约车的平台。对于司机而言,平台为司机创造就业机会,增加收入。同样的,司机是网约车平台的核心资产,司机的辛勤工作也给网约车平台带来了稳定的单量和流水。司机的高频离职往往会影响整个平台的接单效率,对于自营为主的平台,影响尤甚,例如车辆闲置,运力浪费等。针对网约车司机的离职预测也是一个重点课题。
3.现有的离职预测在模型训练时,采集多个用户的信息训练离职模型,然而,有些信息对于一个用户离职还是不离职来说,并没有区分作用,从而导致训练离职模型的数据量比较大,训练速度比较低。


技术实现要素:

4.本发明提供一种网约车司机离职预测方法及系统,能够在训练过程中,将区分网约车司机是否离职的能力小于预设能力的特征信息的类型的特征信息剔除,采用剔除后的特征信息训练离职模型,提高了训练的速度。
5.第一方面,本发明实施例提供一种网约车司机离职预测方法,包括:
6.获取目标网约车司机的多种特征信息,所述特征信息包括个人特征信息和/或工作特征信息;
7.将多种所述特征信息作为输入,通过离职模型确定所述目标网约车司机的离职概率;
8.其中,所述离职模型通过以下方式进行训练得到:
9.获取多个网约车司机的多种特征信息,以及每个网约车司机的离职情况;
10.从多个网约车司机的多种特征信息中,将目标类型的特征信息剔除;其中,所述目标类型为区分网约车司机是否离职的能力小于预设能力的特征信息的类型;
11.根据剔除后的多种特征信息,以及每个网约车司机的离职情况,训练基础模型,得到离职模型。
12.上述方法,能够在训练离职模型时,通过找到区分网约车司机是否离职的能力小于预设能力的特征信息的类型,并将该种类型的特征信息剔除,采用剔除没有区分能力的类型的特征信息后的特征信息,训练离职模型,从而能够提高训练速度。
13.在一种可能实施的方式中,其中,通过以下部分或全部特征分析方式确定目标类型;
14.根据多个网约车司机的多种特征信息,确定每种类型的特征信息的方差,针对每种类型的特征信息的方差,若所述类型的特征信息的方差不超过方差预设阈值,则确定所述类型为目标类型;
15.根据多个网约车司机的多种特征信息,确定每种类型的特征信息的相关系数,针对每种类型的特征信息的相关系数,若所述类型的特征信息的相关系数不超过相关系数预设阈值,则确定所述类型为目标类型;
16.根据多个网约车司机的多种特征信息,通过t检验确定离职网约车司机和未离职网约车司机的每种类型的特征信息的差异程度,针对每种类型的特征信息的差异程度,若所述类型的特征信息的差异程度超过预设程度,则确定所述类型为目标类型。
17.上述方法,能够在训练离职模型时,通过方差、相关系数、以及t检验的部分或全部方式确定没有区分能力的类型的特征信息,并采用剔除没有区分能力的类型的特征信息后的特征信息,训练离职模型,从而能够提高训练速度。
18.在一种可能实施的方式中,将多种所述特征信息作为输入,通过离职模型确定所述目标网约车司机的离职概率之后,所述方法还包括:
19.根据概率范围和预设挽回策略的对应关系,确定所述目标网约车司机的离职概率所属的概率范围对应的预设挽回策略,并将所述目标网约车司机的离职概率所属的概率范围对应的预设挽回策略进行显示。
20.上述方法,能够根据离职模型确定出来的目标网约车司机的离职概率的高低,得到其预设挽回策略,并进行显示,这样能够使得平台管理人员能够及时应对。
21.在一种可能实施的方式中,获取目标网约车司机的多种特征信息,包括:
22.根据目标网约车司机的注册信息,确定目标网约车司机的多种个人特征信息;和/或
23.根据目标网约车司机的工作过程的信息,确定目标网约车司机的多种工作特征信息;其中,所述工作过程的信息包括以下部分或全部:出勤信息、收入信息、订单信息、乘客评价信息、平台奖惩信息、驾驶行为信息、司机语音信息。
24.上述方法,提出网约车司机的数据包含目标网约车司机的个人特征信息,以及工作过程中的出勤信息、收入信息、订单信息、乘客评价信息、平台奖惩信息、驾驶行为信息、司机语音信息的部分或全部信息,确定工作特征信息,这样采用多维度的特征信息进行离职预测,提高了预测的准确性。
25.在一种可能实施的方式中,获取目标网约车司机的多种特征信息之后,所述方法还包括:
26.若记载所述特征信息的形式为文字形式,且所述特征信息的类型为第一预设类型,则根据每种含义对应的预设含义值,对目标网约车司机的所述特征信息进行数值化处理;其中,所述第一预设类型为表述相反含义的特征信息的类型;
27.若记载所述特征信息的形式为文字形式,且所述特征信息的类型为第二预设类型,则根据每个级别对应的预设级别值,对目标网约车司机的所述特征信息进行数值化处理;其中,所述第二预设类型为表述级别含义的特征信息的类型;
28.若记载所述特征信息的形式为文字形式,且所述特征信息的类型为第三预设类型,则根据预设违规事项对应的预设违规分数,对目标网约车司机的所述特征信息进行数值化处理;其中,所述第三预设类型为表述网约车司机的违规事项的特征信息的类型。
29.上述方法,能够通过对文字形式的特征信息进行数值化处理,从而平衡了文字信息无法跟数值型信息统一做处理的问题。
30.在一种可能实施的方式中,获取多个网约车司机的多种特征信息之后,所述方法还包括:
31.若通过多于一个特征分析方式确定没有区分能力的目标类型,则将个数超过预设个数的特征分析方式均确定出的没有区分能力的类型为目标类型。
32.上述方法,能够通过特征分析方式的个数超过预设个数均确定没有区分能力的类型的特征信息进行删除,提高了确定没有区分能力的类型的特征信息的可靠性。
33.第二方面,本发明实施例提供一种网约车司机离职预测系统,包括:
34.获取模块,用于获取目标网约车司机的多种特征信息;所述特征信息包括个人特征信息和/或工作特征信息;
35.预测模块,用于将多种所述个人特征信息和多种所述工作特征信息作为输入,通过离职模型确定所述目标网约车司机的离职概率;
36.训练模块,用于所述离职模型通过以下方式进行训练得到:
37.获取多个网约车司机的多种特征信息,以及每个网约车司机的离职情况;
38.从多个网约车司机的多种特征信息中,将目标类型的特征信息剔除;其中,所述目标类型为区分网约车司机是否离职的能力小于预设能力的特征信息的类型;
39.根据剔除后的多种特征信息,以及每个网约车司机的离职情况,训练基础模型,得到离职模型。
40.在一种可能实施的方式中,所述训练模块具体用于:
41.根据多个网约车司机的多种特征信息,确定每种类型的特征信息的方差,针对每种类型的特征信息的方差,若所述类型的特征信息的方差不超过方差预设阈值,则确定所述类型为目标类型;
42.根据多个网约车司机的多种特征信息,确定每种类型的特征信息的相关系数,针对每种类型的特征信息的相关系数,若所述类型的特征信息的相关系数不超过相关系数预设阈值,则确定所述类型为目标类型;
43.根据多个网约车司机的多种特征信息,通过t检验确定离职网约车司机和未离职网约车司机的每种类型的特征信息的差异程度,针对每种类型的特征信息的差异程度,若所述类型的特征信息的差异程度超过预设程度,则确定所述类型为目标类型。
44.在一种可能实施的方式中,所述系统还包括:
45.挽回模块,用于根据概率范围和预设挽回策略的对应关系,确定所述目标网约车司机的离职概率所属的概率范围对应的预设挽回策略,并将所述目标网约车司机的离职概率所属的概率范围对应的预设挽回策略进行显示。
46.在一种可能实施的方式中,获取模块,具体用于:
47.根据目标网约车司机的注册信息,确定目标网约车司机的多种个人特征信息;和/或
48.根据目标网约车司机的工作过程的信息,确定目标网约车司机的多种工作特征信息;其中,所述工作过程的信息包括以下部分或全部:出勤信息、收入信息、订单信息、乘客评价信息、平台奖惩信息、驾驶行为信息、司机语音信息。
49.在一种可能实施的方式中,所述系统还包括:
50.数据化模块,用于若记载所述特征信息的形式为文字形式,且所述特征信息的类
型为第一预设类型,则根据每种含义对应的预设含义值,对目标网约车司机的所述特征信息进行数值化处理;其中,所述第一预设类型为表述相反含义的特征信息的类型;
51.若记载所述特征信息的形式为文字形式,且所述特征信息的类型为第二预设类型,则根据每个级别对应的预设级别值,对目标网约车司机的所述特征信息进行数值化处理;其中,所述第二预设类型为表述级别含义的特征信息的类型;
52.若记载所述特征信息的形式为文字形式,且所述特征信息的类型为第三预设类型,则根据预设违规事项对应的预设违规分数,对目标网约车司机的所述特征信息进行数值化处理;其中,所述第三预设类型为表述网约车司机的违规事项的特征信息的类型。
53.在一种可能实施的方式中,所述训练模块,还用于若通过多于一个特征分析方式确定没有区分能力的目标类型,则将个数超过预设个数的特征分析方式均确定出的没有区分能力的类型为目标类型。
54.第三方面,本发明实施例提供一种电子设备,包括:处理器和用于存储所述处理器可执行指令的存储器;
55.所述处理器用于执行第一方面任一项所述的网约车司机离职预测方法。
56.第四面,本发明实施例提供一种存储介质,当所述存储介质中的指令由电子设备的处理器执行时,使得所述电子设备能够执行如第一方面中任一项所述的网约车司机离职预测方法。
57.另外,第二方面至第四方面中任一种实现方式所带来的技术效果可参见第一方面中不同实现方式所带来的技术效果,此处不再赘述。
58.应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本发明。
附图说明
59.图1为本发明实施例提供的一种网约车司机离职预测方法的流程图;
60.图2为本发明实施例提供的一种网约车司机离职预测系统的结构示意图;
61.图3为本发明实施例提供的一种电子设备的结构示意图。
具体实施方式
62.为了使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明作进一步地详细描述,显然,所描述的实施例仅仅是本发明一部份实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。
63.目前离职模型训练过程中会获取大量的数据进行训练,训练过程数据量比较大,导致训练速度比较低。
64.基于此,本发明实施例提供了一种网约车司机离职预测方法,如图1所示,包括:
65.s100:获取多个网约车司机的多种特征信息,以及每个网约车司机的离职情况;特征信息包括个人特征信息和/或工作特征信息;
66.其中,每个网约车司机均具有多种个人特征信息和/或多种工作特征信息。
67.每个网约车司机的离职情况,例如,离职,还是未离职,均作为该网约车司机的标
签,进行后续训练。
68.s101:从多个网约车司机的多种特征信息中,将目标类型的特征信息剔除;其中,目标类型为区分网约车司机是否离职的能力小于预设能力的特征信息的类型;
69.s102:根据剔除后的多种特征信息,以及每个网约车司机的离职情况,训练基础模型,得到离职模型;
70.s103:获取目标网约车司机的多种特征信息;
71.其中,目标网约车司机为需要进行离职预测的网约车司机。获取目标网约车司机的多种个人特征信息以及多种工作特征信息与步骤100的方式相同。
72.s104:将多种特征信息作为输入,通过离职模型确定目标网约车司机的离职概率。
73.上述方案中,能够通过精减后的特征信息训练离职模型,并采用该离职模型预测目标网约车司机的离职概率,不仅提高了训练模型的速度,还能够为网约车平台的司机管理做贡献。
74.进一步的,无论是作为训练样本的网约车司机还是目标网约车司机,获取多种特征信息的方法包括:
75.针对每个网约车司机,根据该网约车司机的注册信息,确定该网约车司机的个人特征信息;
76.根据该网约车司机的工作过程的信息,确定该网约车司机的多种工作特征信息;其中,所述工作过程的信息包括以下部分或全部:出勤信息、收入信息、订单信息、乘客评价信息、平台奖惩信息、驾驶行为信息、司机语音信息。
77.其中,注册信息包括年龄、性别、文化水平、婚姻状态、是否从事过网约车行业、曾从事网约车行业时间等。
78.例如:网约车司机的个人特征信息包括:年龄:40岁;性别:男;文化水平:本科毕业;婚姻状态:已婚;是否从事过网约车行业:从事过;曾从事网约车行业时间:5年。
79.根据该网约车司机的出勤信息、收入信息和订单信息,确定该网约车司机的多种工作特征信息,工作特征信息的类型,例如,预设时间段的出勤天数、请假天数、日均在线时长、日均下线时长、日均下线最迟时间、日均流水、周均收入、月均收入。
80.根据该网约车司机的乘客评价信息、平台奖惩信息,确定该网约车司机的多种工作特征信息,工作特征信息的类型,例如,预设时间段的差评数、差评率、客诉数、客诉率、平台违规次数、被乘客拉黑次数、违规扣分总数。
81.根据该网约车司机的驾驶行为信息,确定该网约车司机的多种工作特征信息,工作特征信息的类型,例如,拒单次数、平均接驾时间。
82.根据该网约车司机的司机语音信息,确定该网约车司机的多种工作特征信息,工作特征信息的类型,例如,通过语音转文字接口,获取对话文本。对文本进行分词,统计近7日,近15天内对话中含负面情绪词语(如生气、痛苦、后悔等等)个数、次数,统计近7日,近15天内对话中含离职倾向词语(不干了、不赚钱、太累了、不值得等等)个数、次数。
83.然而,对于上述多种类型的特征信息中,有些特征信息是以数值记录的,例如,含离职倾向的词语的次数、年龄,有些特征信息是以文字形式记录的,例如,文化水平、性别、婚姻状态、是否从事过网约车行业等,均是以文字形式记录,对于以文字形式和数值形式是无法统一处理的,而且文字形式的特征信息无法采用特征分析方式进行剔除目标类型的特
征信息。基于此,本发明提出了数值化处理的方式,具体来说:
84.若记载特征信息的形式为文字形式,且特征信息的类型为第一预设类型,则根据每种含义对应的预设含义值,对目标网约车司机的特征信息进行数值化处理;其中,第一预设类型为表述相反含义的特征信息的类型;
85.若记载特征信息的形式为文字形式,且特征信息的类型为第二预设类型,则根据每个级别对应的预设级别值,对目标网约车司机的所述特征信息进行数值化处理;其中,第二预设类型为表述级别含义的特征信息的类型;
86.若记载特征信息的形式为文字形式,且特征信息的类型为第三预设类型,则根据预设违规事项对应的预设违规分数,对目标网约车司机的特征信息进行数值化处理;其中,第三预设类型为表述网约车司机的违规事项的特征信息的类型。
87.第一预设类型为表述相反含义的特征信息的类型,例如,性别、婚姻状态、是否从事过网约车行业,均为相反含义的类型。性别为男或者女,婚姻状态为已婚或者未婚,是否从事过网约车行业为从事过网约车行业或者未从事过网约车行业。
88.性别为男对应的预设含义值为1,性别为女对应的预设含义值为0;那么当网约车司机的性别为男时,对特征信息进行数值化处理为1;当网约车司机的性别为女时,对特征信息进行数值化处理为0。
89.婚姻状态为已婚对应的预设含义值为1,婚姻状态为未婚对应的预设含义值为0;那么当网约车司机的婚姻状态为已婚时,对特征信息进行数值化处理为1;当网约车司机的婚姻状态为未婚时,对特征信息进行数值化处理为0。
90.是否从事过网约车行业为从事过网约车行业对应的预设含义值为1,是否从事过网约车行业为未从事过网约车行业对应的预设含义值为0;那么当网约车司机从事过网约车行业时,对特征信息进行数值化处理为1;当网约车司机未从事过网约车行业时,对特征信息进行数值化处理为0。
91.第二预设类型为表述级别含义的特征信息的类型;例如:文化水平,具体为:本科、专科、硕士、博士、专科以下;专科以下对应的预设级别值为1,专科对应的预设级别值为2,本科对应的预设级别值为3,硕士对应的预设级别值为4,博士对应的预设级别值为5。
92.例如:当网约车司机的文化水平为本科,对特征信息进行数值化处理为3。当网约车司机的文化水平为硕士,对特征信息进行数值化处理为4。
93.第三预设类型为表述网约车司机的违规事项的特征信息的类型;例如,预设违规事项包括言语攻击、骚扰乘客、提前计费、绕路、中途甩客、加价议价、言语诱导取消、索要好评、多收高速费。
94.各种预设违规事项对应的预设违规分数,例如,言语攻击为

8分,骚扰乘客为

8分,提前计费为

8分、绕路为

8分、中途甩客为

8分、加价议价为

8分、言语诱导取消为

4分、索要好评为

4分、多收高速费为

4分。
95.该种类型的该网约车司机的特征信息包括:预设时间段的违规事项,具体为言语攻击3次,则进行数值化处理为

8乘以3为

24分;网约车司机预设时间段的违规事项包括言语攻击1次、中途甩客2次、加价议价1次,则进行数值化处理为

8乘以4为

32分。
96.其中,通过以下特征分析方式确定目标类型;
97.方式1:根据多个网约车司机的多种特征信息,确定每种类型的特征信息的方差,
针对每种类型的特征信息的方差,若所述类型的特征信息的方差不超过方差预设阈值,则确定所述类型为目标类型;
98.方式2:根据多个网约车司机的多种特征信息,确定每种类型的特征信息的相关系数,针对每种类型的特征信息的相关系数,若所述类型的特征信息的相关系数不超过相关系数预设阈值,则确定所述类型为目标类型;
99.方式3:根据多个网约车司机的多种特征信息,通过t检验确定离职网约车司机和未离职网约车司机的每种类型的特征信息的差异程度,针对每种类型的特征信息的差异程度,若所述类型的特征信息的差异程度超过预设程度,则确定所述类型为目标类型。
100.对于上述提到的方差、相关系数、t检验进行相关解释:
101.其中,方差公式如下:
102.var(x)=e(x

e(x))^2
103.其中,x为变量值,e(x)为x的期望值。通过方差公式,能够确定每种类型的特征信息的方差,例如,年龄、婚姻状态、学历等等每一种类型均需要确定一个方差,当该种类型的方差小于方差预设阈值,则确定所有网约车司机的该种类型为目标类型。
104.例如,特征信息的类型为年龄,将所有网约车司机的年龄计算平均值,然后根据平均值和多个网约车司机的年龄,确定年龄的方差。若年龄的方差不超过方差预设阈值,认为年龄对于一个人离不离职是目标类型,若年龄的方差超过方差预设阈值,认为年龄对于一个人离不离职是有区分能力的类型,将年龄这种类型的特征信息保留下来。
105.其中,相关系数为pearson相关系数,其计算公式如下:
[0106][0107]
其中,x为自变量,y因变量是否离职,相关系数的范围为[

1, 1]。相关系数的绝对值越接近1,说明两个变量越相关。且相关系数消除了量纲的影响,更能直接反应变量之间的关系。
[0108]
即,x为特征信息,y为该特征信息的用户是否离职,为该类型的特征信息的平均值,为多个网约车司机的离职情况的平均值。
[0109]
例如,特征信息的类型为年龄,同样的,将所有网约车司机的年龄计算平均值,然后,计算所有网约车司机,也就是作为训练样本的网约车司机的离职情况进行平均值,该离职情况的平均值是按照离职为1,不离职为0进行计算的。
[0110]
然后根据年龄的平均值、离职情况的平均值和每个网约车司机的年龄和离职情况,确定年龄这种类型的pearson相关系数。若pearson相关系数不超过相关系数预设阈值,则认为年龄对于一个人离不离职是目标类型,若pearson相关系数超过相关系数预设阈值,认为年龄对于一个人离不离职是有区分能力的类型。
[0111]
其中,t检验,用t分布理论来推论差异发生的概率,从而比较两个平均数的差异是否显著。举例:把离职的司机年龄记为x1,未离职司机年龄记为x2,则可以统计构造如下统计量,判断两个群体的年龄是否存在显著差异:
[0112][0113]
其中n1、n2表示两群体样本数量,s1和s2表示两群体样本方差。t检验可以返回p值概率,范围[0,1]。同样的,根据预设的p值阈值,把阈值以下的特征保留下来。
[0114]
也就是说t检验是针对两个群体是否存在差异而确定的,为离职的司机年龄的平均值,为离职的司机年龄的平均值。t检验确定的离职网约车司机和未离职网约车司机的差异程度,当差异程度超过预设程度时,将年龄这种类型的特征信息全部删除,当差异程度不超过预设程度时,将年龄这种类型的所有网约车司机的特征信息全部保留下来。
[0115]
其中,可以单独采用方差、或相关系数、或t检验确定目标类型;也可以采用方差、相关系数确定目标类型;或者采用方差、t检验确定目标类型;或者采用相关系数、t检验确定目标类型;或者采用方差、相关系数、t检验确定目标类型。
[0116]
本发明提出对于多种方式确定目标类型时,只要有一种方式确定为目标类型,即可将该类型的特征信息剔除,例如,采用方差、t检验确定目标类型,当采用方差确定一个目标类型,利用t检验确定另一个目标类型,可将两种目标类型均剔除。
[0117]
当然,为了提高确定出来的目标类型的可靠性,针对通过多种特征分析方式确定目标类型时,本发明实施例还提出了一种方式:
[0118]
若通过多于一个特征分析方式确定没有区分能力的目标类型,则将个数超过预设个数的特征分析方式均确定出的没有区分能力的类型为目标类型。
[0119]
例如通过以上三种方式分别判断每个特征信息是否应该删除,删除为1,不删除为0。具体统计如表1所示:
[0120]
表1
[0121]
[0122]
[0123][0124]
预设个数为2,那么需要剔除的类型,如表2所示:
[0125]
年龄文化水平婚姻状态曾从事网约车行业时间近7天平均接驾时间近30天平均接驾时间
[0126]
预设个数为1,那么需要剔除的类型,如表3所示:
[0127]
年龄文化水平婚姻状态是否从事网约车行业曾从事网约车行业时间近14天休息天数近30天休息天数近30天晚高峰完单流水近7天被评价订单数近7天被投诉工单数量近30天被评价订单数近30天被投诉工单数量
[0128]
其中,基础模型可以为catboost,在该模型中,需要进行调整参数,采用贝叶斯方法进行模型的超参数调整。具体流程如下:
[0129]
确定模型好坏评价标准,选取指标auc;
[0130]
设置各个超参数的范围,如树的深度depth:{2,10};
[0131]
设置迭代次数和交叉验证次数;
[0132]
得到最优auc的超参数组合。
[0133]
当训练完成离职模型后,可以确定目标网约车司机的离职概率,并通知给平台管理者,具体来说:
[0134]
根据概率范围和预设挽回策略的对应关系,确定目标网约车司机的离职概率的概率范围对应的预设挽回策略,并将目标网约车司机的离职概率的概率范围对应的预设挽回策略进行显示。
[0135]
例如,预设挽回策略可以为继续观察一段时间、面对面询问是否有离职想法;概率范围为0~0.5对应的继续观察一段时间;概率范围为0.51~1对应的面对面询问是否有离职想法。当目标网约车司机的离职概率为0.6时,可以将预设挽回策略为面对面询问是否有离职想法进行显示,这样网约车平台的管理者知道目标网约车司机很有可能离职时,可以按照预设挽回策略进行挽回处理。
[0136]
如图2所示,基于网约车司机离职预测方法同样的发明构思,本发明还提供一种网约车司机离职预测系统,包括:
[0137]
获取模块200,用于获取目标网约车司机的多种特征信息,所述特征信息包括个人特征信息和/或工作特征信息;
[0138]
预测模块201,用于将多种特征信息作为输入,通过离职模型确定所述目标网约车司机的离职概率;
[0139]
训练模块202,用于所述离职模型通过以下方式进行训练得到:
[0140]
获取多个网约车司机的多种特征信息,以及每个网约车司机的离职情况;
[0141]
从多个网约车司机的多种特征信息中,将目标类型的特征信息剔除;其中,所述目标类型为区分网约车司机是否离职的能力小于预设能力的特征信息的类型;
[0142]
根据剔除后的多种特征信息,以及每个网约车司机的离职情况,训练基础模型,得到离职模型;
[0143]
可选的,通过以下部分或全部特征分析方式确定目标类型;
[0144]
根据多个网约车司机的多种特征信息,确定每种类型的特征信息的方差,针对每种类型的特征信息的方差,若所述类型的特征信息的方差不超过方差预设阈值,则确定所述类型为目标类型;
[0145]
根据多个网约车司机的多种特征信息,确定每种类型的特征信息的相关系数,针对每种类型的特征信息的相关系数,若所述类型的特征信息的相关系数不超过相关系数预设阈值,则确定所述类型为目标类型;
[0146]
根据多个网约车司机的多种特征信息,通过t检验确定离职网约车司机和未离职网约车司机的每种类型的特征信息的差异程度,针对每种类型的特征信息的差异程度,若所述类型的特征信息的差异程度超过预设程度,则确定所述类型为目标类型。
[0147]
可选的,所述系统还包括:
[0148]
挽回模块,用于根据概率范围和预设挽回策略的对应关系,确定所述目标网约车司机的离职概率所属的概率范围对应的预设挽回策略,并将所述目标网约车司机的离职概率所属的概率范围对应的预设挽回策略进行显示。
[0149]
可选的,获取模块200,具体用于:
[0150]
根据目标网约车司机的注册信息,确定目标网约车司机的多种个人特征信息;和/或
[0151]
根据目标网约车司机的工作过程的信息,确定目标网约车司机的多种工作特征信息;其中,所述工作过程的信息包括以下部分或全部:出勤信息、收入信息、订单信息、乘客评价信息、平台奖惩信息、驾驶行为信息、司机语音信息。
[0152]
可选的,所述系统还包括:
[0153]
数据化模块,用于若记载所述特征信息的形式为文字形式,且所述特征信息的类
型为第一预设类型,则根据每种含义对应的预设含义值,对目标网约车司机的所述特征信息进行数值化处理;其中,所述第一预设类型为表述相反含义的特征信息的类型;
[0154]
若记载所述特征信息的形式为文字形式,且所述特征信息的类型为第二预设类型,则根据每个级别对应的预设级别值,对目标网约车司机的所述特征信息进行数值化处理;其中,所述第二预设类型为表述级别含义的特征信息的类型;
[0155]
若记载所述特征信息的形式为文字形式,且所述特征信息的类型为第三预设类型,则根据预设违规事项对应的预设违规分数,对目标网约车司机的所述特征信息进行数值化处理;其中,所述第三预设类型为表述网约车司机的违规事项的特征信息的类型。
[0156]
可选的,所述训练模块,还用于若通过多于一个特征分析方式确定没有区分能力的目标类型,则将个数超过预设个数的特征分析方式均确定出的没有区分能力的类型为目标类型。
[0157]
另外,结合图1

图2描述的本发明实施例的网约车司机离职预测方法和装置可以由电子设备来实现。
[0158]
该电子设备,包括:处理器和用于存储所述处理器可执行指令的存储器;所述处理器用于执行任一项所述的网约车司机离职预测方法。
[0159]
基于上述的介绍,示例性的,提出了图3的电子设备结构。
[0160]
电子设备可以包括处理器310以及存储有计算机程序指令的存储器320。
[0161]
具体地,上述处理器310可以包括中央处理器(cpu),或者特定集成电路(application specific integrated circuit,asic),或者可以被配置成实施本发明实施例的一个或多个集成电路。
[0162]
存储器320可以包括用于数据或指令的大容量存储器。举例来说而非限制,存储器320可包括硬盘驱动器(hard disk drive,hdd)、软盘驱动器、闪存、光盘、磁光盘、磁带或通用串行总线(universal serial bus,usb)驱动器或者两个或更多个以上这些的组合。在合适的情况下,存储器320可包括可移除或不可移除(或固定)的介质。在合适的情况下,存储器320可在数据处理装置的内部或外部。在特定实施例中,存储器320是非易失性固态存储器。在特定实施例中,存储器320包括只读存储器(rom)。在合适的情况下,该rom可以是掩模编程的rom、可编程rom(prom)、可擦除prom(eprom)、电可擦除prom(eeprom)、电可改写rom(earom)或闪存或者两个或更多个以上这些的组合。
[0163]
处理器310通过读取并执行存储器320中存储的计算机程序指令,以实现上述实施例中的任意一种执行任务的方法。
[0164]
在一个示例中,电子设备还可包括通信接口330和总线340。其中,如图3所示,处理器310、存储器320、通信接口330通过总线340连接并完成相互间的通信。
[0165]
通信接口330,主要用于实现本发明实施例中各模块、装置、单元和/或设备之间的通信。
[0166]
总线340包括硬件、软件或两者,将电子设备的部件彼此耦接在一起。举例来说而非限制,总线可包括加速图形端口(agp)或其他图形总线、增强工业标准架构(eisa)总线、前端总线(fsb)、超传输(ht)互连、工业标准架构(isa)总线、无限带宽互连、低引脚数(lpc)总线、存储器总线、微信道架构(mca)总线、外围组件互连(pci)总线、pci

express(pci

x)总线、串行高级技术附件(sata)总线、视频电子标准协会局部(vlb)总线或其他合适的总线
或者两个或更多个以上这些的组合。在合适的情况下,总线610可包括一个或多个总线。尽管本发明实施例描述和示出了特定的总线,但本发明考虑任何合适的总线或互连。
[0167]
另外,结合上述实施例中的电子设备,本发明实施例可提供一种存储介质,当所述存储介质中的指令由电子设备的处理器执行时,使得所述电子设备能够执行如上述任一项所述的网约车司机离职预测方法。
[0168]
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
[0169]
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
[0170]
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
[0171]
尽管已描述了本发明的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例作出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本发明范围的所有变更和修改。
[0172]
显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献