一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

识别企业和车辆关系类型的方法、装置、设备及存储介质与流程

2021-11-10 02:56:00 来源:中国专利 TAG:


1.本发明涉及车联网技术领域,特别涉及一种识别企业和车辆关系类型的方法、装置、设备及存储介质。


背景技术:

2.车辆挂靠经营行为作为一种常见的经营方式,在道路运输领域普遍存在。所谓营运车辆挂靠行为是指个人出资购买车辆,以运输企业为车主登记入户,并以其名义进行运输经营,由挂靠企业提供适于营运的法律条件并收取相应的管理费或有偿服务费的经营方式。
3.挂靠车辆经营潜藏巨大的风险,由于挂靠车辆的产权大多不属于运输企业,经营权又承包或出租给个人,资本的逐利性使挂靠车主把经济效益最大化放在了第一位,从而不可避免地影响了公路运输业的健康发展。目前,我国公路运输经营主体多、企业规模小、运输组织松散、竞争能力和抗风险能力弱、市场混乱等现象依然突出。挂靠经营存在较多的安全隐患,挂靠企业对挂靠车辆难以有效管理、挂靠车主安全意识薄弱导致车辆交通事故频发;挂靠经营引发的利益主体多元化,挂靠车主往往不按照许可路线运营、不遵守法律法规导致市场秩序混乱;挂靠经营追求的是单车经济效益最大化,挂靠车主服务态度较差、市场信誉较低导致诚信危机突显;挂靠车辆产权关系不明晰、经营主体不明确导致潜在较大的法律风险。
4.因此,如何精确地判断企业和车辆的关系类型是本领域技术人员亟待解决的技术问题。


技术实现要素:

5.本公开实施例提供了一种识别企业和车辆关系类型的方法、装置、设备及存储介质。为了对披露的实施例的一些方面有一个基本的理解,下面给出了简单的概括。该概括部分不是泛泛评述,也不是要确定关键/重要组成元素或描绘这些实施例的保护范围。其唯一目的是用简单的形式呈现一些概念,以此作为后面的详细说明的序言。
6.第一方面,本公开实施例提供了一种识别企业和车辆关系类型的方法,包括:
7.获取车辆的轨迹数据以及车辆和企业之间的关联数据;
8.根据轨迹数据以及车辆和企业之间的关联数据计算车辆和企业之间的关联参数;
9.将车辆和企业之间的关联参数输入预训练的关系识别模型,得到企业和车辆之间的关系类型。
10.在一个可选地实施例中,车辆的轨迹数据包括经纬度信息、时间信息、速度信息、方向信息以及车牌号信息;
11.车辆和企业之间的关联数据包括与企业id关联的车辆id、车辆品牌、车辆型号、车辆类型、联系人手机号、服务商以及入网时间。
12.在一个可选地实施例中,根据轨迹数据以及车辆和企业之间的关联数据计算车辆
和企业之间的关联参数,包括:
13.根据轨迹数据以及车辆和企业之间的关联数据计算车辆关联的手机号关联的车辆数、计算车辆关联的企业关联的服务商个数、计算车辆关联的企业的总车辆数、计算预设时间段内车辆和车辆关联企业车辆同时入网数、计算车辆在企业停车场停车的次数、计算同一企业下车辆所属品牌占比、计算同一企业下车辆所属类型占比以及计算同一企业下车辆所属型号占比。
14.在一个可选地实施例中,将车辆和企业之间的关联参数输入预训练的关系识别模型之前,还包括:
15.根据车辆的轨迹数据以及车辆和企业之间的关联数据构建原始数据集;
16.根据原始数据集构建特征工程,得到标准化后的车辆和企业之间的关联参数数据;
17.将车辆和企业之间的关联参数数据分为训练数据集以及测试数据集;
18.根据训练数据集以及测试数据集训练关系识别模型,得到训练好的关系识别模型。
19.在一个可选地实施例中,根据车辆的轨迹数据以及车辆和企业之间的关联数据构建原始数据集,包括:
20.确定企业关联的车辆数的分位数;
21.在各个分位数区间对企业id进行随机无放回的抽样,每个区间抽样的数量相等,得到抽样后的车辆与企业之间的关联数据;
22.对抽样后的车辆与企业之间的关联数据中的车企关系类型进行人工标注,得到标注后的原始数据集。
23.在一个可选地实施例中,根据原始数据集构建特征工程,得到标准化后的车辆和企业之间的关联参数数据,包括:
24.根据原始数据集计算车辆和企业之间的关联参数数据;
25.将车辆和企业之间的关联参数数据进行有监督的卡方分箱,得到标准化后的车辆和企业之间的关联参数数据。
26.在一个可选地实施例中,关系识别模型如下公式所示:
[0027][0028]
其中,y表示预测出来的关系类型,ω
t
和b表示模型的参数,x表示车辆和企业之间的关联参数组成的特征向量。
[0029]
第二方面,本公开实施例提供了一种识别企业和车辆关系类型的装置,包括:
[0030]
获取模块,用于获取车辆的轨迹数据以及车辆和企业之间的关联数据;
[0031]
计算模块,用于根据轨迹数据以及车辆和企业之间的关联数据计算车辆和企业之间的关联参数;
[0032]
识别模块,用于将车辆和企业之间的关联参数输入预训练的关系识别模型,得到识别出来的企业和车辆之间的关系类型。
[0033]
第三方面,本公开实施例提供了一种识别企业和车辆关系类型的电子设备,包括处理器和存储有程序指令的存储器,处理器被配置为在执行程序指令时,执行上述实施例
提供的识别企业和车辆关系类型的方法。
[0034]
第四方面,本公开实施例提供了一种计算机可读介质,其上存储有计算机可读指令,计算机可读指令可被处理器执行以实现上述实施例提供的一种识别企业和车辆关系类型的方法。
[0035]
本公开实施例提供的技术方案可以包括以下有益效果:
[0036]
根据本公开实施例提供的识别企业和车辆关系类型的方法,通过充分考虑企业和车辆相互结合产生的关联数据,根据该关联数据训练关系识别模型,通过训练好的关系识别模型快速识别车辆和企业的关系(自有、挂靠),该方法大大提高了车企关系识别的效率、准确度以及数据的易用性。
[0037]
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本发明。
附图说明
[0038]
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本发明的实施例,并与说明书一起用于解释本发明的原理。
[0039]
图1是根据一示例性实施例示出的一种识别企业和车辆关系类型的方法流程示意图;
[0040]
图2是根据一示例性实施例示出的一种识别企业和车辆关系类型的方法流程示意图;
[0041]
图3是根据一示例性实施例示出的一种有监督的卡方分箱的示意图;
[0042]
图4是根据一示例性实施例示出的一种识别企业和车辆关系类型的装置结构示意图;
[0043]
图5是根据一示例性实施例示出的一种识别企业和车辆关系类型的设备结构示意图;
[0044]
图6是根据一示例性实施例示出的一种计算机存储介质的示意图。
具体实施方式
[0045]
以下描述和附图充分地示出本发明的具体实施方案,以使本领域的技术人员能够实践它们。
[0046]
应当明确,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。
[0047]
下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本发明相一致的所有实施方式。相反,它们仅是如所附权利要求书中所详述的、本发明的一些方面相一致的系统和方法的例子。
[0048]
在本发明的描述中,需要理解的是,术语“第一”、“第二”等仅用于描述目的,而不能理解为指示或暗示相对重要性。对于本领域的普通技术人员而言,可以具体情况理解上述术语在本发明中的具体含义。此外,在本发明的描述中,除非另有说明,“多个”是指两个
或两个以上。“和/或”,描述关联对象的关联关系,表示可以存在三种关系,例如,a和/或b,可以表示:单独存在a,同时存在a和b,单独存在b这三种情况。字符“/”一般表示前后关联对象是一种“或”的关系。
[0049]
现有技术中的车辆挂靠行为的判断方法,通过对车辆轨迹数据和车辆属性信息进行特征处理后,进行规则的提取,通过提取的每个规则计算一个评分,然后求评分的平均值,即为最终的评分,设定一定的阈值,大于阈值的即存在挂靠行为,不大于阈值的则认为不存在挂靠行为。现有技术中的方案和本实施例定义的挖掘实体不同,现有技术方案是针对车辆是否存在挂靠行为,针对的是车辆,而本实施例是针对企业和车辆的关系类型,是一种包含两个实体,以及关联关系的技术方案。再者,现有技术方案完全基于规则进行车辆挂靠行为判断,且无有效的数据进行验证,一方面,各个规则最优的阈值难以确定,另一方面,无法验证规则判断的效果,使得结果数据难以根据判断的效果进行有针对性的应用,造成应用上的困难。本公开实施例提供的识别方法,基于关系识别模型快速识别车辆和企业的关系,该方法大大提高了车企关系识别的效率、准确度以及数据的易用性。
[0050]
图1是根据一示例性实施例示出的一种识别企业和车辆关系类型的方法流程示意图,参见图1,该方法具体包括以下步骤。
[0051]
s101获取车辆的轨迹数据以及车辆和企业之间的关联数据。
[0052]
其中,车辆的轨迹数据包括车辆的经纬度信息、速度信息、时间信息、方向信息以及车牌号信息等数据。例如,可获取目标车辆的gps轨迹点数据,其中,gps轨迹点是部署在车辆上的gps(globalpositioning system,全球定位系统)设备实时上报的车辆位置数据。通常,gps设备在实时上报时,上报的时间间隔可以根据实际情况进行设定,本技术优选时间间隔为10s。需要说明的是,本技术除了采用车辆安装gps设备实时上报车辆的轨迹数据之外,还可以是由北斗设备定位车辆轨迹并进行上报。
[0053]
进一步地,根据车辆与企业的关联信息,获取车辆和企业之间的关联数据,例如通过车辆行驶证上的企业名称和车牌号查询车辆和企业的关联数据,车辆和企业之间的关联数据包括与企业id关联的车辆id、车辆品牌、车辆型号、车辆类型、联系人手机号、服务商以及入网时间。
[0054]
s102根据轨迹数据以及车辆和企业之间的关联数据计算车辆和企业之间的关联参数。
[0055]
在一个实施例中,根据获取到的轨迹数据以及车辆和企业之间的关联数据计算关联参数。
[0056]
具体地,根据车辆和企业之间的关联数据计算车辆关联的手机号关联的车辆数、计算车辆关联的企业关联的服务商个数、计算车辆关联的企业的总车辆数、计算预设时间段内车辆和车辆关联企业车辆同时入网数,也就是关联企业车辆中与该车辆同时入网的车辆数。
[0057]
进一步地,还包括计算同一企业下车辆所属品牌占比,同一企业下车辆所属品牌占比=同一企业下车辆所属品牌总车辆数/企业关联车辆总数,还包括计算同一企业下车辆所属类型占比,同一企业下车辆所属类型占比=同一企业下车辆所属类型总车辆数/企业关联车辆总数,还包括计算同一企业下车辆所属型号占比,同一企业下车辆所属型号占比=同一企业下车辆所属型号总车辆数/企业关联车辆总数。
[0058]
进一步地,还包括根据车辆的轨迹数据计算车辆预设时间段内在企业停车场的停车次数。
[0059]
具体地,对车辆的轨迹数据进行预处理,提取轨迹数据中的异常数据。其中,异常数据包括速度错误数据、经纬度错误数据、掉线数据、补传数据、未定位数据等信息错误数据,将异常数据删除。
[0060]
获取到预处理后的车辆轨迹数据之后,根据车辆的轨迹数据判断车辆是否发生停靠行为。具体地,获取轨迹信息中速度为0的点,并按时间间隔阈值和偏移量阈值进行合并,例如,将10分钟之内的多个停靠点进行合并,将距离较近的多个停靠点进行合并,获得以质心表示的停靠点,通过该步骤,可以对小停靠做一定范围的聚合,然后计算停靠时间,筛选出大于预设停靠阈值的停靠点,从而确定车辆发生停靠行为。
[0061]
根据车辆的停靠数据计算车辆在预设时间段内在关联的企业停车场的停车次数。
[0062]
根据该步骤,可以得到车辆和企业的关联参数,该关联参数涉及多个维度,可以大大提高后续模型识别的准确率。
[0063]
s103将车辆和企业之间的关联参数输入预训练的关系识别模型,得到企业和车辆之间的关系类型。
[0064]
在一个可选地实施例中,将车辆和企业之间的关联参数输入预训练的关系识别模型之前,还包括:构建训练数据集和测试数据集,根据训练数据集和测试数据集训练关系识别模型。
[0065]
首先构建原始数据集,在一个可选地实施例中,构建原始数据集,包括:确定企业关联的车辆数的分位数;在各个分位数区间对企业id进行随机无放回的抽样,每个区间抽样的数量相等,得到抽样后的车辆与企业之间的关联数据;对抽样后的车辆与企业之间的关联数据中的车企关系类型进行人工标注,得到标注后的原始数据集。
[0066]
具体地,首先将企业关联的车辆数小于预设阈值的数据过滤掉,例如,预设阈值为5,将企业关联的车辆数小于5的企业id关联的数据过滤掉。然后接收设定的企业关联的车辆数的分位数,根据分位数进行分箱,在各个分位数区间对企业id进行随机无放回的抽样,每个区间抽样的数量相等,得到抽样后的车辆与企业之间的关联数据,保证获取的数据的平均性。进一步地,对抽样后的车辆与企业之间的关联数据中的车企关系类型(自有、挂靠)进行人工标注,得到标注后的原始数据集。
[0067]
进一步地,根据原始数据集计算车辆和企业之间的关联参数数据,可以参考步骤s102中的关联参数计算方法,计算车辆关联的手机号关联的车辆数、计算车辆关联的企业关联的服务商个数、计算车辆关联的企业的总车辆数、计算预设时间段内车辆和车辆关联企业车辆同时入网数、计算车辆在企业停车场停车的次数、计算同一企业下车辆所属品牌占比、计算同一企业下车辆所属类型占比以及计算同一企业下车辆所属型号占比。
[0068]
进一步地,为防止数据过拟合,得到车辆和企业之间的关联参数数据之后,还包括将车辆和企业之间的关联参数数据进行有监督的卡方分箱,得到标准化后的车辆和企业之间的关联参数数据。
[0069]
图3是一种有监督的卡方分箱的示意图,如图3所示,表示对一种纬度的关联参数进行有监督的卡方分箱,例如,对关联参数中的车辆在企业停车场的停车次数数据进行有监督的卡方分箱。
[0070]
其中,y1表示车辆和企业的关系类型为自有,y2表示车辆和企业的关系类型为挂靠,x1、x2表示车辆在企业停车场的停车次数,本实施例仅列举了两个例子。
[0071]
进一步地,计算卡方值x=n(ad

bc)^2/(a b)(c d)(a c)(b d),其中,a表示停车次数为x1时,对应的y1值,b表示停车次数为x1时,对应的y2值,c表示停车次数为x2时,对应的y1值,d表示表示停车次数为x2时,对应的y2值,n表示a b c d的和。
[0072]
将卡方值x小于预设卡方阈值的两个数值合并,但是车辆关联的手机号关联的车辆数小于一定分位数以下值不参与合并,车辆关联的企业关联的服务商个数小于一定分位数以下不参与合并,企业车辆数小于一定分位数以下的值不参与合并。
[0073]
由于车辆属性信息都是有序的,所以需要将合并后的分箱值,再进行进一步的处理,将分箱的边界值[xi,xj]进行计算(xi xj)/2,即为分箱的最终值x


[0074]
进一步地,为了得到更加标准化的数据,提高模型的训练效果,求出样本的均值mean和标准差std,然后用(x
′‑
mean)/std,得到标准化后的分箱值。
[0075]
根据上述步骤中的分箱方法,对关联参数中的每一个参数都进行有监督的卡方分箱,得到标准化后的关联参数数据。
[0076]
最后,将车辆和企业之间的关联参数数据分为训练数据集以及测试数据集,根据训练数据集和测试数据集训练关系识别模型。
[0077]
在一个可选地实施例中,关系识别模型为逻辑回归模型,具体公式如下所示:
[0078][0079]
其中,y表示预测出来的关系类型,ω
ω
和b表示模型的参数,x表示车辆和企业之间的关联参数组成的特征向量。
[0080]
在一种可能的实现方式中,通过5折交叉验证和网格化超参数进行模型参数选择,通过f1值选择最优性能在测试集上进行测试,调整模型参数,直到测试集上的效果达到最优,并接近于训练集效果,得到训练好的关系识别模型。
[0081]
其中,5折交叉验证法包括步骤1:将数据集分为5部分;步骤2:选取其中一部分作为测试集,另外四部分作为训练集;步骤3:步骤2进行5次,每一次选取的测试集不同。通过进行交叉验证评估模型,可以提高模型训练的精度。
[0082]
在模型运用的时候,将车辆和企业之间的关联参数输入训练好的关系识别模型,即得到企业和车辆之间的关系类型,企业和车辆之间的关系类型包括自有和挂靠两类。
[0083]
在一个可选地实施例中,若识别出来车辆与企业之间的关系为挂靠,将车辆的车牌号、车辆联系人手机号以及挂靠企业id输出到客户端进行显示。得到挂靠企业id之后,还包括获取挂靠企业id关联的所有车辆,对挂靠企业id关联的所有车辆进行关系检测,得到挂靠企业总共挂靠的车辆数,若挂靠企业总共挂靠的车辆数大于等于预设阈值,将该挂靠企业标记为风险运输企业。
[0084]
为了便于理解本技术实施例提供的识别企业和车辆关系类型的方法,下面结合附图2进行说明。如图2所示,该方法包括:
[0085]
首先,获取数据,包括获取车辆的轨迹数据以及车辆和企业的关联数据,然后构建数据集,对获取的数据进行预处理以及人工标注,得到原始数据集,进一步地,为了得到更加标准的数据,对计算的车辆和企业之间的关联参数数据进行有监督的卡方分箱,得到标
准化后的车辆和企业之间的关联参数数据。将标准后的数据分为训练集和测试集,根据训练集和测试集训练关系识别模型,最后,在识别阶段,将车辆和企业的关联参数输入训练好的关系识别模型,得到识别出来的关系类型。
[0086]
本公开实施例提供的识别企业和车辆关系类型的方法,通过充分考虑企业和车辆相互结合产生的关联数据,根据该关联数据训练关系识别模型,通过训练好的关系识别模型快速识别车辆和企业的关系(自有、挂靠),该方法大大提高了车企关系识别的效率、准确度以及数据的易用性。
[0087]
本公开实施例还提供一种识别企业和车辆关系类型的装置,该装置用于执行上述实施例的识别企业和车辆关系类型的方法,如图4所示,该装置包括:
[0088]
获取模块401,用于获取车辆的轨迹数据以及车辆和企业之间的关联数据;
[0089]
计算模块402,用于根据轨迹数据以及车辆和企业之间的关联数据计算车辆和企业之间的关联参数;
[0090]
识别模块403,用于将车辆和企业之间的关联参数输入预训练的关系识别模型,得到识别出来的企业和车辆之间的关系类型。
[0091]
需要说明的是,上述实施例提供的识别企业和车辆关系类型的装置在执行识别企业和车辆关系类型的方法时,仅以上述各功能模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能模块完成,即将设备的内部结构划分成不同的功能模块,以完成以上描述的全部或者部分功能。另外,上述实施例提供的识别企业和车辆关系类型的装置与识别企业和车辆关系类型的方法实施例属于同一构思,其体现实现过程详见方法实施例,这里不再赘述。
[0092]
本公开实施例还提供一种与前述实施例所提供的识别企业和车辆关系类型的方法对应的电子设备,以执行上述识别企业和车辆关系类型的方法。
[0093]
请参考图5,其示出了本技术的一些实施例所提供的一种电子设备的示意图。如图5所示,电子设备包括:处理器500,存储器501,总线502和通信接口503,处理器500、通信接口503和存储器501通过总线502连接;存储器501中存储有可在处理器500上运行的计算机程序,处理器500运行计算机程序时执行本技术前述任一实施例所提供的识别企业和车辆关系类型的方法。
[0094]
其中,存储器501可能包含高速随机存取存储器(ram:random access memory),也可能还包括非不稳定的存储器(non

volatile memory),例如至少一个磁盘存储器。通过至少一个通信接口503(可以是有线或者无线)实现该系统网元与至少一个其他网元之间的通信连接,可以使用互联网、广域网、本地网、城域网等。
[0095]
总线502可以是isa总线、pci总线或eisa总线等。总线可以分为地址总线、数据总线、控制总线等。其中,存储器501用于存储程序,处理器500在接收到执行指令后,执行程序,前述本技术实施例任一实施方式揭示的识别企业和车辆关系类型的方法可以应用于处理器500中,或者由处理器500实现。
[0096]
处理器500可能是一种集成电路芯片,具有信号的处理能力。在实现过程中,上述方法的各步骤可以通过处理器500中的硬件的集成逻辑电路或者软件形式的指令完成。上述的处理器500可以是通用处理器,包括中央处理器(central processing unit,简称cpu)、网络处理器(network processor,简称np)等;还可以是数字信号处理器(dsp)、专用
集成电路(asic)、现成可编程门阵列(fpga)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。可以实现或者执行本技术实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合本技术实施例所公开的方法的步骤可以直接体现为硬件译码处理器执行完成,或者用译码处理器中的硬件及软件模块组合执行完成。软件模块可以位于随机存储器,闪存、只读存储器,可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器501,处理器500读取存储器501中的信息,结合其硬件完成上述方法的步骤。
[0097]
本技术实施例提供的电子设备与本技术实施例提供的识别企业和车辆关系类型的方法出于相同的发明构思,具有与其采用、运行或实现的方法相同的有益效果。
[0098]
本技术实施例还提供一种与前述实施例所提供的识别企业和车辆关系类型的方法对应的计算机可读存储介质,请参考图6,其示出的计算机可读存储介质为光盘600,其上存储有计算机程序(即程序产品),计算机程序在被处理器运行时,会执行前述任意实施例所提供的识别企业和车辆关系类型的方法。
[0099]
需要说明的是,计算机可读存储介质的例子还可以包括,但不限于相变内存(pram)、静态随机存取存储器(sram)、动态随机存取存储器(dram)、其他类型的随机存取存储器(ram)、只读存储器(rom)、电可擦除可编程只读存储器(eeprom)、快闪记忆体或其他光学、磁性存储介质,在此不再一一赘述。
[0100]
本技术的上述实施例提供的计算机可读存储介质与本技术实施例提供的识别企业和车辆关系类型的方法出于相同的发明构思,具有与其存储的应用程序所采用、运行或实现的方法相同的有益效果。
[0101]
以上实施例仅表达了本发明的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。因此,本发明专利的保护范围应以所附权利要求为准。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献