一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种交通卡号实名匹配方法、电子设备及存储介质与流程

2022-11-19 18:47:13 来源:中国专利 TAG:


1.本发明涉及一种交通卡号实名匹配方法,尤其涉及一种交通卡号实名匹配方法、电子设备及存储介质,属于交通卡号实名匹配技术领域。


背景技术:

2.cn108074301a公开了一种交通卡的实名制方法及装置,该方法针对待匹配的地铁站,识别与所述地铁站之间的距离小于设定距离阈值的小区;针对在设定时间长度内针对所述地铁站保存的第一刷卡记录及针对每个小区保存的第二刷卡记录,识别所述第一刷卡记录中的交通卡的标识信息及进出站时间,并识别所述第二刷卡记录中的用户身份标识信息及出进门时间;统计包含目标用户身份标识信息的第二刷卡记录及包含目标交通卡的标识信息的第一刷卡记录,如果目标第一刷卡记录中的进站时间和目标第二刷卡记录中的出门时间之间的差值小于设定时间阈值,或目标第二刷卡记录中进门时间和目标第一刷卡记录中出站时间的差值小于设定时间阈值,则确定目标第一刷卡记录和目标第二刷卡记录为一条匹配记录;根据该目标用户身份标识信息和目标交通卡的标识信息的匹配记录的条数,确定所述用户身份标识信息和目标交通卡的标识信息的匹配次数,当所述匹配次数大于设定的次数阈值时,确定该目标用户身份标识信息与该目标交通卡的标识信息匹配。
3.但该方法存在以下问题:1.数据利用率低:需考虑每个地铁站附近的小区,若地铁站附近不存在小区或小区数据量极少,或乘车人并非从小区出发乘坐地铁,则地铁站的刷卡数据则无法有效利用;2.匹配率低、准确率低:当数据利用率较低时,交通卡号的匹配率及准确率也会随之降低;3.计算资源开销大:进入小区的个体实际上可能并非搭乘地铁,但是否搭乘地铁信息无法从小区刷卡数据得到,计算时可能大部分数据没有实际用处,会造成计算资源开销大的问题。


技术实现要素:

4.在下文中给出了关于本发明的简要概述,以便提供关于本发明的某些方面的基本理解。应当理解,这个概述并不是关于本发明的穷举性概述。它并不是意图确定本发明的关键或重要部分,也不是意图限定本发明的范围。其目的仅仅是以简化的形式给出某些概念,以此作为稍后论述的更详细描述的前序。
5.鉴于此,为解决现有技术中存在的数据利用率低、匹配率低和计算资源开销大的技术问题,本发明提供一种交通卡号实名匹配方法、电子设备及存储介质。本发明对轨道刷卡数据及实名扫码数据进行预处理获取轨道刷卡进站数据和扫码进站数据后,通过场所映射建立他们之间的位置关系,再通过时间离散化及时间片扩展获得三维稀疏矩阵,通过维度合并将三维矩阵变换为二维矩阵,利用矩阵相乘运算计算匹配度,并基于事实规则对结果进行后处理和结果输出。本发明采用实际场景中覆盖面广、使用率高的实名扫码数据代
替小区刷卡记录,进而提高轨道刷卡数据的可使用量;通过计算扫码场所和地铁站点之间的映射关系,筛选实名扫码数据,能够在计算前提前删除与轨道站点无映射关系的实名扫码数据,减少无效数据;利用稀疏矩阵进一步降低计算资源开销。
6.方案一、一种交通卡号实名匹配方法,基于实名扫码数据和轨道刷卡数据实现的一种交通卡号实名匹配方法,包括以下步骤:s1.对轨道刷卡数据进行预处理;s2.判断轨道站点和扫码场所之间的映射关系;s3.对实名扫码数据进行预处理;s4.构建轨道刷卡进站稀疏矩阵和扫码进站稀疏矩阵;s5.将三维稀疏矩阵变换为二维矩阵;s6.计算轨道刷卡数据和实名扫码数据之间的匹配度,获取交通卡号和个体匹配结果。
7.优选的,s1具体是:包括以下步骤:s11.数据清洗:删除员工卡、单次卡、特殊类型刷卡数据、进站时间大于出站时间的数据、删除个体乘坐地铁的出站时间和出站站点信息;若出现极短时间内重复进入同一站点的数据,保留其中一条数据;s12.建立站点索引表:从轨道刷卡数据中提取进站和出站站点,去重后给予唯一自增id作为轨道站点索引;s13.交通卡号筛选:基于轨道刷卡数据覆盖时间范围、覆盖工作日数量设定卡号在轨道刷卡数据中出现的次数;若轨道刷卡数据中卡号的出现次数小于设定的阈值,则将小于设定阈值的卡号数据删除;s14.建立交通卡号索引表:从卡号筛选后的数据中提取卡号,去重后给予唯一自增id作为交通卡号索引。
8.优选的,s2具体是:包括以下步骤:s21.通过轨道站点名称和扫码场所名称,通过正则表达式或nlp语义分析对轨道站点名称和扫码场所名称进行匹配;s22.通过轨道站点和扫码场所之间的距离进行匹配,采用下述公式计算两者距离:=2**arcsin其中,代表场所纬度,代表场所经度,代表地球赤道半径;s23.设定轨道站点和扫码场所之间的距离阈值;当轨道站点和扫码场所满足名称匹配条件且距离小于设定阈值时判断轨道站点和扫码场所存在映射关系。
9.优选的,s3具体是:包括以下步骤:s31.时间筛选:筛选实名扫码数据的时间与清洗后的轨道刷卡数据的最小时间和最大时间对应的数据;s32.场所筛选、获取对应轨道站点索引:基于场所映射结果,删除与轨道站点不存在映射关系的场所扫码数据,获取与轨道站点存在映射关系的扫码场所对应的轨道站点索
引;s33.个体筛选:设定个体在实名扫码数据中出现的次数,个体在实名扫码数据中出现的次数与设定的交通卡号在轨道刷卡数据中出现次数保持一致;若实名扫码数据中个体的出现次数小于设定的阈值,则将小于设定阈值的个体数据删除;s34.建立个体索引表:从个体筛选后的实名扫码数据提取个体信息,去重后给予唯一自增id作为个体索引。
10.优选的,s4具体是:包括以下步骤:s41.将轨道刷卡数据中的刷卡进站时间与实名扫码数据中的扫码时间通过下述公式进行离散化,获取时间片索引表:其中,代表将时间转换为10位时间戳,代表清洗后的轨道刷卡数据和实名扫码数据的最小时间,代表向下取整;s42.根据站点索引表和交通卡号索引表构建轨道刷卡进站稀疏矩阵;预处理后的轨道刷卡数据中存在的交通卡号、站点、时间所对应的交通卡号索引、站点索引、时间片索引下的元素为1,其余为0;s43.根据个体索引表、轨道站点索引表构建扫码进站稀疏矩阵;预处理后的实名扫码数据中存在的个体、站点、时间所对应的交通卡号索引、站点索引、时间片索引下的元素为1,其余为0;s44.将扫码进站稀疏矩阵向后扩展延伸n个时间片,扩展延伸的矩阵元素为1;s45.将轨道刷卡进站稀疏矩阵需向前扩展延伸n个时间片,扩展延伸的矩阵元素为0。
11.优选的,s5具体是:采用如下规则进行变换:其中,代表站点索引,代表时间片索引,代表轨道刷卡进站数据和扫码进站数据的最大时间片索引。
12.优选的,s6具体是:通过二维矩阵乘法运算计算轨道刷卡数据和实名扫码数据之间的匹配度。将轨道刷卡进站稀疏矩阵和扫码进站稀疏矩阵相乘,得到的矩阵行索引和列索引分别为交通卡号索引和个体索引,矩阵中每个元素值为交通卡号索引和个体索引匹配度,结合交通卡号索引表和个体索引表即可获取交通卡号和个体之间的匹配度;匹配度在实际意义中代表同一时间段个体和交通卡号出现在同一个轨道站点的次数;设定匹配度阈值为,当匹配度大于等于时,认为卡号匹配成功;匹配度计算结果若存在一卡对应多人或一人拥有多卡现象时,设定以下规则:a一个交通卡最多对应一人;b一人最多拥有交通卡;每个交通卡号选取匹配度最高的对应个体作为该卡持有个体,若大于
个交通卡号匹配度最高的对应个体为同一个,则认为前个匹配度最高的交通卡号为该个体持有卡。
13.方案二、一种电子设备,包括存储器和处理器,存储器存储有计算机程序,所述的处理器执行所述计算机程序时实现方案一所述一种交通卡号实名匹配方法的步骤。
14.方案三、一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现方案一所述一种交通卡号实名匹配方法。
15.本发明的有益效果如下:1)适配大数据技术,可依托于大数据分布式计算技术实施,可充分发挥分布式计算的优点,有效减少计算时间;2)减少存储资源,通过引入稀疏矩阵,降低计算所需的存储资源,节省资源开销;3)结果可重复利用,所得结果在一定时间段内可重复使用,无需高频率重复计算;4)应用场景广泛,可应用于现实场景,如个体级轨迹还原,进而可拓展至个体追踪、疫情防控等重要场景;5)可与其他技术相结合使用,可与地铁仿真技术、出行推演技术结合,获取更为详细的个体出行信息。
附图说明
16.此处所说明的附图用来提供对本发明的进一步理解,构成本发明的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:图1为本发明一种交通卡号实名匹配方法流程示意图;图2为本发明轨道刷卡进站稀疏矩阵示意图;图3为本发明扫码进站稀疏矩阵。
具体实施方式
17.为了使本发明实施例中的技术方案及优点更加清楚明白,以下结合附图对本发明的示例性实施例进行进一步详细的说明,显然,所描述的实施例仅是本发明的一部分实施例,而不是所有实施例的穷举。需要说明的是,在不冲突的情况下,本发明中的实施例及实施例中的特征可以相互组合。
18.实施例1、参照图1-图3说明本实施方式,一种交通卡号实名匹配方法,实名扫码数据需包含个体实名信息(即证件类型和证件号码)、扫码场所信息、扫码时间信息,与之对应的,轨道刷卡数据需包含交通卡号信息、站点信息、刷卡时间信息。本发明将以上两类活动数据进行轨迹碰撞,计算轨迹的匹配度来获取个体的交通卡号信息。首先需要获取轨道刷卡数据和实名扫码数据,其次,再进行以下步骤:s1.对轨道刷卡数据进行预处理,轨道刷卡数据预处理的目的是去除脏数据、建立站点及交通卡号索引表并获取清洗后的轨道刷卡进站数据,其包括以下步骤:s11.数据清洗:删除员工卡、单次卡、特殊类型刷卡数据、进站时间大于出站时间的数据、删除个体乘坐地铁的出站时间和出站站点信息;若出现极短时间内重复进入同一站点的数据,保留其中一条数据;s12.建立站点索引表:从轨道刷卡数据中提取进站和出站站点,去重后给予唯一
自增id作为轨道站点索引;s13.交通卡号筛选:基于轨道刷卡数据覆盖时间范围、覆盖工作日数量设定卡号在轨道刷卡数据中出现的次数;若轨道刷卡数据中卡号的出现次数小于设定的阈值,则将小于设定阈值的卡号数据删除;s14.建立交通卡号索引表:从卡号筛选后的数据中提取卡号,去重后给予唯一自增id作为交通卡号索引。
19.s2.判断轨道站点和扫码场所之间的映射关系;场所映射的目的为将轨道站点与扫码场所建立等价关系,基于场所映射结果对实名扫码数据进行筛选,判断轨道站点和扫码场所之间的映射关系,包括以下步骤:s21.通过轨道站点名称和扫码场所名称,通过正则表达式或nlp语义分析对轨道站点名称和扫码场所名称进行匹配;s22.通过轨道站点和扫码场所之间的距离进行匹配,采用下述公式计算两者距离:=2**arcsin其中,代表场所纬度,代表场所经度,代表地球赤道半径;s23.设定轨道站点和扫码场所之间的距离阈值;当轨道站点和扫码场所满足名称匹配条件且距离小于设定阈值时判断轨道站点和扫码场所存在映射关系。
20.s3.对实名扫码数据进行预处理,实名扫码数据预处理的目的是对实名扫码数据进行筛选、建立个体索引表、获取扫码进入轨道站点数据,包括以下步骤:s31.时间筛选:筛选实名扫码数据的时间与清洗后的轨道刷卡数据的最小时间和最大时间对应的数据;s32.场所筛选、获取对应轨道站点索引:基于场所映射结果,删除与轨道站点不存在映射关系的场所扫码数据,获取与轨道站点存在映射关系的扫码场所对应的轨道站点索引;s33.个体筛选:设定个体在实名扫码数据中出现的次数,个体在实名扫码数据中出现的次数与设定的交通卡号在轨道刷卡数据中出现次数保持一致;若实名扫码数据中个体的出现次数小于设定的阈值,则将小于设定阈值的个体数据删除;s34.建立个体索引表:从个体筛选后的实名扫码数据提取个体信息,去重后给予唯一自增id作为个体索引。
21.s4.构建轨道刷卡进站稀疏矩阵和扫码进站稀疏矩阵,包括以下步骤:s41.将轨道刷卡数据中的刷卡进站时间与实名扫码数据中的扫码时间通过下述公式进行离散化,获取时间片索引表:其中,代表将时间转换为10位时间戳,代表清洗后的轨道刷卡数据和实名扫码数据的最小时间,代表向下取整;s42.根据站点索引表和交通卡号索引表构建轨道刷卡进站稀疏矩阵;预处理后的
轨道刷卡数据中存在的交通卡号、站点、时间所对应的交通卡号索引、站点索引、时间片索引下的元素为1,其余为0;s43.根据个体索引表、轨道站点索引表构建扫码进站稀疏矩阵;预处理后的实名扫码数据中存在的个体、站点、时间所对应的交通卡号索引、站点索引、时间片索引下的元素为1,其余为0;由于个体在乘坐地铁时的动作顺序为先进行场所扫码,再进行刷卡,两个动作间存在一定时间差,因此需将扫码进站稀疏矩阵向后扩展延伸n个时间片,扩展延伸的矩阵元素为1,相对应地,轨道刷卡进站稀疏矩阵需向前扩展延伸n个时间片,但扩展延伸的矩阵元素为0。上述处理代表同一轨道站点下个体的轨道刷卡进站时间片位于区间中,代表扫码进站时间片。
22.s44.将扫码进站稀疏矩阵向后扩展延伸n个时间片,即扩展延伸后的扫码进站稀疏矩阵的数量级是原始稀疏矩阵的倍,扩展延伸的矩阵元素为1;扩展延伸后的扫码进站稀疏矩阵大小为;其中代表个体数量,代表轨道站点数据,代表时间片数量。
23.s45.将轨道刷卡进站稀疏矩阵需向前扩展延伸n个时间片,即扩展延伸后的轨道刷卡进站稀疏矩阵的数量级是原始稀疏矩阵的倍,扩展延伸的矩阵元素为0。扩展延伸后的轨道刷卡进站稀疏矩阵大小为;其中代表交通卡号数量。
24.s5.为方便矩阵运算,需对三维矩阵进行维度合并,转换为二维矩阵。由于交通卡号和个体为需要匹配的维度,因此将轨道站点维度和时间片维度进行合并。合并规则必须保证在唯一站点、唯一时间片下的合并值是唯一的,且需保证在合并后的维度上为连续自然数,将三维稀疏矩阵变换位二维矩阵,采用如下规则进行变换:其中,代表站点索引,代表时间片索引,代表轨道刷卡进站数据和扫码进站数据的最大时间片索引。
25.由于轨道刷卡进站稀疏矩阵和扫码进站稀疏矩阵中站点维度和时间维度均为连续自然数且,因此上述合并规则可保证合并维度的连续自然性和合并值的唯一性。
26.s6.计算轨道刷卡数据和实名扫码数据之间的匹配度,获取交通卡号和个体匹配结果;通过二维矩阵乘法运算计算轨道刷卡数据和实名扫码数据之间的匹配度。将轨道刷卡进站稀疏矩阵和扫码进站稀疏矩阵相乘,得到的矩阵行索引和列索引分别为交通卡号索引和个体索引,矩阵中每个元素值为交通卡号索引和个体索引匹配度,结合交通卡号索引表和个体索引表即可获取交通卡号和个体之间的匹配度;匹配度在实际意义中代表同一时间段个体和交通卡号出现在同一个轨道站点的次数;
其具体方法是:设定匹配度阈值为,当匹配度大于等于时,认为卡号匹配成功;匹配度计算结果若存在一卡对应多人或一人拥有多卡现象时,设定以下规则:a一个交通卡最多对应一人;b一人最多拥有交通卡;每个交通卡号选取匹配度最高的对应个体作为该卡持有个体,若大于个交通卡号匹配度最高的对应个体为同一个,则认为前个匹配度最高的交通卡号为该个体持有卡。
27.实施例2、本发明的计算机装置可以是包括有处理器以及存储器等装置,例如包含中央处理器的单片机等。并且,处理器用于执行存储器中存储的计算机程序时实现上述的基于creo软件的可修改由关系驱动的推荐数据的推荐方法的步骤。
28.所称处理器可以是中央处理单元(central processing unit,cpu),还可以是其他通用处理器、数字信号处理器 (digital signal processor,dsp)、专用集成电路(application specific integrated circuit,asic)、现成可编程门阵列 (field-programmable gate array,fpga) 或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
29.所述存储器可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等;存储数据区可存储根据手机的使用所创建的数据(比如音频数据、电话本等)等。此外,存储器可以包括高速随机存取存储器,还可以包括非易失性存储器,例如硬盘、内存、插接式硬盘,智能存储卡(smart media card, smc),安全数字(secure digital, sd)卡,闪存卡(flash card)、至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。
30.实施例3、计算机可读存储介质实施例本发明的计算机可读存储介质可以是被计算机装置的处理器所读取的任何形式的存储介质,包括但不限于非易失性存储器、易失性存储器、铁电存储器等,计算机可读存储介质上存储有计算机程序,当计算机装置的处理器读取并执行存储器中所存储的计算机程序时,可以实现上述的基于creo软件的可修改由关系驱动的建模数据的建模方法的步骤。
31.所述计算机程序包括计算机程序代码,所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质可以包括:能够携带所述计算机程序代码的任何实体或装置、记录介质、u盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(rom,read-only memory)、随机存取存储器(ram,random access memory)、电载波信号、电信信号以及软件分发介质等。需要说明的是,所述计算机可读介质包含的内容可以根据司法管辖区内立法和专利实践的要求进行适当的增减,例如在某些司法管辖区,根据立法和专利实践,计算机可读介质不包括电载波信号和电信信号。
32.尽管根据有限数量的实施例描述了本发明,但是受益于上面的描述,本技术领域
内的技术人员明白,在由此描述的本发明的范围内,可以设想其它实施例。此外,应当注意,本说明书中使用的语言主要是为了可读性和教导的目的而选择的,而不是为了解释或者限定本发明的主题而选择的。因此,在不偏离所附权利要求书的范围和精神的情况下,对于本技术领域的普通技术人员来说许多修改和变更都是显而易见的。对于本发明的范围,对本发明所做的公开是说明性的,而非限制性的,本发明的范围由所附权利要求书限定。
再多了解一些

本文用于创业者技术爱好者查询,仅供学习研究,如用于商业用途,请联系技术所有人。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献