一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

账号异常检测方法、装置及可读存储介质与流程

2022-12-09 22:30:32 来源:中国专利 TAG:


1.本技术涉及信息处理技术领域,具体涉及一种账号异常检测方法、装置及可读存储介质。


背景技术:

2.随着互联网的发展,快递业务逐渐由线下人工收费转到线上自动结账。即快递公司选择与个人或企业合作,为个人或企业绑定一个账号,通过该账号自动结算寄件费用。
3.而快递公司为了吸引客户开通账号,一般会为办理账号的个人或企业打折。也就是,办理了账号的个人或企业在邮寄快递时,通过该账号结算寄件费用时会有折扣。
4.但是,有一些个人或企业会非法使用自己的账号,即让一些没有办理账号的人或企业使用自己的账号寄送快递,或者,存在专门的盗号违法人员通过各种渠道获得账号,并非法使用账号权益,从而,对快递公司和正常用户造成了损失。
5.因此,如何有效检测出账号是否异常成为一个亟需解决的技术问题。


技术实现要素:

6.本技术提供一种账号异常检测方法、装置及可读存储介质,旨在有效检测出账号是否异常的技术问题。
7.一方面,本技术提供一种账号异常检测方法,所述方法包括:
8.获取待检测账号在预设时间段内的运单信息及所述待检测账号的账号信息,其中,所述运单信息至少包括托寄物信息、寄件地址信息,所述账号信息至少包括所述待检测账号对应的账号基本信息和采用所述待检测账号进行下单的下单信息;
9.基于所述运单信息和所述账号信息,确定异常寄件特征信息;
10.基于所述异常寄件特征信息,生成异常检测结果;
11.基于所述异常检测结果,检测所述待检测账号是否异常。
12.在本技术一种可能的实现方式中,所述基于所述运单信息和所述账号信息,确定异常寄件特征信息,包括:
13.对所述托寄物信息进行第一预处理,得到托寄物衍生特征;
14.对所述寄件地址信息进行第二预处理,得到寄件地址衍生特征;
15.对所述账号信息进行第三预处理,得到账号衍生特征;
16.基于所述托寄物衍生特征、寄件地址衍生特征以及账号衍生特征,确定异常寄件特征信息。
17.在本技术一种可能的实现方式中,所述对所述托寄物信息进行第一预处理,得到托寄物衍生特征,包括:
18.对所述托寄物信息进行分词处理,从所述托寄物信息中提取预设数量的关键词信息;
19.基于所述关键词信息,生成目标分类文本;
20.基于所述目标分类文本,生成托寄物衍生特征。
21.在本技术一种可能的实现方式中,所述对所述托寄物信息进行分词处理,从所述托寄物信息中提取预设数量的关键词信息,包括:
22.采用结巴分词对所述托寄物信息进行关键词提取,得到预设数量的关键词信息。
23.在本技术一种可能的实现方式中,所述基于所述关键词信息,生成目标分类文本,包括:
24.基于预设的标签集对所述关键词信息进行多级分类处理,得到初级分类文本;
25.将所述初级分类文本按照预设排序进行聚合,得到目标分类文本。
26.在本技术一种可能的实现方式中,所述对所述寄件地址信息进行第二预处理,得到寄件地址衍生特征,包括:
27.提取所述寄件地址信息中的三级地址信息,所述三级地址信息中的三级地址分别为省级、市级以及区级或县级;
28.对所述三级地址信息进行统计,得到所述三级地址信息的长尾分布信息;
29.基于所述长尾分布信息,生成寄件地址衍生特征。
30.在本技术一种可能的实现方式中,所述对所述账号信息进行第三预处理,得到账号衍生特征,包括:
31.获取所述账号基本信息和所述下单信息,所述账号基本信息包括账号标识信息,所述下单信息包括下单标识信息、下单量信息以及下单渠道信息;
32.基于所述账号标识信息和所述下单标识信息,生成第一账号特征;
33.基于所述下单渠道信息和所述下单量信息,生成第二账号特征;
34.基于所述下单标识信息和所述下单量信息,生成第三账号特征;
35.基于所述第一账号特征、所述第二账号特征以及所述第三账号特征,生成账号衍生特征。
36.另一方面,本技术提供一种账号异常检测装置,所述装置包括:
37.第一获取单元,用于获取待检测账号在预设时间段内的运单信息及所述待检测账号的账号信息,其中,所述运单信息至少包括托寄物信息、寄件地址信息,所述账号信息至少包括所述待检测账号对应的账号基本信息和采用所述待检测账号进行下单的下单信息;
38.第一确定单元,用于基于所述运单信息和所述账号信息,确定异常寄件特征信息;
39.第一生成单元,用于基于所述异常寄件特征信息,生成异常检测结果;
40.第一检测单元,用于基于所述异常检测结果,检测所述待检测账号是否异常。
41.在本技术一种可能的实现方式中,所述第一确定单元具体包括:
42.第一预处理单元,用于对所述托寄物信息进行第一预处理,得到托寄物衍生特征;
43.第二预处理单元,用于对所述寄件地址信息进行第二预处理,得到寄件地址衍生特征;
44.第三预处理单元,用于对所述账号信息进行第三预处理,得到账号衍生特征;
45.第二确定单元,用于基于所述托寄物衍生特征、寄件地址衍生特征以及账号衍生特征,确定异常寄件特征信息。
46.在本技术一种可能的实现方式中,所述第一预处理单元具体包括:
47.第一分词处理单元,用于对所述托寄物信息进行分词处理,从所述托寄物信息中
提取预设数量的关键词信息;
48.第二生成单元,用于基于所述关键词信息,生成目标分类文本;
49.第三生成单元,用于基于所述目标分类文本,生成托寄物衍生特征。
50.在本技术一种可能的实现方式中,所述第一分词处理单元具体用于:
51.采用结巴分词对所述托寄物信息进行关键词提取,得到预设数量的关键词信息。
52.在本技术一种可能的实现方式中,所述第二生成单元具体用于:
53.基于预设的标签集对所述关键词信息进行多级分类处理,得到初级分类文本;
54.将所述初级分类文本按照预设排序进行聚合,得到目标分类文本。
55.在本技术一种可能的实现方式中,所述第二生成单元具体用于:
56.提取所述寄件地址信息中的三级地址信息,所述三级地址信息中的三级地址分别为省级、市级以及区级或县级;
57.对所述三级地址信息进行统计,得到所述三级地址信息的长尾分布信息;
58.基于所述长尾分布信息,生成寄件地址衍生特征。
59.在本技术一种可能的实现方式中,所述第三生成单元具体用于:
60.获取所述账号信息对应的账号基本信息和下单信息,所述账号基本信息包括账号标识信息,所述下单信息包括下单标识信息、下单量信息以及下单渠道信息;
61.基于所述账号标识信息和所述下单标识信息,生成第一账号特征;
62.基于所述下单渠道信息和所述下单量信息,生成第二账号特征;
63.基于所述下单标识信息和所述下单量信息,生成第三账号特征;
64.基于所述第一账号特征、所述第二账号特征以及所述第三账号特征,生成账号衍生特征。
65.另一方面,本技术还提供一种计算机设备,所述计算机设备包括:
66.一个或多个处理器;
67.存储器;以及
68.一个或多个应用程序,其中所述一个或多个应用程序被存储于所述存储器中,并配置为由所述处理器执行以实现所述的账号异常检测方法。
69.另一方面,本技术还提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器进行加载,以执行所述的账号异常检测方法中的步骤。
70.本技术提供一种账号异常检测方法,该方法包括:获取待检测账号在预设时间段内的运单信息及待检测账号的账号信息,其中,运单信息至少包括托寄物信息、寄件地址信息,账号信息至少包括待检测账号对应的账号基本信息和采用待检测账号进行下单的下单信息;基于运单信息和账号信息,确定异常寄件特征信息;基于异常寄件特征信息,生成异常检测结果;基于异常检测结果,检测待检测账号是否异常。相较于现有技术,本技术通过对托寄物信息、寄件地址信息以及账号信息综合分析,得到异常寄件特征信息,并基于该异常寄件特征信息,生成异常检测结果,以此检测出待检测账号是否异常,提高了检测准确度,避免了不必要的经济损失。
附图说明
71.为了更清楚地说明本技术实施例中的技术方案,下面将对实施例描述中所需要使
用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本技术的一些实施例,对于本领域技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
72.图1是本技术实施例提供的账号异常检测系统的场景示意图;
73.图2是本技术实施例中提供的账号异常检测方法的一个实施例流程示意图;
74.图3是本技术实施例中提供的账号异常检测方法的另一个实施例流程示意图;
75.图4是本技术实施例中提供的账号异常检测方法的另一个实施例流程示意图;
76.图5是本技术实施例中提供的账号异常检测方法的另一个实施例流程示意图;
77.图6是本技术实施例中提供的账号异常检测方法的另一个实施例流程示意图;
78.图7是本技术实施例中提供的账号异常检测方法的另一个实施例流程示意图;
79.图8是本技术实施例中提供的账号异常检测装置的一个实施例结构示意图;
80.图9是本技术实施例中提供的计算机设备的一个实施例结构示意图。
具体实施方式
81.下面将结合本技术实施例中的附图,对本技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本技术一部分实施例,而不是全部的实施例。基于本技术中的实施例,本领域技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本技术保护的范围。
82.在本技术的描述中,需要理解的是,术语“中心”、“纵向”、“横向”、“长度”、“宽度”、“厚度”、“上”、“下”、“前”、“后”、“左”、“右”、“竖直”、“水平”、“顶”、“底”、“内”、“外”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本技术和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本技术的限制。此外,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括一个或者更多个所述特征。在本技术的描述中,“多个”的含义是两个或两个以上,除非另有明确具体的限定。
83.在本技术中,“示例性”一词用来表示“用作例子、例证或说明”。本技术中被描述为“示例性”的任何实施例不一定被解释为比其它实施例更优选或更具优势。为了使本领域任何技术人员能够实现和使用本技术,给出了以下描述。在以下描述中,为了解释的目的而列出了细节。应当明白的是,本领域普通技术人员可以认识到,在不使用这些特定细节的情况下也可以实现本技术。在其它实例中,不会对公知的结构和过程进行详细阐述,以避免不必要的细节使本技术的描述变得晦涩。因此,本技术并非旨在限于所示的实施例,而是与符合本技术所公开的原理和特征的最广范围相一致。
84.本技术实施例提供一种账号异常检测方法、装置及可读存储介质,该账号异常检测方法包括:获取待检测账号在预设时间段内的运单信息及待检测账号的账号信息,其中,运单信息至少包括托寄物信息、寄件地址信息,账号信息至少包括待检测账号对应的账号基本信息和采用待检测账号进行下单的下单信息;基于运单信息和账号信息,确定异常寄件特征信息;基于异常寄件特征信息,生成异常检测结果;基于异常检测结果,检测待检测账号是否异常。以下分别进行详细说明。
85.如图1所示,图1是本技术实施例提供的账号异常检测系统的场景示意图,该账号异常检测系统可以包括多个终端100和服务器200,终端100和服务器200网络连接,服务器200中集成有账号异常检测装置,如图1中的服务器,终端100可以访问服务器200。
86.本技术实施例中服务器200主要用于获取待检测账号在预设时间段内的运单信息及待检测账号的账号信息,其中,运单信息至少包括托寄物信息、寄件地址信息,账号信息至少包括待检测账号对应的账号基本信息和采用待检测账号进行下单的下单信息;基于运单信息和账号信息,确定异常寄件特征信息;基于异常寄件特征信息,生成异常检测结果;基于异常检测结果,检测待检测账号是否异常。
87.本技术实施例中,该服务器200可以是独立的服务器,也可以是服务器组成的服务器网络或服务器集群,例如本技术实施例中所描述的服务器200,其包括但不限于计算机、网络终端、单个网络服务器、多个网络服务器集或多个服务器构成的云服务器。其中,云服务器由基于云计算(cloud computing)的大量计算机或网络服务器构成。本技术的实施例中,服务器与终端之间可通过任何通信方式实现通信,包括但不限于,基于第三代合作伙伴计划(3rd generation partnership project,3gpp)、长期演进(long term evolution,lte)、全球互通微波访问(worldwide interoperability for microwave access,wimax)的移动通信,或基于tcp/ip协议族(tcp/ip protocol suite,tcp/ip)、用户数据报协议(user datagram protocol,udp)的计算机网络通信等。
88.可以理解的是,本技术实施例中所使用的终端100可以是既包括接收和发射硬件的设备,既具有能够在双向通信链路上,执行双向通信的接收和发射硬件的设备。这种终端可以包括:蜂窝或其他通信设备,其具有单线路显示器或多线路显示器或没有多线路显示器的蜂窝或其他通信设备。具体的终端100具体可以是台式终端或移动终端,终端100具体还可以是手机、平板电脑、笔记本电脑等中的一种。
89.本领域技术人员可以理解,图1中示出的应用环境,仅仅是与本技术方案的一种应用场景,并不构成对本技术方案应用场景的限定,其他的应用环境还可以包括比图1中所示更多或更少的终端,或者服务器网络连接关系,例如图1中仅示出1个服务器和2个终端。可以理解的,该账号异常检测系统还可以包括一个或多个其他服务器,或/且一个或多个与服务器网络连接的终端,具体此处不作限定。
90.另外,如图1所示,该账号异常检测系统还可以包括存储器300,用于存储数据,如存储用户账号数据和账号异常检测数据,例如账号异常检测系统运行时的账号异常检测数据。
91.需要说明的是,图1所示的账号异常检测系统的场景示意图仅仅是一个示例,本技术实施例描述的账号异常检测系统以及场景是为了更加清楚的说明本技术实施例的技术方案,并不构成对于本技术实施例提供的技术方案的限定,本领域普通技术人员可知,随着账号异常检测系统的演变和新业务场景的出现,本技术实施例提供的技术方案对于类似的技术问题,同样适用。
92.接下来,介绍本技术实施例提供的账号异常检测方法。
93.本申实施例账号异常检测方法的实施例中以账号异常检测装置作为执行主体,为了简化与便于描述,后续方法实施例中将省略该执行主体,该账号异常检测装置应用于计算机设备,该方法包括:获取待检测账号在预设时间段内的运单信息及待检测账号的账号
信息,其中,运单信息至少包括托寄物信息、寄件地址信息,账号信息至少包括待检测账号对应的账号基本信息和采用待检测账号进行下单的下单信息;基于运单信息和账号信息,确定异常寄件特征信息;基于异常寄件特征信息,生成异常检测结果;基于异常检测结果,检测待检测账号是否异常。
94.请参阅图2至图7,图2为本技术实施例中提供的账号异常检测方法的一个实施例流程示意图,该账号异常检测方法包括步骤201至步骤204:
95.201、获取待检测账号在预设时间段内的运单信息及待检测账号的账号信息。
96.其中,所述运单信息至少包括托寄物信息、寄件地址信息,所述账号信息至少包括所述待检测账号对应的账号基本信息和采用所述待检测账号进行下单的下单信息
97.在物流运输过程中,运单是指承运人与托运人之间关于货物运输事宜的“一次性”书面契约。是货物运输及运输代理的合同凭证,也是运输经营者接受货物并在运输期间负责保管和据以交付的凭据。其内列明托运货物的名称、包装、各项费用和金额、起运和到达港站、发货人与收货人、承运和达到日期及其他有关货物运输的事项。托运人托运货物时,必须按规定填写运单,有特殊运输要求的应在运单的备注栏中签注,经托运人或承运人签认后,运输合同即告成立,而运单信息即是至少可包括记录在运单中与货物运输相关的托寄物信息、寄件地址信息以及寄件信息。其中,托寄物信息主要包括托寄物的属性信息,该属性信息可以是托寄物的类别和特性,例如托寄物的类别为酒杯,其特性为易碎,例如托寄物的类别为电子产品,其特性是易损、防水。而寄件地址信息通常就是收货人的取货地址,如a省b市c区d小区。寄件信息可包括寄件标识信息。
98.账号信息,一般是针对与快递公司合作较为密切,且物流单数较大的目标客户设置的一套合作体系,该账号信息一般包括待检测账号对应的账号基本信息和下单信息。通常情况下,为了提高服务质量,针对上述目标客户可以采取固定周期进行结算,例如该固定周期可以是一个月、三个月或者是三个月以上,具体的,其固定周期时间长度可以根据目标客户的历史结算信用来进行设定,例如,在十二个月内,a客户结算不存在任何异常,而b客户在十二个月内存在两次迟缴记录,以及c客户在十二个月内存在两次欠缴记录,因此,基于上述三个客户在前十二个月的结算记录,可以将a客户的结算固定周期设置为一个月至三个月之间,b客户的结算固定周期设置为15天至一个月之间,而c客户的结算固定周期设置为0天。
99.账号基本信息包括账号标识信息,下单信息可包括下单标识信息、下单量信息以及下单渠道信息,其中,账号标识信息可以是注册该账号所使用的手机号码或者是手机号码与用户实名的信息,而下单标识信息则是在下单平台上获取的下单标识信息,其中,下单标识信息可以仅仅包括下单人的手机号码,或者同时包括下单人的手机号码和实名信息,而下单平台也可以是包括多个平台,一般情况下,下单平台可包括第三方下单平台(bsp)和微信(cx)下单平台。
100.具体的,可以在账号管理系统中获取待检测账号的账号信息,在物流管理系统中获取待检测账号在预设时间段内的运单信息。
101.202、基于运单信息和账号信息,确定异常寄件特征信息。
102.在长期使用过程中,可以统计下各个平台的账号异常量,例如,发现账号异常量全部或主要集中在cx下单平台中,那么,在后期可专门针对cx下单平台进行分析。
103.需要说明的是,异常寄件特征信息是与异常使用账号相关的寄件特征信息,该异常寄件特征信息可至少包括以下特征a至h中的一种或多种,或新增其他特征,特征a、在下单平台进行下单的账号标识信息(实际可对应下单人手机号码)是否与下单标识信息(实际可对应寄件人手机号码)相同,特征b、下单人近一个月寄件标识(电话)数量,特征c、寄件地址是否是目标客户地址的长尾部分,特征d、托寄物是否在目标客户第一预设排名的三级托寄物分类中,特征e、托寄物是否在目标客户第二预设排名的三级托寄物分类中,其中第二预设排名不等于第一预设排名,特征f、下单标识信息是否在目标客户top3下单标识信息中,特征g、寄件电话是否在目标客户top5寄件电话中,特征h、目标客户在cx下单平台的下单量与总下单量占比。其中,第一预设排名可以是第三排名,第二预设排名可以是第五排名。
104.203、基于异常寄件特征信息,生成异常检测结果。
105.其中,可以对异常寄件特征信息进行分析,得到分析后的结果,即为异常检测结果,而分析过程可以采用以下方式:
106.1、确定判定规则,统计待检测账号中的异常寄件特征信息中满足要求的特征数量比值,将满足要求的特征数量比值与预设比值相比较,得到异常检测结果。
107.2、采用机器学习,训练异常检测模型,并将异常寄件特征信息输入异常检测模型进行分析,生成异常检测结果。
108.例如,该异常检测模型可以是逻辑回归二分类模型,逻辑回归:例如根据步骤202中a至h的特征,对应的决策边界可以表示为:
109.w1*x1 w2*x2 w3*x3 w4*x4 w5*x5 w6*x6 w7*x7 w8*x8 b=0;其中w为特征对模型的贡献度或者是每个特征的权重,x为特征的预处理值(例如,当前运单托寄物在目标客户top3分类中就这个特征值就记为1否则0),b为常数,代表误差,具体的,b可通过梯度下降进行求解。
110.假设某个样本点:
111.h(x)=w*xt=w1*x1 w2*x2 w3*x3 w4*x4 w5*x5 w6*x6 w7*x7 w8*x8 b》0则判断该样本点判别类别1,其中类别1则代表该账号为正常,相反的,当h(x)不大于0,则判断该样本点判别类别2,其中类别2则代表该账号为异常。
112.进一步的,考虑到wxt b取值是连续的,因此它不能拟合离散变量。故需要借助对数几率函数,将h(x)的值映射到[0,1]二分类。
[0113]
对数几率函数如下:
[0114][0115]
于是有
[0116][0117]
具体的,将y视为x为正例的概率,则1-y为x为其反例的概率。其中,w
t
为w的转置,w的转置是换成向量的表示方法,两者的比值称为几率(odds),指该事件发生与不发生的概率比值,若事件发生的概率为p。则对数几率:
[0118][0119]
将y视为类后验概率估计,重写公式有:
[0120][0121][0122]
其中,本技术所采用的逻辑回归模型,有效提高了检测准确率。
[0123]
204、基于异常检测结果,检测待检测账号是否异常。
[0124]
本技术实施例提供一种账号异常检测方法,该方法包括:获取待检测账号在预设时间段内的运单信息及待检测账号的账号信息,其中,运单信息至少包括托寄物信息、寄件地址信息,账号信息至少包括待检测账号对应的账号基本信息和采用待检测账号进行下单的下单信息;基于运单信息和账号信息,确定异常寄件特征信息;基于异常寄件特征信息,生成异常检测结果;基于异常检测结果,检测待检测账号是否异常。相较于现有技术,本技术通过对托寄物信息、寄件地址信息以及账号信息综合分析,得到异常寄件特征信息,并基于该异常寄件特征信息,生成异常检测结果,以此检测出待检测账号是否异常,提高了检测准确度,避免了不必要的经济损失。
[0125]
本技术实施例中,所述基于所述运单信息和所述账号信息,确定异常寄件特征信息,具体包括步骤301至步骤304:
[0126]
301、对托寄物信息进行第一预处理,得到托寄物衍生特征。
[0127]
302、对寄件地址信息进行第二预处理,得到寄件地址衍生特征。
[0128]
303、对账号信息进行第三预处理,得到账号衍生特征。
[0129]
304、基于托寄物衍生特征、寄件地址衍生特征以及账号衍生特征,确定异常寄件特征信息。
[0130]
其中,可通过对托寄物衍生特征、寄件地址衍生特征以及账号衍生特征进行整合、分析以及权重分配,得到异常寄件特征信息,其中权重分配可根据特征的重要程度进行设定(一般权重分配范围为0.1至1之间),例如,通过分析,认定特征d、托寄物是否在目标客户top3三级托寄物分类中,为重要特征,其权重分配为0.8,而特征b、下单人近一个月寄件标识(电话)数量,为一般特征,其权重分为仅为0.2。
[0131]
本技术实施例中,所述对所述托寄物信息进行第一预处理,得到托寄物衍生特征,具体包括步骤401至403:
[0132]
401、对托寄物信息进行分词处理,从托寄物信息中提取预设数量的关键词信息。
[0133]
402、基于关键词信息,生成目标分类文本。
[0134]
403、基于目标分类文本,生成托寄物衍生特征。
[0135]
本技术实施例中,所述对所述托寄物信息进行分词处理,从所述托寄物信息中提取预设数量的关键词信息,包括:采用结巴分词对所述托寄物信息进行关键词提取,得到预设数量的关键词信息。即托寄物衍生特征对应上述特征d和特征e。
[0136]
通过分词处理(分词,关键词提取),具体的,可以采用tf-idf关键词提取。判断一个词在一篇文章中是否重要,一个容易想到的衡量指标就是词频,重要的词往往在文章中
出现的频率也非常高。其中,目标下单平台可以是cx平台。
[0137]
但另一方面,不是出现次数越多的词就一定重要,因为有些词在各种文章中都频繁出现,那它的重要性肯定不如那些只在某篇文章中频繁出现的词重要性强。从统计学的角度,就是给予那些不常见的词以较大的权重,而减少常见词的权重。idf(逆文档频率)就是这样一个权重,tf则指的是词频。tf和idf计算公式如下:
[0138]
具体的,词频(tf)=某个词在文本出现的次数/文章的总次数;
[0139]
逆文档频率(idf)=log(语料库文档总数/(包含该词的文档数 1));
[0140]
一个词idf值的计算是根据语料库得出的,如果一个词在语料库中越常见,那么分母就越大,idf就越小越接近0。分母之所以要加1,是为了避免分母为0(即所有文档都不包含该词)。最终得到tf-idf值:
[0141]
tf-idf=词频(tf)*逆文档频率(idf);
[0142]
可以看出tf-idf与一个词在文档中的出现次数成正比,与该词在整个语料库中出现次数成反比。一个词的tf-idf值非常高,说明这个词比较少见,但是它在这篇文章中多次出现,那么这个词就非常可能是需要的关键词。
[0143]
本技术实施例中,所述基于所述关键词信息,生成目标分类文本,具体包括步骤501和步骤502:
[0144]
501、基于预设的标签集对关键词信息进行多级分类处理,得到初级分类文本。
[0145]
其中,多级分类处理一般可以采用三级分类,即大类-中类-小类,例如例如,家具厨具-烹饪锅具-平底锅,又或者家具厨具-烹饪锅具-圆底锅。
[0146]
502、将初级分类文本按照预设排序进行聚合,得到目标分类文本。
[0147]
本技术实施例中,所述对所述寄件地址信息进行第二预处理,得到寄件地址衍生特征,具体包括步骤601至步骤603:
[0148]
601、提取寄件地址信息中的三级地址信息;
[0149]
其中,三级地址信息中的三级地址分别为省级、市级以及区级或县级。
[0150]
602、对三级地址信息进行统计,得到三级地址信息的长尾分布信息。
[0151]
603、基于长尾分布信息,生成寄件地址衍生特征。
[0152]
其中,寄件地址信息一般包括多层级的地址信息,具体的,该多层级一般设定为三级,即省级、市级以及区级或县级,寄件地址具体到省市区县详细小区,可以采用cpca库提取地址中的省,市,区县。
[0153]
三级地址信息的长尾分布信息是三级地址信息的长尾分布曲线图,即统计目标客户寄件地址的长尾分布曲线图,具体的,长尾分布曲线图满足长尾效应,长尾效应的英文名称long tail effect。其中的“头”(head)和“尾”(tail)是两个统计学名词。正态曲线中间的突起部分叫“头”;两边相对平缓的部分叫“尾”。
[0154]
从目标客户寄件地址的长尾分布曲线图可知,大多数的运单会集中在头部,而分布在尾部的运单是个性化的,零散的小量的需求。而这部分差异化的、少量的需求会在需求曲线上面形成一条长长的“尾巴”。具体的,寄件地址衍生特征即对应上述特征c、寄件地址是否是目标客户地址的长尾部分。
[0155]
本技术实施例中,所述对所述账号信息进行第三预处理,得到账号衍生特征,具体包括步骤701至705:
[0156]
701、获取账号信息对应的账号基本信息和下单信息,所述账号基本信息包括账号标识信息,所述下单信息包括下单标识信息、下单量信息以及下单渠道信息。
[0157]
702、基于账号标识信息和所述下单标识信息,生成第一账号特征。
[0158]
703、基于下单渠道信息和所述下单量信息,生成第二账号特征。
[0159]
704、基于下单标识信息和所述下单量信息,生成第三账号特征。
[0160]
705、基于第一账号特征、所述第二账号特征以及所述第三账号特征,生成账号衍生特征。
[0161]
其中,第一账号特征对应上述特征a、特征f以及特征g;第二账号特征对应上述特征h;第三账号特征对应上述特征b。
[0162]
具体的,基于账号标识信息和下单标识信息,生成第一账号特征,具体可以包括:统计下单标识信息,其中,下单标识信息可以是下单人填写的寄件人的联系方式,而账号标识信息是下单人在登录下单平台时,提供的实名信息,其中该实名信息可以包括下单人姓名和下单人手机号码,通过比对下单人手机号码和寄件人的联系方式是否相同,即可得到特征a,进一步的,将统计下单标识信息的统计结果进行排名,然后确定下单标识信息是否在目标客户top3和top5中,即可得到特征g和特征f。
[0163]
为了更好实施本技术实施例中账号异常检测方法,在账号异常检测方法基础之上,本技术实施例中还提供一种账号异常检测装置,如图8所示,所述账号异常检测装置800包括:
[0164]
第一获取单元801,用于获取待检测账号在预设时间段内的运单信息及所述待检测账号的账号信息,其中,所述运单信息至少包括托寄物信息、寄件地址信息,所述账号信息至少包括所述待检测账号对应的账号基本信息和采用所述待检测账号进行下单的下单信息。
[0165]
第一确定单元802,用于基于所述运单信息和所述账号信息,确定异常寄件特征信息。
[0166]
第一生成单元803,用于基于所述异常寄件特征信息,生成异常检测结果。
[0167]
第一检测单元804,用于基于所述异常检测结果,检测所述待检测账号是否异常。
[0168]
本技术实施例中,所述第一确定单元802具体包括:
[0169]
第一预处理单元,用于对所述托寄物信息进行第一预处理,得到托寄物衍生特征。
[0170]
第二预处理单元,用于对所述寄件地址信息进行第二预处理,得到寄件地址衍生特征。
[0171]
第三预处理单元,用于对所述账号信息进行第三预处理,得到账号衍生特征。
[0172]
第二确定单元,用于基于所述托寄物衍生特征、寄件地址衍生特征以及账号衍生特征,确定异常寄件特征信息。
[0173]
本技术实施例中,所述第一预处理单元具体包括:
[0174]
第一分词处理单元,用于对所述托寄物信息进行分词处理,从所述托寄物信息中提取预设数量的关键词信息。
[0175]
第二生成单元,用于基于所述关键词信息,生成目标分类文本。
[0176]
第三生成单元,用于基于所述目标分类文本,生成托寄物衍生特征。
[0177]
本技术实施例中,所述第一分词处理单元具体用于:
[0178]
采用结巴分词对所述托寄物信息进行关键词提取,得到预设数量的关键词信息。
[0179]
本技术实施例中,所述第三生成单元具体用于:
[0180]
基于预设的标签集对所述关键词信息进行多级分类处理,得到初级分类文本。
[0181]
将所述初级分类文本按照预设排序进行聚合,得到目标分类文本。
[0182]
本技术实施例中,所述第二生成单元具体用于:
[0183]
提取所述寄件地址信息中的三级地址信息,所述三级地址信息中的三级地址分别为省级、市级以及区级或县级。
[0184]
对所述三级地址信息进行统计,得到所述三级地址信息的长尾分布信息。
[0185]
基于所述长尾分布信息,生成寄件地址衍生特征。
[0186]
本技术实施例中,所述第三生成单元具体用于:
[0187]
获取所述账号信息对应的账号基本信息和下单信息,所述账号基本信息包括账号标识信息,所述下单信息包括下单标识信息、下单量信息以及下单渠道信息。
[0188]
基于所述账号标识信息和所述下单标识信息,生成第一账号特征。
[0189]
基于所述下单渠道信息和所述下单量信息,生成第二账号特征。
[0190]
基于所述下单标识信息和所述下单量信息,生成第三账号特征。
[0191]
基于所述第一账号特征、所述第二账号特征以及所述第三账号特征,生成账号衍生特征。
[0192]
本技术提供一种账号异常检测装置,该装置包括:第一获取单元801,用于获取待检测账号在预设时间段内的运单信息及待检测账号的账号信息,其中,运单信息至少包括托寄物信息、寄件地址信息,账号信息至少包括待检测账号对应的账号基本信息和采用待检测账号进行下单的下单信息;第一确定单元802,用于基于运单信息和账号信息,确定异常寄件特征信息;第一生成单元,用于基于异常寄件特征信息,生成异常检测结果;第一检测单元,用于基于异常检测结果,检测待检测账号是否异常。相较于现有技术,本技术通过账号异常检测装置对托寄物信息、寄件地址信息以及账号信息综合分析,得到异常寄件特征信息,并基于该异常寄件特征信息,生成异常检测结果,以此检测出待检测账号是否异常,提高了检测准确度,避免了不必要的经济损失。
[0193]
除了上述介绍用于账号异常检测方法与装置之外,本技术实施例还提供一种计算机设备,其集成了本技术实施例所提供的任一种账号异常检测装置,所述计算机设备包括:
[0194]
一个或多个处理器;
[0195]
存储器;以及
[0196]
一个或多个应用程序,其中所述一个或多个应用程序被存储于所述存储器中,并配置为由所述处理器执行上述账号异常检测方法实施例中任一实施例中所述的任一方法的操作。
[0197]
本技术实施例还提供一种计算机设备,其集成了本技术实施例所提供的任一种账号异常检测装置。参阅图9,图9是本技术实施例提供的计算机设备一个实施例结构示意图。
[0198]
如图9所示,其示出了本技术实施例所设计的账号异常检测装置的结构示意图,具体来讲:
[0199]
该账号异常检测装置可以包括一个或者一个以上处理核心的处理器901、一个或一个以上计算机可读存储介质的存储器902、电源903和输出单元904等部件。本领域技术人
员可以理解,图9中示出的账号异常检测装置结构并不构成对账号异常检测装置的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。其中:
[0200]
处理器901是该账号异常检测装置的控制中心,利用各种接口和线路连接整个账号异常检测装置的各个部分,通过运行或执行存储在存储器902内的软件程序和/或模块,以及调用存储在存储器902的数据,执行账号异常检测装置的各种功能和处理数据,从而对账号异常检测装置进行整体监控。可选的,处理器901可包括一个或多个处理核心;优选的,处理器901可集成应用处理器和调制解调处理器,其中,应用处理器主要处理操作系统、用户界面和应用程序等,调制解调处理器主要处理无线通信。可以理解的是,上述调制解调处理器也可以不集成到处理器901中。
[0201]
存储器902可用于存储软件程序以及模块,处理器901通过运行存储在存储器902的软件程序以及模块,从而执行各种功能应用以及数据处理。存储器902可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等;存储数据区可存储根据账号异常检测装置的使用所创建的数据等。此外,存储器902可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。相应地,存储器902还可以包括存储器控制器,以提供处理器901对存储器902的访问。
[0202]
账号异常检测装置还包括给各个部件供电的电源903,优选的,电源903可以通过电源管理系统与处理器901逻辑相连,从而通过电源管理系统实现管理充电、放电、以及功耗管理等功能。电源903还可以包括一个或一个以上的直流或交流电源、再充电系统、电源故障检测电路、电源转换器或者逆变器、电源状态指示器等任意组件。
[0203]
该账号异常检测装置还可包括输入单元904,该输入单元904可用于接收输入的数字或字符信息,以及产生与用户设置以及功能控制有关的键盘、鼠标、操作杆、光学或者轨迹球信号输入。
[0204]
尽管未示出,账号异常检测装置还可以包括显示单元等,在此不再赘述。具体在本技术实施例中,账号异常检测装置中的处理器901会按照如下的指令,将一个或一个以上的应用程序的进程对应的可执行文件加载到存储器902中,并由处理器901来运行存储在存储器902中的应用程序,从而实现各种功能,如下:
[0205]
获取待检测账号在预设时间段内的运单信息及待检测账号的账号信息,其中,运单信息至少包括托寄物信息、寄件地址信息,账号信息至少包括待检测账号对应的账号基本信息和采用待检测账号进行下单的下单信息;基于运单信息和账号信息,确定异常寄件特征信息;基于异常寄件特征信息,生成异常检测结果;基于异常检测结果,检测待检测账号是否异常。相较于现有技术,本技术通过对托寄物信息、寄件地址信息以及账号信息综合分析,得到异常寄件特征信息,并基于该异常寄件特征信息,生成异常检测结果,以此检测出待检测账号是否异常,提高了检测准确度,避免了不必要的经济损失。
[0206]
为此,本技术实施例提供一种计算机可读存储介质,该计算机可读存储介质可以包括:只读存储器(rom,read only memory)、随机存取记忆体(ram,random access memory)、磁盘或光盘等。该计算机可读存储介质中存储有多条指令,该指令能够被处理器进行加载,以执行本技术实施例所提供的任一种账号异常检测方法中的步骤。例如,该指令可以执行如下步骤:
[0207]
获取待检测账号在预设时间段内的运单信息及待检测账号的账号信息,其中,运单信息至少包括托寄物信息、寄件地址信息,账号信息至少包括待检测账号对应的账号基本信息和采用待检测账号进行下单的下单信息;基于运单信息和账号信息,确定异常寄件特征信息;基于异常寄件特征信息,生成异常检测结果;基于异常检测结果,检测待检测账号是否异常。
[0208]
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
[0209]
以上对本技术实施例所提供的一种账号异常检测方法、装置及可读存储介质进行了详细介绍,本文中应用了具体个例对本技术的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本技术的方法及其核心思想;同时,对于本领域的技术人员,依据本技术的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本技术的限制。
再多了解一些

本文用于创业者技术爱好者查询,仅供学习研究,如用于商业用途,请联系技术所有人。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献