一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种支付预测方法及电子设备与流程

2022-10-26 18:17:40 来源:中国专利 TAG:


1.本技术涉及人工智能技术领域,尤其涉及一种支付预测方法及电子设备。


背景技术:

2.在日常购物时,大部分群众习惯采用电子支付方式。考虑到电子支付的操作(包括打开支付应用、打开付款码或者打开扫码界面等)比较繁琐,很多厂商试图预测用户的支付意图,以便为用户提供方便、快捷的支付流程。
3.现有的预测方法主要是通过累积用户的支付数据,然后利用该支付数据来训练预测模型。该支付数据可以是特定用户的,也可以是多个用户的。若利用特定用户的支付数据训练模型,则得到的模型可以满足该用户的个性化需求,达到精准预测的效果,但问题在于单个用户的支付数据较为稀疏,收集足够多的支付数据需要大量时间,且在收集支付数据期间则无法进行预测,影响用户使用相应业务的体验。若利用多个用户的支付数据训练模型,则可以快速收集到大量支付数据,但缺点在于得到的模型难以满足用户的个性化需求,无法精准预测每个用户的支付意图。
4.可见,现有技术存在精准预测个体用户的支付意图需要等待较久的数据累积时间的问题。


技术实现要素:

5.本技术实施例提供一种支付预测方法及电子设备,可以在快速累积数据的同时,还能精准识别个体用户的支付意图。
6.为达到上述目的,本技术的实施例采用如下技术方案:第一方面,提供了一种支付预测方法,应用于电子设备,方法包括:当检测信息触发异常检测条件时,获取待测样本,待测样本包括在检测信息触发异常检测条件前预设时间段内的用户行为数据;获取正常样本集,正常样本集包括多个正常样本,正常样本包括在检测到非支付事件前预设时间段内的用户行为数据;基于正常样本集确定待测样本的标签,标签包括支付事件和非支付事件;若待测样本的标签为支付事件,推送支付服务卡片。
7.可见,本技术将支付事件视为异常样本,将非支付事件视为正常样本,并利用无监督异常检测的方式判断待测样本为正常样本或异常样本,这样能够缩短数据累积时间,快速收集不同用户的正常样本,实现对不同用户的个性化预测。
8.在第一方面提供的一种实现方式中,基于正常样本集确定待测样本的标签包括:将待测样本及多个正常样本输入多个不同的异常检测模型,得到每个样本的多个第一异常得分,异常检测模型为基于用户在至少一个终端设备中的历史事件样本和对应的标签所训练得到的,多个第一异常得分用于表征两个样本在不同维度的差异程度;对每个样本的多个第一异常得分进行归一化处理;针对每个样本,按照多个异常检测模型的权重,对进行归一化处理后的多个第一异常得分进行加权融合得到第二异常得分;按照从大到小的顺序对每个样本的第二异常得分进行排序,得到第二异常得分最大的p个样本;若p个样本包括待
测样本,确定待测样本的标签为支付事件。
9.通过给不同的异常检测模型设置不同的权重,例如若某个异常检测模型的准确度较高则其对应的权重较高,若某个异常检测模型的准确度较低则其对应的权重较低,这样可使最终得到的第二异常得分能够更加准确地反映两个样本之间的差异程度。同时,在进行融合前对第一异常得分进行归一化处理,可以减小由于不同第一异常得分之间量纲不统一导致的误差。
10.在第一方面提供的一种实现方式中,基于正常样本集确定待测样本的标签包括:对待测样本及多个正常样本进行聚类,得到多个样本簇,每个样本簇包括多个样本以及簇中心,多个样本包括待测样本和/或正常样本;计算每个样本到对应的簇中心的特征向量距离;按照从大到小的特征向量距离排列顺序,得到特征向量距离最大的n个样本;若n个样本中包括待测样本,确定待测样本的标签为支付事件。
11.在第一方面提供的一种实现方式中,每个样本和对应的簇中心之间存在m组特征向量,每组特征向量包括样本的第一特征向量以及簇中心的第二特征向量,计算每个样本到对应的簇中心的特征向量距离包括:计算m组特征向量中每组特征向量包括的第一特征向量和第二特征向量之间的特征向量距离,得到m个第一特征向量距离;对m个第一特征向量距离进行归一化处理;按照m组特征向量的权重,对进行归一化处理后的m个第一特征向量距离进行加权融合得到特征向量距离。
12.可见,本技术根据实际业务对聚类算法进行改进,即可以给不同的特征设置不同的权重,这样得到的特征向量距离能够更加准确地反映两个样本之间的相似程度。
13.在第一方面提供的一种实现方式中,基于正常样本集确定待测样本的标签包括:将待测样本及多个正常样本输入多个不同的异常检测模型,得到多个异常检测结果,异常检测模型为基于用户在至少一个终端设备中的历史事件样本和对应的标签所训练得到的;若标签为支付事件的异常检测结果的数量大于标签为非支付事件的异常检测结果的数量,确定待测样本的标签为支付事件。
14.在第一方面提供的一种实现方式中,基于正常样本集确定待测样本的标签包括:将待测样本及多个正常样本输入异常检测模型,得到待测样本的标签。
15.在第一方面提供的一种实现方式中,异常检测模型包括基于孤立森林算法的异常检测模型、基于局部异常因子算法的异常检测模型或基于聚类算法的异常检测模型。
16.在第一方面提供的一种实现方式中,检测信息包括当前时间,当检测信息触发异常检测条件时,获取待测样本包括:若当前时刻与预设的历史支付时间匹配,获取待测样本,其中,历史支付时间为历史上支付事件发生的时间或时间段。这样一来,手机可根据用户的支付习惯(例如,习惯支付的时间)来获取待测样本,达到初步预测用户是否存在支付需求的效果。
17.在第一方面提供的一种实现方式中,检测信息包括用户位置信息,当检测信息触发异常检测条件时,获取待测样本包括:若用户位置信息在预设的地理围栏内,获取待测样本,地理围栏的位置中心为历史上支付事件发生时用户所在的位置。
18.在第一方面提供的一种实现方式中,方法还包括:当检测到非支付事件时,获取新增正常样本;其中,新增正常样本包括在检测到非支付事件前预设时间段内的用户行为数据,非支付事件包括显示桌面、开启非支付应用、播放视频/音乐、显示照片的事件。
19.在第一方面提供的一种实现方式中,方法还包括:按照预设周期,基于新增正常样本更新正常样本集。这样可使正常样本集中所包括的正常样本与用户的实际行为贴合,从而使异常检测模型更具个性化。
20.在第一方面提供的一种实现方式中,用户行为数据包括用于反映用户是否行走、跑步或搭乘交通工具、是否搭乘电梯的数据、是否连接或断开wifi、连接或断开wifi的时间、行走、跑步或搭乘交通工具的起始时间和结束时间、乘电梯的起始时间和结束时间。
21.在第一方面提供的一种实现方式中,样本还包括位置数据和环境数据。
22.第二方面,本技术提供了一种电子设备,包括处理器,处理器和存储器耦合,存储器存储有程序指令,当存储器存储的程序指令被处理器执行时使得电子设备实现第一方面中任一实现方式的方法。
23.第三方面,本技术提供了一种计算机可读存储介质,包括计算机指令;当计算机指令在电子设备上运行时,使得电子设备执行如第一方面中任一实现方式的方法。
24.第四方面,提供了一种包含指令的计算机程序产品,当其在计算机上运行时,使得计算机可以执行上述第一方面中任一项所述的服务质量监测方法。
25.第五方面,提供了一种装置(例如,该装置可以是芯片系统),该装置包括处理器,用于支持第一设备实现上述第一方面中所涉及的功能。在一种可能的设计中,该装置还包括存储器,该存储器,用于保存电子设备必要的程序指令和数据。该装置是芯片系统时,可以由芯片构成,也可以包含芯片和其他分立器件。
26.其中,第二方面至第五方面中任一种设计方式所带来的技术效果可参见第一方面中不同设计方式所带来的技术效果,此处不再赘述。
附图说明
27.图1为本技术实施例提供的一种电子设备200的结构示意图;图2为本技术实施例提供的一种支付预测方法的流程图;图3为本技术实施例提供的一种手机确定待测样本的标签的流程图;图4为本技术实施例提供的另一种手机确定待测样本的标签的流程图;图5为本技术实施例提供的一种芯片系统的结构示意图。
具体实施方式
28.以下,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括一个或者更多个该特征。在本实施例的描述中,除非另有说明,“多个”的含义是两个或两个以上。
29.本技术主要涉及一种支付预测方法,将较多的非支付事件作为正常事件,将较少的支付事件作为异常(非正常)事件,并通过比对待测样本与多个非支付事件样本以确定待测样本为正常事件或异常事件,以及在确定待测样本为异常事件时预测用户存在支付需求。由于非支付事件相对于支付事件更加频繁、数量更多,可减少电子设备累积足够多正常样本所需的时间,达到快速实现支付预测功能的效果。
30.在本技术实施例中,支付事件是指用户主动显示付款码进行支付或者主动扫描商
家的收款码进行支付的事件。非支付事件可指用户进行的除支付事件以为的其他操作事件。例如,非支付事件可指手机返回桌面(也可以称为主界面、home界面等)的事件,手机响应于用户的操作而开启非支付应用的事件等,在此不做具体限制。
31.图1为本技术实施例提供的一种电子设备200的结构示意图。
32.如图1所示,电子设备200可以包括:处理器210,外部存储器接口220,内部存储器221,通用串行总线(universal serial bus,usb)接口230,充电管理模块240,电源管理模块241,电池242,天线1,天线2,移动通信模块250,无线通信模块260,音频模块270,扬声器270a,受话器270b,麦克风270c,耳机接口270d,传感器模块280,按键290,马达291,指示器292,摄像头293,显示屏294,以及用户标识模块(subscriber identification module,sim)卡接口295等。
33.其中,上述传感器模块280可以包括压力传感器,陀螺仪传感器,气压传感器,磁传感器,加速度传感器,距离传感器,接近光传感器,指纹传感器,温度传感器,触摸传感器,环境光传感器和骨传导传感器等传感器。
34.处理器210可以包括一个或多个处理单元,例如:处理器210可以包括应用处理器(application processor,ap),调制解调处理器,图形处理器(graphics processing unit,gpu),图像信号处理器(image signal processor,isp),控制器,存储器,视频编解码器,数字信号处理器(digital signal processor,dsp),基带处理器,和/或神经网络处理器(neural-network processing unit,npu)等。其中,不同的处理单元可以是独立的器件,也可以集成在一个或多个处理器中。
35.控制器可以是电子设备200的神经中枢和指挥中心。控制器可以根据指令操作码和时序信号,产生操作控制信号,完成取指令和执行指令的控制。
36.处理器210中还可以设置存储器,用于存储指令和数据。在一些实施例中,处理器210中的存储器为高速缓冲存储器。该存储器可以保存处理器210刚用过或循环使用的指令或数据。如果处理器210需要再次使用该指令或数据,可从所述存储器中直接调用。避免了重复存取,减少了处理器210的等待时间,因而提高了系统的效率。
37.在一些实施例中,处理器210可以包括一个或多个接口。接口可以包括集成电路(inter-integrated circuit,i2c)接口,集成电路内置音频(inter-integrated circuit sound,i2s)接口,脉冲编码调制(pulse code modulation,pcm)接口,通用异步收发传输器(universal asynchronous receiver/transmitter,uart)接口,移动产业处理器接口(mobile industry processor interface,mipi),通用输入输出(general-purpose input/output,gpio)接口,用户标识模块(subscriber identity module,sim)接口,和/或通用串行总线(universal serial bus,usb)接口等。
38.可以理解的是,本实施例示意的各模块间的接口连接关系,只是示意性说明,并不构成对电子设备200的结构限定。在另一些实施例中,电子设备200也可以采用上述实施例中不同的接口连接方式,或多种接口连接方式的组合。
39.充电管理模块240用于从充电器接收充电输入。其中,充电器可以是无线充电器,也可以是有线充电器。充电管理模块240为电池242充电的同时,还可以通过电源管理模块241为终端设备供电。
40.电源管理模块241用于连接电池242,充电管理模块240与处理器210。电源管理模
块241接收电池242和/或充电管理模块240的输入,为处理器210,内部存储器221,外部存储器,显示屏294,摄像头293,和无线通信模块260等供电。在一些实施例中,电源管理模块241和充电管理模块240也可以设置于同一个器件中。
41.电子设备200的无线通信功能可以通过天线1,天线2,移动通信模块250,无线通信模块260,调制解调处理器以及基带处理器等实现。在一些实施例中,电子设备200的天线1和移动通信模块250耦合,天线2和无线通信模块260耦合,使得电子设备200可以通过无线通信技术与网络以及其他设备通信。
42.天线1和天线2用于发射和接收电磁波信号。电子设备200中的每个天线可用于覆盖单个或多个通信频带。不同的天线还可以复用,以提高天线的利用率。例如:可以将天线1复用为无线局域网的分集天线。在另外一些实施例中,天线可以和调谐开关结合使用。
43.移动通信模块250可以提供应用在电子设备200上的包括2g/3g/4g/5g等无线通信的解决方案。移动通信模块250可以包括至少一个滤波器,开关,功率放大器,低噪声放大器(low noise amplifier,lna)等。移动通信模块250可以由天线1接收电磁波,并对接收的电磁波进行滤波,放大等处理,传送至调制解调处理器进行解调。
44.移动通信模块250还可以对经调制解调处理器调制后的信号放大,经天线1转为电磁波辐射出去。在一些实施例中,移动通信模块250的至少部分功能模块可以被设置于处理器210中。在一些实施例中,移动通信模块250的至少部分功能模块可以与处理器210的至少部分模块被设置在同一个器件中。
45.无线通信模块260可以提供应用在电子设备200上的包括wlan(如(wireless fidelity,wi-fi)网络),蓝牙(bluetooth,bt),全球导航卫星系统(global navigation satellite system,gnss),调频(frequency modulation,fm),近距离无线通信技术(near field communication,nfc),红外技术(infrared,ir)等无线通信的解决方案。
46.无线通信模块260可以是集成至少一个通信处理模块的一个或多个器件。无线通信模块260经由天线2接收电磁波,将电磁波信号调频以及滤波处理,将处理后的信号发送到处理器210。无线通信模块260还可以从处理器210接收待发送的信号,对其进行调频,放大,经天线2转为电磁波辐射出去。
47.电子设备200通过gpu,显示屏294,以及应用处理器等实现显示功能。gpu为图像处理的微处理器,连接显示屏294和应用处理器。gpu用于执行数学和几何计算,用于图形渲染。处理器210可包括一个或多个gpu,其执行程序指令以生成或改变显示信息。
48.显示屏294用于显示图像,视频等。该显示屏294包括显示面板。
49.电子设备200可以通过isp,摄像头293,视频编解码器,gpu,显示屏294以及应用处理器等实现拍摄功能。isp用于处理摄像头293反馈的数据。摄像头293用于捕获静态图像或视频。在一些实施例中,电子设备200可以包括1个或n个摄像头293,n为大于1的正整数。
50.外部存储器接口220可以用于连接外部存储卡,例如micro sd卡,实现扩展电子设备200的存储能力。外部存储卡通过外部存储器接口220与处理器210通信,实现数据存储功能。例如将音乐,视频等文件保存在外部存储卡中。
51.内部存储器221可以用于存储计算机可执行程序代码,所述可执行程序代码包括指令。处理器210通过运行存储在内部存储器221的指令,从而执行电子设备200的各种功能应用以及数据处理。例如,在本技术实施例中,处理器210可以通过执行存储在内部存储器
221中的指令,内部存储器221可以包括存储程序区和存储数据区。
52.其中,存储程序区可存储操作系统,至少一个功能所需的应用程序(比如支付预测功能等)等。存储数据区可存储电子设备200使用过程中所创建或采集的数据(比如用户行为数据、位置数据、天气数据等)等。此外,内部存储器221可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件,闪存器件,通用闪存存储器(universal flash storage,ufs)等。
53.电子设备200可以通过音频模块270,扬声器270a,受话器270b,麦克风270c,耳机接口270d,以及应用处理器等实现音频功能。例如音乐播放,录音等。
54.按键290包括开机键,音量键等。按键290可以是机械按键。也可以是触摸式按键。马达291可以产生振动提示。马达291可以用于来电振动提示,也可以用于触摸振动反馈。指示器292可以是指示灯,可以用于指示充电状态,电量变化,也可以用于指示消息,未接来电,通知等。sim卡接口295用于连接sim卡。sim卡可以通过插入sim卡接口295,或从sim卡接口295拔出,实现和电子设备200的接触和分离。电子设备200可以支持1个或n个sim卡接口,n为大于1的正整数。sim卡接口295可以支持nano sim卡,micro sim卡,sim卡等。
55.本技术实施例提供的电子设备200可以是手机、平板电脑、带无线收发功能的电脑、个人通信业务(personal communication service,pcs)电话、台式计算机、虚拟现实(virtual reality,vr)终端设备、增强现实(augmented reality,ar)终端设备、工业控制(industrial control)中的无线终端、无人驾驶(self driving)中的无线终端、智能电网(smart grid)中的无线终端、运输安全(transportation safety)中的无线终端、智慧城市(smart city)中的无线终端、智慧家庭(smart home)中的无线终端等,在此不做具体限制。
56.以下实施例中的方法均可以在具有上述硬件结构的电子设备200中实现。
57.为了便于理解,以下结合附图对本技术实施例提供的方法进行具体介绍。
58.如图2所示,本技术实施例提供了一种支付预测方法,可以由电子设备200(例如手机)执行。该支付预测方法的流程包括步骤s210~s240。
59.s210,当检测信息触发异常检测条件时,手机获取待测样本。
60.在本技术实施例中,一个样本包括可区分支付事件和非支付事件的数据。示例性的,用户进行支付事件前通常存在一系列关联行为,例如职员a中午吃饭前,需要先步行至电梯口,搭乘电梯到1楼后,再步行去餐饮店,然后进行支付操作购买午餐,其中行走、搭乘电梯即为该支付事件(即职员a进行支付)的关联行为。即用户在行走一段时间后,再搭乘电梯,接着继续行走的行为时,大概率会发起支付事件。如此,样本可包括在用户进行支付事件或非支付事件前预设时间段内的用户行为数据。其中,用户行为数据包括用于反映用户行为的数据,例如反映用户是否行走、跑步或搭乘交通工具的数据、用户行走、跑步或搭乘交通工具的起始时间和结束时间、反映手机连接或断开wifi的数据、手机连接或断开wifi的时间、反映用户是否搭乘电梯的数据、用户搭乘电梯的起始时间和结束时间等。
61.可选的,考虑到天气和用户所在的位置也可能成为影响用户发起支付操作的因素,例如在大雪天或者大雨天用户大概率不会外出吃饭或购物,进而存在支付事件的概率较小;又或者,在家或在办公场所时大概率不存在购物的环境,进而存在支付事件的概率较小。因此,一个样本还可包括在用户进行支付事件或非支付事件前预设时间段内的位置数据和/或天气数据。该位置数据包括用户的位置信息,例如经纬度、所在省市、区县、街道等
信息。天气数据用于反映天气情况,例如阴、晴、雪、雨等。可见,一个样本可仅包括用户行为数据,或者包括用户行为数据和位置数据,或者包括用户行为数据和天气数据,或者包括用户行为数据、位置数据和天气数据。需要说明的是,样本还可包括其他可区分支付事件和非支付事件的数据,在此不做具体限制。
62.其中,进行支付事件/非支付事件前预设时间段可指以用户进行支付事件/非支付事件的时刻为起始点,经过预设时间后的时刻为终止点所形成的时间段。例如,该预设时间可以为半小时,手机在12:00检测到非支付事件,则该预设时间段为12:00~12:30,该非支付事件对应的样本包括用户在12:00~12:30期间的用户行为数据、位置数据和/或天气数据。
63.待测样本包括在检测信息触发异常检测条件前预设时间段内的用户行为数据、位置数据和/或天气数据。其中,当手机检测信息触发异常检测条件时,可初步判断用户可能存在支付需求,因此手机进一步获取检测信息触发异常检测条件前预设时间段内的用户行为数据、位置数据和/或天气数据以构成待测样本,通过更丰富的信息进一步精准地预测用户是否会发起支付操作。
64.检测信息可包括与支付事件相关联的信息。可选的,检测信息包括用户位置信息,用于反映用户当前所在的位置。手机可实时或按照一定的时间间隔获取该用户位置信息。对应的,该异常检测条件可指用户位置信息在预设的地理围栏内。预设地理围栏为手机以预设的中心位置向外延伸构建得到的。该中心位置可以为历史支付事件发生时用户所在的位置。具体的,手机可以分析历史上的支付事件发生时用户所在的位置信息,并将出现频率较高的位置信息作为该中心位置。例如,手机通过分析历史支付事件的数据可确定,用户大多在a位置进行支付操作,则手机可以该a位置向外延伸构建得到地理围栏a。当手机检测到用户位置信息在该地理围栏a内时,初步判断可能会存在支付事件,并进一步获取在检测到用户位置信息在该地理围栏a内的前预设时间(例如,20分钟)内的用户行为数据、位置数据和/或天气数据,以构成待测样本。
65.可选的,检测信息包括当前时间。对应的,该异常检测条件可指当前时间与历史支付时间匹配。该历史支付时间为历史上支付事件发生的时间或时间段,当前时间与历史支付事件匹配可以理解为当前时间与历史支付时间相同或当前时间在历史支付时间所指示的时间段内。具体的,手机可以分析历史上支付事件的发生时间,并将出现频率较高的时间或时间段作为该历史支付时间。示例性的,手机通过分析历史上支付事件的发生时间确定,用户a通常在中午12:00~13:00之间进行支付操作,则该历史支付时间为12:00~13:00。从而,在当前时间在12:00时,手机初步判断可能会存在支付事件,并进一步获取在检测到当前时间在12:00~13:00内的前预设时间(例如,40分钟)内的用户行为数据、位置数据和/或天气数据,以构成待测样本。
66.可选的,检测信息可包括用户位置信息和当前时间,对应的,该异常检测条件可指用户位置信息在预设的地理围栏内以及当前时间与历史支付时间匹配。也即,当手机检测到用户位置信息在预设的地理围栏内,且当前时间与历史支付时间匹配时,获取待测样本。
67.其中,检测信息还包括其他与支付事件相关联的信息,在此不做具体赘述。通过在检测信息触发异常检测条件时获取待测样本,可以进行初步筛选,减少手机获取/采集数据的频率,进一步减少手机进行异常检测的次数,达到降低手机能耗的效果。
68.可选的,手机还可以按照预设的时间间隔获取待测样本。例如,手机每间隔1小时
获取前预设时间段内的用户行为数据、位置数据和/或天气数据作为待测样本,并对该待测样本进行异常检测。
69.s220,手机获取正常样本集。
70.其中,正常样本集包括多个正常样本。正常样本为历史上的非支付事件的样本。该正常样本可以为手机在被用户正常使用过程中采集并存储的。正常样本可用于反映用户在进行非支付事件前的行为、动作,包括检测到非支付事件前预设时间段内的用户行为数据、位置数据和/或环境数据。
71.非支付事件可包括除支付事件以外的其他事件,例如显示桌面(也可以称为主界面、home界面)、开启非支付应用、播放视频/音乐、显示照片等事件等。
72.在本技术实施例中,手机可在检测到显示桌面时获取第一预设时间段内的用户行为数据、位置数据和/或环境数据作为正常样本,该第一预设时间段为以手机显示桌面的时刻为起始点,以该起始点向前预设时间(例如半小时)的时刻为终止点形成的时间段。或者,手机还可在检测到其他非支付事件时获取正常样本。
73.可选的,手机还可以按照预设的周期采集正常样本。具体的,手机可检测当前周期内的非支付事件,并获取每个支付事件发生前的预设时间内的用户行为数据、位置数据和/或环境数据,作为对应支付事件的样本,并将该样本作为正常样本。
74.可以理解地,由于在日常生活中的非支付事件相对于支付事件更多且更频繁,手机可以以较快的速度累积到大量可供异常检测的正常样本。
75.s230,手机基于正常样本集确定待测样本的标签。
76.其中,标签包括支付事件和非支付事件。
77.手机基于正常样本集确定待测样本的标签的方式包括多种,下文将分别进行说明。
78.方式一,手机可利用单个异常检测模型确定待测样本的标签。
79.具体的,手机可将待测样本和正常样本集一同输入至异常检测模型,得到待测样本的标签。其中,该异常检测模型可以为手机或其他电子设备(例如pc、服务器)利用用户在至少一个终端设备中的历史事件样本(包括支付事件样本和非支付事件样本)和对应的标签所训练得到的。
80.该异常检测模型可以为基于独立森林(iforest)算法的异常检测模型、基于局部异常因子(local outlier factor,lof)算法的异常检测模型或者基于聚类算法的异常检测模型等,在此不做具体限制。
81.方式二,手机利用基于业务情况进行改良后的聚类算法确定待测样本的标签。
82.示例性的,手机基于正常样本集确定待测样本的标签可采用如图3所示的流程实现。该流程包括s310~s340。
83.s310,手机对待测样本及多个正常样本进行聚类,得到多个样本簇。
84.其中,每个样本簇包括多个样本以及簇中心,该多个样本可包括待测样本和/或非支付事件样本。
85.具体的,手机可从待测样本及多个正常样本中随机取k个样本作为簇中心,然后计算每个样本到k个簇中心的特征向量距离,并将样本划分至与该样本具有最小特征向量距离的簇中心所在的样本簇,以得到k个样本簇。由于前述的簇中心是手机随机抽取的,其并
不一定是真的簇中心。为了将较为相似的样本划分至同一样本簇,手机可以重新确定每个样本簇的簇中心。例如,手机可以取每簇样本的算术平均数,并以算术平均数作为新的簇中心重新聚类,直至聚类得到的结果不再变化时,输出k组样本簇以及每个样本簇的簇中心。
86.其中,两个样本之间的特征向量距离可用于反映两个样本的相似程度。其中,若两个样本之间的特征向量距离越大,则表明该两个的样本的相似程度越小;两个样本之间的特征向量距离越小,则表明该两个的样本的相似程度越大。
87.手机计算样本到簇中心的特征向量距离的过程具体可以为:手机提取样本的特征信息以及簇中心的特征信息,然后计算样本的特征信息与簇中心的特征信息的特征向量距离。具体的,样本和簇中心所包括的特征维度相同,例如均包括m维特征。如此,样本和簇中心之间可存在m组特征向量,每组特征向量包括样本的第一特征向量以及簇中心的第二特征向量。手机可计算m组特征向量中每组特征向量所包括的第一特征向量和第二特征向量之间的特征向量距离,得到m个第一特征向量距离。手机还可以对m个第一特征向量距离进行归一化处理,以避免由于特征之间量纲不统一导致的误差。手机还可以按照m组特征向量的权重,对进行归一化处理后的m个第一特征向量距离进行加权融合得到特征向量距离。
88.也即,两个样本(例如样本1与样本2)之间的特征向量距离可通过算式1计算。
89.其中,d为特征向量距离,x1i为样本1的第i维特征,x2i为样本2的第i维特征,wi为第i维特征的权重。需要说明的是,算式1中以特征向量距离为欧式距离进行举例,该特征向量距离还可以为其他距离,例如曼哈顿距离,在此不做具体限制。
90.手机可根据实际业务需求给不同的特征设置不同的权重。例如,将较为重要的特征的权重设置得较高,将较为不重要的特征的权重设置得较低。这样得到的特征向量距离能够更加准确地反映两个样本之间的相似程度。
91.s320,手机确定每个样本到对应的簇中心的特征向量距离。
92.其中,手机可基于算式1计算每个样本到对应的簇中心的特征向量距离,或者直接获取在聚类过程中计算的特征向量距离。
93.s330,手机按照从大到小的顺序对多个特征向量距离进行排序,得到特征向量距离最大的n个样本。
94.其中,特征向量距离最大的n个样本为手机筛选出的异常样本,即支付事件的样本。在一种可选的实施方式中,手机可以预先设置异常样本比例,以及可以通过样本总数量(待测样本和正常样本集中的所有样本的数量总和)及该异常样本比例确定n。具体的,n为样本总数量与异常样本比例的乘积。例如,该异常样本比例为1%,则100个样本中只有特征向量距离最大的样本为异常样本。又例如,异常样本比例为0.2%,样本总数量为10000时,手机可以得到20个异常样本(即n=20)。
95.s340,若n个样本中包括待测样本,手机确定待测样本的标签为支付事件。
96.方式三,手机利用多个异常检测模型确定待测样本的标签。
97.示例性的,手机利用多个异常检测模型确定待测样本的标签可采用如图4所示的流程实现。该流程包括s410~s450。
98.s410,手机将待测样本及多个正常样本输入多个不同的异常检测模型,得到每个
样本的多个第一异常得分。
99.其中,多个不同的异常检测模型可以分别为基于iforest的异常检测模型、基于lof的异常检测模型、基于聚类算法的异常检测模型等。多个不同的异常检测模型输出的多个第一异常得分用于表征两个样本在不同维度的差异程度。其中不同维度包括密度、距离等。
100.每个异常检测模型均可输出待测样本和多个正常样本的第一异常得分。例如,手机将1个待测样本和1000个正常样本一同输入至3个不同的异常检测模型,每个异常检测模型均可输入1001个样本(包括1个待测样本和1000个正常样本)的第一异常得分。因此,每个样本均对应多个第一异常得分。
101.s420,手机对每个样本的多个第一异常得分进行归一化处理。
102.通过归一化处理可以减小由于不同第一异常得分之间量纲不统一导致的误差。
103.s430,手机针对每个样本,按照多个异常检测模型的权重,对进行归一化处理后的多个第一异常得分进行加权融合得到第二异常得分。
104.其中,多个第一异常得分和第二异常得分可满足算式2。
105.其中,s2为第二异常得分,ki为第i个异常检测模型的权重,s
1i
为第i个异常检测模型输出的第一异常得分。
106.需要说明的是,手机可以利用算式2计算每个样本的第二异常得分。
107.通过融合多个异常检测模型输出的异常得分,可以使最终得到的第二异常得分能够更加准确地反映两个样本之间的差异程度。
108.多个异常检测模型的权重可以为用户根据各异常检测模型的准确度进行设置的,例如若某个异常检测模型的准确度较高则其对应的权重较高,若某个异常检测模型的准确度较低则其对应的权重较低。
109.可选的,多个异常检测模型的权重可以是手机或其他电子设备通过网格调参机制确定的。示例性的,异常检测模型的数量可以为m个,假设前m-1个异常检测模型的权重为a1、a2
……
am-1,则最后一个异常检测模型的权重为1-a1-a2
‑……‑ꢀ
am-1。设定a1、a2
……
am-1的取值范围为[0.05,0.1,0.15
……
0.95],且a1 a2
……
am-1<1。电子设备可循环遍历每个权重的取值范围,以确定多组权重系数。然后,电子设备可基于每组权重系数对多个异常检测模型输出的第一异常得分进行融合,最终选择融合结果最为准确的一组权重系数。需要说明的是,该取值范围也可以为其他,例如[0.01,0.02,0.03
……
0.99]、[0.001,0.002,0.003
……
0.999]。该取值范围中相邻两个参数之间的差值越小,则网格密度越大,最终得到的权重系数越精确。
[0110]
可选的,多个异常检测模型的权重可以是手机或其他电子设备通过训练逻辑回归模型得到的。电子设备可以将多个异常检测模型输出的异常得分作为输入,将待测样本的真实标签作为输入的标签对模型进行训练,直至模型收敛后可输出多个异常检测模型的权重。
[0111]
上述提供的两种确定多个异常检测模型的权重的方式是电子设备根据业务实际情况得到的,比凭用户主观设置的权重更加准确,也可使多个异常检测模型的融合结果更贴合实际。
[0112]
s440,按照从大到小的顺序对每个样本的第二异常得分进行排序,得到第二异常得分最大的p个样本。
[0113]
其中,第二异常得分最大的p个样本为手机筛选出的异常样本,即支付事件的样本。在一种可选的实施方式中,手机可以预先设置异常样本比例,以及可以通过样本总数量(待测样本和多个正常样本的数量总和)及该异常样本比例确定p。具体的,p为样本总数量与异常样本比例的乘积。例如,该异常样本比例为0.1%,则1000个样本中只有第二异常得分最大的样本为异常样本。又例如,异常样本比例为0.5%,样本总数量为1000时,手机可以得到5个异常样本(即p=5)。
[0114]
s450,若p个样本包括待测样本,确定待测样本的标签为支付事件。
[0115]
若第二异常得分小于预设的第一阈值,手机确定待测样本的标签为非支付事件。
[0116]
可选的,多个异常检测模型还可以输出待测样本的标签。在这种情况下,手机将待测样本及多个正常样本输入多个不同的异常检测模型后可得到多个异常检测结果。该异常检测结果中包括待测样本的标签,标签包括支付事件或非支付事件。若多个异常检测结果中,标签为支付事件的异常检测结果的数量大于标签为非支付事件的异常检测结果的数量,则手机可以确定待测样本的标签为支付事件。反之,若多个异常检测结果中,标签为支付事件的异常检测结果的数量小于标签为非支付事件的异常检测结果的数量,则手机可以确定待测样本的标签为非支付事件。
[0117]
s240,若待测样本的标签为支付事件,手机推送支付服务卡片。
[0118]
可以理解地,若待测样本的标签为支付事件,则表明用户可能即将存在支付操作。为了简化用户的支付操作,手机可以推送支付服务卡片。该支付服务卡片可用于为用户提供快捷支付途径,例如扫一扫、收款码等。
[0119]
通过推送支付服务卡片,可使用户方便、快捷地进行支付操作,简化了用户操作,提升用户体验。
[0120]
可选的,当检测到非支付事件时,手机可获取新增正常样本。非支付事件可包括除支付事件以外的其他事件,例如显示桌面(也可以称为主界面、home界面)、开启非支付应用、播放视频/音乐、显示照片等事件等。
[0121]
在本技术实施例中,手机可在检测到显示桌面时获取第一预设时间段内的用户行为数据、位置数据和/或环境数据作为新增正常样本,该第一预设时间段为以手机显示桌面的时刻为起始点,以该起始点向前预设时间(例如半小时)的时刻为终止点形成的时间段。或者,手机还可在检测到其他非支付事件时获取新增正常样本。
[0122]
可选的,手机还可以按照预设的周期采集新增正常样本。具体的,手机可检测当前周期内的非支付事件,并获取每个支付事件发生前的预设时间内的用户行为数据、位置数据和/或环境数据,作为对应支付事件的样本,并将该样本作为新增正常样本。
[0123]
手机还可基于该新增正常样本对正常样本集进行更新。可选的,手机可定时(例如每天、每周、每月等)对正常样本集进行更新。这样可使正常样本集中所包括的正常样本与用户的实际行为贴合,从而使异常检测的过程更具个性化。
[0124]
综上所述,相对于现有技术中需要累积大量支付事件的有监督异常检测方式,本技术考虑到短时间内仅能累积少量支付事件的样本和大量非支付事件的样本,采用无监督异常检测的方式,将支付事件视为异常样本,将非支付事件视为正常样本,能够缩短数据累
积时间,快速实现对不同用户的个性化检测。
[0125]
本技术实施例还提供一种芯片系统,如图5所示,该芯片系统包括至少一个处理器501和至少一个接口电路502。处理器501和接口电路502可通过线路互联。例如,接口电路502可用于从其它装置(例如,电子设备的存储器)接收信号。又例如,接口电路502可用于向其它装置(例如处理器501)发送信号。
[0126]
例如,接口电路502可读取电子设备中存储器中存储的指令,并将该指令发送给处理器501。当所述指令被处理器501执行时,可使得电子设备执行上述实施例中的各个步骤。
[0127]
当然,该芯片系统还可以包含其他分立器件,本技术实施例对此不作具体限定。
[0128]
本技术实施例还提供一种计算机可读存储介质,该计算机可读存储介质包括计算机指令,当所述计算机指令在电子设备(如图1所示的电子设备200)上运行时,使得电子设备200执行上述方法实施例中电子设备执行的各个功能或者步骤。
[0129]
本技术实施例还提供一种计算机程序产品,当所述计算机程序产品在计算机上运行时,使得所述计算机执行上述方法实施例中电子设备执行的各个功能或者步骤。
[0130]
通过以上实施方式的描述,所属领域的技术人员可以清楚地了解到,可以根据需要而将上述功能分配由不同的功能模块完成,即将装置的内部结构划分成不同的功能模块,以完成以上描述的全部或者部分功能。
[0131]
在本技术所提供的几个实施例中,应该理解到,所揭露的装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述模块或单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个装置,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
[0132]
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是一个物理单元或多个物理单元,即可以位于一个地方,或者也可以分布到多个不同地方。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
[0133]
另外,在本技术各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
[0134]
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个可读取存储介质中。基于这样的理解,本技术实施例的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该软件产品存储在一个存储介质中,包括若干指令用以使得一个设备(可以是单片机,芯片等)或处理器(processor)执行本技术各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:u盘、移动硬盘、只读存储器(read only memory,rom)、随机存取存储器(random access memory,ram)、磁碟或者光盘等各种可以存储程序代码的介质。
[0135]
以上内容,仅为本技术的具体实施方式,但本技术的保护范围并不局限于此,任何在本技术揭露的技术范围内的变化或替换,都应涵盖在本技术的保护范围之内。因此,本技术的保护范围应以所述权利要求的保护范围为准。
再多了解一些

本文用于创业者技术爱好者查询,仅供学习研究,如用于商业用途,请联系技术所有人。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献