一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

收寄件数据分析方法、装置、计算机设备和存储介质与流程

2022-05-17 21:39:58 来源:中国专利 TAG:


1.本技术涉及大数据技术领域,特别是涉及一种收寄件数据分析方法、装置、计算机设备和存储介质。


背景技术:

2.对于物流领域,核心企业供应链上的每一个环节都存在欺诈的风险,随着大数据技术的发展,大数据的应用在物流风控中起着重要的作用。
3.信息技术行业往往面临着对各种复杂网络的理解挖掘,例如对物流数据信息加以挖掘利用,对用户的收寄件行为进行欺诈可能性分析。
4.传统的欺诈可能性分析,一般是通过挖掘具体用户的历史行为中是否存在欺诈行为来判断用户的收寄件行为的欺诈可能性,分析的数据来源和分析手段较为简单,从而导致分析结果准确性不高。


技术实现要素:

5.基于此,有必要针对上述技术问题,提供一种能够提高欺诈可能性分析准确率的收寄件数据分析方法、装置、计算机设备和存储介质。
6.一种收寄件数据分析方法,方法包括:
7.获取数据分析任务,确定待分析的目标用户和目标时刻,根据目标时刻所属目标时间段,得到目标时间段对应的收寄件数据;
8.根据收寄件数据,构建无向图,通过特征降维,将无向图上的节点嵌入低维特征空间;
9.根据目标用户在低维特征空间中对应的目标节点,得到目标节点在目标时刻对应的第一特征表示序列、以及目标节点在参照时刻对应的第二特征表示序列,参照时刻与目标时刻关联;
10.将第一特征表示序列和第二特征表示序列分别输入hmm(hidden markov model,隐马尔可夫模型)模型,得到第一预测结果和第二预测结果;
11.根据第一预测结果与第二预测结果的差异数据,得到目标用户在目标时刻的欺诈概率。
12.在其中一个实施例中,根据收寄件数据,构建无向图,通过特征降维,将无向图上的节点嵌入低维特征空间包括:
13.根据收寄件数据对应的收寄行为,确定收寄件数据关联的用户;
14.以用户为节点、以收寄行为为节点关联关系,构建无向图;
15.对无向图中的节点进行特征降维,基于无向图与低维特征空间的映射关系,将节点嵌入低维特征空间。
16.在其中一个实施例中,对无向图中的节点进行特征降维,基于无向图与低维特征空间的映射关系,将节点嵌入低维特征空间之前,还包括:
17.根据低维特征空间中的节点关系,确定低维特征空间的目标函数;
18.根据随机梯度下降优化算法,在目标函数取最优值时,确定无向图与低维特征空间的映射关系。
19.在其中一个实施例中,根据目标用户在低维特征空间中对应的目标节点,得到目标节点在目标时刻对应的第一特征表示序列、以及目标节点在参照时刻对应的第二特征表示序列包括:
20.根据低维特征空间与无向图的映射关系,确定低维特征空间中与目标用户对应的目标节点;
21.根据随机游走算法,得到目标节点在低维特征空间中的邻近节点;
22.根据目标时间段中的任一时刻,获取目标节点与邻近节点构成的子图在时刻的低维特征数据;
23.筛选目标时刻之前的各时刻对应的低维特征数据,得到目标节点在目标时刻对应的第一特征表示序列;
24.确定与目标时刻关联的参照时刻,筛选目标节点在参照时刻之前的各时刻对应的低维特征数据,得到参照时刻对应的第二特征表示序列。
25.在其中一个实施例中,筛选目标时刻之前的各时刻对应的低维特征数据,得到目标节点在目标时刻对应的第一特征表示序列包括:
26.获取特征表示序列的目标特征数量;
27.根据目标特征数量,以目标时刻为最后时刻进行递推,依次获取目标时刻之前的各时刻对应的低维特征数据;
28.当获取的低维特征数据的数量达到目标特征数量时,根据获取的低维特征数据,构建第一特征表示序列。
29.在其中一个实施例中,将第一特征表示序列和第二特征表示序列分别输入hmm模型,得到第一预测结果和第二预测结果之前,还包括:
30.将多个节点对应的特征表示序列作为初始hmm模型的观测序列;
31.以观测序列为训练数据,根据baum-welch算法训练hmm模型的参数,得到hmm模型。
32.在其中一个实施例中,根据第一预测结果与第二预测结果的差异数据,得到目标用户在目标时刻的欺诈概率包括:
33.确定第一预测结果与第二预测结果的差异数据;
34.计算差异数据与第一预测结果的比值;
35.当比值不小于预设阈值时,得到存在欺诈行为的分析结果;
36.当比值小于预设阈值时,得到不存在欺诈行为的分析结果。
37.一种收寄件数据分析装置,装置包括:
38.任务获取模块,用于获取数据分析任务,确定待分析的目标用户和目标时刻,根据目标时刻所属目标时间段,得到目标时间段对应的收寄件数据;
39.节点嵌入模块,用于根据收寄件数据,构建无向图,通过特征降维,将无向图上的节点嵌入低维特征空间;
40.序列得到模块,用于根据目标用户在低维特征空间中对应的目标节点,得到目标节点在目标时刻对应的第一特征表示序列、以及目标节点在参照时刻对应的第二特征表示
序列,参照时刻与目标时刻关联;
41.结果预测模块,用于将第一特征表示序列和第二特征表示序列分别输入hmm模型,得到第一预测结果和第二预测结果;
42.欺诈分析模块,用于根据第一预测结果与第二预测结果的差异数据,得到目标用户在目标时刻的欺诈概率。
43.一种计算机设备,包括存储器和处理器,存储器存储有计算机程序,处理器执行计算机程序时实现以下步骤:
44.获取数据分析任务,确定待分析的目标用户和目标时刻,根据目标时刻所属目标时间段,得到目标时间段对应的收寄件数据;
45.根据收寄件数据,构建无向图,通过特征降维,将无向图上的节点嵌入低维特征空间;
46.根据目标用户在低维特征空间中对应的目标节点,得到目标节点在目标时刻对应的第一特征表示序列、以及目标节点在参照时刻对应的第二特征表示序列,参照时刻与目标时刻关联;
47.将第一特征表示序列和第二特征表示序列分别输入hmm模型,得到第一预测结果和第二预测结果;
48.根据第一预测结果与第二预测结果的差异数据,得到目标用户在目标时刻的欺诈概率。
49.一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现以下步骤:
50.获取数据分析任务,确定待分析的目标用户和目标时刻,根据目标时刻所属目标时间段,得到目标时间段对应的收寄件数据;
51.根据收寄件数据,构建无向图,通过特征降维,将无向图上的节点嵌入低维特征空间;
52.根据目标用户在低维特征空间中对应的目标节点,得到目标节点在目标时刻对应的第一特征表示序列、以及目标节点在参照时刻对应的第二特征表示序列,参照时刻与目标时刻关联;
53.将第一特征表示序列和第二特征表示序列分别输入hmm模型,得到第一预测结果和第二预测结果;
54.根据第一预测结果与第二预测结果的差异数据,得到目标用户在目标时刻的欺诈概率。
55.上述收寄件数据分析方法、装置、计算机设备和存储介质,通过获取数据分析任务,确定分析对象,并以目标时刻所属目标时间段的收寄件数据为分析数据,通过构建无向图实现收寄件数据对应的供应链上用户之间的关联,将无向图上的节点嵌入低维特征空间,利用低维特征空间来得到目标用户在目标时刻的特征表示序列以及在参照时刻的特征表示序列,通过hmm模型进行预测,并利用两个特征表示序列对应的预测结果的差异数据,来判定目标用户在目标时刻的欺诈概率。在整个方案中,通过无向图和低维特征空间来得到特征表示序列,既考虑了目标用户本身数据维度的信息,又考虑了整个供应链的拓扑结构信息,实现了多维数据的融合,并且通过不同时刻的预测结果的差异比较,避免单一维度
信息造成的误差,能够得到准确的欺诈分析结果。
附图说明
56.图1为一个实施例中收寄件数据分析方法的应用环境图;
57.图2为一个实施例中收寄件数据分析方法的流程示意图;
58.图3为另一个实施例中收寄件数据分析方法的流程示意图;
59.图4为再一个实施例中收寄件数据分析方法的流程示意图;
60.图5为又一个实施例中收寄件数据分析方法的流程示意图;
61.图6为还一个实施例中收寄件数据分析方法的流程示意图;
62.图7为一个实施例中收寄件数据分析方法的数据流程图;
63.图8为一个实施例中收寄件数据分析装置的结构框图;
64.图9为一个实施例中计算机设备的内部结构图。
具体实施方式
65.为了使本技术的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本技术进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本技术,并不用于限定本技术。
66.本技术提供的收寄件数据分析方法,可以应用于如图1所示的应用环境中。其中,终端102通过网络与服务器104进行通信。服务器104获取终端配置的数据分析任务,确定待分析的目标用户和目标时刻,根据目标时刻所属目标时间段,得到目标时间段对应的收寄件数据,根据收寄件数据,构建无向图,通过特征降维,将无向图上的节点嵌入低维特征空间,根据目标用户在低维特征空间中对应的目标节点,得到目标节点在目标时刻对应的第一特征表示序列、以及目标节点在参照时刻对应的第二特征表示序列,参照时刻与目标时刻关联,将第一特征表示序列和第二特征表示序列分别输入hmm模型,得到第一预测结果和第二预测结果,根据第一预测结果与第二预测结果的差异数据,得到目标用户在目标时刻的欺诈概率。并将得到的欺诈概率推送至终端102。其中,终端102可以但不限于是各种个人计算机、笔记本电脑、智能手机、平板电脑和便携式可穿戴设备,服务器104可以用独立的服务器或者是多个服务器组成的服务器集群来实现。
67.在一个实施例中,如图2所示,提供了一种收寄件数据分析方法,以该方法应用于图1中的服务器为例进行说明,包括以下步骤202至步骤210。
68.步骤202,获取数据分析任务,确定待分析的目标用户和目标时刻,根据目标时刻所属目标时间段,得到目标时间段对应的收寄件数据。
69.数据分析任务是指对指定用户在指定时刻产生的收寄件行为进行欺诈可能性分析的任务。在数据分析任务中,配置有待分析的目标用户和目标时刻对应的信息。目标用户是供应链上的需要进行欺诈风险分析的指定用户,目标时刻是针对某一指定收寄件行为发生的时间点。
70.目标时刻所属目标时间段可以是以目标时刻为最后时间的预设时间长度的时间段,在该时间段内包括多个时间间隔相同的时刻。比如,目标时间段的时间长度为一周,时间间隔为1天,当目标时刻为1月7日时,目标时间段可以是1月1日至1月7日构成的时间段。
目标时刻所属目标时间段可以是预先划分好的多个时间段中,包含稿目标时刻的一个时间段。例如,目标时间段的时间长度为一周,时间间隔为1天,而且服务器已经预先进行了时间段的划分,如1月1日至1月7日为一个时间段,1月8日至1月14日为一个时间段,当目标时刻对应为1月7日时,则目标时刻所属的目标时间段为1月1日至1月7日。
71.收寄件数据是指物流领域中用户对物品进行收件或寄件时产生的数据信息。收寄件数据包括收件人信息、寄件人信息、收寄件行为的用户付款情况以及收寄件时间等。
72.目标时间段对应的收寄件数据是指收寄件时间处于该目标时间段的收寄件数据。需要说明的是,基于目标时间段得到的收寄件数据只与收寄件时间有关,与具体的收寄件用户无关,也就是说,只要收寄件时间处于该目标时间段的各个用户对应的收寄件数据都可以被获取到。
73.基于收寄件数据对应的收件方和寄件方,能够构建出由收件方和寄件方组成的供应链。供应链是指生产及流通过程中,涉及将产品提供给最终用户活动的上游与下游企业,所形成的网链结构。可以理解,同一个用户,在不同的收寄件数据对应的收寄件行为中,既可以作为收件方,也可以作为寄件方。
74.步骤204,根据收寄件数据,构建无向图,通过特征降维,将无向图上的节点嵌入低维特征空间。
75.无向图是指边没有方向的图,基于收寄件数据构建的无向图可以表征具有收寄件行为的用户双方之间的联系。通过无向图可以将多个用户之间的关系在同一个图中展示出来。具体来说,服务器可以根据目标时间段内的收寄件数据,将收寄件数据中涉及的各用户以及其两两之间的关系存储成无向图。
76.降维是机器学习中很重要的一种思想,在机器学习中会碰到一些高维的数据集,而在高维数据情形下会出现数据样本稀疏,距离计算等困难,在高维特征中容易出现特征之间的线性相关,导致特征冗余存在。特征降维可以通过线性降维的处理方式来实现,线性降维是指通过特征的线性组合,把数据投影到低维线性子空间的处理过程。通过对无向图中每个节点的特征进行降维处理,将无向图上的节点嵌入低维特征空间。
77.graph embedding(图嵌入)为将无向图中的节点嵌入到一个低维向量空间,获得低维向量表达的过程。设v为无向图中所有节点构成的集合,e为所有节点两两之间的关系(边)构成的集合,g=(v,e)为节点和边构成的无向图。学习图嵌入的特征表达f,将无向图上的每一个节点嵌入到一个低维特征空间rd,即f:v

rd。
78.步骤206,根据目标用户在低维特征空间中对应的目标节点,得到目标节点在目标时刻对应的第一特征表示序列、以及目标节点在参照时刻对应的第二特征表示序列,参照时刻与目标时刻关联。
79.通过将无向图上的节点嵌入低维特征空间,则无向图中的每一个节点在低维特征空间中都存在与之对应的节点。根据目标用户在无向图中对应的节点,基于无线图与低维特征空间的映射关系,可以确定该节点在低维特征空间对应的目标节点,即为目标用户在低维特征空间中对应的目标节点。
80.特征表示序列是由多个特征表示按一定的规则组合在一起得到的序列结果,其中组合的规则可以是按时间顺序进行组合,特征表示是指每一个节点在每一个时刻对应的特征向量的表示结果。通过将每一个节点的多个时刻对应的特征向量按时间顺序进行组合,
则可以得到与该节点对应的特征表示序列。
81.其中,特征序列的序列长度可以是预先配置的,在目标时刻对应的第一特征表示序列是指以目标时刻的特征表示为序列起点或序列终点、具有固定长度的特征表示序列。同理,在参照时刻对应的第二特征表示序列是指以参照时刻的特征表示为序列起点或序列终点、具有固定长度的特征表示序列。第一特征表示序列的序列长度与第二特征表示序列的序列长度可以相同。参照时刻是指用于对目标时刻进行参照的指定时刻,具体可以是目标时刻的前一时刻,也可是与目标时刻具有固定时间间隔长度的其他时刻。在实施例中,参照时刻与目标时刻的关联关系可以是预先配置的,当目标时刻确定时,对应的参照时刻也是确定的。
82.步骤208,将第一特征表示序列和第二特征表示序列分别输入hmm模型,得到第一预测结果和第二预测结果。
83.hmm模型(hidden markov model,隐马尔可夫模型)是关于时序的概率模型,描述由一个隐藏的马尔可夫链随机生成不可观测的状态随机序列,再由各个状态生成一个观测而产生观测随机序列的过程。它的状态不能直接观察到,但能通过观测向量序列观察到,每个观测向量都是通过某些概率密度分布表现为各种状态,每一个观测向量是由一个具有相应概率密度分布的状态序列产生。hmm模型是一个双重随机过程,具有一定状态数的隐马尔可夫链和显示随机函数集。隐藏的马尔可夫链随机生成的状态的序列,称为状态序列,每个状态生成一个观测,而由此生成的观测的随机序列,称为观测序列,序列的每个位置又可以看做一个时刻。
84.在一个实施例中,将第一特征表示序列和第二特征表示序列分别输入hmm模型,得到第一预测结果和第二预测结果之前,还包括hmm模型的训练过程。hmm模型的训练过程如下:将多个节点对应的特征表示序列作为初始hmm模型的观测序列。以观测序列为训练数据,根据baum-welch算法训练hmm模型的参数,得到hmm模型。
85.多个节点可以是无向图中或是低维特征空间中的各节点。节点对应的特征表示序列可以是固定序列长度的特征表示序列,也可以是随机长度的特征表示序列。baum-welch算法可以在不知道状态序列的情况下,对模型的参数进行训练拟合,已得到参数最优的hmm模型。
86.通过将无向图中或是低维特征空间中的各节点的特征表示序列作为hmm模型的观测序列进行模型训练,能够使得训练后得到的hmm模型更加贴合实际的应用场景,得到更为准确的预测结果。
87.在实施例中,将第一特征表示序列和第二特征表示序列分别输入hmm模型,得到第一预测结果和第二预测结果,第一预测结果可以是第一特征表示序列对应的预测结果,相应的,第二预测结果是第二特征表示序列对应的预测结果。可以理解,在其他实施例中,第一预测结果也可以是第二特征表示序列对应的预测结果,相应地,第二预测结果是第一特征表示序列对应的预测结果。
88.步骤210,根据第一预测结果与第二预测结果的差异数据,得到目标用户在目标时刻的欺诈概率。
89.第一预测结果与第二预测结果是hmm模型预测得到的概率数据,第一预测结果与第二预测结果之间的差异数据是两个概率数据之间的数值差。以第一特征表示序列的预测
结果为第一预测结果为例,根据该数据差与第一预测结果的比值大小,得到目标用户在目标时刻的欺诈概率。
90.上述收寄件数据分析方法,通过获取数据分析任务,确定分析对象,并以目标时刻所属目标时间段的收寄件数据为分析数据,通过构建无向图实现收寄件数据对应的供应链上用户之间的关联,将无向图上的节点嵌入低维特征空间,利用低维特征空间来得到目标用户在目标时刻的特征表示序列以及在参照时刻的特征表示序列,通过hmm模型进行预测,并利用两个特征表示序列对应的预测结果的差异数据,来判定目标用户在目标时刻的欺诈概率。在整个方案中,通过无向图和低维特征空间来得到特征表示序列,既考虑了目标用户本身数据维度的信息,又考虑了整个供应链的拓扑结构信息,实现了多维数据的融合,并且通过不同时刻的预测结果的差异比较,避免单一维度信息造成的误差,能够得到准确的欺诈分析结果。
91.在一个实施例中,如图3所示,根据收寄件数据,构建无向图,通过特征降维,将无向图上的节点嵌入低维特征空间包括步骤302至步骤306。
92.步骤302,根据收寄件数据对应的收寄行为,确定收寄件数据关联的用户。
93.步骤304,以用户为节点、以收寄行为为节点关联关系,构建无向图。
94.步骤306,对无向图中的节点进行特征降维,基于无向图与低维特征空间的映射关系,将节点嵌入低维特征空间。
95.收寄行为用于表征物品从用户a流通至用户b或是从用户b流通至用户a的流通过程。根据收寄行为分别对应的收寄用户,可以确定基于收寄件数据关联的用户。以用户为节点、以收寄行为为节点之间的关联关系,构建得到多个用户之间的无向图。通过构建无向图,实现基于物流关系的供应链上各个用户的特征关联,为多角度的特征融合做了数据铺垫。
96.由于每个节点对应数据的维度是众多的,基于无向图与低维特征空间的映射关系,对无向图中的节点进行特征降维,实现无向图中节点在低维特征空间的映射,将节点嵌入至低维特征空间,实现多维度的特征融合。
97.在一个实施例中,如图4所示,对无向图中的节点进行特征降维,基于无向图与低维特征空间的映射关系,将节点嵌入低维特征空间之前,还包括步骤402至步骤404。
98.步骤402,根据低维特征空间中的节点关系,确定低维特征空间的目标函数。
99.步骤404,根据随机梯度下降优化算法,在目标函数取最优值时,确定无向图与低维特征空间的映射关系。
100.具体来说,设f:v

rd为从节点到d维特征空间的映射,设为在随机游走采样方法s下节点v的邻近节点的集合,则在v的特征表示f(v)的条件下,对数似然估计为:
[0101][0102]
假设在给定v的特征表示f(v)的条件下,v的邻近节点ns()之间是条件独立的,即:
[0103][0104]
进一步假设在d维特征空间中,任意两个节点之间是相互影响的,从而有下式:
[0105][0106]
根据如上假设,低维特征空间的目标函数可重写成如下形式:
[0107][0108]
其中∑
u∈v
exp(f(u)
·
f(v))用负采样的方式来估计。
[0109]
根据随机梯度下降优化算法,优化目标函数并求出目标函数取最优值时的f:v

rd,得到无向图与低维特征空间的映射关系。
[0110]
在一个实施例中,如图5所示,根据目标用户在低维特征空间中对应的目标节点,得到目标节点在目标时刻对应的第一特征表示序列、以及目标节点在参照时刻对应的第二特征表示序列即步骤206,包括步骤502至步骤510。
[0111]
步骤502,根据低维特征空间与无向图的映射关系,确定低维特征空间中与目标用户对应的目标节点。
[0112]
步骤504,根据随机游走算法,得到目标节点在低维特征空间中的邻近节点。
[0113]
步骤506,根据目标时间段中的任一时刻,获取目标节点与邻近节点构成的子图在时刻的低维特征数据。
[0114]
步骤508,筛选目标时刻之前的各时刻对应的低维特征数据,得到目标节点在目标时刻对应的第一特征表示序列。
[0115]
步骤510,确定与目标时刻关联的参照时刻,筛选目标节点在参照时刻之前的各时刻对应的低维特征数据,得到参照时刻对应的第二特征表示序列。
[0116]
随机游走算法的基本思想是,随机选择一个节点,并可以跳转到另一个节点。每当到达一个节点,都有两种选择,停留在当前节点或者继续跳转至其他节点。如果用户继续访问节点的概率为d,那么用户停留在当前节点的概率为1-d。如果继续访问其他节点,则会以均匀分布的方式随机访问当前节点指向的另一节点,是一个随机游走的过程,根据随机游走算法,得到目标节点在低维特征空间中的邻近节点。
[0117]
目标节点与邻近节点构成的子图是指仅包括目标节点及其邻近节点的节点联系图,该节点联系图为无向图的一部分,因此称之为子图。子图在时刻的低维特征数据用于表征将目标节点及其邻近节点在指定时间的特征通过特征融合得到的结果。
[0118]
例如,对于任一节点v,设其在t0时刻与其所有邻近节点构成的子图为则子图的低维特征表示为其中,为归一化因子,d(v)表示节点v的度。
[0119]
在实施例中,节点v在t0,t1,

tn时刻构成的子图序列的特征表示序列作为hmm的观测序列,根据baum-welch算法训练hmm模型的参数。
[0120]
在本实施例中,只需要关注最近m个时刻的收寄件行为,将目标时刻tn的特征表示序列输入hmm模型,根据前向后向算法,得到第一预测结果然后将参照时刻(如当前时刻tn的前一时刻t
n-1
)的特征表
示序列输入hmm模型,根据前向后向算法,得到第二预测结果
[0121]
最后,计算如果则说明当前时刻的收寄件行为与之前有较大差别,可怀疑为存在欺诈行为,否则认为为正常行为,其中θ为人工设定的阈值。
[0122]
在一个实施例中,筛选目标时刻之前的各时刻对应的低维特征数据,得到目标节点在目标时刻对应的第一特征表示序列。
[0123]
获取特征表示序列的目标特征数量。
[0124]
根据目标特征数量,以目标时刻为最后时刻进行递推,依次获取目标时刻之前的各时刻对应的低维特征数据。
[0125]
当获取的低维特征数据的数量达到目标特征数量时,根据获取的低维特征数据,构建第一特征表示序列。
[0126]
目标特征数量是指用于构成特征表示序列的特征表示的数量,目标特征数量可以预先进行配置,例如,设置为m,则表示只需要关注最近m个时刻的收寄件行为,以目标时刻为最后时刻进行递推,依次获取目标时刻之前的各时刻对应的低维特征数据对应的,构建得到的目标时刻tn的特征表示序列为
[0127]
在一个实施例中,如图6所示,根据第一预测结果与第二预测结果的差异数据,得到目标用户在目标时刻的欺诈概率包括步骤602至步骤608。
[0128]
步骤602,确定第一预测结果与第二预测结果的差异数据。
[0129]
步骤604,计算差异数据与第一预测结果的比值。
[0130]
步骤606,当比值不小于预设阈值时,得到存在欺诈行为的分析结果。
[0131]
步骤608,当比值小于预设阈值时,得到不存在欺诈行为的分析结果。
[0132]
在实施例中,通过hmm模型的预测,得到第一预测结果为第一预测结果为则第一预测结果与第二预测结果的差异数据为通过计算得到差异数据与第一预测结果的比如果则说明当前时刻的收寄件行为与之前有较大差别,可怀疑为存在欺诈行为,否则认为为正常行为,其中θ为人工设定的阈值。
[0133]
在一个实施例中,如图7所示,提供了一种收寄件数据分析方法的数据处理流程图。首先,将时间段t=(t0,t1,

tn)内所有用户以及其两两之间的关系存储成一个图g=(v,e),然后学习图嵌入的特征表达f,将图上的每一个节点嵌入到一个低维特征空间rd,即f:v

rd;对于节点v,设其在t0时刻与其所有邻近节点构成的子图为则子图的低维特征表示为低维特征表示为其中为归一化因子,d(v)表示节点v的度。其中,节点v1=(v
11
,v
12
……v1d
)、
……
vn=(v
n1
,v
n2
……vnd
)。求
出节点v在t0,t1,

tn时刻构成的子图序列的特征表示序列作为hmm的观测序列,根据baum-welch算法训练hmm模型的参数。在预测过程中,只关注最近m个时刻的收寄件行为,将输入hmm,根据前向后向算法,得到预测结果然后将下一时刻序列输入hmm,根据前向后向算法,求出得到预测结果如果则说明当前时刻的收寄件行为与之前有较大差别,可怀疑为存在欺诈行为,否则认为为正常行为,其中θ为人工设定的阈值。
[0134]
应该理解的是,虽然上述实施例涉及的各流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,上述实施例涉及的各流程图中的至少一部分步骤可以包括多个步骤或者多个阶段,这些步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤中的步骤或者阶段的至少一部分轮流或者交替地执行。
[0135]
在一个实施例中,如图8所示,提供了一种收寄件数据分析装置,包括:任务获取模块802、节点嵌入模块804、序列得到模块806、结果预测模块808和欺诈分析模块810,其中:
[0136]
任务获取模块802,用于获取数据分析任务,确定待分析的目标用户和目标时刻,根据目标时刻所属目标时间段,得到目标时间段对应的收寄件数据;
[0137]
节点嵌入模块804,用于根据收寄件数据,构建无向图,通过特征降维,将无向图上的节点嵌入低维特征空间;
[0138]
序列得到模块806,用于根据目标用户在低维特征空间中对应的目标节点,得到目标节点在目标时刻对应的第一特征表示序列、以及目标节点在参照时刻对应的第二特征表示序列,参照时刻与目标时刻关联;
[0139]
结果预测模块808,用于将第一特征表示序列和第二特征表示序列分别输入hmm模型,得到第一预测结果和第二预测结果;
[0140]
欺诈分析模块810,用于根据第一预测结果与第二预测结果的差异数据,得到目标用户在目标时刻的欺诈概率。
[0141]
在其中一个实施例中,节点嵌入模块还用于根据收寄件数据对应的收寄行为,确定收寄件数据关联的用户;以用户为节点、以收寄行为为节点关联关系,构建无向图;对无向图中的节点进行特征降维,基于无向图与低维特征空间的映射关系,将节点嵌入低维特征空间。
[0142]
在其中一个实施例中,节点嵌入模块还用于根据低维特征空间中的节点关系,确定低维特征空间的目标函数;根据随机梯度下降优化算法,在目标函数取最优值时,确定无向图与低维特征空间的映射关系。
[0143]
在其中一个实施例中,序列得到模块还用于根据低维特征空间与无向图的映射关系,确定低维特征空间中与目标用户对应的目标节点;根据随机游走算法,得到目标节点在
低维特征空间中的邻近节点;根据目标时间段中的任一时刻,获取目标节点与邻近节点构成的子图在时刻的低维特征数据;筛选目标时刻之前的各时刻对应的低维特征数据,得到目标节点在目标时刻对应的第一特征表示序列;确定与目标时刻关联的参照时刻,筛选目标节点在参照时刻之前的各时刻对应的低维特征数据,得到参照时刻对应的第二特征表示序列。
[0144]
在其中一个实施例中,序列得到模块还用于获取特征表示序列的目标特征数量;根据目标特征数量,以目标时刻为最后时刻进行递推,依次获取目标时刻之前的各时刻对应的低维特征数据;当获取的低维特征数据的数量达到目标特征数量时,根据获取的低维特征数据,构建第一特征表示序列。
[0145]
在其中一个实施例中,收寄件数据分析装置还包括模型训练模块,用于将多个节点对应的特征表示序列作为初始hmm模型的观测序列;以观测序列为训练数据,根据baum-welch算法训练hmm模型的参数,得到hmm模型。
[0146]
在其中一个实施例中,欺诈分析模块还用于确定第一预测结果与第二预测结果的差异数据;计算差异数据与第一预测结果的比值;当比值不小于预设阈值时,得到存在欺诈行为的分析结果;当比值小于预设阈值时,得到不存在欺诈行为的分析结果。
[0147]
上述收寄件数据分析装置,通过获取数据分析任务,确定分析对象,并以目标时刻所属目标时间段的收寄件数据为分析数据,通过构建无向图实现收寄件数据对应的供应链上用户之间的关联,将无向图上的节点嵌入低维特征空间,利用低维特征空间来得到目标用户在目标时刻的特征表示序列以及在参照时刻的特征表示序列,通过hmm模型进行预测,并利用两个特征表示序列对应的预测结果的差异数据,来判定目标用户在目标时刻的欺诈概率。在整个方案中,通过无向图和低维特征空间来得到特征表示序列,既考虑了目标用户本身数据维度的信息,又考虑了整个供应链的拓扑结构信息,实现了多维数据的融合,并且通过不同时刻的预测结果的差异比较,避免单一维度信息造成的误差,能够得到准确的欺诈分析结果。
[0148]
关于收寄件数据分析装置的具体限定可以参见上文中对于收寄件数据分析方法的限定,在此不再赘述。上述收寄件数据分析装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
[0149]
在一个实施例中,提供了一种计算机设备,该计算机设备可以是服务器,其内部结构图可以如图9所示。该计算机设备包括通过系统总线连接的处理器、存储器和网络接口。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于存储收寄件数据分析数据。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种收寄件数据分析方法。
[0150]
本领域技术人员可以理解,图9中示出的结构,仅仅是与本技术方案相关的部分结构的框图,并不构成对本技术方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
[0151]
在一个实施例中,提供了一种计算机设备,包括存储器和处理器,存储器中存储有计算机程序,该处理器执行计算机程序时实现以下步骤:
[0152]
获取数据分析任务,确定待分析的目标用户和目标时刻,根据目标时刻所属目标时间段,得到目标时间段对应的收寄件数据;根据收寄件数据,构建无向图,通过特征降维,将无向图上的节点嵌入低维特征空间;根据目标用户在低维特征空间中对应的目标节点,得到目标节点在目标时刻对应的第一特征表示序列、以及目标节点在参照时刻对应的第二特征表示序列,参照时刻与目标时刻关联;将第一特征表示序列和第二特征表示序列分别输入hmm(hidden markov model,隐马尔可夫模型)模型,得到第一预测结果和第二预测结果;根据第一预测结果与第二预测结果的差异数据,得到目标用户在目标时刻的欺诈概率。
[0153]
在一个实施例中,处理器执行计算机程序时还实现以下步骤:
[0154]
根据收寄件数据对应的收寄行为,确定收寄件数据关联的用户;以用户为节点、以收寄行为为节点关联关系,构建无向图;对无向图中的节点进行特征降维,基于无向图与低维特征空间的映射关系,将节点嵌入低维特征空间。
[0155]
在一个实施例中,处理器执行计算机程序时还实现以下步骤:
[0156]
根据低维特征空间中的节点关系,确定低维特征空间的目标函数;根据随机梯度下降优化算法,在目标函数取最优值时,确定无向图与低维特征空间的映射关系。
[0157]
在一个实施例中,处理器执行计算机程序时还实现以下步骤:
[0158]
根据低维特征空间与无向图的映射关系,确定低维特征空间中与目标用户对应的目标节点;根据随机游走算法,得到目标节点在低维特征空间中的邻近节点;根据目标时间段中的任一时刻,获取目标节点与邻近节点构成的子图在时刻的低维特征数据;筛选目标时刻之前的各时刻对应的低维特征数据,得到目标节点在目标时刻对应的第一特征表示序列;确定与目标时刻关联的参照时刻,筛选目标节点在参照时刻之前的各时刻对应的低维特征数据,得到参照时刻对应的第二特征表示序列。
[0159]
在一个实施例中,处理器执行计算机程序时还实现以下步骤:
[0160]
获取特征表示序列的目标特征数量;根据目标特征数量,以目标时刻为最后时刻进行递推,依次获取目标时刻之前的各时刻对应的低维特征数据;当获取的低维特征数据的数量达到目标特征数量时,根据获取的低维特征数据,构建第一特征表示序列。
[0161]
在一个实施例中,处理器执行计算机程序时还实现以下步骤:
[0162]
将多个节点对应的特征表示序列作为初始hmm模型的观测序列;以观测序列为训练数据,根据baum-welch算法训练hmm模型的参数,得到hmm模型。
[0163]
在一个实施例中,处理器执行计算机程序时还实现以下步骤:
[0164]
确定第一预测结果与第二预测结果的差异数据;计算差异数据与第一预测结果的比值;当比值不小于预设阈值时,得到存在欺诈行为的分析结果;当比值小于预设阈值时,得到不存在欺诈行为的分析结果。
[0165]
在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现以下步骤:
[0166]
获取数据分析任务,确定待分析的目标用户和目标时刻,根据目标时刻所属目标时间段,得到目标时间段对应的收寄件数据;根据收寄件数据,构建无向图,通过特征降维,将无向图上的节点嵌入低维特征空间;根据目标用户在低维特征空间中对应的目标节点,
得到目标节点在目标时刻对应的第一特征表示序列、以及目标节点在参照时刻对应的第二特征表示序列,参照时刻与目标时刻关联;将第一特征表示序列和第二特征表示序列分别输入hmm(hidden markov model,隐马尔可夫模型)模型,得到第一预测结果和第二预测结果;根据第一预测结果与第二预测结果的差异数据,得到目标用户在目标时刻的欺诈概率。
[0167]
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:
[0168]
根据收寄件数据对应的收寄行为,确定收寄件数据关联的用户;以用户为节点、以收寄行为为节点关联关系,构建无向图;对无向图中的节点进行特征降维,基于无向图与低维特征空间的映射关系,将节点嵌入低维特征空间。
[0169]
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:
[0170]
根据低维特征空间中的节点关系,确定低维特征空间的目标函数;根据随机梯度下降优化算法,在目标函数取最优值时,确定无向图与低维特征空间的映射关系。
[0171]
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:
[0172]
根据低维特征空间与无向图的映射关系,确定低维特征空间中与目标用户对应的目标节点;根据随机游走算法,得到目标节点在低维特征空间中的邻近节点;根据目标时间段中的任一时刻,获取目标节点与邻近节点构成的子图在时刻的低维特征数据;筛选目标时刻之前的各时刻对应的低维特征数据,得到目标节点在目标时刻对应的第一特征表示序列;确定与目标时刻关联的参照时刻,筛选目标节点在参照时刻之前的各时刻对应的低维特征数据,得到参照时刻对应的第二特征表示序列。
[0173]
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:
[0174]
获取特征表示序列的目标特征数量;根据目标特征数量,以目标时刻为最后时刻进行递推,依次获取目标时刻之前的各时刻对应的低维特征数据;当获取的低维特征数据的数量达到目标特征数量时,根据获取的低维特征数据,构建第一特征表示序列。
[0175]
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:
[0176]
将多个节点对应的特征表示序列作为初始hmm模型的观测序列;以观测序列为训练数据,根据baum-welch算法训练hmm模型的参数,得到hmm模型。
[0177]
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:
[0178]
确定第一预测结果与第二预测结果的差异数据;计算差异数据与第一预测结果的比值;当比值不小于预设阈值时,得到存在欺诈行为的分析结果;当比值小于预设阈值时,得到不存在欺诈行为的分析结果。
[0179]
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,该计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本技术所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和易失性存储器中的至少一种。非易失性存储器可包括只读存储器(read-only memory,rom)、磁带、软盘、闪存或光存储器等。易失性存储器可包括随机存取存储器(random access memory,ram)或外部高速缓冲存储器。作为说明而非局限,ram可以是多种形式,比如静态随机存取存储器(static random access memory,sram)或动态随机存取存储器(dynamic random access memory,dram)等。
[0180]
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例
中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
[0181]
以上实施例仅表达了本技术的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本技术构思的前提下,还可以做出若干变形和改进,这些都属于本技术的保护范围。因此,本技术专利的保护范围应以所附权利要求为准。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献