一种数据处理方法、装置、计算机设备及存储介质与流程

2022-07-10 10:18:15 来源：中国专利 TAG：

1.本技术涉及互联网技术领域，尤其涉及一种数据处理方法、装置、计算机设备及存储介质。

背景技术：

2.随着人们日常生活水平的逐渐提高，用户常常与各种各样的交易对象之间进行交易。因此，通常可以基于用户交易后产生的交易数据进行分析，得到用户对应的业务数据。
3.为了确定某一个用户的业务数据，需要先确定与该用户发生了交易的交易对象的对象特征。目前，确定交易对象的对象特征主要是根据交易对象本身的静态属性来确定，具体来说，基于交易对象的显性分类构造的对象特征，例如，属于餐饮类的交易对象1的对象特征和交易对象2的对象特征相似。依据交易对象的静态属性确定交易对象的对象特征，会导致确定的对象特征不够准确，进而导致确定的用户的业务数据也不够准确。

技术实现要素：

4.本技术实施例提出了一种数据处理方法、装置、计算机设备以及存储介质，可以根据每个交易对象之间的交易顺序确定每个交易对象的对象特征，进而确定用户的业务数据，提高了业务数据的准确性。
5.本技术实施例一方面提供了一种数据处理方法，包括：
6.获取用户交易流水集合，所述用户交易流水集合包括n个交易对象的交易顺序，n是正整数；
7.根据所述n个交易对象的交易顺序，构建交易对象拓扑图，所述交易对象拓扑图包括n个对象顶点，n个对象顶点与n个交易对象之间一一对应；
8.从所述交易对象拓扑图中抽取交易对象序列，根据所述交易对象序列确定每个交易对象的对象特征；
9.当获取到目标用户的业务请求时，根据所述每个交易对象的对象特征以及所述目标用户的交易流水确定所述目标用户的业务数据，所述业务请求携带所述目标用户的交易流水。
10.本技术实施例一方面提供了一种数据处理装置，包括：
11.获取单元，用于获取用户交易流水集合，所述用户交易流水集合包括n个交易对象的交易顺序，n是正整数；
12.构建单元，用于根据所述n个交易对象的交易顺序，构建交易对象拓扑图，所述交易对象拓扑图包括n个对象顶点，n个对象顶点与n个交易对象之间一一对应；
13.处理单元，用于从所述交易对象拓扑图中抽取交易对象序列，根据所述交易对象序列确定每个交易对象的对象特征；
14.确定单元，用于当获取到目标用户的业务请求时，根据所述每个交易对象的对象特征以及所述目标用户的交易流水确定所述目标用户的业务数据，所述业务请求携带所述
目标用户的交易流水。
15.本技术实施例一方面提供了一种计算机设备，包括存储器和处理器，存储器存储有计算机程序，计算机程序被处理器执行时，使得处理器执行上述各实施例中的方法。
16.本技术实施例一方面提供了一种计算机存储介质，计算机存储介质存储有计算机程序，计算机程序包括程序指令，程序指令当被处理器执行时，执行上述各实施例中的方法。
17.本技术实施例一方面提供了一种计算机程序产品或计算机程序，计算机程序产品或计算机程序包括计算机指令，计算机指令存储在计算机可读存储介质中，计算机指令被终端设备的处理器执行时，执行上述各实施例中的方法。
18.通过本技术实施例的数据处理方法，计算机设备通过用户交易流水集合可以构建交易对象拓扑图，并且可以从交易对象拓扑图中抽取交易对象序列，然后根据交易对象序列可以确定每个交易对象的对象特征。本方案通过交易对象之间的交易顺序确定交易对象的对象特征，可以从动态角度挖掘到交易对象之间的隐性相关性，相比于现有方式只通过交易对象本身静态属性确定交易对象的对象特征，本技术得到的对象特征更加准确。后续，当用户提交业务请求时，可以根据每个交易对象的对象特征和业务请求中携带的用户的交易流水确定该用户的业务数据。进一步地，从而提高了业务数据的准确性。
附图说明
19.为了更清楚地说明本技术实施例技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图是本技术的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。
20.图1是本技术实施例提供的一种数据处理系统的结构示意图；
21.图2a是本技术实施例提供的一种用户交易流水集合的场景示意图；
22.图2b是本技术实施例提供的一种交易对象拓扑图的场景示意图；
23.图2c是本技术实施例提供一种交易对象序列的场景示意图；
24.图2d是本技术实施例提供的一种确定对象特征的场景示意图；
25.图2e是本技术实施例提供的一种推荐业务数据的场景示意图；
26.图2f是本技术实施例提供的一种确定业务特征的场景示意图；
27.图2g是本技术实施例提供的一种构建决策树的场景示意图；
28.图2h是本技术实施例提供的一种推荐业务数据的场景示意图；
29.图3是本技术实施例提供的一种数据处理方法的流程示意图；
30.图4a是本技术实施例提供的一种随机游走的流程示意图；
31.图4b是本技术实施例提供的另一种随机游走的流程示意图；
32.图4c是本技术实施例提供的一种词嵌入模型的模型示意图；
33.图5是本技术实施例提供的另一种数据处理方法的流程示意图；
34.图6a是本技术实施例提供的一种聚类方法的流程示意图；
35.图6b是本技术实施例提供的一种样本数据的表格示意图；
36.图6c是本技术实施例提供的一种决策树的示意图；
37.图7是本技术实施例提供的一种确定业务数据方法的流程示意图；
38.图8是本技术实施例提供的另一种确定业务数据方法的流程示意图；
39.图9是本技术实施例提供的一种数据处理装置的结构示意图；
40.图10是本技术实施例提供的一种计算机设备的结构示意图。
具体实施方式
41.下面将结合本技术实施例中的附图，对本技术实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本技术中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本技术保护的范围。
42.为了能够更好地理解本技术实施例，下面对本技术实施例涉及的专业术语进行介绍：
43.node2vec：node2vec是一种算法，用于生成图上节点的矢量表示。node2vec框架通过使用从目标节点开始的随机遍历图来学习图中节点的低维表示。
44.k-means：k均值聚类算法是先随机选取k个对象作为初始的聚类中心。然后计算每个对象与各个种子聚类中心之间的距离，把每个对象分配给距离它最近的聚类中心。聚类中心以及分配给它们的对象就代表一个聚类。每分配一个样本，聚类的聚类中心会根据聚类中现有的对象被重新计算。
45.决策树(decision tree)：是在已知各种情况发生概率的基础上，通过构成决策树来求取净现值的期望值大于等于零的概率，评价项目风险，判断其可行性的决策分析方法。
46.人工智能(artificial intelligence，ai)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能，感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。换句话说，人工智能是计算机科学的一个综合技术，它企图了解智能的实质，并生产出一种新的能以人类智能相似的方式做出反应的智能机器。人工智能也就是研究各种智能机器的设计原理与实现方法，使机器具有感知、推理与决策的功能。
47.人工智能技术是一门综合学科，涉及领域广泛，既有硬件层面的技术也有软件层面的技术。人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、操作/交互系统、机电一体化等技术。人工智能软件技术主要包括计算机视觉技术、语音处理技术、自然语言处理技术以及机器学习/深度学习等几大方向。
48.本技术实施例提供的方案属于人工智能领域下属的深度学习技术和机器学习技术。
49.深度学习(deep learning，dl)是一门多领域交叉学科，涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为，以获取新的知识或技能，重新组织已有的知识结构使之不断改善自身的性能。机器学习是人工智能的核心，是使计算机具有智能的根本途径，其应用遍及人工智能的各个领域。机器学习和深度学习通常包括人工神经网络、置信网络、强化学习、迁移学习、归纳学习、式教学习等技术。
50.在本技术中，主要涉及深度学习技术确定每个交易对象的对象特征。具体的，可以根据深度学习技术领域的词嵌入模型对交易对象序列进行识别，从而得到每个交易对象的对象特征。后续，当获取到目标用户的业务请求时，可以利用机器学习技术领域的业务预测
模型，根据每个交易对象的对象特征以及目标用户的交易流水确定业务数据。
51.本技术可以应用于如下场景：当需要预测用户的信贷风险时，可以采用本技术的方案，确定多个交易对象的对象特征。然后，根据每个交易对象的对象特征和用户交易流水中包含的交易对象确定用户的用户特征，后续，通过信贷风险预测模型识别用户特征，即可输出该用户对应的信贷风险概率。进一步地，基于用户对应的信贷风险概率可以进行风险预测或者风险评估等等。
52.当需要进行推荐时，可以采用本技术的方案，确定多个交易对象的对象特征。然后，根据每个交易对象的对象特征和用户交易流水中包含的交易对象，将多个交易对象中与用户交易流水中包含的交易对象相似的交易对象确定为待推荐交易对象，并向用户推荐待推荐交易对象。
53.当需要更新黑名单时，可以采用本技术的方案，确定多个交易对象的对象特征。然后，根据每个交易对象的对象特征和黑名单中包含的黑交易对象的对象特征确定多个交易对象中需要添加到黑名单中的交易对象，并将确定出来的交易对象添加至黑名单中。后续，还可以基于更新后的黑名单和用户交易流水中的交易对象，向用户发送提醒消息，以使用户在和黑名单中的黑交易对象进行交易时提高警惕，谨慎交易，从而降低交易风险系数。
54.请参见图1，图1是本技术实施例提供的一种数据处理系统的结构示意图。服务器140以及计算机设备集群，其中，计算机设备集群可以包括：计算机设备110、计算机设备120、...、计算机设备130等。计算机设备集群与服务器140可以通过有线或无线通信方式进行直接或间接地连接，本技术在此不做限制。
55.图1所示的服务器140可以是独立的物理服务器，也可以是多个物理服务器构成的服务器集群或者分布式系统，还可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、cdn(content delivery network，内容分发网络)、以及大数据和人工智能平台等基础云计算服务的云服务器。
56.图1所示的计算机设备110、计算机设备120、计算机设备130等可以是手机、平板电脑、笔记本电脑、掌上电脑、移动互联网设备(mid，mobile internet device)、车辆、路边设备、飞行器、可穿戴设备，例如智能手表、智能手环、计步器等，等具有数据处理功能的智能设备。
57.以计算机设备110为例，计算机设备110获取用户交易流水集合，所述用户交易流水集合包括n个交易对象，n是正整数。计算机设备110将用户交易流水集合发送至服务器140。服务器140根据n个交易对象的交易顺序，构建交易对象拓扑图，其中，交易对象拓扑图包括n个对象顶点，n个对象顶点与n个交易对象之间一一对应。服务器140从交易对象拓扑图中抽取交易对象序列，并根据交易对象序列确定每个交易对象的对象特征。
58.后续，当服务器140获取到目标用户的业务请求时，服务器140可以根据每个交易对象的对象特征以及目标用户的交易流水确定业务数据。其中，业务请求携带目标用户的交易流水。然后，服务器140将业务数据发送至计算机设备110，进一步地，计算机设备110可以根据业务数据在不同的业务场景中用来评价用户的业务属性。
59.需要说明的是，根据n个交易对象的交易顺序，构建交易对象拓扑图，以及从交易对象拓扑图中抽取交易对象序列，并根据交易对象序列确定每个交易对象的对象特征，也可以由计算机设备110或者计算机设备集群中任意的计算机设备来执行。
60.可以理解的是，本技术实施例描述的系统架构示意图是为了更加清楚的说明本技术实施例的技术方案，并不构成对于本技术实施例提供的技术方案的限定，本领域普通技术人员可知，随着系统架构的演变和新业务场景的出现，本技术实施例提供的技术方案对于类似的技术问题，同样适用。
61.请参见图2a，图2a是本技术实施例提供的一种用户交易流水集合的场景示意图。本技术中，可以选定一批建模样本，即选取一部分样本用户在一段时间内的交易流水信息，例如可以选取该批用户中每个用户在三个月内的交易流水信息。其中，交易流水信息可以包括用户的交易账号，用户的交易对象以及交易时间等。其中，每个用户的交易账号可以是每个用户在不同的交易对象中的交易账号，也可以统一为每个用户对应的身份标识。最后，将该批用户中每个用户对应的交易流水信息组合为用户交易流水集合。
62.具体实现时，如图2a所示，用户交易流水集合中，具体可以包括每个用户对应的原始用户交易序列，并且每个原始用户交易序列中所有的交易对象之间是按照各个交易对象对应的交易时间的先后顺序进行排序的。当然，图2a所示的用户交易流水集合中的用户数量以及各个用户对应的交易流水信息中包括的交易对象的数量仅仅用于示例，实际情况中，可根据具体场景选定相应数量的用户，或者选择相应时长内的交易流水信息，本技术实施例对此不作限定。例如，对于用户1，用户1对应的交易流水信息可以包括商户1、商户2以及商户3等等，对于用户2，用户3对应的交易流水信息可以包括商户3、商户4、商户1、商户4以及商户5等等。
63.请参见图2b，图2b是本技术实施例提供的一种交易对象拓扑图的场景示意图。具体实现时，计算机设备可以根据图2a中用户交易流水集合中所包含的n个交易对象的交易顺序，构建交易对象拓扑图。其中，交易对象拓扑图包括n个对象顶点，n个对象顶点与n个交易对象之间一一对应，图2b所示的交易对象拓扑图中包含6个交易对象，分别为商户1、商户2、商户3、商户4、商户5和商户6。
64.举例来说，以用户1为例，用户1的原始用户交易序列中有先在商户1消费，之后再商户2消费。那么在交易对象拓扑图中，商户1和商户2商户之间就会有一条直连边，权重为1。若用户1还有[商户1————商户2]这样的关系对，则每出现一次权重加1。同样地，其他用户的原始用户交易序列中若有[商户1————商户2]这样的关系对，则商户网络中的[商户1————商户2]边权重按出现次数增加相应的权重。通过遍历建模样本的所有支付关系对后，得到由建模样本的用户交易流水集合构成的交易对象拓扑图。
[0065]
请参见图2c，图2c是本技术实施例提供一种交易对象序列的场景示意图。在一种可能的实现方式中，计算机设备可以从交易对象拓扑图中抽取交易对象序列，交易对象序列的数量为多个。具体实现时，基于建模样本构建的交易对象拓扑图，针对图2b中的每个交易对象，在交易对象拓扑图中进行随机游走。在随机游走中，有两种策略，一种是广度优先搜索(breadth first search，bfs)，一种是深度优先搜索(depth first search，dfs)。通过随机游走，可以生成多个交易对象序列。
[0066]
在一种可能的实现方式中，计算机设备可以根据图2c得到的交易对象序列确定每个交易对象的对象特征。具体实现时，计算机设备可以通过词嵌入模型识别每个交易对象序列，词嵌入模型具体可以为word2vec模型，word2vec模型具体可以为skip-gram模型(调字模型)或者cbow模型(连续词袋模型)。
[0067]
如图2d所示，图2d是本技术实施例提供的一种确定对象特征的场景示意图。以skip-gram模型为例进行说明，将每个交易对象序列依次输入skip-gram模型中，通过skip-gram模型可以预测每个交易对象的前后交易对象，假设skip-window＝1，即可以预测每个交易对象的前一个交易对象以及该交易对象的后一个交易对象。依次类推，通过交易对象序列对skip-gram模型的训练，得到训练后的业务预测模型。其中，业务预测模型包括输入层、隐藏层以及输出层，然后通过训练后的业务预测模型的输入层和隐藏层，对每个交易对象进行预测，得到每个交易对象的对象特征，对象特征具体可以为特征向量或者特征矩阵。
[0068]
在一种可能的实现方式中，当获取到目标用户的业务请求时，计算机设备可以图2d得到的每个交易对象的对象特征以及业务请求中所携带的目标用户的交易流水确定业务数据。如图2e所示，图2e是本技术实施例提供的一种推荐业务数据的场景示意图。根据每个交易对象的对象特征和交易流水可以确定用户的业务特征，然后可以将业务特征输入到业务预测模型中，输出该用户对应的业务数据。
[0069]
在一种可能的实现方式中，可以根据每个交易对象的对象特征和目标用户的交易流水确定目标用户的业务特征。如图2f所示，图2f是本技术实施例提供的一种确定业务特征的场景示意图。举例来说，若用户1的交易流水包括商户1消费两次，商户2消费一次，商户3消费一次。则用户的业务特征可以为：业务特征＝2*商户1对象特征 1*商户2对象特征 1*商户3对象特征。最终得到的用户的业务特征可以是向量，也可以是矩阵。
[0070]
在一种可能的实现方式中，可以根据每个交易对象的对象特征构造决策树，然后再根据决策树和目标用户的交易流水确定目标用户的业务特征。如图2g所示，图2g是本技术实施例提供的一种构建决策树的场景示意图。如图2h所示，可以将商户2、商户4、商户3、商户6、商户5和商户1通过聚类算法构造决策树，得到a、b、c三个聚类，其中a类包括商户1和商户6，b类包括商户4和商户2，c类包括商户3和商户5。然后，根据a、b、c聚类，通过聚类算法可以生成决策树，决策树可以为二叉树。最后，基于决策树可以得到用户的业务特征，例如，用户在a类消费但是没有在b类消费为业务特征1，用户没有在a类消费，但是有在c类消费为业务特征2。可以用“01”变量来分别表示用户的业务特征。
[0071]
需要说明的是，本技术实施例具体可应用到如下场景：推荐场景、业务预测场景以及风险提示场景。
[0072]
在一种可能的实现方式中，当计算机设备获取到目标用户的业务请求时，可以根据每个交易对象的对象特征以及业务请求中携带的目标用户的交易流水确定业务数据。举例来说，交易流水具体可以为用户浏览购物应用程序产生的浏览数据，例如，用户在三个月内在该浏览购物应用程序中浏览的商品(交易对象)为商品a，商品b和商品c，商品a的对象特征为对象特征a，商品b的对象特征为对象特征b，商品c的对象特征为对象特征c。根据图2d中得到的每个交易对象的对象特征，从每个交易对象中分别选择与对象特征a，对象特征b和对象特征c之间的特征距离较小的交易对象，将选择出来的交易对象作为用户的业务数据。具体的，本技术实施例可具体应用到推荐场景，如图2h所示，图2h是本技术实施例提供的一种推荐业务数据的场景示意图。用户三个月内在购物应用程序中浏览的商品包括雨伞，托特包以及眉笔，则当下一次用户再次浏览该购物应用程序时，则可以将与雨伞，托特包以及眉笔相关的商品，如雨衣，贝壳包以及眼线笔推荐给该用户。
[0073]
请参见图3，图3为本技术实施例提供的一种数据处理的流程示意图。该方法应用
于计算机设备，如图3所示，该数据处理方法可包括步骤s310～s340。其中：
[0074]
步骤s310：获取用户交易流水集合，所述用户交易流水集合包括n个交易对象的交易顺序，n是正整数。
[0075]
具体实现时，可以选定一批建模样本，即选取一部分样本用户在一段时间内的交易流水信息，例如可以选取该批用户中每个用户在三个月内的交易流水信息。其中，交易流水信息可以包括用户的交易账号，用户的交易对象以及交易时间等。其中，每个用户的交易账号可以是每个用户在不同的交易对象中的交易账号，也可以统一为每个用户对应的身份标识。最后，将该批用户中每个用户对应的交易流水信息组合为用户交易流水集合。举例来说，可以利用用户在某某支付中心的交易流水，提取用户的交易账号，用户的交易对象以及交易时间等。以实际应用为例，可以提取样本用户的近3个月交易流水。
[0076]
举例来说，如图2a所示，用户交易流水集合中，具体可以包括每个用户对应的原始用户交易序列，并且每个原始用户交易序列中所有的交易对象之间是按照各个交易对象对应的交易时间的先后顺序进行排序的。当然，图2a所示的用户交易流水集合中的用户数量以及各个用户对应的交易流水信息中包括的交易对象的数量仅仅用于示例，实际情况中，可根据具体场景选定相应数量的用户，或者选择相应时长内的交易流水信息，本技术实施例对此不作限定。例如，对于用户1，用户1对应的交易流水信息可以包括商户1、商户2以及商户3等等，对于用户2，用户3对应的交易流水信息可以包括商户3、商户4、商户1、商户4以及商户5等等。
[0077]
当然，选定样本用户对应的交易流水信息的时间段可以根据具体场景做相应地调整，若某场景对建模样本的准确性要求比较高，则需要更准确更全面的交易流水信息，那么，可以选取样本用户中每个用户在一年内的交易流水信息。若某场景对建模样本的准确性要求较低，则为了降低建模成本，那么，可以选取样本用户中每个用户在一周内的交易流水信息等等，本技术对此不做具体限定。
[0078]
在一种可能的实现方式中，将获取到的每个样本用户的交易流水信息可以按照每个用户的单位交易流水信息组合为用户交易流水集合。例如，用户1对对应的交易流水信息为用户交易序列1，用户2对应的交易流水信息为用户交易序列2，用户n对应的交易流水信息为用户交易序列n。每个用户交易序列中包括对应用户的交易对象，并且交易对象之间按照交易时间的先后顺序进行排列。当然，也可以将获取到的所有样本用户的的交易流水信息构建为一个用户交易序列，该用户交易序列中所有的交易对象按照交易时间的先后顺序进行排列。
[0079]
步骤s320：根据所述n个交易对象的交易顺序，构建交易对象拓扑图，所述交易对象拓扑图包括n个对象顶点，n个对象顶点与n个交易对象之间一一对应。
[0080]
具体实现时，计算机设备根据用户交易流水集合构建交易对象拓扑图，具体的，计算机设备根据n个交易对象的交易顺序，构建交易对象拓扑图。交易对象拓扑图是由n个对象顶点和对象顶点与对象顶点之间的连接边构成的，但是不一定任意两个对象顶点之间都存在连接边，对象顶点与对象顶点之间的连接边的数量可以为一条也可以为多条。举例来说，如图2b所示，图2b为一种交易对象拓扑图的示意图，如图2b，商户1与商户5之间不存在连接边，商户2和商户3之间存在两条连接边。
[0081]
在一种可能的实现方式中，交易对象拓扑图包括第一对象顶点和第二对象顶点，
其中，第一对象顶点和第一交易对象对应，第二对象顶点和第二交易对象对应，用户交易流水集合包括多个原始用户交易序列，若多个原始用户交易序列中存在第一交易对象和第二交易对象的关系对，则第一对象顶点和第二对象顶点之间存在连接边。第一交易对象和第二交易对象的关系对是指第一交易对象和第二交易对象在原始用户交易序列中相邻。举例来说，如图2a中的商户1和商户2，商户2和商户3，商户3和商户4等等。原始用户交易序列是由用户1对应的用户交易序列，用户2对应的用户交易序列，用户3对应的用户交易序列，用户4对应的用户交易序列组成的。
[0082]
在一种可能的实现方式中，第一对象顶点和第二对象顶点之间的连接边权重，是根据第一交易对象和第二交易对象的关系对在多个原始用户交易序列中的出现频次确定的。具体的，第一对象顶点和第二对象顶点之间的连接边权重可以等于第一交易对象和第二交易对象的关系对在多个原始用户交易序列中的出现频次；第一对象顶点和第二对象顶点之间的连接边权重也可以为第一交易对象和第二交易对象的关系对在多个原始用户交易序列中的出现频次的k倍。
[0083]
举例来说，如图2a所示的用户交易流水集合，以用户1为例，用户1的交易序列中有先在商户1消费，之后再商户2消费，那么在商户网络中，商户1和商户2商户之间就会有一条连接边，权重可以为1，若用户1还有[商户1————商户2]这样的关系对，则每出现一次权重加1。同样地，其他用户的交易序列中若有[商户1————商户2]这样的关系对，则商户网络中的[商户1————商户2]边权重按出现次数增加相应的权重。通过遍历建模样本的所有支付关系对后，得到由建模样本用户交易流水构成的商户网络(即交易对象拓扑图)。
[0084]
步骤s330：从所述交易对象拓扑图中抽取交易对象序列，根据所述交易对象序列确定每个交易对象的对象特征。
[0085]
具体实现时，计算机设备可以通过随机游走的方式遍历交易对象拓扑图，得到多个交易对象序列。其中，随机游走方式包括广度优先搜索方式或者深度优先搜索方式。并且，交易对象序列的数量为多个，每个交易对象序列中的交易对象的数量均等于参考数量阈值。
[0086]
举例来说，请参见图4a，图4a是本技术实施例提供的一种随机游走的流程示意图。如图4a所示，可以认为u跟s1，s2，s3，s4它们是相似的，它们是网络中直接的邻居，这时称为homophily(同质性)；也可以认为u应该跟s6更相似，这种称为结构相似，structural equivalence(结构对等性)。要想从一个节点去寻找它的直接邻居，就要通过bfs(广度优先搜索)，而如果想找到那些结构相似的，就需要“走出去”，因此就需要通过dfs(深度优先搜索)。即对于节点u来说，广度优先搜索为遍历节点s1，或者遍历节点s2，s或者遍历节点s3；深度优先搜索为遍历节点s4，节点s5，直到遍历至节点s6。
[0087]
在一种可能的实现方式中，可以通过参数来使随机游走更偏重哪种策略。即通过设置参数使随机游走方式为广度优先搜索方式或者深度优先搜索方式。具体地，如图4b所示，图4b是本技术实施例提供的另一种随机游走的流程示意图。假设从节点t开始了一个random walk(随机游走)，现在到达了节点v。如果采取bfs策略的话，应该走到x1，因为v和x1都是t节点的直接邻居；如果采取dfs策略的话，应该走向x2或者x3，因为它们和t都中间隔了一步；当然，也可能又返回到了t节点。于是两个节点之间的转移概率为公式1：
[0088]
π
vx
＝α
pq
(t,x).ω
vx
ꢀꢀ
(1)
[0089]
公式(1)中，w为两节点的边权重，t，即交易对象拓扑图中的边权重。α为search bias(搜索偏置)，搜索偏置定义为公式2：
[0090][0091]
公式2中，一个节点的下一步怎么走，取决于它的上一步和下一步的关系。如图4b所示，v是当前的节点，t是v的上一步所在节点，而x代表下一步的位置。d(t，x)代表t和x之间的最短距离：
[0092]
当d＝0时，就是从v又回到t节点的意思，这个时候搜索偏置为1/p，可以理解为以1/p的概率返回上一步；
[0093]
当d＝1时，则x为t的直接邻居，相当于bfs，这时的搜索偏置为1；
[0094]
当d＝2时，则x是t邻居的邻居，相当于dfs，这时的搜索偏置为1/q；
[0095]
p为return parameter(返回参数)，因为p控制着回到原节点的概率；q为in-out parameter(输入输出参数)，因为它控制着bfs和dfs的关系。具体的，q控制着游走是向外还是向内，若q》1，随机游走倾向于访问和t接近的顶点(偏向bfs)；若q《1，倾向于访问远离t的顶点(偏向dfs)。
[0096]
综上所述，可以设置不同的参数p和参数q，就可以得到不一样偏重的node sequence(节点序列)。在训练模型的时候，可以使用grid search(网格搜索)方式来寻找最优的参数p和参数q。当然，也可以根据具体场景的需要来选择参数p和参数q。举例来说，本方案采用了bfs策略，其中p为1，q为2，进行随机游走，生成长度为10的新交易序列(交易对象序列)。其中，10为参考数量阈值，参考数量阈值可以由用户提前指定。其中，交易对象序列的数量可以为一个，也可以为多个，通常情况下，交易对象序列的数量为多个。
[0097]
在一种可能的实现方式中，计算机设备根据交易对象序列，训练词嵌入模型，其中，词嵌入模型包括输入层、隐藏层和输出层。当训练后的词嵌入模型满足模型收敛条件时，调用训练后的词嵌入模型中的输入层和隐藏层，识别n个交易对象，得到每个交易对象的对象特征。
[0098]
具体实现时，词嵌入模型包括但不限于：单词表示的全局向量(global vectors for word representation，glove)模型，word2vec模型等。word2vec模型具体可以为skip-gram模型(调字模型)或者cbow模型(连续词袋模型)。其中，以word2vec模型为例进行说明，word2vec模型的用处是将文本中的词转变为其上下文环境所决定的词向量。根据语义信息表示的分布假说，关键词的语义表示不在于其本身，而在于其所处的上下文环境。因此每个关键词与不同的词的组合在文本中出现的概率分布是可以通过神经网络学习得到的。
[0099]
举例来说，如图4c所示，图4c是本技术实施例提供的一种词嵌入模型的模型示意图。若词嵌入模型为skip-gram模型，将交易对象序列中某个交易对象作为输入，则输出该对象对应的前后相邻交易对象的概率。前后分别相邻的交易对象的数量可以根据窗口大小skip-window决定，具体的，skip-window＝2，则代表输出与该交易对象前项2个相邻的交易对象的概率和与该交易对象后项2个相邻的交易对象的概率。若交易对象序列为图2c中的
第一个序列，则将商户3输入skip-gram模型中，若窗口大小为1，则通过词嵌入模型可以输出与商户3前项相邻的交易对象的概率和输出与商户3后项相邻的交易对象的概率。
[0100]
在一种可能的实现方式中，计算机设备根据交易对象序列，训练词嵌入模型具体包括如下过程：首先，计算机设备获取交易对象序列中每个交易对象的对象标识；其次，计算机设备通过词嵌入模型识别每个交易对象的对象标识，得到每个交易对象对应的预测对象标签；然后，计算机设备根据每个交易对象对应的预测对象标签和每个交易对象对应的对象标识，调整词嵌入模型的模型参数。具体地，模型参数可以包括隐藏层的权重矩阵，通常来说，输入层的权重矩阵可以为n
×
768维的矩阵，隐藏层的权重矩阵可以为n
×
300的矩阵，从输入层到隐藏层之间矩阵维度的变化可以基于降维算法，降维算法可以包括但不限于主成分分析(principal components analysis，pca)算法，或者等距特征映射(isometric mapping，isomap)算法。
[0101]
在一种可能的实现方式中，交易对象的对象标识可以是构建好交易对象拓扑图之后，计算机设备自动为每个交易对象生成的，并且，每个交易对象的对象标识为由“01”变量构成的字符串，字符串长度等于交易对象拓扑图中所包含的对象顶点的数量n。举例来说，若n＝6，则交易对象1对应的对象标识可以为100000，交易对象2对应的对象标识可以为010000，交易对象3对应的对象标识可以为001000，交易对象4对应的对象标识可以为000100交易对象5对应的对象标识可以为000010，交易对象6对应的对象标识可以为000001。
[0102]
需要说明的是，所谓模型收敛条件可以是指：当词嵌入模型的训练次数达到预设训练阈值时，例如100次，则词嵌入模型满足模型收敛条件；当每个交易对象对应的预测对象标签和每个交易对象对应的对象标识之间的误差小于误差阈值时，则词嵌入模型满足模型收敛条件；当词嵌入模型相邻两次训练得到的每个交易对象对应的预测对象标签之间的变化小于变化阈值时，则词嵌入模型满足模型收敛条件。
[0103]
在一种可能的实现方式中，训练好的词嵌入模型在投入使用的过程中，通常会去掉输出层，只需通过训练后的输入层和隐藏层即可进行模型预测。因此，将训练好的词嵌入模型的的输入层和隐藏层用来识别n个交易对象，即可输出每个交易对象的对象特征。其中，对象特征具体可以为特征向量或者特征矩阵。如图2d所示，将交易对象序列输入训练好的词嵌入模型的输入层和隐藏层中，隐藏层输出每个交易对象的向量表达，即每个交易对象的对象特征。例如，商户2的对象特征可以为[x11，x12，...，x1n]，商户3的对象特征可以为[x21，x22，...，x2n]，商户4的对象特征可以为[x31，x32，...，x3n]等等。
[0104]
步骤s340：当获取到目标用户的业务请求时，根据所述每个交易对象的对象特征以及所述目标用户的交易流水确定所述目标用户的业务数据，所述业务请求携带所述目标用户的交易流水。
[0105]
具体实现时，目标用户可以为建模样本中的样本用户，业务数据可以为业务标签。本技术实施例具体可应用到如下场景：推荐场景、业务预测场景以及风险提示场景。那么，在具体业务场景不同的情况下，业务数据也不相同。具体的，推荐场景的业务数据可以为与交易流水相关的数据，例如交易流水包括多个交易对象，则在推荐场景中业务数据同样为交易对象，具体来说业务数据对应的交易对象是与用户中的交易对象之间有关联关系的交易对象。在业务预测场景中，业务数据包括业务标签，例如信贷场景中，业务标签可以为逾
期和不会逾期，业务标签也可以为通过和不通过等等。在风险提示场景中，业务数据包括提示消息，提示消息可以为提示用户防止被不良商家盗取钱财或者防止重要信息泄露等。
[0106]
通过本技术实施例提供的数据处理方法，可以通过用户交易流水集合构建交易对象拓扑图，并且可以从交易对象拓扑图中抽取交易对象序列，然后根据交易对象序列可以确定每个交易对象的对象特征。通过交易对象之间的交易顺序确定交易对象的对象特征，可以从动态角度挖掘到交易对象之间的隐性相关性，相比于现有方式只通过交易对象本身静态属性确定交易对象的对象特征，本技术得到的对象特征更加准确。后续，后续，当用户提交业务请求时，可以根据每个交易对象的对象特征和业务请求中携带的用户的交易流水确定该用户的业务数据。进一步地，从而提高了业务数据的准确性。另外，根据具体场景的不同，确定的业务数据不同，可以广泛用于多种业务场景，提高了确定出的每个交易对象的对象特征的实用性。
[0107]
请参见图5，图5是本技术实施例提供的另一种数据处理方法的流程图。图5为本技术实施例提供的一种数据处理的流程示意图。该方法应用于计算机设备，如图5所示，该数据处理方法可包括步骤s510～s550。其中：
[0108]
步骤s510：获取用户交易流水集合，所述用户交易流水集合包括n个交易对象的交易顺序，n是正整数。
[0109]
步骤s520：根据n个交易对象的交易顺序，构建交易对象拓扑图，所述交易对象拓扑图包括n个对象顶点，n个对象顶点与n个交易对象之间一一对应。
[0110]
步骤s530：从所述交易对象拓扑图中抽取交易对象序列，根据所述交易对象序列确定每个交易对象的对象特征。
[0111]
需要说明的是，步骤s510～步骤s530中计算机设备执行的操作步骤具体可参见图3实施例中步骤s310～步骤s330中计算机设备执行的操作步骤，本技术对此不作限定。
[0112]
步骤s540：当获取到目标用户的业务请求时，根据所述每个交易对象的对象特征，以及所述目标用户的交易流水确定所述目标用户的业务特征。
[0113]
具体实现时，业务特征可以为特征向量或者特征矩阵或者变量等等，可根据具体业务场景不同做具体分析，本技术对此不作具体限定。
[0114]
在一种可能的实现方式中，目标用户的交易流水包括多个参考交易对象和每个参考交易对象的数量，n个交易对象包括多个参考交易对象。具体的，计算机设备根据每个交易对象的对象特征，以及目标用户的交易流水确定目标用户的业务特征，具体可以包括：首先，计算机设备根据每个交易对象的对象特征，确定每个参考交易对象的对象特征；然后，计算机设备根据每个参考交易对象的对象特征和每个参考交易对象的数量，获取目标用户的业务特征。
[0115]
举例来说，若用户1的交易流水包括用户1在商户1消费两次，商户2消费一次，商户3消费一次。则根据图3实施例中所确定的各个交易对象的对象特征，可以得到商户1的对象特征为对象特征1，对象特征1假设为[x61，x62，...，x6n]，商户2的对象特征为对象特征2，对象特征2假设为[x11，x12，...，x1n]，商户3的对象特征为对象特征3，对象特征3假设为[x21，x22，...，x2n]。则可以确定用户1的业务特征为user1＝2*[x61，x62，...，x6n] [x11，x12，...，x1n] [x21，x22，...，x2n]。
[0116]
在一种可能的实现方式中，计算机设备根据每个交易对象的对象特征，以及目标
用户的交易流水确定目标用户的业务特征，具体可以包括：首先，计算机设备根据每个交易对象的对象特征，对n个交易对象进行聚类，得到k个聚类结果，k为正整数。然后，计算机设备根据k个聚类结果和用户交易流水集合，构造决策树。最后，计算机设备根据决策树和目标用户的交易流水，确定目标用户的业务特征。
[0117]
具体实现时，计算机设备可以根据每个交易对象的对象特征，采用聚类算法对n个交易对象进行聚类，得到k个聚类结果。其中，聚类算法具体可以为k均值聚类算法。k-means算法(k均值聚类算法)是无监督的聚类算法，它实现起来比较简单，聚类效果也不错，因此应用很广泛。k-means算法的思想很简单，对于给定的样本集，按照样本之间的距离大小，将样本集划分为k个簇。让簇内的点尽量紧密的连在一起，而让簇间的距离尽量的大。
[0118]
如果用数据表达式表示，假设簇划分为(c1，c2，...，ck)，则我们的目标是最小化平方误差e，e的表达式如公式3：
[0119][0120]
其中，ui是簇ci的均值向量，有时也称为质心，表达式为公式4：
[0121][0122]
如果我们想直接求公式3的最小值并不容易，这是一个np难的问题，因此只能采用启发式的迭代方法。
[0123]
举例来说，如图6a所示，图6a是本技术实施例提供的一种聚类方法的流程示意图。图6a中的(a)图表达了初始的数据集，假设k＝2。在图6a中的(b)图中，随机选择了两个k类所对应的类别质心，即图中的实线叉叉质心和虚线叉叉质心，然后分别求样本中所有点到这两个质心的距离，并标记每个样本的类别为和该样本距离最小的质心的类别。如图6a中的(c)图所示，经过计算样本(每个交易对象的对象特征)和实线叉叉质心和虚线叉叉质心的距离，可以得到所有样本点的第一轮迭代后的类别。此时对当前标记为圆形和三角形的点分别求其新的质心，如图6a中的(d)图所示，新的实线叉叉质心和虚线叉叉质心的位置已经发生了变动。图6a中的(e)图和图6a中的(f)图重复了图6a中的(c)图和图6a中的(d)图的过程，即将所有点的类别标记为距离最近的质心的类别并求新的质心。最终，可以得到的两个类别如图6a中的(f)图。当然在实际k-mean算法中，一般会多次运行图6a中的(c)图和图6a中的(d)图，才能达到最终的比较优的类别。
[0124]
具体实现时，计算机设备根据k个聚类结果和用户交易流水集合，可以通过决策树算法构造决策树。其中，决策树算法包括但不限于：id3算法，c4.5算法，c5.0算法和分类和回归树(classification and regression tree，cart)算法。下面，以id3算法为例进行详细说明：id3算法由增熵(entropy)原理来决定哪个做父节点，哪个节点需要分裂。对于一组数据，熵越小说明分类结果越好。熵定义如公式5：
[0125][0126]
公式5中，p(x_i)为x_i出现的概率。假如是二分类问题，当a类和b类各占50％的时候，entropy＝-(0.5*log_2(0.5) 0.5*log_2(0.5))＝1。
[0127]
当只有a类，或只有b类的时候，entropy＝-(1*log_2(1) 0)＝0
[0128]
所以当entropy最大为1的时候，是分类效果最差的状态，当它最小为0的时候，是完全分类的状态。因为熵等于零是理想状态，一般实际情况下，熵介于0和1之间。熵的不断最小化，实际上就是提高分类正确率的过程。
[0129]
为了避免分割太细，c4.5算法对id3算法进行了改进，c4.5算法中，优化项要除以分割太细的代价，这个比值叫做信息增益率，显然分割太细分母增加，信息增益率会降低。信息增益率的表达式如公式6：
[0130][0131]
公式6中，属性a的可能取值数目越多(即v越大)，则iv(a)的值通常就越大。当然，除了熵和信息增益率来决定生成决策树之外，还可以采用信息增益，基尼指数(gini指数)等参数来决定生成决策树。具体的，gini指数：总体内包含的类别越杂乱，gini指数就越大(跟熵的概念很相似)。
[0132]
举例来说，如图6b所示，图6b是本技术实施例提供的一种样本数据的表格示意图。已知一共有十个样本(学生数量)，每个样本有分数，出勤率，回答问题次数，作业提交率四个属性，最后判断这些学生是否是好学生。通过id3算法可以构造决策树，决策树构建主要分为以下两个步骤。1.节点的分裂：一般当一个节点所代表的属性无法给出判断时，则选择将这一节点分成2个子节点(如不是二叉树的情况会分成n个子节点)；2.阈值的确定：选择适当的阈值使得分类错误率最小(training error)。最终构建的决策树如图6c所示。
[0133]
举例来说，首先，可以通过k-means算法将n个交易对象的对象特征进行聚类，假设n＝6，k＝3，则聚类后得到a，b，c三个聚类结果。然后，通过cart算法对a，b，c三个聚类结果以及用户交易流水集合进行决策树构建。其中，用户交易流水集合中包括每个用户的样本业务标签，决策树可以为二叉树，也可以为n叉树。根据每个用户的样本业务标签和k个聚类结果，可以生成如图2g所示的决策树。
[0134]
最后，生成决策树之后，根据目标用户的交易流水和决策树，确定目标用户的业务特征。业务特征可以为“01”变量，具体的，若根据决策树和用户1的交易流水确定用户1对应的规则为：在a类有消费和在b类有消费，则用户1的业务特征可以为“1”；若根据决策树和用户1的交易流水确定用户1对应的规则为：在a类无消费和在c类有消费，则用户1的业务特征可以为“0”；若根据决策树和用户1的交易流水确定用户1对应的规则为：在a类有消费和在b类无消费，则用户1的业务特征可以为“0”；若根据决策树和用户1的交易流水确定用户1对应的规则为：在a类无消费和在c类无消费，则用户1的业务特征可以为“0”。
[0135]
步骤s550：调用业务预测模型对所述业务特征进行预测处理，确定所述目标用户的业务标签。
[0136]
其中，业务预测模型可以进行业务预测，例如业务预测模型具体可以为信贷模型，还可以为对象推荐模型，还可以为风险预测模型等等。
[0137]
在一种可能的实现方式中，基于得到的业务特征，可以将业务特征作为一个新增加的特征变量输入到业务预测模型中。当然，输入业务预测模型的特征本来应该包括目标用户的性别、年龄以及工作职业等等基本属性信息。具体实现时，业务预测模型输出的可以
是目标用户在该业务领域的业务概率，例如，业务预测模型可以为信贷模型，则业务预测模型输出的可以为目标用户的逾期可能性的业务概率。计算机设备可以获取参考概率阈值，参考概率阈值可以是由用户事先设置的，假设参考概率阈值为80％，若信贷模型输出的目标用户对应的业务概率为90％，则该目标用户对应的业务标签为会逾期。又如，业务预测模型还可以用于预测学生的是否通过考试，同理，输出的业务标签为通过或者不通过，具体来说，假设参考概率阈值为78％，若业务预测模型输出的目标用户对应的业务概率为88％，则该目标用户对应的业务标签为通过。
[0138]
通过本技术实施例所提供的方法，通过用户的交易流水构建的交易对象拓扑图，基于这个交易对象拓扑图通过node2vec得到每个交易对象的矢量特征，通过聚类后，得到的是隐性的相似商户。这种隐性的相似商户区别于我们按行业进行划分的商户分类(餐饮、网购、交通等等)，按商户隐性的相似商户归到了一类。基于得到的新的隐性分类，可以挖掘到了交易数据中新的信息，从而得到用户的业务特征，将业务特征输入到业务预测模型中从而得到用户的业务数据。由于挖掘到了新的信息，使得确定的业务数据更加准确。进一步地，基于得到的隐性相似的交易对象，还可以将业务特征应用到推荐场景或者风险支付场景中，应用领域较为广泛。
[0139]
请参见图7，图7是本技术实施例提供的一种方法的流程示意图。该方法应用于计算机设备，图7实施例为图3实施例中步骤s340的一个具体实施例，具体地，业务数据包括提示消息。如图7所示，该数据处理方法可包括步骤s710～s740。其中：
[0140]
步骤s710：根据所述每个交易对象的对象特征，确定每个参考交易对象的对象特征。
[0141]
具体实现时，目标用户的交易流水包括多个参考交易对象，n个交易对象包括多个参考交易对象。举例来说，n个交易对象可以具体为6个，分别为商户1、商户2、商户3、商户4、商户5以及商户6，目标用户的交易流水可以包括商户1、商户2、商户3。则基于商户1的对象特征，商户2的对象特征，商户3的对象特征，商户4的对象特征，商户5的对象特征，以及商户6的对象特征，可以确定参考交易对象的对象特征，即等于商户1的对象特征，商户2的对象特征，商户3的对象特征。对象特征可以为特征向量或者特征矩阵，本技术实施例对此不作限定。
[0142]
步骤s720：获取黑名单列表，所述黑名单列表中包括一个或者多个黑交易对象以及每个黑交易对象的对象特征。
[0143]
具体实现时，黑交易对象可以是指存在不合理营业，或者违法违纪操作的对象。黑名单列表中每个黑交易对象与对象特征一一对应，需要说明的是，黑交易对象的对象特征也可以是特征向量或者特征矩阵，并且，黑交易对象的对象特征应当与参考交易对象的对象特征的数据形式相同，例如，黑交易对象的对象特征为特征向量，参考交易对象的对象特征也为特征向量；或者，黑交易对象的对象特征为特征矩阵，参考交易对象的对象特征也为特征矩阵。若黑交易对象的对象特征应当与参考交易对象的对象特征的数据形式不相同，即黑交易对象的对象特征为特征向量，参考交易对象的对象特征为特征矩阵，则可以通过数据转换使得二者的对象特征的数据形式相同。
[0144]
步骤s730：获取所述每个参考交易对象的对象特征和所述每个黑交易对象的对象特征之间的特征距离。
[0145]
在一种可能的实现方式中，本技术实施例具体可以应用于风险提示场景中，某用户的交易流水中的包含的参考交易对象(假设为交易对象x1，x2，x3，...)，则分别计算黑名单列表中的各个黑交易对象(假设为黑交易对象h1，h2，h3，...)的对象特征与参考交易对象(假设为交易对象x1，x2，x3，...)的对象特征之间的特征距离，假设对象特征为特征向量，则将任意两个交易对象的特征向量对应相减然后再求相减得到的向量的距离，即先求平方和再开方，即可得到这两个交易对象之间的特征距离。
[0146]
举例来说，针对任意两个黑交易对象和参考交易对象，假设黑交易对象为h1，参考交易对象为x1，并且h1的对象特征为[a1，a2，a3]，x1的对象特征为[b1，b2，b3]，则h1与x1之间的特征距离如公式7：
[0147][0148]
步骤s740：将所述特征距离小于第一参考距离阈值对应的参考交易对象添加至所述黑名单列表中，并根据所述特征距离小于第一参考距离阈值对应的参考交易对象生成所述提示消息。
[0149]
具体实现时，计算机设备可以将特征距离小于第一参考距离阈值对应的参考交易对象认为是可能为新的黑交易对象，并将新的黑交易对象添加至黑名单列表中，后续，计算机设备可以将黑名单列表发送至相关管理部门，以使相关管理部门对黑交易对象进行进一步监管处理，例如警告处分等等。最后，根据确定出来的交易流水中新的黑交易对象生成提示消息，等到下一次用户进行业务交易的时候，可以提示用户该交易对象可能为黑交易对象，以使用户谨慎交易，提高用户的支付安全性。
[0150]
请参见图8，图8是本技术实施例提供的一种方法的流程示意图。该方法应用于计算机设备，图8实施例为图3实施例中步骤s340的一个具体实施例，具体地，业务数据包括推荐交易对象。如图8所示，该数据处理方法可包括步骤s810～s830。其中：
[0151]
步骤s810：根据所述每个交易对象的对象特征，确定每个参考交易对象的对象特征。
[0152]
具体实现时，目标用户的交易流水包括多个参考交易对象，n个交易对象包括多个参考交易对象。举例来说，n个交易对象可以具体为6个，分别为商户1、商户2、商户3、商户4、商户5以及商户6，目标用户的交易流水可以包括商户1、商户2、商户3。则基于商户1的对象特征，商户2的对象特征，商户3的对象特征，商户4的对象特征，商户5的对象特征，以及商户6的对象特征，可以确定参考交易对象的对象特征，即等于商户1的对象特征，商户2的对象特征，商户3的对象特征。对象特征可以为特征向量或者特征矩阵，本技术实施例对此不作限定。
[0153]
步骤s820：获取所述每个参考交易对象的对象特征与非参考交易对象的对象特征之间的特征距离，所述非参考交易对象是所述n个交易对象中除所述参考交易对象以外的交易对象。
[0154]
具体实现时，假设n个交易对象分别是指x1，x2，x3，x4，x5，x6，参考交易对象为x1，x2，x3，则非参考交易对象是指x4，x5，x6。举例来说，n个交易对象分别可以为商户1、商户2、商户3、商户4、商户5以及商户6，参考交易对象为商户1、商户2、商户3，则非参考交易对象为商户4、商户5以及商户6。进一步地，计算x1的对象特征、x2的对象特征、x3的对象特征分别
与x4的对象特征、x5的对象特征、x6的对象特征之间的特征距离。
[0155]
举例来说，针对任意两个参考交易对象和非参考交易对象，假设参考交易对象为x1，非参考交易对象为x4，并且x1的对象特征为[b1，b2，b3]，x4的对象特征为[c1，c2，c3]，则x1与x4之间的特征距离可以根据图7实施例中的公式7进行计算。
[0156]
步骤s830：将所述特征距离小于第二参考距离阈值对应的非参考交易对象，确定为所述推荐交易对象。
[0157]
具体实现时，第二参考距离阈值可以是由用户预先设置，并且，第一参考阈值与第二参考阈值之间没有关系，即第一参考阈值可以大于第二参考阈值，或者第一参考阈值也可以小于第二参考阈值，或者第一参考阈值也可以等于第二参考阈值。
[0158]
举例来说，本技术实施例具体可以应用于业务推荐场景中，将用户在某购物平台浏览或者交易的交易对象作为交易流水，当用户下一次点开购物平台时，则可以将与用户浏览或者交易的交易对象相关的交易对象推荐给该用户。例如，用户某一段时间内经常浏览在浏览器中浏览与新冠疫情相关的网页消息，则当用户再次点击该浏览器时，可以向该用户推荐新冠疫情截止用户点击该浏览器时候的实时动态消息。进一步地，还可以在购物平台中为该用户推荐可以预防新冠疫情的相关物品，例如口罩、护目镜、防护服等等。
[0159]
通过本技术实施例的方案，基于每个交易对象的对象特征，可以为用户推荐与用户交易流水中的参考交易对象相关的交易对象，以此增加用户在业务平台的浏览量以及点击量，并且可以增加用户的体验感。
[0160]
请参见图9，图9是本技术实施例提供的一种数据处理装置的结构示意图。图9是本技术实施例提供的一种数据处理装置的结构示意图。图7是本技术实施例所提供的一种数据处理装置的结构示意图。该数据处理装置可应用于图3～图8对应的方法实施例中的计算机设备。数据处理装置可以是运行于轻量节点中的一个计算机程序(包括程序代码)，例如该数据处理装置为一个应用软件；该装置可以用于执行本技术实施例提供的方法中的相应步骤。该数据处理装置可包括：
[0161]
获取单元910，用于获取用户交易流水集合，所述用户交易流水集合包括n个交易对象的交易顺序，n是正整数；
[0162]
构建单元920，用于根据所述n个交易对象的交易顺序，构建交易对象拓扑图，所述交易对象拓扑图包括n个对象顶点，n个对象顶点与n个交易对象之间一一对应；
[0163]
处理单元930，用于从所述交易对象拓扑图中抽取交易对象序列，根据所述交易对象序列确定每个交易对象的对象特征；
[0164]
确定单元940，用于当获取到目标用户的业务请求时，根据所述每个交易对象的对象特征以及所述目标用户的交易流水确定所述目标用户的业务数据，所述业务请求携带所述目标用户的交易流水。
[0165]
在一种可能的实现方式中，业务数据包括业务标签；
[0166]
确定单元940根据所述每个交易对象的对象特征以及所述目标用户的交易流水确定所述目标用户的业务数据，包括：
[0167]
根据所述每个交易对象的对象特征，以及所述目标用户的交易流水确定所述目标用户的业务特征；
[0168]
调用业务预测模型对所述业务特征进行预测处理，确定所述目标用户的业务标
签。
[0169]
在一种可能的实现方式中，目标用户的交易流水包括多个参考交易对象和每个参考交易对象的数量，所述n个交易对象包括所述多个参考交易对象；
[0170]
确定单元940根据所述每个交易对象的对象特征，以及所述目标用户的交易流水确定所述目标用户的业务特征，包括：
[0171]
根据所述每个交易对象的对象特征，确定每个参考交易对象的对象特征；
[0172]
根据所述每个参考交易对象的对象特征和所述每个参考交易对象的数量，获取所述目标用户的业务特征。
[0173]
在一种可能的实现方式中，确定单元940根据所述每个交易对象的对象特征，以及所述目标用户的交易流水确定所述目标用户的业务特征，包括：
[0174]
根据所述每个交易对象的对象特征，对所述n个交易对象进行聚类，得到k个聚类结果，k为正整数；
[0175]
根据所述k个聚类结果和所述交易流水集合，构造决策树；
[0176]
根据所述决策树和所述目标用户的交易流水，确定所述目标用户的业务特征。
[0177]
在一种可能的实现方式中，业务数据包括提示消息，所述目标用户的交易流水包括多个参考交易对象，所述n个交易对象包括所述多个参考交易对象；
[0178]
确定单元940根据所述每个交易对象的对象特征以及所述目标用户的交易流水确定所述目标用户的业务数据，包括：
[0179]
根据所述每个交易对象的对象特征，确定每个参考交易对象的对象特征；
[0180]
获取黑名单列表，所述黑名单列表中包括一个或者多个黑交易对象以及每个黑交易对象的对象特征；
[0181]
获取所述每个参考交易对象的对象特征和所述每个黑交易对象的对象特征之间的特征距离；
[0182]
将所述特征距离小于第一参考距离阈值对应的参考交易对象添加至所述黑名单列表中，并根据所述特征距离小于第一参考距离阈值对应的参考交易对象生成所述提示消息。
[0183]
在一种可能的实现方式中，业务数据包括推荐交易对象，所述目标用户的交易流水包括多个参考交易对象，所述n个交易对象包括所述多个参考交易对象；
[0184]
确定单元940根据所述每个交易对象的对象特征以及所述目标用户的交易流水确定所述目标用户的业务数据，包括：
[0185]
根据所述每个交易对象的对象特征，确定每个参考交易对象的对象特征；
[0186]
获取所述每个参考交易对象的对象特征与非参考交易对象的对象特征之间的特征距离，所述非参考交易对象是所述n个交易对象中除所述参考交易对象以外的交易对象；
[0187]
将所述特征距离小于第二参考距离阈值对应的非参考交易对象，确定为所述推荐交易对象。
[0188]
在一种可能的实现方式中，所述交易对象拓扑图包括第一对象顶点和第二对象顶点，所述第一对象顶点和第一交易对象对应，所述第二对象顶点和第二交易对象对应，所述交易流水集合包括多个原始用户交易序列，若多个原始用户交易序列中存在第一交易对象和第二交易对象的关系对，则第一对象顶点和第二对象顶点之间存在连接边；所述第一交
易对象和第二交易对象的关系对是指第一交易对象和第二交易对象在原始用户交易序列中相邻。
[0189]
在一种可能的实现方式中，第一对象顶点和第二对象顶点之间的连接边权重，是根据所述第一交易对象和第二交易对象的关系对在所述多个原始用户交易序列中的出现频次确定的。
[0190]
在一种可能的实现方式中，所述交易对象序列的数量为多个；
[0191]
处理单元930从所述交易对象拓扑图中抽取交易对象序列，包括：
[0192]
通过广度优先搜索方式或者深度优先搜索方式遍历所述交易对象拓扑图，得到多个交易对象序列，所述每个交易对象序列中的交易对象的数量均等于参考数量阈值。
[0193]
在一种可能的实现方式中，处理单元930根据所述交易对象序列确定每个交易对象的对象特征，包括：
[0194]
根据所述交易对象序列，训练词嵌入模型，所述词嵌入模型包括输入层、隐藏层和输出层；
[0195]
当所述训练后的词嵌入模型满足模型收敛条件时，调用所述训练后的词嵌入模型中的输入层和隐藏层，识别所述n个交易对象，得到每个交易对象的对象特征。
[0196]
在一种可能的实现方式中，处理单元930根据所述交易对象序列，训练词嵌入模型，包括：
[0197]
获取所述交易对象序列中每个交易对象的对象标识；
[0198]
通过所述词嵌入模型识别所述每个交易对象的对象标识，得到每个交易对象对应的预测对象标签；
[0199]
根据所述每个交易对象对应的预测对象标签和所述每个交易对象对应的对象标识，调整所述词嵌入模型的模型参数。
[0200]
通过本技术实施例的数据处理装置，计算机设备通过用户交易流水集合可以构建交易对象拓扑图，并且可以从交易对象拓扑图中抽取交易对象序列，然后根据交易对象序列可以确定每个交易对象的对象特征。本方案通过交易对象之间的交易顺序确定交易对象的对象特征，可以从动态角度挖掘到交易对象之间的隐性相关性，相比于现有方式只通过交易对象本身静态属性确定交易对象的对象特征，本技术得到的对象特征更加准确。后续，当用户提交业务请求时，可以根据每个交易对象的对象特征和业务请求中携带的用户的交易流水确定该用户的业务数据。进一步地，从而提高了业务数据的准确性。
[0201]
请参见图10，请参见图10，图10是本技术实施例提供的一种计算机设备的结构示意图。上述图3～图8对应实施例中的终端设备可以为终端设备1000，如图10所示，计算机设备1000可以包括：用户接口1002、处理器1004、编码器1006以及存储器1008。信号接收器1016用于经由蜂窝接口1010、wifi接口1012、...、或nfc接口1014接收或者发送数据。编码器1006将接收到的数据编码为计算机处理的数据格式。存储器1008中存储有计算机程序，处理器1004被设置为通过计算机程序执行上述任一项方法实施例中的步骤。存储器1008可包括易失性存储器(例如，动态随机存取存储器dram)，还可以包括非易失性存储器(例如，一次性可编程只读存储器otprom)。在一些实例中，存储器1008可进一步包括相对于处理器1004远程设置的存储器，这些远程存储器可以通过网络连接至终端设备1000。用户接口1002可以包括：键盘1018和显示器1020。
[0202]
在图10所示的计算机设备1000中，处理器1004可以用于调用存储器1008中存储计算机程序，以实现：
[0203]
获取用户交易流水集合，所述用户交易流水集合包括n个交易对象的交易顺序，n是正整数；
[0204]
根据所述n个交易对象的交易顺序，构建交易对象拓扑图，所述交易对象拓扑图包括n个对象顶点，n个对象顶点与n个交易对象之间一一对应；
[0205]
从所述交易对象拓扑图中抽取交易对象序列，根据所述交易对象序列确定每个交易对象的对象特征；
[0206]
当获取到目标用户的业务请求时，根据所述每个交易对象的对象特征以及所述目标用户的交易流水确定所述目标用户的业务数据，所述业务请求携带所述目标用户的交易流水。
[0207]
在一种可能的实现方式中，业务数据包括业务标签；
[0208]
处理器1004根据所述每个交易对象的对象特征以及所述目标用户的交易流水确定所述目标用户的业务数据，包括：
[0209]
根据所述每个交易对象的对象特征，以及所述目标用户的交易流水确定所述目标用户的业务特征；
[0210]
调用业务预测模型对所述业务特征进行预测处理，确定所述目标用户的业务标签。
[0211]
在一种可能的实现方式中，目标用户的交易流水包括多个参考交易对象和每个参考交易对象的数量，所述n个交易对象包括所述多个参考交易对象；
[0212]
处理器1004根据所述每个交易对象的对象特征，以及所述目标用户的交易流水确定所述目标用户的业务特征，包括：
[0213]
根据所述每个交易对象的对象特征，确定每个参考交易对象的对象特征；
[0214]
根据所述每个参考交易对象的对象特征和所述每个参考交易对象的数量，获取所述目标用户的业务特征。
[0215]
在一种可能的实现方式中，处理器1004根据所述每个交易对象的对象特征，以及所述目标用户的交易流水确定所述目标用户的业务特征，包括：
[0216]
根据所述每个交易对象的对象特征，对所述n个交易对象进行聚类，得到k个聚类结果，k为正整数；
[0217]
根据所述k个聚类结果和所述交易流水集合，构造决策树；
[0218]
根据所述决策树和所述目标用户的交易流水，确定所述目标用户的业务特征。
[0219]
在一种可能的实现方式中，业务数据包括提示消息，所述目标用户的交易流水包括多个参考交易对象，所述n个交易对象包括所述多个参考交易对象；
[0220]
处理器1004根据所述每个交易对象的对象特征以及所述目标用户的交易流水确定所述目标用户的业务数据，包括：
[0221]
根据所述每个交易对象的对象特征，确定每个参考交易对象的对象特征；
[0222]
获取黑名单列表，所述黑名单列表中包括一个或者多个黑交易对象以及每个黑交易对象的对象特征；
[0223]
获取所述每个参考交易对象的对象特征和所述每个黑交易对象的对象特征之间
的特征距离；
[0224]
将所述特征距离小于第一参考距离阈值对应的参考交易对象添加至所述黑名单列表中，并根据所述特征距离小于第一参考距离阈值对应的参考交易对象生成所述提示消息。
[0225]
在一种可能的实现方式中，业务数据包括推荐交易对象，所述目标用户的交易流水包括多个参考交易对象，所述n个交易对象包括所述多个参考交易对象；
[0226]
处理器1004根据所述每个交易对象的对象特征以及所述目标用户的交易流水确定所述目标用户的业务数据，包括：
[0227]
根据所述每个交易对象的对象特征，确定每个参考交易对象的对象特征；
[0228]
获取所述每个参考交易对象的对象特征与非参考交易对象的对象特征之间的特征距离，所述非参考交易对象是所述n个交易对象中除所述参考交易对象以外的交易对象；
[0229]
将所述特征距离小于第二参考距离阈值对应的非参考交易对象，确定为所述推荐交易对象。
[0230]
在一种可能的实现方式中，交易对象拓扑图包括第一对象顶点和第二对象顶点，所述第一对象顶点和第一交易对象对应，所述第二对象顶点和第二交易对象对应，所述交易流水集合包括多个原始用户交易序列，若多个原始用户交易序列中存在第一交易对象和第二交易对象的关系对，则第一对象顶点和第二对象顶点之间存在连接边；所述第一交易对象和第二交易对象的关系对是指第一交易对象和第二交易对象在原始用户交易序列中相邻。
[0231]
在一种可能的实现方式中，第一对象顶点和第二对象顶点之间的连接边权重，是根据所述第一交易对象和第二交易对象的关系对在所述多个原始用户交易序列中的出现频次确定的。
[0232]
在一种可能的实现方式中，交易对象序列的数量为多个；
[0233]
处理器1004从所述交易对象拓扑图中抽取交易对象序列，包括：
[0234]
通过广度优先搜索方式或者深度优先搜索方式遍历所述交易对象拓扑图，得到多个交易对象序列，所述每个交易对象序列中的交易对象的数量均等于参考数量阈值。
[0235]
在一种可能的实现方式中，处理器1004根据所述交易对象序列确定每个交易对象的对象特征，包括：
[0236]
根据所述交易对象序列，训练词嵌入模型，所述词嵌入模型包括输入层、隐藏层和输出层；
[0237]
当所述训练后的词嵌入模型满足模型收敛条件时，调用所述训练后的词嵌入模型中的输入层和隐藏层，识别所述n个交易对象，得到每个交易对象的对象特征。
[0238]
在一种可能的实现方式中，处理器1004根据所述交易对象序列，训练词嵌入模型，包括：
[0239]
获取所述交易对象序列中每个交易对象的对象标识；
[0240]
通过所述词嵌入模型识别所述每个交易对象的对象标识，得到每个交易对象对应的预测对象标签；
[0241]
根据所述每个交易对象对应的预测对象标签和所述每个交易对象对应的对象标识，调整所述词嵌入模型的模型参数。
[0242]
通过本技术实施例的计算机设备，计算机设备通过用户交易流水集合可以构建交易对象拓扑图，并且可以从交易对象拓扑图中抽取交易对象序列，然后根据交易对象序列可以确定每个交易对象的对象特征。本方案通过交易对象之间的交易顺序确定交易对象的对象特征，可以从动态角度挖掘到交易对象之间的隐性相关性，相比于现有方式只通过交易对象本身静态属性确定交易对象的对象特征，本技术得到的对象特征更加准确。后续，当用户提交业务请求时，可以根据每个交易对象的对象特征和业务请求中携带的用户的交易流水确定该用户的业务数据。进一步地，从而提高了业务数据的准确性。
[0243]
应当理解，本技术实施例中所描述的计算机设备1000可执行前文图3～图8所对应实施例中对数据处理方法的描述，也可执行前文图9对应实施例中对数据处理装置的描述，在此不再赘述。另外，对采用相同方法的有益效果描述，也不再进行赘述。
[0244]
在本技术所提供的几个实施例中，应该理解到，所揭露的方法、装置和系统，可以通过其它的方式实现。例如，以上所描述的装置实施例仅仅是示意性的；例如，所述单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式；例如多个单元或组件可以结合或者可以集成到另一个系统，或一些特征可以忽略，或不执行。另一点，所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口，装置或单元的间接耦合或通信连接，可以是电性，机械或其它的形式。
[0245]
此外，这里需要指出的是：本技术实施例还提供了一种计算机存储介质，且计算机存储介质中存储有前文提及的数据处理装置所执行的计算机程序，且该计算机程序包括程序指令，当处理器执行上述程序指令时，能够执行前文图3～图8所对应实施例中的方法，因此，这里将不再进行赘述。另外，对采用相同方法的有益效果描述，也不再进行赘述。对于本技术所涉及的计算机存储介质实施例中未披露的技术细节，请参照本技术方法实施例的描述。作为示例，程序指令可以被部署在一个计算机设备上，或者在位于一个地点的多个计算机设备上执行，又或者，在分布在多个地点且通过通信网络互连的多个计算机设备上执行，分布在多个地点且通过通信网络互连的多个计算机设备可以组成区块链系统。
[0246]
根据本技术的一个方面，提供了一种计算机程序产品或计算机程序，该计算机程序产品或计算机程序包括计算机指令，该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令，处理器执行该计算机指令，使得该计算机设备可以执行前文图3～图8所对应实施例中的方法，因此，这里将不再进行赘述。
[0247]
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程，是可以通过计算机程序来指令相关的硬件来完成，上述程序可存储于一计算机可读取存储介质中，该程序在执行时，可包括如上述各方法的实施例的流程。其中，上述存储介质可为磁碟、光盘、只读存储记忆体(read-only memory，rom)或随机存储记忆体(random access memory，ram)等。
[0248]
以上所揭露的仅为本技术的部分实施例而已，当然不能以此来限定本技术之权利范围，本领域普通技术人员可以理解实现上述实施例的全部或部分流程，并依本技术权利要求所作的等同变化，仍属于发明所涵盖的范围。

再多了解一些

1/2 1 2 下一页尾页

本文用于企业家、创业者技术爱好者查询，结果仅供参考。

一种数据处理方法、装置、计算机设备及存储介质与流程

相关文献

最热文献