一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种业务交互网络的预测方法及装置与流程

2022-05-21 03:03:16 来源:中国专利 TAG:


1.本公开涉及数据处理技术领域,尤其涉及一种业务交互网络的预测方法及装置。


背景技术:

2.目前,由于经济社会的发展和交互,使得各个企业之间存在密切的业务往来,通常通过建立业务交互网络,以确定交互对象之间的供需关系。
3.现有技术下,建立业务交互网络时,通常从业务类型的角度,先构建业务类型框架,再确定不同类型业务对应的交互对象,进而建立业务交互网络,例如,以构建产业链网络为例,通常从供应的物品的角度,搭建商品产业链框架,再通过检索匹配,获取商品产业链中,各环节的商品链所对应的企业信息,经过大规模的检索和匹配,完善与商品产业链对应的企业产业链。
4.但这样,业务交互网络的生成依赖于自定义规则的检索和匹配,无法避免存在信息遗漏的问题,使得无法完整列举不同业务类型节点上存在的全部交互对象,而且,建立的业务交互网络灵活性较差,无法实现对潜在的业务关系进行预测,使得无法根据建立的业务交互网络,确定交互对象之间潜在的供需关系。


技术实现要素:

5.本公开实施例提供一种业务交互网络的预测方法及装置,用以解决现有技术中存在建立的业务交互网络不完整,以及无法对潜在的业务关系进行预测的问题。
6.本公开实施例提供的具体技术方案如下:
7.第一方面,提出一种业务交互网络的预测方法,包括:
8.获取采集的各个业务数据,并根据所述各个业务数据关联的各个交互对象,以及根据所述各个交互对象各自的标识信息,建立对应的交互网络,其中,所述交互网络用于表征各个交互对象之间的业务关系和业务值;
9.根据所述交互网络中,各个交互对象之间的业务关系,建立对应的邻接矩阵,以及根据所述交互网络中,各个交互对象对于不同业务的业务值,建立对应的特征矩阵,其中,所述邻接矩阵中表征存在业务关系的元素,取值为第一设定值,以及表征不存在业务关系的元素,取值为第二设定值,所述特征矩阵的列元素数目与业务类型总数正相关;
10.将所述邻接矩阵和所述特征矩阵,输入训练完成的预测模型,得到所述预测模型输出的业务交互预测矩阵,其中,所述业务交互预测矩阵中的元素,表征预测的业务交互网络中各个交互对象之间存在业务关系的概率;
11.将所述业务交互预测矩阵中元素值不低于设定门限值的元素,取值设置为第一设定值,将元素值低于设定门限值的元素,取值设置为第二设定值,生成业务交互网络矩阵,并基于所述业务交互网络矩阵确定预测的业务交互网络。
12.可选的,所述建立对应的交互网络之后,所述根据所述交互网络中,各个交互对象之间的业务关系,建立对应的邻接矩阵之前,进一步包括:
13.合并所述交互网络中,任意两个交互对象之间业务类型相同的业务数据,并针对所述交互网络包括的各个交互对象中的任意一个交互对象,获取该交互对象作为业务请求方时,关联的各个第一类业务值,并获取该交互对象作为业务提供方时,关联的各个第二类业务值;以及,在所述交互网络中,保留数量占比为设定比例值的,取值最大的第一类业务值和第二类业务值。
14.可选的,所述根据所述交互网络中,各个交互对象之间的业务关系,建立对应的邻接矩阵,包括:
15.获取所述交互网络中存在的各个交互对象,将所述各个交互对象按照随机的顺序进行排序,并基于排序完成的所述各个交互对象,建立表征所述各个交互对象之间的业务关系的邻接矩阵,其中,所述邻接矩阵中表征存在业务关系的两个交互对象的元素取值相同,所述邻接矩阵中的任一行向量表征一个交互对象与所述各个交互对象之间的业务关系。
16.可选的,所述邻接矩阵与所述特征矩阵中,相对位置相同的各个行向量对应的交互对象相同。
17.可选的,所述将所述邻接矩阵和所述特征矩阵,输入训练完成的产业链预测模型之前,进一步包括,对所述产业链预测模型进行训练,包括:
18.获取训练样本集合,其中,一个训练样本包括一个邻接矩阵样本和一个特征矩阵样本;
19.读取训练样本,分别执行以下操作,直至所述产业链预测模型满足预设的收敛条件:
20.将邻接矩阵样本和特征矩阵样本,输入搭建的产业链预测模型,得到所述产业链预测模型输出的产业链预测矩阵,其中,所述产业链预测模型是基于gvae技术搭建的;
21.采用预设的交叉熵损失函数和高斯分布函数,在符合高斯分布的情况下,根据所述预测链预测矩阵与所述邻接矩阵样本之间的元素取值差异,计算所述产业链预测模型的损失值,基于所述损失值,调整生成产业链预测矩阵的参数。
22.可选的,进一步包括:
23.分别针对所述产业链预测矩阵的各个行向量中的任意一个行向量,确定该行向量表征的一个交互对象与所述各个交互对象之间,存在业务关系的概率;并筛选出该行向量中元素值达到设定阈值的各个元素,以及将所述各个元素确定的业务关系设置为强关联的业务关系。
24.第二方面,提出一种业务交互网络的预测装置,包括:
25.获取单元,用于获取采集的各个业务数据,并根据所述各个业务数据关联的各个交互对象,以及根据所述各个交互对象各自的标识信息,建立对应的交互网络,其中,所述交互网络用于表征各个交互对象之间的业务关系和业务值;
26.建立单元,用于根据所述交互网络中,各个交互对象之间的业务关系,建立对应的邻接矩阵,以及根据所述交互网络中,各个交互对象对于不同业务的业务值,建立对应的特征矩阵,其中,所述邻接矩阵中表征存在业务关系的元素,取值为第一设定值,以及表征不存在业务关系的元素,取值为第二设定值,所述特征矩阵的列元素数目与业务类型总数正相关;
27.输入单元,用于将所述邻接矩阵和所述特征矩阵,输入训练完成的预测模型,得到所述预测模型输出的业务交互预测矩阵,其中,所述业务交互预测矩阵中的元素,表征预测的业务交互网络中各个交互对象之间存在业务关系的概率;
28.处理单元,用于将所述业务交互预测矩阵中元素值不低于设定门限值的元素,取值设置为第一设定值,将元素值低于设定门限值的元素,取值设置为第二设定值,生成业务交互网络矩阵,并基于所述业务交互网络矩阵确定预测的业务交互网络。
29.可选的,所述建立对应的交互网络之后,所述根据所述交互网络中,各个交互对象之间的业务关系,建立对应的邻接矩阵之前,所述建立单元进一步用于:
30.合并所述交互网络中,任意两个交互对象之间业务类型相同的业务数据,并针对所述交互网络包括的各个交互对象中的任意一个交互对象,获取该交互对象作为业务请求方时,关联的各个第一类业务值,并获取该交互对象作为业务提供方时,关联的各个第二类业务值;以及,在所述交互网络中,保留数量占比为设定比例值的,取值最大的第一类业务值和第二类业务值。
31.可选的,所述根据所述交互网络中,各个交互对象之间的业务关系,建立对应的邻接矩阵时,所述建立单元用于:
32.获取所述交互网络中存在的各个交互对象,将所述各个交互对象按照随机的顺序进行排序,并基于排序完成的所述各个交互对象,建立表征所述各个交互对象之间的业务关系的邻接矩阵,其中,所述邻接矩阵中表征存在业务关系的两个交互对象的元素取值相同,所述邻接矩阵中的任一行向量表征一个交互对象与所述各个交互对象之间的业务关系。
33.可选的,所述邻接矩阵与所述特征矩阵中,相对位置相同的各个行向量对应的交互对象相同。
34.可选的,所述将所述邻接矩阵和所述特征矩阵,输入训练完成的产业链预测模型之前,进一步包括,对所述产业链预测模型进行训练,所述输入单元用于:
35.获取训练样本集合,其中,一个训练样本包括一个邻接矩阵样本和一个特征矩阵样本;
36.读取训练样本,分别执行以下操作,直至所述产业链预测模型满足预设的收敛条件:
37.将邻接矩阵样本和特征矩阵样本,输入搭建的产业链预测模型,得到所述产业链预测模型输出的产业链预测矩阵,其中,所述产业链预测模型是基于gvae技术搭建的;
38.采用预设的交叉熵损失函数和高斯分布函数,在符合高斯分布的情况下,根据所述预测链预测矩阵与所述邻接矩阵样本之间的元素取值差异,计算所述产业链预测模型的损失值,基于所述损失值,调整生成产业链预测矩阵的参数。
39.可选的,所述处理单元进一步用于:
40.分别针对所述产业链预测矩阵的各个行向量中的任意一个行向量,确定该行向量表征的一个交互对象与所述各个交互对象之间,存在业务关系的概率;并筛选出该行向量中元素值达到设定阈值的各个元素,以及将所述各个元素确定的业务关系设置为强关联的业务关系。
41.第三方面,提出一种电子设备,包括:
42.存储器,用于存储可执行指令;
43.处理器,用于读取并执行存储器中存储的可执行指令,以实现上述任一项所述的业务交互网络的预测方法。
44.第四方面,提出一种计算机可读存储介质,当所述存储介质中的指令由电子设备执行时,使得所述电子设备能够执行上述任一项所述的业务交互网络的预测方法。
45.本公开有益效果如下:
46.本公开实施例中,获取采集的各个业务数据,将业务数据中包括的业务提供方和业务请求方确定为交互对象,并根据各个交互对象的标识信息,建立对应的交互网络,其中,所述交互网络表征交互对象之间的业务关系和业务值,再针对所述交互网络中各个交互对象中的任意一个交互对象,确定该交互对象作为业务提供方时的对应的各个业务请求方,以及分别确定该交互对象提供的,各个业务类型的业务值;建立表征业务提供方与对应的业务请求方之间的业务关系的邻接矩阵,以及根据各个交互对象提供的不同业务类型的业务值,建立对应的特征矩阵,然后,将所述邻接矩阵和所述特征矩阵,输入训练完成的预测模型,得到所述预测模型输出的业务交互预测矩阵,其中,所述业务交互预测矩阵中的元素,表征预测的业务交互网络中各个交互对象之间存在业务关系的概率,再将所述业务交互预测矩阵中元素值不低于设定门限值的元素,取值设置为所述邻接矩阵中表征存在业务关系的取值,以及将元素值低于设定门限值的元素,取值设置为所述邻接矩阵中表征不存在业务关系的取值后,生成业务交互网络矩阵,并基于所述业务交互网络矩阵确定预测的业务交互网络。这样,实现了基于业务数据中包括的各个交互对象,逐渐构建交互网络,并根据从交互网络中提取的邻接矩阵和特征矩阵,对业务交互网络进行预测,将交互对象作为建立交互网络的基础,进而基于交互网络预测业务交互网络,规避建立预测交互网络时,需要检索确定同种业务类型的全部交互对象,使得建立的业务交互网络不完整的弊端,而且借助于预测模型,能够综合邻接矩阵和特征矩阵的特征,生成业务交互预测矩阵,分别预测两个交互对象之间存在业务关系的概率,进而基于业务交互预测矩阵进行处理后,得到能够对应生成业务交互网络的业务交互网络矩阵,借助于预测模型的预测,能够预测出存在潜在交互可能的交互对象。
附图说明
47.图1为本公开实施例中业务交互网络预测的流程示意图;
48.图2a为本公开实施例中基于业务数据创建的不同交互对象之间的连线示意图;
49.图2b为本公开实施例中对不同交互对象之间的连接线路进行简化后的示意图;
50.图2c为本公开实施例中处理后的交互网络示意图;
51.图3a为本公开实施例中根据交互网络确定的业务关系示意图;
52.图3b为本公开实施例中将业务关系示意图数值化的示意图;
53.图3c为本公开实施例中将业务关系示意图赋予具体数值后的示意图;
54.图4为本公开实施例中建立的特征矩阵示意图;
55.图5为本公开实施例中预测矩阵的内部处理示意图;
56.图6为本公开实施例中预测产业链网络的流程示意图;
57.图7为本公开实施例中业务交互网络预测的逻辑结构示意图;
58.图8为本公开实施例中业务交互网络预测的实体结构示意图。
具体实施方式
59.为了使本公开的目的、技术方案及有益效果更加清楚明白,以下结合附图及实施例,对本公开进行进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本公开,并不用于限定本公开。
60.本领域技术人员知道,本公开的实施方式可以实现为一种系统、装置、设备、方法或计算机程序产品。因此,本公开可以具体实现为以下形式,即:完全的硬件、完全的软件(包括固件、驻留软件、微代码等),或者硬件和软件结合的形式。
61.为了解决现有技术中存在建立的业务交互网络不完整,以及无法对潜在的业务关系进行预测的问题,本公开针对性的提出了一种业务交互网络的预测方法及装置,具体为,获取采集的各个业务数据,将业务数据中包括的业务提供方和业务请求方确定为交互对象,并根据各个交互对象的标识信息,建立对应的交互网络,其中,所述交互网络表征交互对象之间的业务关系和业务值,再针对所述交互网络中各个交互对象中的任意一个交互对象,确定该交互对象作为业务提供方时的对应的各个业务请求方,以及分别确定该交互对象提供的,各个业务类型的业务值;建立表征业务提供方与对应的业务请求方之间的业务关系的邻接矩阵,以及根据各个交互对象提供的不同业务类型的业务值,建立对应的特征矩阵,然后,将所述邻接矩阵和所述特征矩阵,输入训练完成的预测模型,得到所述预测模型输出的业务交互预测矩阵,其中,所述业务交互预测矩阵中的元素,表征预测的业务交互网络中各个交互对象之间存在业务关系的概率,再将所述业务交互预测矩阵中元素值不低于设定门限值的元素,取值设置为所述邻接矩阵中表征存在业务关系的取值,以及将元素值低于设定门限值的元素,取值设置为所述邻接矩阵中表征不存在业务关系的取值后,生成业务交互网络矩阵,并基于所述业务交互网络矩阵确定预测的业务交互网络。
62.需要说明的是,本公开所限定的业务交互网络的预测可以周期性的重复进行,如以月为周期,获取过去的一个周期内产生的业务数据,并根据获得的业务数据实现对业务交互网络的预测。
63.本公开的一些实施例中,可以应用于税务机关根据采集的税务数据,建立产业链网络预测的场景中,税务机关根据采集的各个税务数据,确定税务数据中包括的各个公司之间的交易类型,以及交易数据,并根据各个公司的交易数据和交易类型,建立交互网络,以及从交互网络中提取表征公司间交易关系的邻接矩阵和表征公司间交易数据的特征矩阵,进而预测公司之间潜在的交易关系。具体的,可以以月为周期,按月获取过去一个周期内的税务数据,并根据获得的税务数据,预测不同公司之间的产业链网络。
64.下面结合附图,对本公开实施例优选的实施方式进行进一步详细说明:
65.下面结合附图1,对本公开实施中,处理设备基于获得的业务数据对业务交互网络的预测过程进行说明:
66.步骤101:处理设备获取采集的各个业务数据,将业务数据中包括的业务提供方和业务请求方确定为交互对象,并根据各个交互对象的标识信息,建立对应的交互网络。
67.具体的,处理设备获取采集的各个业务数据,并将所述各个业务数据中包括的业务提供方和业务请求方确定为交互对象,以及根据各个交互对象的标识信息,建立对应的
交互网络,其中,一个业务数据中包含至少两个交互对象,分别为业务请求方和业务提供方,所述交互网络用于表征各个交互对象之间的业务关系和业务值,所述业务关系和业务值由业务数据确定,所述业务关系表征业务请求方和业务提供方之间的交互关系,所述业务值用于价值化业务提供方提供的业务。
68.需要说明的是,考虑到不同交互对象之间存在多种类型的业务,以及两个交互对象之间同类型的业务可能由多个业务数据表征,故为了对交互网络进行简化,处理设备合并所述交互网络中,任意两个交互对象之间业务类型相同的业务数据,并针对所述交互网络包括的各个交互对象中的任意一个交互对象,获取该交互对象作为业务请求方时,关联的各个第一类业务值,并获取该交互对象作为业务提供方时,关联的各个第二类业务值;以及,在所述交互网络中,保留数量占比为设定比例值的,取值最大的第一类业务值和第二类业务值。
69.具体的,处理设备根据业务数据初步建立交互网络后,将交互网络中,业务类型相同的任意两个交互对象之间的业务数据合并,使得所述交互网络中任意两个交互对象之间,针对同种业务类型,仅存在一条连接线路,也就是说,仅对应一个合并后的业务值,其中,所述业务类型用于限定两个交互对象之间,确定的业务请求方与业务提供方之间的传输的具体内容。
70.例如,参阅图2a所示,假设根据获取的业务数据,确定交互对象a和交互对象b之间存在3种业务类型的交互,且存在两条对应业务类型1的业务数据,三条对应业务类型2的业务数据,两条对应业务类型3的业务数据,故将同种业务类型的业务数据进行合并后,可以得到图2b所示意的连接线路。进一步的,对交互网络进行上述简化处理后,能够得到图2c所示意的交互网络,其中,所述交互网络中的箭头指向表征业务关系,以交互对象a和交互对象b之间的箭头指向为例,由交互对象a指向交互对象b的箭头,示意了某种类型的业务下,交互对象a作为业务提供方,交互对象b作为业务请求方时的交互关系。
71.又例如,以产业链网络的预测场景为例,税务机关的处理设备获取各个税务数据,根据各个税务数据关联的各个公司,以及将各个公司的标识信息,所述标识信息可以是纳税人识别号,建立交互网络,其中,所述交互网络中,以有向边的形式连接发生实际交易的任意两个企业,有向边从销售方企业指向购买方企业,业务值为发生实际交易的金额。进而根据企业之间交易的内容,将表征两个企业之间同种物品交易的有向边进行合并,实现对交互网络的简化。
72.进一步的,针对所述交互网络中各个交互对象中的任意一个交互对象,确定该交互对象作为业务请求方时关联的第一业务值,以及确定该交互对象作为业务提供方时关联的第二业务值,并在所述交互网络中,保留数量占比为设定比例值的,取值最大的第一业务值和第二业务值,其中,所述数量占比具体为保留的数量与同类型总数的占比,例如,假设数量占比为85%,交互网络中交互对象作为业务提供方时的连接线路总数为100,则选择第二业务值最大的前85条连接线路进行保存。
73.这样,借助于采集的各个业务数据,能够建立表征各个交互对象之间业务关系和业务值的交互网络,规避了现有技术下通过检索确定交互对象的弊端,保证了后续对业务交互网络预测过程的有效进行。
74.步骤102:处理设备针对交互网络中各个交互对象中的任意一个交互对象,确定该
交互对象作为业务提供方时的对应的各个业务请求方,以及分别确定该交互对象提供的,各个业务类型的业务值;基于各个交互对象与对应的业务请求方之间的业务关系,建立邻接矩阵,以及根据各个交互对象提供的不同业务类型的业务值,建立对应的特征矩阵。
75.处理设备建立交互网络后,处理设备针对交互网络中各个交互对象中的任意一个交互对象,确定该交互对象作为业务提供方时的对应的各个业务请求方,以及分别确定该交互对象提供的,各个业务类型的业务值。进而基于各个交互对象与对应的业务请求方之间的业务关系,建立邻接矩阵。
76.具体的,所述处理设备获取所述交互网络中存在的各个交互对象,将所述各个交互对象按照随机的顺序进行排序,再针对排序完成后的所述各个交互对象中的任意一个交互对象,获取该交互对象作为业务提供方时对应的各个业务请求方,并基于该交互对象与所述各个业务请求方之间的业务关系,建立行元素,然后将各个交互对象对应的各个行元素,按照所述排序进行排列后,组合为邻接矩阵。
77.例如,继续以步骤101中涉及到的图2c为例进行说明,交互网络中存在5个交互对象,分别为交互对象a-e,交互对象a作为业务提供方时,交互对象b为对应的业务请求方;交互对象b作为业务提供方时,交互对象a、交互对象e作为业务请求方;交互对象c作为业务提供方时,交互对象b和交互对象d作为业务请求方;交互对象d作为业务提供方时,交互对象a作为业务请求方;交互对象e作为业务提供方时,交互对象d作为业务请求方。
78.参阅图3a-3c所示意的,如图3a所示,假设按照交互对象a-e的顺序排序,则表征交互对象a-e分别作为业务提供方时,存在的业务关系具体可如黑框部分所示意,进一步的,参阅图3b所示,经业务关系进行数值后处理后,将表征存在业务关系的黑框部分用第一设定值表征,将表征不存在业务关系的空白部分用第二设定值表征,其中,第一设定值和第二设定值根据实际情况配置,且第一设定值和第二设定值的取值不同。将第一设定值取值设置为1,第二设定值取值设置为0时,进而能够得到图3c所示意的邻接矩阵。
79.进一步的,所述处理设备根据各个交互对象提供的不同业务类型的业务值,构建独热编码one-hot的特征矩阵。
80.具体的,所述处理设备根据各个交互对象提供的不同类型的业务值,建立特征矩阵,所述处理设备针对所述各个对象中的任意一个交互对象,获取该交互对象作为对象提供方和对象请求方时,对应的业务值,并根据该交互对象与不同业务类型下的业务值的对应关系,建立对应该交互对象的行向量;进而将各个交互对象对应的各个行向量,组合生成特征矩阵。
81.本公开实施例中,所述邻接矩阵与所述特征矩阵中,相对位置相同的各个行向量对应的交互对象相同,特征矩阵的列数与各个交互对象所能够提供的业务类型的总类型数正相关,具体为总类型数目的二倍,其中,设置为二倍原因在于,使得特征矩阵中能够同时体现交互对象作为业务提供方和业务请求方时涉及到的业务值。
82.需要说明的是,本公开应用于产业链网络的预测场景中时,生成的特征矩阵的列数为各类商品税收编码和服务税收分类编码总数的二倍,用于表征公司作为请求方和提供方时对应的交易数据,所述商品税收编码和服务税收分类编码由国家统一制定。
83.例如,参阅图4所示意的,n为交互网络中交互对象的总数,m为业务类型总类型数,x为生成的特征矩阵,所述总类型数指代的是客观存在的全部业务类型,包括各个交互对象
之间存在的和目前不存在的业务类型。
84.这样,通过建立邻接矩阵和特征矩阵,能够将交互网络中存在的业务关系,以及不同业务关系下的业务值以数值化的形式体现,实现对交互特征的矩阵化描述,为后续预测模型的处理提供输入数据,使得后续能够借助于gvae模型实现对业务交互网络的预测。
85.步骤103:处理设备将邻接矩阵和特征矩阵,输入训练完成的预测模型,得到所述预测模型输出的业务交互预测矩阵。
86.处理设备采用训练完成的预测模型,对邻接矩阵和特征矩阵进行处理之前,所述处理设备对所述预测模型进行训练,下面对预测模型的训练过程进行说明:
87.获取训练样本集合,其中,一个训练样本包括一个邻接矩阵样本和一个特征矩阵样本。
88.具体的,所述处理设备根据不同历史周期内的业务数据,建立历史交互网络,进而确定历史交互网络对应的历史邻接矩阵和历史特征矩阵,并将得到的历史邻接矩阵作为邻接矩阵样本,以及将对应的历史特征矩阵作为特征矩阵样本。
89.进一步的,所述处理设备读取训练样本,分别执行以下操作,直至所述预测模型满足预设的收敛条件:
90.s1:处理设备将邻接矩阵样本和特征矩阵样本,输入搭建的预测模型,得到所述预测模型输出的业务交互预测矩阵,其中,所述预测模型是基于图像变分自编码器(graph variational autoencoder,gvae)技术搭建的。
91.参阅图5所示意的处理过程,处理设备将特征矩阵x和邻接矩阵a输入预测模型,使得在所述预测模型内部,先后通过编码器与解码器,最终重构业务交互网络。其中,编码器完成对交互对象的编码工作,而解码器需根据交互对象解码生成边。编码器使用的是多层图卷积神经网络(graph convolutional network,gcn),通过gcn提取图上数据特征,同时引入高斯分布作为分布约束,对生成的隐变量矩阵z进行微调,解码器通过节点特征的点积与激活函数,最小化目标函数loss完成模型计算,最终实现预测模型的预测功能。
92.具体的,在构建预测模型时,构建编码器encoder的流程为:使用多层gcn模型提取构建的网络上的数据特征,完成交互对象在节点特征矩阵维度下的均值μ与标准差δ的gcn建模,最后综合随机采样(sample)实现隐变量矩阵z的构建。其中,gcn为一个神经网络层,它的层与层之间的传播方式如下面公式所示:
[0093][0094]
其中,i是单位矩阵,a是邻接矩阵,是的度矩阵(degreeematrix),h是每一层的特征,对于输入层,h=x,σ是非线性激活函数。
[0095]
需要说明的是,本公开实施例中,gcn的作用在于提取决定交互对象间业务关系的主要特征,并剔除冗余特征,获得推理能力,得到较明确的规律,同时,可以将交互对象特征与其他交互对象特征融合。例如,以预测产业链网络的场景为例,销售光伏电池的企业,其上游关联企业倾向为销售晶体材料的相关行业的企业,gcn预测出链路后,对于一个有向边来说,必然预测出了下游的企业,进而潜在映射了企业的上下游产业链关系。
[0096]
编码器的输出z是每个交互对象在业务类型维度上,在概率分布下的均值和标准
差的综合隐变量矩阵,即将标准差与随机生成的变量ε相乘,再与均值相加,得到高斯分布上采样后的结果,具体处理过程详见下述公式:
[0097]
μ=gcn
μ
(x,a)
[0098]
σ=gcn
σ
(x,a)
[0099]
z=μ ε
×
σ
[0100]
进一步的,构建解码器decoder流程为:对编码器输出的隐变量矩阵z进行节点特征点积,通过激活函数σ实现节点关系概率预测。具体地,解码器公式如下:
[0101]y′
=δ(z
t
*z)
[0102]
其中,z为编码器的输出,y’表征计算得到的概率值。
[0103]
s2:处理设备采用预设的交叉熵损失函数和高斯分布函数,在符合高斯分布的情况下,根据所述预测链预测矩阵与所述邻接矩阵样本之间的元素取值差异,计算所述预测模型的损失值,基于所述损失值,调整生成业务交互预测矩阵的参数。
[0104]
本公开实施例中,对于损失值的定义如下:
[0105]
loss=crossentropy kl[q(z|x,a)||p(z)]
[0106]
其中:kl散度表示z的分布与高斯分布之间的差异;p(z)代表一个标准高斯分布;q(z|x,a)代表目标分布;交叉熵(cross entropy)代表a与a'的差异程度,a’表示预测模型重构的邻接矩阵,其中,邻接矩阵代表构建的业务交互网络结构,具体计算公式如下:
[0107][0108]
其中,y代表邻接矩阵a中的某个元素的值(0或1),y

代表重构的邻接矩阵a'中相应元素的概率值。
[0109]
进一步的,计算出模型损失值后,基于所述损失值调整所述预测模型中生成业务交互预测矩阵的参数,并在确定满足预设的收敛条件时,判定训练完成。其中,所述收敛条件可以是,预测模型的训练次数达到设定训练次数,或者,损失值连续低于设定值的次数达到预设门限值。
[0110]
步骤104:处理设备将业务交互预测矩阵中元素值不低于设定门限值的元素,取值设置为所述邻接矩阵中表征存在业务关系的取值,以及将元素值低于设定门限值的元素,取值设置为所述邻接矩阵中表征不存在业务关系的取值后,生成业务交互网络矩阵,并基于所述业务交互网络矩阵确定预测的业务交互网络。
[0111]
具体的,处理设备获得业务交互预测矩阵后,将所述业务交互预测矩阵中元素值不低于设定门限值的元素,取值设置为邻接矩阵中表征存在业务关系的取值,以及将元素值低于设定门限值的元素,取值设置为所述邻接矩阵中表征不存在业务关系的取值后,生成业务交互网络矩阵,这样使得业务交互网络矩阵中的元素与邻接矩阵中的元素,表征的意义相同,在邻接矩阵是基于交互网络生成的情况下,通过业务交互网络矩阵对应的反向生成预测得到的业务交互矩阵。
[0112]
需要说明的是,对于业务交互预测矩阵来说,处理设备可以分别针对所述业务交互预测矩阵的各个行向量中的任意一个行向量,确定该行向量表征的一个交互对象与所述各个交互对象之间,存在业务关系的概率;并筛选出该行向量中元素值达到设定阈值的各个元素,以及将所述各个元素确定的业务关系设置为强关联的业务关系。
[0113]
具体的,处理设备可以根据实际的需要,在获得业务交互预测矩阵后,在表征作为业务提供方的一个交互对象,与其他交互对象存在业务关系的概率的行向量中,根据设定阈值进行筛选,确定作为所述一个交互对象的业务请求方的各个其他交互对象中,与所述一个交互对象具有强关联的业务关系。
[0114]
在预测产业链网络的场景中,获得业务交互预测矩阵之后,按照设定阈值对业务交互矩阵的元素进行过滤,所述设定阈值可以根据实际需要配置,如,取值为0.5,进一步的,确定各个行元素对应的销售方企业,以及确定各个行元素中概率值高于0.5的各个元素,并将确定出的各个元素对应的购买方企业,确定为与该销售方企业具有强关联的购买方企业,所述强关联表征不同企业之间进行交易的可能性。
[0115]
这样,通过将深度学习,图计算技术相结合引入到业务交互网络的预测中,能够实现对交互对象之间业务关系的特征提取,并实现各交互对象之间的特征融合,实现对业务交互网络的深度挖掘,大幅度简化传统的业务交互网络建立的复杂度,极大的降低了人工干预,能够实现对潜在的业务关系的预测。
[0116]
下面结合附图6,税务机关基于一定时间内获取到的税务数据,预测得到产业链网络的过程进行说明:
[0117]
步骤601:获取税务数据。
[0118]
具体的,在此场景下,税务机关的处理设备获取一段时间内产生的税务数据,所述税务数据具体可以是发票数据,其中,发票数据中包括有交易企业双方的唯一标识信息,也就是纳税人标识号,以及交易企业双方的交易信息。
[0119]
步骤602:根据税务数据建立企业交易网络。
[0120]
处理设备根据发票数据中记录的,销售方企业和买方业务企业之间的交易关系,建立企业交易网络。
[0121]
进一步的,对建立的企业交易网络进行简化,具体为合并同种类型的交易数据,以及删除部分交易数据。
[0122]
例如,销售方企业a和买方企业b之间针对商品x存在多次交易,也就是对应存在有多个发票数据,故将企业交易网络中,仅存在一条表征销售方企业a和买方企业b之间针对商品x的交易关系的网络线路。
[0123]
又例如,假设企业a作为销售方企业时,与企业b、企业c、企业d、企业e、企业f、企业g、企业h、企业i、企业j、企业k存在交易关系,且对应的交易金额分别为10万、5万、3万、6万、25万、0.2万、0.15万、13万、20万、36万,假设针对数量设置的设定比例值为80%,则与企业a存在交易关系的共有10个企业的情况下,在企业交易网络中仅保留与8个企业的交易关系,即,选择交易金额最大的8个企业,在企业交易网络中保留交易关系的示意,企业b:10万、企业c:5万、企业d:3万、企业e:6万、企业f:25万、企业g:0.2万、企业h:0.15万、企业i:13万、企业j:20万、企业k:36万,按照交易金额从大到小排序后:企业k:36万、企业f:25万、企业j:20万、企业i:13万、企业b:10万、企业e:6万、企业c:5万、企业d:3万、企业g:0.2万、企业h:0.15万,故在交易网络中保留企业k、f、j、i、b、e、c、d与企业a的交易关系对应的网络线路。
[0124]
步骤603:确定企业交易网络对应的邻接矩阵和特征矩阵。
[0125]
处理设备根据建立的企业交易网络建立对应的邻接矩阵和特征矩阵,其中,邻接矩阵和特征矩阵的建立过程已经在图1的流程中进行详细说明在此不再赘述。
[0126]
步骤604:将邻接矩阵和特征矩阵,输入训练完成的预测模型,得到所述预测模型输出的交易预测矩阵。
[0127]
处理设备将邻接矩阵和特征矩阵输入训练完成的预测模型,得到所述预测模型输出的交易预测矩阵。其中,所述交易预测矩阵中各个元素表征对应的各个企业之间存在交易关系的概率。具体的生成过程已将在图1的流程中进行详细说明,在此不再赘述。所述交易预测矩阵中各行元素和列元素对应的公司,与邻接矩阵中各行元素和列元素对应的公司相同。
[0128]
步骤605:对交易预测矩阵进行处理,得到产业链网络矩阵,并根据所述产业链网络矩阵生成产业链网络。
[0129]
处理设备对交易预测矩阵进行处理,具体的,根据所述交易预测矩阵中各个元素的元素值,将取值不低于设定门限值的元素的元素值设置为,邻接矩阵中表征存在交易关系的取值,以及将取值低于设定门限值的元素值设置为,邻接矩阵中表征不存在交易关系的元素值,进而建立产业链网络矩阵,以及根据产业链网络矩阵反向建立产业链网络。
[0130]
基于同一发明构思,参阅图7所示,本公开实施例中,提出一种业务交互网络的预测装置,包括:
[0131]
获取单元701,用于获取采集的各个业务数据,并根据所述各个业务数据关联的各个交互对象,以及根据所述各个交互对象各自的标识信息,建立对应的交互网络,其中,所述交互网络用于表征各个交互对象之间的业务关系和业务值;
[0132]
建立单元702,用于根据所述交互网络中,各个交互对象之间的业务关系,建立对应的邻接矩阵,以及根据所述交互网络中,各个交互对象对于不同业务的业务值,建立对应的特征矩阵,其中,所述邻接矩阵中表征存在业务关系的元素,取值为第一设定值,以及表征不存在业务关系的元素,取值为第二设定值,所述所述特征矩阵的列元素数目与业务类型总数正相关;
[0133]
输入单元703,用于将所述邻接矩阵和所述特征矩阵,输入训练完成的预测模型,得到所述预测模型输出的业务交互预测矩阵,其中,所述业务交互预测矩阵中的元素,表征预测的业务交互网络中各个交互对象之间存在业务关系的概率;
[0134]
处理单元704,用于将所述业务交互预测矩阵中元素值不低于设定门限值的元素,取值设置为第一设定值,将元素值低于设定门限值的元素,取值设置为第二设定值,生成业务交互网络矩阵,并基于所述业务交互网络矩阵确定预测的业务交互网络。
[0135]
可选的,所述建立对应的交互网络之后,所述根据所述交互网络中,各个交互对象之间的业务关系,建立对应的邻接矩阵之前,所述建立单元702进一步用于:
[0136]
合并所述交互网络中,任意两个交互对象之间业务类型相同的业务数据,并针对所述交互网络包括的各个交互对象中的任意一个交互对象,获取该交互对象作为业务请求方时,关联的各个第一类业务值,并获取该交互对象作为业务提供方时,关联的各个第二类业务值;以及,在所述交互网络中,保留数量占比为设定比例值的,取值最大的第一类业务值和第二类业务值。
[0137]
可选的,所述根据所述交互网络中,各个交互对象之间的业务关系,建立对应的邻接矩阵时,所述建立单元702用于:
[0138]
获取所述交互网络中存在的各个交互对象,将所述各个交互对象按照随机的顺序
进行排序,并基于排序完成的所述各个交互对象,建立表征所述各个交互对象之间的业务关系的邻接矩阵,其中,所述邻接矩阵中表征存在业务关系的两个交互对象的元素取值相同,所述邻接矩阵中的任一行向量表征一个交互对象与所述各个交互对象之间的业务关系。
[0139]
可选的,所述邻接矩阵与所述特征矩阵中,相对位置相同的各个行向量对应的交互对象相同。
[0140]
可选的,所述将所述邻接矩阵和所述特征矩阵,输入训练完成的产业链预测模型之前,进一步包括,对所述产业链预测模型进行训练,所述输入单元703用于:
[0141]
获取训练样本集合,其中,一个训练样本包括一个邻接矩阵样本和一个特征矩阵样本。
[0142]
读取训练样本,分别执行以下操作,直至所述产业链预测模型满足预设的收敛条件:
[0143]
将邻接矩阵样本和特征矩阵样本,输入搭建的产业链预测模型,得到所述产业链预测模型输出的产业链预测矩阵,其中,所述产业链预测模型是基于gvae技术搭建的;
[0144]
采用预设的交叉熵损失函数和高斯分布函数,在符合高斯分布的情况下,根据所述预测链预测矩阵与所述邻接矩阵样本之间的元素取值差异,计算所述产业链预测模型的损失值,基于所述损失值,调整生成产业链预测矩阵的参数。
[0145]
可选的,所述处理单元704进一步用于:
[0146]
分别针对所述产业链预测矩阵的各个行向量中的任意一个行向量,确定该行向量表征的一个交互对象与所述各个交互对象之间,存在业务关系的概率;并筛选出该行向量中元素值达到设定阈值的各个元素,以及将所述各个元素确定的业务关系设置为强关联的业务关系。
[0147]
基于同一发明构思,参阅图8所示,业务交互网络的预测装置800可以为服务器或具有处理功能的终端设备。参照图8,装置800包括处理组件822,其进一步包括一个或多个处理器,以及由存储器832所代表的存储器资源,用于存储可由处理组件822的执行的指令,例如应用程序。存储器832中存储的应用程序可以包括一个或一个以上的每一个对应于一组指令的模块。此外,处理组件822被配置为执行指令,以执行上述方法。
[0148]
装置800还可以包括一个电源组件826被配置为执行装置800的电源管理,一个有线或无线网络接口850被配置为将装置800连接到网络,和一个输入输出(i/o)接口858。装置800可以操作基于存储在存储器832的操作系统,例如windows servertm,mac os xtm,unixtm,linuxtm,freebsdtm或类似系统。
[0149]
基于同一发明构思,本公开实施例中基于业务交互网络预测的实施例中提供一种存储介质,当所述存储介质中的指令由电子设备执行时,使得所述电子设备能够执行上述任一种方法。
[0150]
综上所述,本公开实施例中,获取采集的各个业务数据,将业务数据中包括的业务提供方和业务请求方确定为交互对象,并根据各个交互对象的标识信息,建立对应的交互网络,其中,所述交互网络表征交互对象之间的业务关系和业务值,再针对所述交互网络中各个交互对象中的任意一个交互对象,确定该交互对象作为业务提供方时的对应的各个业务请求方,以及分别确定该交互对象提供的,各个业务类型的业务值;建立表征业务提供方
与对应的业务请求方之间的业务关系的邻接矩阵,以及根据各个交互对象提供的不同业务类型的业务值,建立对应的特征矩阵,然后,将所述邻接矩阵和所述特征矩阵,输入训练完成的预测模型,得到所述预测模型输出的业务交互预测矩阵,其中,所述业务交互预测矩阵中的元素,表征预测的业务交互网络中各个交互对象之间存在业务关系的概率,再将所述业务交互预测矩阵中元素值不低于设定门限值的元素,取值设置为所述邻接矩阵中表征存在业务关系的取值,以及将元素值低于设定门限值的元素,取值设置为所述邻接矩阵中表征不存在业务关系的取值后,生成业务交互网络矩阵,并基于所述业务交互网络矩阵确定预测的业务交互网络。这样,实现了基于业务数据中包括的各个交互对象,逐渐构建交互网络,并根据从交互网络中提取的邻接矩阵和特征矩阵,对业务交互网络进行预测,将交互对象作为建立交互网络的基础,进而基于交互网络预测业务交互网络,规避建立预测交互网络时,需要检索确定同种业务类型的全部交互对象,使得建立的业务交互网络不完整的弊端,而且借助于预测模型,能够综合邻接矩阵和特征矩阵的特征,生成业务交互预测矩阵,分别预测两个交互对象之间存在业务关系的概率,进而基于业务交互预测矩阵进行处理后,得到能够对应生成业务交互网络的业务交互网络矩阵,借助于预测模型的预测,能够预测出存在潜在交互可能的交互对象。
[0151]
本领域内的技术人员应明白,本公开的实施例可提供为方法、系统、或计算机程序产品。因此,本公开可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本公开可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、cd-rom、光学存储器等)上实施的计算机程序产品的形式。
[0152]
本公开是参照根据本公开实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
[0153]
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
[0154]
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
[0155]
尽管已描述了本公开的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例作出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本公开范围的所有变更和修改。
[0156]
显然,本领域的技术人员可以对本公开实施例进行各种改动和变型而不脱离本公开实施例的精神和范围。这样,倘若本公开实施例的这些修改和变型属于本公开权利要求
及其等同技术的范围之内,则本公开也意图包含这些改动和变型在内。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献