一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

用于生成合成数据的系统、方法和计算机程序产品与流程

2022-07-02 03:43:11 来源:中国专利 TAG:


1.本公开大体上涉及数据分析技术和应用,并且在一些非限制性实施例或方面,涉及用于生成合成数据的系统、方法和计算机程序产品。


背景技术:

2.可能需要合成数据(例如,不是通过直接测量环境获得的数据)来测试和训练各种计算机驱动的模型。为了使合成数据可靠地表示环境(例如,支付交易处理网络、计算机用户的系统等),通常需要使用环境的测得数据(例如,实时数据、历史数据等)作为参考/输入来生成合成数据。从时间和/或资源角度来看,可能不可能获得用以生成合成数据的测得数据。
3.在所属领域中需要一种可在不需要依赖于环境的测得数据的情况下生成环境的准确合成数据的技术解决方案。需要一种包括合成数据生成的技术解决方案,所述合成数据生成可用于训练机器学习模型在某个环境中工作以使得计算机驱动的系统可在不用等待获得测得数据的情况下实施和实现运行。


技术实现要素:

4.因此,当前公开的主题的目标是提供用于生成合成数据的系统、方法和计算机程序产品。
5.根据一些非限制性实施例或方面,提供一种用于生成合成数据的计算机实施的方法。所述方法可包括利用至少一个处理器接收与待评估环境相关联的多个数据类型。所述方法还可包括利用至少一个处理器接收多个相关性,所述多个相关性中的每个相关性包括所述多个数据类型中的一个数据类型对所述多个数据类型中的另一数据类型的依赖性。所述方法还可包括利用至少一个处理器基于所述多个相关性生成所述多个数据类型的相关性图。所述方法还可包括利用至少一个处理器基于所述相关性图生成所述多个数据类型的有向无环图。所述方法还可包括利用至少一个处理器通过将路径遍历技术应用于所述有向无环图而生成所述多个数据类型的层次图。所述方法还可包括利用至少一个处理器通过重复遍历所述层次图以生成数据的多个记录来生成合成数据集,所述多个记录中的每个记录包括与所述多个数据类型相关联的值。
6.在一些非限制性实施例或方面,待评估环境可以是支付交易处理网络,所述支付交易处理网络包括被编程和/或配置以处理多个交易的交易处理系统。所述方法还可包括利用至少一个处理器使用所述合成数据集来训练欺诈检测系统的至少一个机器学习模型。所述方法还可包括利用至少一个处理器接收与商家系统与支付装置之间的交易相关联的授权请求。所述方法还可包括利用至少一个处理器在所述交易的支付处理期间将所述授权请求的至少一部分传送到所述欺诈检测系统。所述方法还可包括利用至少一个处理器从所述欺诈检测系统接收所述交易的欺诈评估。所述方法还可包括利用至少一个处理器基于所述欺诈评估而拒绝所述授权请求。所述多个数据类型可包括以下至少两个:交易时间、支付
装置持有人账户标识符、交易描述、发行方标识符、收单方标识符、交易标识符、商家账户标识符,或其任何组合。
7.在一些非限制性实施例或方面,所述方法还可包括利用至少一个处理器在用户界面中显示所述多个数据类型或引起所述多个数据类型的显示。所述方法还可包括利用至少一个处理器基于所述用户界面中标识所述多个数据类型内的关联的用户输入而接收所述多个相关性。应用于有向无环图的路径遍历技术可包括随机漫步(random walk)技术或广度优先搜索(breadth first search)技术。
8.根据一些非限制性实施例或方面,提供一种用于生成合成数据的系统。所述系统可包括服务器,所述服务器包括至少一个处理器。所述至少一个处理器可被编程和/或配置以接收与待评估环境相关联的多个数据类型。所述至少一个处理器还可被编程和/或配置以接收多个相关性,所述多个相关性中的每个相关性包括所述多个数据类型中的一个数据类型对所述多个数据类型中的另一数据类型的依赖性。所述至少一个处理器还可被编程和/或配置以基于所述多个相关性生成所述多个数据类型的相关性图。所述至少一个处理器还可被编程和/或配置以基于所述相关性图生成所述多个数据类型的有向无环图。所述至少一个处理器还可被编程和/或配置以通过将路径遍历技术应用于所述有向无环图而生成所述多个数据类型的层次图。所述至少一个处理器还可被编程和/或配置以通过重复遍历所述层次图以生成数据的多个记录来生成合成数据集,所述多个记录中的每个记录包括与所述多个数据类型相关联的值。
9.在一些非限制性实施例或方面,待评估环境可以是支付交易处理网络,所述支付交易处理网络包括被编程和/或配置以处理多个交易的交易处理系统。所述至少一个处理器还可被编程和/或配置以使用所述合成数据集来训练欺诈检测系统的至少一个机器学习模型。所述至少一个处理器还可被编程和/或配置以接收与商家系统与支付装置之间的交易相关联的授权请求。所述至少一个处理器还可被编程和/或配置以在所述交易的支付处理期间将所述授权请求的至少一部分传送到所述欺诈检测系统。所述至少一个处理器还可被编程和/或配置以从所述欺诈检测系统接收所述交易的欺诈评估。所述至少一个处理器还可被编程和/或配置以基于所述欺诈评估而拒绝所述授权请求。所述多个数据类型可包括以下至少两个:交易时间、支付装置持有人账户标识符、交易描述、发行方标识符、收单方标识符、交易标识符、商家账户标识符,或其任何组合。
10.在一些非限制性实施例或方面,所述至少一个处理器还可被编程和/或配置以在用户界面中显示所述多个数据类型或引起所述多个数据类型的显示。在一些非限制性实施例或方面,所述至少一个处理器还可被编程和/或配置以基于所述用户界面中标识所述多个数据类型内的关联的用户输入而接收所述多个相关性。应用于有向无环图的路径遍历技术可包括随机漫步(random walk)技术或广度优先搜索(breadth first search)技术。
11.根据一些非限制性实施例或方面,提供一种用于生成合成数据的计算机程序产品。所述计算机程序产品可包括至少一个非瞬态计算机可读介质,其包括程序指令,所述程序指令在由至少一个处理器执行时使所述至少一个处理器接收与待评估环境相关联的多个数据类型。所述程序指令还可使所述至少一个处理器接收多个相关性,所述多个相关性中的每个相关性包括所述多个数据类型中的一个数据类型对所述多个数据类型中的另一数据类型的依赖性。所述程序指令还可使所述至少一个处理器基于所述多个相关性生成所
述多个数据类型的相关性图。所述程序指令还可使所述至少一个处理器基于所述相关性图生成所述多个数据类型的有向无环图。所述程序指令还可使所述至少一个处理器通过将路径遍历技术应用于所述有向无环图而生成所述多个数据类型的层次图。所述程序指令还可使所述至少一个处理器通过重复遍历所述层次图以生成数据的多个记录来生成合成数据集,所述多个记录中的每个记录包括与所述多个数据类型相关联的值。
12.在一些非限制性实施例或方面,待评估环境可以是支付交易处理网络,所述支付交易处理网络包括被编程和/或配置以处理多个交易的交易处理系统。所述多个数据类型可包括以下至少两个:交易时间、支付装置持有人账户标识符、交易描述、发行方标识符、收单方标识符、交易标识符、商家账户标识符,或其任何组合。所述程序指令还可使所述至少一个处理器使用所述合成数据集来训练欺诈检测系统的至少一个机器学习模型。所述程序指令还可使所述至少一个处理器接收与商家系统与支付装置之间的交易相关联的授权请求。所述程序指令还可使所述至少一个处理器在所述交易的支付处理期间将所述授权请求的至少一部分传送到所述欺诈检测系统。所述程序指令还可使所述至少一个处理器从所述欺诈检测系统接收所述交易的欺诈评估。所述程序指令还可使所述至少一个处理器基于所述欺诈评估而拒绝所述授权请求。
13.在一些非限制性实施例或方面,所述程序指令还可使所述至少一个处理器在用户界面中显示所述多个数据类型或引起所述多个数据类型的显示。所述程序指令还可使所述至少一个处理器基于所述用户界面中标识所述多个数据类型内的关联的用户输入而接收所述多个相关性。应用于有向无环图的路径遍历技术可包括随机漫步(random walk)技术或广度优先搜索(breadth first search)技术。
14.在以下编号的条款中阐述其它实施例或方面:
15.第1条:一种计算机实施的方法包括:利用至少一个处理器接收与待评估环境相关联的多个数据类型;利用至少一个处理器接收多个相关性,所述多个相关性中的每个相关性包括所述多个数据类型中的一个数据类型对所述多个数据类型中的另一数据类型的依赖性;利用至少一个处理器基于所述多个相关性生成所述多个数据类型的相关性图;利用至少一个处理器基于所述相关性图生成所述多个数据类型的有向无环图;利用至少一个处理器通过将路径遍历技术应用于所述有向无环图而生成所述多个数据类型的层次图;以及利用至少一个处理器通过重复遍历所述层次图以生成数据的多个记录来生成合成数据集,所述多个记录中的每个记录包括与所述多个数据类型相关联的值。
16.第2条:根据第1条所述的计算机实施的方法,其中所述待评估环境是支付交易处理网络,所述支付交易处理网络包括被编程和/或配置以处理多个交易的交易处理系统。
17.第3条:根据第1条或第2条所述的计算机实施的方法,还包括利用至少一个处理器使用所述合成数据集来训练欺诈检测系统的至少一个机器学习模型。
18.第4条:根据第1至3条中的任一条所述的计算机实施的方法,还包括:利用至少一个处理器接收与商家系统与支付装置之间的交易相关联的授权请求;利用至少一个处理器在所述交易的支付处理期间将所述授权请求的至少一部分传送到所述欺诈检测系统;利用至少一个处理器从所述欺诈检测系统接收所述交易的欺诈评估;以及利用至少一个处理器基于所述欺诈评估而拒绝所述授权请求。
19.第5条:根据第1至4条中的任一条所述的计算机实施的方法,其中所述多个数据类
型包括以下至少两个:交易时间、支付装置持有人账户标识符、交易描述、发行方标识符、收单方标识符、交易标识符、商家账户标识符,或其任何组合。
20.第6条:根据第1至5条中的任一条所述的计算机实施的方法,还包括:利用至少一个处理器在用户界面中显示所述多个数据类型或引起所述多个数据类型的显示;以及利用至少一个处理器基于所述用户界面中标识所述多个数据类型内的关联的用户输入而接收所述多个相关性。
21.第7条:根据第1至6条中的任一条所述的计算机实施的方法,其中应用于所述有向无环图的所述路径遍历技术包括随机漫步技术或广度优先搜索技术。
22.第8条:一种包括服务器的系统,所述服务器包括至少一个处理器,所述至少一个处理器被编程和/或配置以:接收与待评估环境相关联的多个数据类型;接收多个相关性,所述多个相关性中的每个相关性包括所述多个数据类型中的一个数据类型对所述多个数据类型中的另一数据类型的依赖性;基于所述多个相关性生成所述多个数据类型的相关性图;基于所述相关性图生成所述多个数据类型的有向无环图;通过将路径遍历技术应用于所述有向无环图而生成所述多个数据类型的层次图;以及通过重复遍历所述层次图以生成数据的多个记录来生成合成数据集,所述多个记录中的每个记录包括与所述多个数据类型相关联的值。
23.第9条:根据第8条所述的系统,其中所述待评估环境是支付交易处理网络,所述支付交易处理网络包括被编程和/或配置以处理多个交易的交易处理系统。
24.第10条:根据第8条或第9条所述的系统,其中所述至少一个处理器还被编程和/或配置以使用所述合成数据集来训练欺诈检测系统的至少一个机器学习模型。
25.第11条:根据第8至10条中的任一条所述的系统,其中所述至少一个处理器还被编程和/或配置以:接收与商家系统与支付装置之间的交易相关联的授权请求;在所述交易的支付处理期间将所述授权请求的至少一部分传送到所述欺诈检测系统;从所述欺诈检测系统接收所述交易的欺诈评估;以及基于所述欺诈评估而拒绝所述授权请求。
26.第12条:根据第8至11条中的任一条所述的系统,其中所述多个数据类型包括以下至少两个:交易时间、支付装置持有人账户标识符、交易描述、发行方标识符、收单方标识符、交易标识符、商家账户标识符,或其任何组合。
27.第13条:根据第8至12条中的任一条所述的系统,其中所述至少一个处理器还被编程和/或配置以:在用户界面中显示所述多个数据类型或引起所述多个数据类型的显示;以及基于所述用户界面中标识所述多个数据类型内的关联的用户输入而接收所述多个相关性。
28.第14条:根据第8至13条中的任一条所述的系统,其中应用于所述有向无环图的所述路径遍历技术包括随机漫步技术或广度优先搜索技术。
29.第15条:一种计算机程序产品,其包括至少一个非瞬态计算机可读介质,所述至少一个非瞬态计算机可读介质包括程序指令,所述程序指令在由至少一个处理器执行时使所述至少一个处理器:接收与待评估环境相关联的多个数据类型;接收多个相关性,所述多个相关性中的每个相关性包括所述多个数据类型中的一个数据类型对所述多个数据类型中的另一数据类型的依赖性;基于所述多个相关性生成所述多个数据类型的相关性图;基于所述相关性图生成所述多个数据类型的有向无环图;通过将路径遍历技术应用于所述有向
无环图而生成所述多个数据类型的层次图;以及通过重复遍历所述层次图以生成数据的多个记录来生成合成数据集,所述多个记录中的每个记录包括与所述多个数据类型相关联的值。
30.第16条:根据第15条所述的计算机程序产品,其中所述待评估环境是支付交易处理网络,所述支付交易处理网络包括被编程和/或配置以处理多个交易的交易处理系统,并且其中所述多个数据类型包括以下至少两个:交易时间、支付装置持有人账户标识符、交易描述、发行方标识符、收单方标识符、交易标识符、商家账户标识符,或其任何组合。
31.第17条:根据第15条或第16条所述的计算机程序产品,其中所述程序指令还使所述至少一个处理器使用所述合成数据集来训练欺诈检测系统的至少一个机器学习模型。
32.第18条:根据第15至17条中的任一条所述的计算机程序产品,其中所述程序指令还使所述至少一个处理器:接收与商家系统与支付装置之间的交易相关联的授权请求;在所述交易的支付处理期间将所述授权请求的至少一部分传送到所述欺诈检测系统;从所述欺诈检测系统接收所述交易的欺诈评估;以及基于所述欺诈评估而拒绝所述授权请求。
33.第19条:根据第15至18条中的任一条所述的计算机程序产品,其中所述程序指令还使所述至少一个处理器:在用户界面中显示所述多个数据类型或引起所述多个数据类型的显示;以及基于所述用户界面中标识所述多个数据类型内的关联的用户输入而接收所述多个相关性。
34.第20条:根据第15至19条中的任一条所述的计算机程序产品,其中应用于所述有向无环图的所述路径遍历技术包括随机漫步技术或广度优先搜索技术。
35.在参考附图和附录考虑以下描述和所附权利要求书之后,本公开的这些和其它特征和特性以及相关结构元件和各部分的组合的操作方法和功能以及制造经济性将变得更加显而易见,所有附图和附录形成本说明书的部分,其中相似附图标号在各图中标示对应部分。然而,应明确地理解,图式仅用于说明及描述的目的,且不希望作为对本公开的限制的定义。除非上下文另外明确规定,否则在本说明书和权利要求书中使用时,单数形式“一”和“所述”包括多个指示物。
附图说明
36.下文参考所附示意图中示出的示例性实施例或方面更详细地解释本公开的额外优势和细节,图中:
37.图1是其中可实施本文所描述的系统、设备和/或方法的环境的非限制性实施例或方面的图;
38.图2是示出根据本公开的原理的用于生成合成数据的方法的非限制性实施例或方面的流程图;
39.图3是示出根据本公开的原理的用于生成合成数据的方法的非限制性实施例或方面的流程图;
40.图4是图1的一个或多个装置的部件的非限制性实施例或方面的图;
41.图5是示出根据本公开的原理的用于生成合成数据的方法的非限制性实施例或方面的流程图;
42.图6是根据本公开的原理的用于生成合成数据的方法的非限制性实施例或方面的
相关性图;
43.图7是根据本公开的原理的用于生成合成数据的方法的非限制性实施例或方面的有向无环图;
44.图8是遍历根据本公开的原理的用于生成合成数据的方法的非限制性实施例或方面的有向无环图中的路径的第一步骤;
45.图9是遍历根据本公开的原理的用于生成合成数据的方法的非限制性实施例或方面的有向无环图中的路径的第二步骤;
46.图10是遍历根据本公开的原理的用于生成合成数据的方法的非限制性实施例或方面的有向无环图中的路径的第三步骤;
47.图11是遍历根据本公开的原理的用于生成合成数据的方法的非限制性实施例或方面的有向无环图中的路径的第四步骤;
48.图12是遍历根据本公开的原理的用于生成合成数据的方法的非限制性实施例或方面的有向无环图中的路径的第五步骤;
49.图13是根据本公开的原理的用于生成合成数据的方法的非限制性实施例或方面的层次图;以及
50.图14是与将值分配给根据本公开原理的用于生成合成数据的方法的非限制性实施例或方面的数据类型相关联的示意图。
具体实施方式
51.下文出于描述的目的,术语“端”、“上”、“下”、“右”、“左”、“竖直”、“水平”、“顶部”、“底部”、“横向”、“纵向”以及其衍生词应涉及本公开如其在附图中的定向。然而,应理解,除了明确指定相反情况之外,本公开可以采用各种替代变化和步骤序列。还应理解,附图中所说明的以及在以下说明中描述的特定装置和过程仅仅是本公开的示例性实施例或方面。因此,除非另有指示,否则与本文公开的实施例或实施例的方面相关联的特定维度和其它物理特性不应被视为限制。
52.本文所使用的方面、部件、元件、结构、动作、步骤、功能、指令等都不应当被理解为关键的或必要的,除非明确地如此描述。并且,如本文所使用,冠词“一”希望包括一个或多个项目,且可与“一个或多个”和“至少一个”互换使用。此外,如本文中所使用,术语“集合”希望包括一个或多个项目(例如,相关项目、不相关项目、相关项目与不相关项目的组合等),并且可与“一个或多个”或“至少一个”互换使用。在希望仅有一个项目的情况下,使用术语“一个”或类似语言。且,如本文中所使用,术语“具有”等希望是开放式术语。另外,除非另外明确陈述,否则短语“基于”希望意味着“至少部分地基于”。
53.如本文所使用,术语“通信”和“传送”可以指信息(例如,数据、信号、消息、指令、命令等)的接收、接纳、传输、传送、提供等。一个单元(例如,装置、系统、装置或系统的部件、其组合等)与另一单元通信意味着所述一个单元能够直接或间接地从所述另一单元接收信息和/或向所述另一单元发送(例如,传输)信息。这可以指代本质上有线和/或无线的直接或间接连接。另外,即使所发送的信息可能在第一单元与第二单元之间被修改、处理、中继和/或路由,这两个单元也可以彼此通信。例如,即使第一单元被动地接收信息且不会主动地将信息发送到第二单元,第一单元也可以与第二单元通信。作为另一示例,如果至少一个中间
单元(例如,位于第一单元与第二单元之间的第三单元)处理从第一单元接收的信息且将处理后的信息发送到第二单元,则第一单元可以与第二单元通信。在一些非限制性实施例或方面,消息可以指包括数据的网络包(例如,数据包等)。
54.如本文所使用,术语“发行方”、“发行方机构”、“发行方银行”或“支付装置发行方”可指向个体(例如,用户、客户等)提供用于进行例如信用支付交易和/或借记支付交易等支付交易的账户的一个或多个实体。例如,发行方机构可向客户提供唯一地标识与所述客户相关联的一个或多个账户的账户标识符,例如主账号(pan)。在一些非限制性实施例或方面,发行方可以与唯一地标识发行方机构的银行标识号码(bin)相关联。如本文所使用,“发行方系统”可以指由发行方或代表发行方操作的一个或多个计算机系统,例如执行一个或多个软件应用程序的服务器。例如,发行方系统可以包括用于授权交易的一个或多个授权服务器。
55.如本文所使用,术语“账户标识符”可以包括与账户相关联的一种或多种类型的标识符(例如,与账户相关联的pan、与账户相关联的卡号、与账户相关联的支付卡号、与账户相关联的令牌等)。在一些非限制性实施例或方面,发行方可以向用户(例如账户持有人)提供账户标识符(例如,pan、令牌等),所述账户标识符唯一地标识与所述用户相关联的一个或多个账户。账户标识符可以体现在支付装置(例如,用于进行支付交易的物理工具,例如支付卡、信用卡、借记卡、礼品卡等)上,和/或可以是向用户传送的电子信息,用户可以将其用于电子支付交易。在一些非限制性实施例或方面,账户标识符可以是原始账户标识符,其中在创建与账户标识符相关联的账户时,将原始账户标识符提供给用户。在一些非限制性实施例或方面,账户标识符可以是补充账户标识符,其可以包括在原始账户标识符提供给用户之后被提供给用户的账户标识符。例如,如果原始账户标识符被遗忘、被盗等,可将补充账户标识符提供给用户。在一些非限制性实施例或方面,账户标识符可直接或间接地与发行方机构相关联,使得账户标识符可以是映射到pan或其它类型账户标识符的令牌。账户标识符可以是文数字、字符和/或符号的任何组合等。
56.如本文所使用,术语“商家”可以指基于支付交易等交易向用户(例如,客户、顾客等)提供商品、服务和/或对商品和/或服务的访问的一个或多个实体(例如,零售业务的运营商)。如本文所使用,术语“商家系统”可以指由商家或代表商家操作的一个或多个计算机系统,例如执行一个或多个软件应用程序的服务器。如本文所使用,术语“产品”可以指由商家提供的一个或多个商品和/或服务。
57.如本文所使用,术语“销售点(pos)装置”可指可由商家用来发起交易(例如,支付交易)的一个或多个电子装置,例如交易终端。pos装置可包括外围装置、读卡器、扫描装置(例如,代码扫描器等)、通信接收器、近场通信(nfc)接收器、射频标识(rfid)接收器和/或其它非接触式收发器或接收器、基于接触的接收器、支付终端等。如本文所使用,术语“销售点(pos)系统”可以指商家用来进行交易的一个或多个客户端装置和/或外围装置。例如,pos系统可以包括一个或多个pos装置,和/或可用于进行支付交易的其它类似装置。在一些非限制性实施例或方面,pos系统(例如,商家pos系统)可以包括被编程或配置成通过网页、移动应用程序等处理在线支付交易的一个或多个服务器计算机。
58.如本文所使用,术语“交易服务提供商”可以指接收来自商家或其它实体的交易授权请求且在一些情况下通过交易服务提供商与发行方机构之间的协议来提供支付保证的
实体。在一些非限制性实施例或方面,交易服务提供商可包括信用卡公司、借记卡公司、例如american等支付网络,或处理交易的任何其它实体。如本文所使用,术语“交易处理系统”可以指由交易服务提供商或代表交易服务提供商操作的一个或多个计算机系统,例如执行一个或多个软件应用程序的交易处理系统。交易处理系统可包括一个或多个处理器,并且在一些非限制性实施例或方面中可由交易服务提供商或代表交易服务提供商操作。交易处理系统可在支付交易处理网络中处理交易,所述支付交易处理网络可包括一个或多个商家系统、收单方系统、发行方系统、支付网关等。
59.如本文所使用,术语“计算装置”可以指被配置成处理数据的一个或多个电子装置。在一些示例中,计算装置可以包括接收、处理和输出数据的必要部件,例如处理器、显示器、存储器、输入装置、网络接口等。计算装置可以是移动装置。作为示例,移动装置可以包括蜂窝电话(例如,智能电话或标准蜂窝电话)、便携式计算机、可穿戴装置(例如,手表、眼镜、镜片、衣物等)、个人数字助理(pda)和/或其它类似装置。计算装置还可以是台式计算机或其它形式的非移动计算机。
60.如本文所使用,术语“服务器”可以指或包括由互联网等网络环境中的多方操作或促进所述多方的通信和处理的一个或多个计算装置,但应了解,可通过一个或多个公共或专用网络环境促进通信,并且可能有各种其它布置。此外,在网络环境中直接或间接通信的多个计算装置(例如服务器、pos装置、移动装置等)可构成“系统”。如本文所使用,对“服务器”或“处理器”的提及可指陈述为实施先前步骤或功能的先前所述服务器和/或处理器、不同的服务器和/或处理器,和/或服务器和/或处理器的组合。例如,如在说明书和权利要求书中所使用,陈述为执行第一步骤或功能的第一服务器和/或第一处理器可指陈述为执行第二步骤或功能的相同或不同服务器和/或处理器。
61.如本文所使用,术语“收单方”可以指由交易服务提供商许可且由交易服务提供商批准以发起涉及与交易服务提供商相关联的支付装置的交易(例如,支付交易)的实体。如本文所使用,术语“收单方系统”也可以指由收单方或代表收单方操作的一个或多个计算机系统、计算机装置等。收单方可发起的交易可包括支付交易(例如购买、原始信用交易(oct)、账户资金交易(aft)等)。在一些非限制性实施例或方面中,收单方可以由交易服务提供商授权以与商家或服务提供商签约,发起涉及与交易服务提供商相关联的支付装置的交易。收单方可与支付服务商签合约,以使支付服务商能够向商家提供赞助。收单方可以根据交易服务提供商规章监视支付服务商的合规性。收单方可以对支付服务商进行尽职调查,并确保在与受赞助的商家签约之前发生适当的尽职调查。收单方可能对收单方操作或赞助的所有交易服务提供商计划负责任。收单方可以负责收单方支付服务商、由收单方支付服务商赞助的商家等等的行为。在一些非限制性实施例或方面中,收单方可以是金融机构,例如银行。
62.如本文所使用,术语“客户端”和“客户端装置”可以指一个或多个计算装置,例如处理器、存储装置和/或访问服务器提供的服务的类似计算机部件。在一些非限制性实施例或方面,“客户端装置”可指促进支付交易的一个或多个装置,例如商家使用的销售点(pos)装置和/或pos系统。在一些非限制性实施例或方面,客户端装置可包括被配置成与一个或多个网络通信和/或促进支付交易的电子装置,例如但不限于一个或多个台式计算机、一个或多个便携式计算机(例如,平板计算机)、一个或多个移动装置(例如,蜂窝电话、智能电
话、pda、可穿戴装置,例如手表、眼镜、镜片和/或衣物等),和/或其它类似装置。此外,“客户端”还可以指拥有、利用和/或操作客户端装置以促进与交易服务提供商的支付交易的实体,例如商家。
63.如本文所使用,术语“电子钱包”、“电子钱包移动应用程序”和“数字钱包”可以指被配置成发起和/或进行交易(例如,支付交易、电子支付交易等)的一个或多个电子装置,包括一个或多个软件应用程序。例如,电子钱包可包括执行应用程序的用户装置(例如,移动装置)以及用于维护和向用户装置提供在支付交易期间要使用的数据的服务器端软件和/或数据库。如本文所使用,术语“电子钱包提供商”可包括为用户(例如,客户)提供和/或维护电子钱包和/或电子钱包移动应用程序的实体。电子钱包提供商的示例包括但不限于googleandroidapple和samsung在一些非限制性示例中,金融机构(例如,发行方机构)可以是电子钱包提供商。如本文所使用,术语“电子钱包提供商系统”可以指由电子钱包提供商或代表电子钱包提供商操作的一个或多个计算机系统、计算机装置、服务器、服务器群组等。
64.如本文所使用,术语“支付装置”可以指支付卡(例如信用卡或借记卡)、礼品卡、智能卡、智能介质、工资卡、医疗保健卡、腕带、含有账户信息的机器可读介质、钥匙链装置或吊坠、rfid应答器、零售商折扣或会员卡等。支付装置可以包括易失性或非易失性存储器以存储信息(例如,账户标识符、账户持有人的姓名等)。
65.如本文中所使用,术语“支付网关”可指实体和/或由此类实体或代表此类实体操作的支付处理系统,所述实体(例如商家服务提供商、支付服务提供商、支付服务商、与收单方有合约的支付服务商、支付集合人(payment aggregator)等)将支付服务(例如交易服务提供商支付服务、支付处理服务等)提供到一个或多个商家。支付服务可以与由交易服务提供商管理的便携式金融装置的使用相关联。如本文所使用,术语“支付网关系统”可以指由支付网关或代表支付网关操作的一个或多个计算机系统、计算机装置、服务器、服务器群组等。
66.如本文中所使用,术语“系统”可指一个或多个计算装置或计算装置组合,例如但不限于处理器、服务器、客户端装置、软件应用程序和/或其它类似部件。此外,如本文所使用,对“服务器”或“处理器”的参考可指先前所述的陈述为执行先前步骤或功能的服务器和/或处理器、不同的服务器和/或处理器,和/或服务器和/或处理器的组合。例如,如在说明书和权利要求书中所使用,陈述为执行第一步骤或功能的第一服务器和/或第一处理器可指陈述为执行第二步骤或功能的相同或不同服务器和/或处理器。
67.如本文所使用,术语“令牌”可以指用作另一账户标识符(例如pan)的替代或替换另一账户标识符的账户标识符。令牌可与一个或多个数据结构(例如一个或多个数据库等)中的pan或另一原始账户标识符相关联,使得令牌可用于进行支付交易而无需直接使用原始账户标识符。在一些非限制性实施例或方面中,pan等原始账户标识符可与用于不同个体或目的的多个令牌相关联。在一些非限制性实施例或方面,令牌可以与pan或一个或多个数据结构中的其它账户标识符相关联,使得令牌可以用来进行交易,而无需直接使用pan或其它账户标识符。在一些示例中,pan等账户标识符可与用于不同用途或目的的多个令牌相关联。
68.本公开的非限制性实施例或方面涉及用于生成合成数据的系统、方法和计算机程
序产品。所描述的系统和方法提供了对减少用于操作计算机联网环境的计算机资源(例如,正常运行时间、通信数量、带宽、处理能力等)的技术改进。所描述的系统和方法消除了计算机系统完全运行需要的启动时间,而所述启动时间原本在首先监测环境事件、测量用户数据、随后训练/测试系统部件、生成可用的合成数据和/或管理用户交互的情况下是必需的。所描述的系统和方法在技术上也可适应,因为不依赖于测得数据的此类合成数据可允许立即进行系统操作,而合成数据可稍后在获取测得数据时修改,从而消除系统设置与操作之间的空隙。此外,因为测得数据不是必要的,因此所描述的系统和方法提供一种通过合成数据生成来对未来数据集建模的方式。
69.合成数据可用于训练机器学习模型、设计用户界面、辅助端对端产品开发等。并非由测得数据生成的合成数据提供了系统安全性的另一技术益处,因为不需要收集环境中真实用户的个人信息。此外,并非由测得数据生成的合成数据加速了计算机驱动的开发时间线,因为所述合成数据减少了模型、程序等在能运行之前进行训练和/或测试所需的时间。例如,在可获得足够的测得数据而以其它方式生成合成数据之前,可使支付交易处理网络的欺诈检测系统较早地在新环境中运行。通过使用基于根据本文所描述的系统和方法生成的合成数据训练的机器学习模型,可比基于测得数据训练的机器学习模型更早地检测到欺诈性交易。较早检测节省了此后例如在欺诈交易因缺乏测得数据而未被检测到的情况下采用补救措施所需的计算机时间和资源。
70.现参考图1,示出根据本公开的非限制性实施例或方面的环境100的示意图。环境100可包括数据生成系统106,所述系统可与交易服务提供商相关联。环境100可包括交易处理系统118。交易处理系统118和数据生成系统106可与同一交易服务提供商相关联。数据生成系统106可被编程和/或配置以根据本文所描述的方法生成合成数据集。例如,数据生成系统106可接收多个数据类型,接收多个数据类型当中的多个相关性,从所述多个相关性生成相关性图,从相关性图生成有向无环图,从有向无环图生成层次图,以及通过重复遍历所述层次图来生成合成数据集。数据生成系统106可使用生成的合成数据集训练和/或测试一个或多个系统的一个或多个机器学习模型。环境100可包括用户界面108,其可用于显示所述多个数据类型并接收一个或多个相关性的用户输入。
71.环境100可包括与支付装置112的持有人相关联的支付装置112。支付装置112可用于参与交易,以便从支付装置112的持有人向商家进行支付。环境可包括商家的商家系统116的销售点(pos)装置114。可向支付装置112提供商家系统116的pos装置114,和/或所述支付装置与所述pos装置通信,以促进交易。环境100可包括交易处理系统118。商家系统116可将交易的授权请求例如通过收单方系统和/或支付网关传送到交易处理系统118,以用于处理交易。环境100可包括欺诈检测系统120。欺诈检测系统120可被编程和/或配置以与交易处理系统118通信以接收授权请求的至少一部分并基于所述授权请求的至少一部分生成欺诈评估。可利用数据生成系统106生成的合成数据来训练和/或测试欺诈检测系统120的一个或多个机器学习模型。交易处理系统118、欺诈检测系统120和/或数据生成系统106可包括在同一系统中。
72.环境100可包括通信网络110,环境100的一个或多个装置和/或系统可通过所述通信网络通信。支付交易处理网络可包括通信网络110的部分或全部。通信网络110可包括用于在一个或多个商家系统116、交易处理系统118、欺诈检测系统120、数据生成系统106、用
户界面108等的子集组合之间通信的一个或多个信道。
73.现参考图2,示出用于生成合成数据的方法200。方法200可由pos装置114、商家系统116、交易处理系统118、欺诈检测系统120、数据生成系统106、用户界面108、通信网络110等的一个或多个计算装置执行。方法200的一个或多个步骤可由与方法200的前一步骤或后一步骤相同或不同的计算装置执行。
74.在步骤202,可接收多个数据类型。例如,数据生成系统106可接收与待评估环境相关联的多个数据类型。在一些非限制性实施例或方面,待评估环境可以是支付交易处理网络。所述支付交易处理网络可包括被编程和/或配置以处理多个交易的交易处理系统118。例如,多个数据类型可与交易数据相关联,并且可包括但不限于:交易标识符(例如,交易的唯一标识符)、借方金额(例如,将从与交易相关联的支付装置账户中扣除的金额)、贷方金额(例如,将添加到与交易相关联的商家账户的金额)、交易描述、支付装置持有人账户标识符(例如,与发行方管理的支付装置持有人账户相关联的标识符、与交易中使用的支付装置相关联的账户)、支付装置持有人标识符(例如,与交易支付装置持有人相关联的标识符)、支付装置持有人姓名、商家账户标识符(例如,收单方管理的商家账户标识符、与交易中涉及的商家系统相关联的账户)、商家标识符(例如,与交易中涉及的商家相关联的标识符)、商家名称、发行方标识符(例如,与交易中涉及的支付装置账户相关联的发行方标识符)、收单方标识符(例如,与交易中涉及的商家账户相关联的收单方标识符)、交易时间、交易跟踪号(例如,由收单方系统分配的标识所述交易的唯一编号)、标准录入类别代码(sec码)(例如,指示账户/市场类型、交易类型、信用/数据交易方法等的特定支付应用程序的标识符)等。应了解,所述多个数据类型可针对待评估环境进行定制。
75.在步骤204,可接收多个相关性。例如,数据生成系统106可接收多个相关性,其中所述多个相关性中的每个相关性包括一个数据类型对另一数据类型的依赖性。例如,在包括支付交易处理网络的环境中,多个数据类型可与交易数据相关联,并且商家标识符可与商家名称相关联。进一步举例,交易时间可与跟踪号相关联,并且支付装置持有人姓名可与发行方标识符相关联。所述多个相关性可以是计算机生成的。另外或替代地,所述多个相关性可由用户输入。
76.在步骤206,可生成相关性图。例如,数据生成系统106可基于所述多个相关性生成所述多个数据类型的相关性图。相关性图可包括多个节点,每个节点与多个数据类型中的数据类型相关联。所述相关性图还可包括多个边,每个边与两个数据类型之间的相关性相关联。关于由多个数据类型生成的相关性图的示例,参看图6。
77.在步骤208,可生成有向无环图(dag)。例如,数据生成系统106可基于所述相关性图生成所述多个数据类型的dag。所述dag可包括多个节点,每个节点与一个或多个数据类型相关联,所述一个或多个数据类型可包括相关性图的一个或多个节点。数据生成系统106可将相关性图的数据类型(节点)组合到dag中的同一节点中,以在同一步骤中一起处理。所述dag可包括多个有向边,每个有向边与dag的一个节点对dag的另一节点的依赖性相关联。例如,有向边可由一端上带箭头的线进行视觉表示,其中邻近有向边的箭头端的节点依赖于连接到有向边的相对端的节点的值。dag的生成极大地简化相关性图,由此增大显著性并减少处理时间。
78.在步骤210,可生成层次图。例如,数据生成系统106可通过将路径遍历技术应用于
dag而生成所述多个数据类型的层次图。所述路径遍历技术可包括随机漫步技术。另外或替代地,所述路径遍历技术可包括广度优先搜索技术。参看图8到13以了解有关通过将路径遍历技术应用于dag而生成层次图的进一步描述。
79.在步骤212,可生成合成数据集。例如,数据生成系统106可通过重复遍历所述层次图以生成数据的多个记录来生成合成数据集。所述多个记录中的每个记录可包括与所述多个数据类型相关联的值。关于从层次图生成值的进一步描述,参看图14。
80.在步骤214,可训练至少一个机器学习模型。例如,数据生成系统106可训练环境100中的系统的一个或多个机器学习模型。所述合成数据集可用作替代测得数据的训练集,所述测得数据可原本用于训练所述机器学习模型。在一些非限制性实施例或方面,可在欺诈检测系统中包括待训练的机器学习模型。
81.在步骤216,可接收授权请求。例如,交易处理系统118可接收与商家系统116与支付装置112之间的交易相关联的授权请求。授权请求可包括交易数据,包括但不限于交易标识符、借方金额、贷方金额、交易描述、支付装置持有人账户标识符、支付装置持有人标识符、支付装置持有人姓名、商家账户标识符、商家标识符、商家名称、发行方标识符、收单方标识符、交易时间、交易跟踪号、sec码等。
82.在步骤218,可传送授权请求的至少一部分。例如,交易处理系统116可将授权请求的至少一部分(例如,其中的交易数据的一个或多个部分)传送到欺诈检测系统120。另外或替代地,交易处理系统116和欺诈检测系统120可以是相同系统和/或包括在同一系统内。
83.在步骤220,可接收欺诈评估。例如,交易处理系统116可从欺诈检测系统120接收交易的欺诈评估。欺诈检测系统120可至少部分地基于传送到欺诈检测系统120的授权请求的所述至少一部分来生成欺诈评估。
84.在步骤222,可拒绝授权请求。例如,交易处理系统116可(例如,至少部分地)基于从欺诈检测系统120接收的欺诈评估来拒绝授权请求。在一些非限制性实施例或方面,欺诈评估可包括与与所述授权请求相关联的交易是欺诈性交易的可能性相关联的分类或值。交易处理系统116可基于欺诈评估的分类或值满足预定阈值分类或值(例如,设置成使误报最少化的欺诈阈值)来拒绝与所述交易相关联的授权请求。
85.现参考图3,示出用于生成合成数据的方法300。方法300可由pos装置114、商家系统116、交易处理系统118、欺诈检测系统120、数据生成系统106、用户界面108、通信网络110等的一个或多个计算装置执行。方法300的一个或多个步骤可由与方法300的前一步骤或后一步骤相同或不同的计算装置执行。
86.在步骤202,可接收多个数据类型。例如,数据生成系统106可接收与待评估环境相关联的多个数据类型。
87.在步骤302,可显示多个数据类型。例如,数据生成系统106可在用户界面108中显示所述多个数据类型或引起所述多个数据类型的显示。在一些非限制性实施例或方面,用户界面108可在用户的计算装置上实施,所述计算装置经过训练以分析和标识数据类型中的相关性。
88.在步骤304,可接收多个相关性。例如,数据生成系统106可基于用户界面108中标识多个数据类型内的关联的用户输入来接收多个相关性。在一些非限制性实施例或方面,用户输入可包括用户在用户界面108中选择至少一组两个或更多个相关的数据类型。可根
据用户输入确定和/或生成多个相关性。
89.在步骤206,可生成相关性图。例如,数据生成系统106可基于根据用户输入确定和/或生成的所述多个相关性来生成相关性图。图2中描绘的后续步骤208到222可跟在方法300的步骤206之后。
90.现参考图4,示出装置400的示例部件的图。装置400可对应于支付装置112的一个或多个装置、pos装置114的一个或多个装置、商家系统116的一个或多个装置、交易处理系统118的一个或多个装置、欺诈检测系统120的一个或多个装置、数据生成系统106的一个或多个装置、用户界面108的一个或多个装置和/或通信网络110的一个或多个装置。在一些非限制性实施例或方面,前文的一个或多个装置可包括至少一个装置400和/或装置400的至少一个部件。如图4中所示,装置400可包括总线402、处理器404、存储器406、存储部件408、输入部件410、输出部件412和通信接口414。
91.总线402可包括准许装置400的部件之间的通信的部件。在一些非限制性实施例或方面,处理器404可在硬件、软件或硬件与软件的组合中实施。例如,处理器404可包括处理器(例如中央处理单元(cpu)、图形处理单元(gpu)、加速处理单元(apu)等)、微处理器、数字信号处理器(dsp)和/或可被编程以执行功能的任何处理部件(例如现场可编程门阵列(fpga)、专用集成电路(asic)等)。存储器406可包括随机存取存储器(ram)、只读存储器(rom)和/或存储供处理器404使用的信息和/或指令的另一类型的动态或静态存储装置(例如快闪存储器、磁存储器、光学存储器等)。
92.存储部件408可存储与装置400的操作和使用相关的信息和/或软件。例如,存储部件408可包括硬盘(例如磁盘、光盘、磁光磁盘、固态磁盘等)、压缩光盘(cd)、数字多功能光盘(dvd)、软盘、盒带、磁带和/或另一类型的计算机可读介质,以及相应的驱动器。
93.输入部件410可包括准许装置400例如通过用户输入(例如触摸屏显示器、键盘、小键盘、鼠标、按钮、开关、麦克风、相机等)接收信息的部件。另外或替代地,输入部件410可包括用于感测信息的传感器(例如全球定位系统(gps)部件、加速度计、陀螺仪、致动器等)。输出部件412可包括从装置400提供输出信息的部件(例如显示器、扬声器、一个或多个发光二极管(led)等)。
94.通信接口414可包括使装置400能够例如通过有线连接、无线连接或有线和无线连接的组合与其它装置通信的收发器类部件(例如收发器、单独的接收器和发送器等)。通信接口414可准许装置400从另一装置接收信息和/或提供信息给另一装置。例如,通信接口414可包括以太网接口、光接口、同轴接口、红外接口、射频(rf)接口、通用串行总线(usb)接口、接口、蜂窝网络接口等。
95.装置400可执行本文中所描述的一个或多个过程。装置400可基于处理器404执行由存储器406和/或存储部件408等计算机可读介质存储的软件指令来执行这些过程。计算机可读介质(例如,非瞬态计算机可读介质)在本文中定义为非瞬态存储器装置。非瞬态存储器装置包括位于单个物理存储装置内部的存储器空间或散布于多个物理存储装置上的存储器空间。
96.软件指令可通过通信接口414从另一计算机可读介质或从另一装置读取到存储器406和/或存储部件408中。在被执行时,存储在存储器406和/或存储部件408中的软件指令可使处理器404执行本文中所描述的一个或多个过程。另外或替代地,硬接线电路系统可以
替代或结合软件指令使用以执行本文中所描述的一个或多个过程。因此,本文描述的实施例或方面不限于硬件电路系统和软件的任何特定组合。
97.存储器406和/或存储部件408可包括数据存储装置或一个或多个数据结构(例如数据库等)。装置400能够从存储器406和/或存储部件408中的数据存储装置或一个或多个数据结构接收信息、将信息存储于所述数据存储装置或一个或多个数据结构中、向所述数据存储装置或一个或多个数据结构传送信息或搜索其中存储的信息。例如,信息可以包括加密数据、输入数据、输出数据、交易数据、账户数据或其任何组合。
98.提供图4中示出的部件的数目和布置作为实例。在一些非限制性实施例或方面,与图4中所示的那些相比,装置400可包括额外部件、更少部件、不同部件或以不同方式布置的部件。另外或替代地,装置400的一组部件(例如一个或多个部件)可执行被描述为由装置400的另一组部件执行的一个或多个功能。
99.现参考图5,描绘了根据本公开的原理的用于生成合成数据的方法的流程图。所描绘的方法包括可由pos装置114、商家系统116、交易处理系统118、欺诈检测系统120、数据生成系统106、用户界面108、通信网络110等中的一个或多个计算装置执行的一系列步骤。所描绘的方法的一个或多个步骤可由与所描绘的方法的前一步骤或后一步骤相同或不同的计算装置执行。
100.步骤502包括相关性过程。例如,可标识待评估环境,并且针对所述环境限定一组数据类型。可通过使用数据生成系统106分析样本数据集来生成多个相关性。另外或替代地,可基于具有所述环境的专业知识的用户的输入生成多个相关性。
101.步骤504包括统计分布过程。例如,现有样本数据集的统计分布可由数据生成系统106分析,以确定针对待评估环境限定的数据类型之间的相关性。
102.步骤506包括生成相关性图的过程。例如,基于步骤502中的相关性过程和/或步骤504中的统计分布过程,数据生成系统106可生成表示多个数据类型内的相关性的相关性图。
103.步骤508包括生成有向无环图(dag)的过程。例如,数据生成系统106可基于步骤506的相关性图生成dag。
104.步骤510包括搜索算法过程。例如,数据生成系统106可将搜索算法(例如,路径遍历技术,例如随机漫步、广度优先等)应用于dag,以确定待从dag中的数据类型生成的值的依赖次序。
105.步骤512包括层次图过程。例如,基于步骤510,数据生成系统106可基于应用于dag的搜索算法生成所述多个数据类型的层次图。
106.步骤514包括合成数据集生成过程。例如,数据生成系统106可通过重复遍历步骤512中生成的层次图以生成合成数据集的多个记录来生成合成数据集。
107.现参考图6,描绘了根据用于生成合成数据的方法的一些非限制性实施例或方面的相关性图。所描绘的相关性图可针对作为待评估环境的支付交易处理网络而生成。所示的多个数据类型表示可由支付交易处理系统中的交易处理系统118处理的交易。所述多个数据类型包括但不限于交易标识符、借方金额、贷方金额、交易描述、支付装置持有人账户标识符、支付装置持有人标识符、支付装置持有人姓名、商家账户标识符、商家标识符、商家名称、发行方标识符、收单方标识符、交易时间、交易跟踪号和sec码。每个数据类型与相关
性图的节点相关联。相关性图的每个边表示两个节点之间的相关性(例如,两个数据类型之间的相关性)。应了解,生成相关性图的上述技术可应用于包括其它数据类型的环境。
108.现参考图7,描绘了根据用于生成合成数据的方法的一些非限制性实施例或方面的有向无环图(dag)。可基于图6中描绘的相关性图生成描绘的dag。dag的每个节点表示一个或多个数据类型。图6的相关性图的某些节点已基于相关性图中指示的数据类型的相关性(例如,可能指示需要同一生成步骤的强相关性)而组合。以下数据类型已组合到dag中的相应相同节点中:(i)支付装置持有人姓名、支付装置持有人标识符、商家名称、商家标识符;(ii)收单方标识符、发行方标识符;(iii)支付装置持有人账户标识符、商家账户标识符;以及(iv)贷方金额、借方金额。dag的每个有向边表示节点对连接的节点的依赖性(例如,生成次序)。例如,表示邻近有向边的箭头端的一个或多个数据类型的节点可依赖于表示邻近有向边的非箭头端的一个或多个数据类型的节点。进一步举例,交易时间节点依赖于交易跟踪号节点。应了解,生成dag的上述技术可应用于包括其它数据类型的环境。
109.现参考图8到12,描绘了应用于图7的dag的路径遍历技术(例如,广度优先搜索技术,包括最长路径技术)的步骤(例如,第一步骤到第五步骤)。为便于参考,已为相应节点的数据类型分配节点字母。例如,图8到12的节点a对应于图7中包括sec码数据类型的节点。图8到12的节点b对应于图7中包括借方金额和贷方金额数据类型的节点。图8到12的节点c对应于图7中包括交易标识符数据类型的节点。图8到12的节点d对应于图7中包括交易描述数据类型的节点。图8到12的节点e对应于图7中包括支付装置持有人账户标识符和商家账户标识符数据类型的节点。图8到12的节点f对应于图7中包括收单方标识符和发行方标识符数据类型的节点。图8到12的节点g对应于图7中包括支付装置持有人姓名、支付装置持有人标识符、商家名称和商家标识符数据类型的节点。图8到12的节点h对应于图7中包括交易跟踪号数据类型的节点。图8到12的节点i对应于图7中包括交易时间数据类型的节点。图8到12中的每个图中所描绘的表将节点示为行并将迭代(步骤)示为列。由于路径遍历技术的第一步骤包括标识索引节点,因此第一步骤在表中被指定为迭代0。
110.具体参考图8,描绘了用于遍历图7的dag的路径遍历技术的第一步骤。描绘的路径遍历技术是广度优先搜索(例如,最长路径),但可应用其它路径遍历技术。节点a可被标识为路径遍历的开始,因为节点a不依赖于任何其它节点。因此,节点a的路径长度可给定为0,因为节点a是索引节点。表示出在迭代0(第一步骤),到dag的每个节点的当前最长路径是零,因为最远遍历到节点a。
111.具体参考图9,描绘了用于遍历图7的dag的路径遍历技术的第二步骤。起于节点a,有向边通向节点b、c、d和e。因此,节点b、c、d和e可被给予路径长度1(例如,节点a的路径长度加1)。已更新所描绘的表以反映在迭代1(第二步骤)中,节点b、c、d和e现在具有最长路径长度1。鉴于节点a是索引节点,节点a保持在长度0。在第二步骤中,其余节点尚未到达并且保持长度0。
112.具体参考图10,描绘了用于遍历图7的dag的路径遍历技术的第三步骤。起于节点c,有向边通向节点b和d。因此,节点b和d可被给予路径长度2(例如,节点c的路径长度加1)。起于节点e,有向边通向节点f和g。因此,节点f和g可被给予路径长度2(例如,节点e的路径长度加1)。已更新所描绘的表以反映在迭代2(第三步骤)中,节点b和d现在具有最长路径长度2。在迭代2中,已到达的节点f和g也进行了更新以示出路径长度2。鉴于节点a是索引节
点,节点a保持在长度0。在第三步骤中,其余节点尚未到达并且保持长度0。
113.具体参考图11,描绘了用于遍历图7的dag的路径遍历技术的第四步骤。起于节点f,有向边通向节点g和h。因此,节点g和h可被给予路径长度3。已更新所描绘的表以反映在迭代3(第四步骤)中节点g和h的最长路径长度。鉴于节点a是索引节点,节点a保持在长度0。在第四步骤中,节点i尚未到达并且保持长度0。
114.具体参考图12,描绘了用于遍历图7的dag的路径遍历技术的第五步骤。起于节点h,有向边通向节点i。因此,节点i可被给予路径长度4(例如,到节点h的最长路径长度加1)。已更新所描绘的表以反映在迭代4(第五步骤)中节点i的最长路径长度。鉴于节点a是索引节点,节点a保持在长度0。除a之外的所有节点都已沿有向边的路径到达,并且没有任何节点仍未到达。因此,已通过迭代4计算出所有节点的最长路径。应了解,以上技术可应用于其它dag。还应了解,本文中的dag的视觉表示可作为有序值(例如,在数据对象中)进行存储和操作。
115.具体参考图13,描绘了使用图8到12中描绘的路径遍历技术从图7的dag生成的层次图。层次图的每个层表示后续路径长度。例如,作为索引节点的节点a可表示为层次图在顶层中的根,具有最长路径长度0。可从节点a遍历的节点c和e具有最长路径长度1,并且可描绘在层次图的下一最低层中。虽然节点b和d也依赖于节点a,但节点b和d具有更长的最长路径长度。节点b和d依赖于节点c并具有最长路径长度2,并且因此可描绘在层次图的下一最低层中。节点f也具有最长路径长度2并依赖于节点e,因此,节点f可与节点b和d描绘在同一层中。节点g和h具有最长路径长度3并依赖于节点f,因此节点g和h可描绘在下一最低层中。最后,节点i依赖于节点h并具有最长路径长度4,因此,节点i可描绘在下一最低层中。
116.然后,可通过从索引节点a开始并以维持有序依赖性的任何次序行进来遍历所述层次图以生成由层次图的节点表示的数据类型的值(例如,按以下次序生成节点的数据类型:a、c、b、d、e、f、g、h、i;还有a、e、f、g、h、i、c、b、d;等)。例如,节点a的数据类型的一系列值可基于节点a的数据类型的所述值的概率而生成,所述概率可通过对环境、用户输入等进行统计分析来确定。数据类型的有效值可以是数值的、分类的等。可通过概率分布来确定数值。然后可(例如,通过统计分析、用户输入等)确定节点c的数据类型的有效值与节点a的数据类型的有效值之间的相关性。因此,可将节点c的数据类型的一系列有效值确定为节点a的数据类型的有效值的条件概率。可遍历每个连续依赖节点,其中基于来自连续依赖节点所依赖的节点的条件概率来确定其中的连续数据类型的值。应了解,以上技术可应用于其它层次图。还应了解,所述层次图的视觉表示可作为有序值(例如,在数据对象中)进行存储和操作。
117.参考图14,描绘了根据一些非限制性实施例或方面的与使用图13的层次图将值分配给数据类型相关联的示意图。层次图的每个数据类型可被分配一组或一系列有效值。如所示,与节点a相关联的数据类型可具备一组五个值a1到a5(例如,五个类别)。应了解,有效值可以是数值的、分类的等。与节点c相关联的数据类型可具备一组七个值c1到c7(例如,七个类别)。可初始地计算出(例如,节点a的)第一数据类型的每个值的概率。例如,可基于对现有数据集的统计分析来生成有效值a1到a5中的每个值的概率。有效值a1到a5的概率也可由具有待评估环境的专业知识的用户输入。基于(例如,节点a的)第一数据类型的值的各个概率,可(例如,由数据生成系统106、由用户等)标识一个数据类型的值与另一数据类型的
值之间的相互依赖性(例如,相关性、关系)。通过值(例如,a1到c1、c3和c5)之间的线描绘每个数据类型的值之间的相互依赖性。通过提供给每个值的字段的相对大小举例说明每个数据类型的值的比较概率(例如,可能性)。
118.进一步参考图13和14,在生成层次图后,可针对图中的每个节点填充值。由于层次图中的节点表示数据集中的属性/变量,因此可生成一个合成记录,在从顶部的节点到最底部的节点遍历层次图后用值填充所述合成记录。在生成合成数据时,可维持层次图中节点之间的相互依赖性。例如,考虑在图14中以统计方式示出的从图13中的节点a到节点c的遍历。在此类示例中,考虑节点a和节点c是分类变量的情况。应了解,相同的算法可用于数值变量。在所描绘的非限制性实施例或方面,节点a的变量有5个类别,节点c的变量有7个类别。两个方框之间的线表示相互依赖性。例如,所描绘的线指示:如果a的值是a1,则c的值只能是c1、c3和c5。方框之间的每个连线/边也可被分配权重以指示概率。在此类示例中,当节点a是a1时,节点c是c1的概率为50%,节点c是c3的概率为30%,节点c是c5的概率为20%。使用此方法,可生成如图14所描绘的图以用于遍历层次图中的所有节点。将层次图和图14的方法组合,可生成考虑了不同变量之间的相互依赖性的现实性合成数据。
119.尽管已出于说明的目的而基于当前被认为是最实用和优选的实施例或方面详细描述了本公开,但应理解,此类细节仅用于所述目的,且本公开不限于所公开实施例或方面,而相反,旨在涵盖属于所附权利要求书的精神和范围内的修改和等同布置。例如,应理解,本公开预期,尽可能地,任何实施例的一个或多个特征可以与任何其它实施例的一个或多个特征组合。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献