商品变量预测方法、设备以及计算机可读介质与流程

2021-10-27 13:28:00 来源：中国专利 TAG：介质变量可读预测计算机

1.本技术涉及信息技术领域，尤其涉及一种商品变量预测方法、设备以及计算机可读介质。

背景技术：

2.在许多商业场景下，商家感兴趣的内容是在改变一个变量后，另一个目标变量会如何发生改变。例如，商家在改变一种商品的属性后，将会对这个商品的转化率产生什么影响。常规情况下的方法是训练一个相关预测模型，把改变的属性作为输入，将转化率作为输出，通过改变的属性与转化率之间的相关关系，实现的商品转化率的预测。
3.由于是基于相关关系作出的预测，因此商品的转化率的变化并非一定是改变的属性所直接引起的。例如，商家在将精华液中的一种成分从玫瑰替换成维生素c之后，预测出该精华液的转化率增长了20％。但是，由于成分改变和转化率增长之间可能并无直接的因果关系，可能是因为成分改变之后，导致成本会下降，进而使得价格也随之下降，最终使得转化率发生增长，也就是这个20％的转化率增长可能并不是因为成分的变化直接带来的结果。而实际场景中，商家在对商品进行开发、改良时感兴趣可能就是商品的成分改变是否会对转化率有直接的影响，若有，直接影响会是多少等信息。而现有的预测方式，仅能够基于变量之间的相关性进行简单预测，而无法获得此类信息，不适合解决商业场景中此类需求。

技术实现要素：

4.本技术的一个目的是提供一种商品变量预测方法，用以解决无法应用于对商品变量直接影响进行预测的场景的问题。
5.本技术实施例提供了一种商品变量预测方法，其中，该方法包括：
6.从与商品相关的特征池中，确定同时与自变变量以及目标变量具有相关关系的干扰变量；
7.确定所述自变变量、目标变量以及干扰变量之间的因果关系图，所述因果关系图中包括顶点和连接两个顶点之间的有向连线，所述顶点表示自变变量、目标变量或干扰变量，所述有向连线表示两个顶点之间的因果关系；
8.在根据所述因果关系图确定自变变量与目标变量之间存在因果关系时，将自变变量的变化值以及干扰变量的样本数据输入因果预测模型，获取所述目标变量在自变变量发生变化后的因果预测值。
9.本技术的一些实施例还提供了另一种商品变量预测方法，该方法包括：
10.向用户呈现可选的商品变量；
11.根据所述用户的选择信息从所述商品变量中确定自变变量和目标变量；
12.从与商品相关的特征池中，确定同时与自变变量以及目标变量具有相关关系的干扰变量；
13.确定所述自变变量、目标变量以及干扰变量之间的因果关系图，所述因果关系图
中包括顶点和连接两个顶点之间的有向连线，所述顶点表示自变变量、目标变量或干扰变量，所述有向连线表示两个顶点之间的因果关系；
14.在根据所述因果关系图确定自变变量与目标变量之间存在因果关系时，将自变变量的变化值以及干扰变量的样本数据输入因果预测模型，获取所述目标变量在自变变量发生变化后的因果预测值；
15.向所述用户呈现所述因果预测值。
16.本技术的一些实施例还提供了一种商品变量预测设备，该设备包括：
17.特征关联模块，用于从与商品相关的特征池中，确定同时与自变变量以及目标变量具有相关关系的干扰变量；
18.因果发现模块，用于确定所述自变变量、目标变量以及干扰变量之间的因果关系图，所述因果关系图中包括顶点和连接两个顶点之间的有向连线，所述顶点表示自变变量、目标变量或干扰变量，所述有向连线表示两个顶点之间的因果关系；
19.因果效应模块，用于在根据所述因果关系图确定自变变量与目标变量之间存在因果关系时，将自变变量的变化值以及干扰变量的样本数据输入因果预测模型，获取所述目标变量在自变变量发生变化后的因果预测值。
20.本技术的一些实施例还提供了另一种商品变量预测设备，该设备包括：
21.交互模块，用于向用户呈现可选的商品变量，以及向所述用户呈现所述因果预测值；
22.变量获取模块，用于根据所述用户的选择信息从所述商品变量中确定自变变量和目标变量；
23.特征关联模块，用于从与商品相关的特征池中，确定同时与自变变量以及目标变量具有相关关系的干扰变量；
24.因果发现模块，用于确定所述自变变量、目标变量以及干扰变量之间的因果关系图，所述因果关系图中包括顶点和连接两个顶点之间的有向连线，所述顶点表示自变变量、目标变量或干扰变量，所述有向连线表示两个顶点之间的因果关系；
25.因果效应模块，用于在根据所述因果关系图确定自变变量与目标变量之间存在因果关系时，将自变变量的变化值以及干扰变量的样本数据输入因果预测模型，获取所述目标变量在自变变量发生变化后的因果预测值。
26.本技术的一些实施例还提供了一种计算设备，其中，该设备包括用于存储计算机程序指令的存储器和用于执行计算机程序指令的处理器，其中，当该计算机程序指令被该处理器执行时，触发所述设备执行前述的商品变量预测方法。
27.本技术的另一些实施例还提供了一种计算机可读介质，其上存储有计算机程序指令，所述计算机可读指令可被处理器执行以实现所述的商品变量预测方法。
28.本技术实施例提供的商品变量预测方案中，可以从与商品相关的特征池中，确定同时与自变变量以及目标变量具有相关关系的干扰变量，然后确定所述自变变量、目标变量以及干扰变量之间的因果关系图，其中，所述因果关系图中包括顶点和连接两个顶点之间的有向连线，所述顶点表示自变变量、目标变量或干扰变量，所述有向连线表示两个顶点之间的因果关系，由此通过因果关系图可以确定这些变量之间的因果关系，若自变变量与目标变量之间存在因果关系时，可以将自变变量的变化值以及干扰变量的样本数据输入因
果预测模型，获取所述目标变量在自变变量发生变化后的因果预测值，由此获得的因果预测值并非是基于变量之间的相关性确定的相关预测值，而是能够表示因目标变量的变化直接导致的结果，可以应用于对商品变量直接影响进行预测的场景。
附图说明
29.通过阅读参照以下附图所作的对非限制性实施例所作的详细描述，本技术的其它特征、目的和优点将会变得更明显：
30.图1为本技术实施例提供的一种商品变量预测方法的处理流程图；
31.图2为本技术实施例在确定干扰变量时的处理流程图；
32.图3为本技术实施例中生成的一种因果关系图；
33.图4为本技术实施例中生成的一种全联接图；
34.图5为本技术实施例中生成的一种无向图；
35.图6为本技术实施例中生成的一种有向图；
36.图7为采用本技术实施提供的方案对商品变量进行因果预测时的处理流程图；
37.图8为本技术实施提供的一种商品变量预测设备的结构示意图；
38.图9为本技术实施例提供的一种用于实现商品变量预测的计算设备的结构示意图；
39.图10为用户使用本技术实施例提供的方法进行预测时交互界面示意图；
40.附图中相同或相似的附图标记代表相同或相似的部件。
具体实施方式
41.下面详细描述本发明的实施例，所述实施例的示例在附图中示出，其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的，仅用于解释本发明，而不能解释为对本发明的限制。
42.本技术领域技术人员可以理解，除非特意声明，这里使用的单数形式“一”、“一个”、“所述”和“该”也可包括复数形式。应该进一步理解的是，本发明的说明书中使用的措辞“包括”是指存在所述特征、整数、步骤、操作、元件和/或组件，但是并不排除存在或添加一个或多个其他特征、整数、步骤、操作、元件、组件和/或它们的组。应该理解，当我们称元件被“连接”或“耦接”到另一元件时，它可以直接连接或耦接到其他元件，或者也可以存在中间元件。此外，这里使用的“连接”或“耦接”可以包括无线连接或无线耦接。这里使用的措辞“和/或”包括一个或更多个相关联的列出项的全部或任一单元和全部组合。
43.本技术实施例提供了一种商品变量预测方法，该方法可以生成各种相关变量之间的因果关系图，通过因果关系图可以确定这些变量之间的因果关系，若自变变量与目标变量之间存在因果关系时，可以将自变变量的变化值以及干扰变量的样本数据输入因果预测模型，获取目标变量在自变变量发生变化后的因果预测值，由此获得的因果预测值并非是基于变量之间的相关性确定的相关预测值，而是能够表示因目标变量的变化直接导致的结果，可以应用于对商品变量直接影响进行预测的场景。
44.图1示出了本技术实施例提供的一种商品变量预测方法的处理流程，该方法包括以下的处理步骤：
45.步骤s101，从与商品相关的特征池中，确定同时与自变变量以及目标变量具有相关关系的干扰变量。
46.其中，商品变量为为商业场景中与商品相关的变量，例如这些变量可以是销售商品时的优惠方式、商品的流量价值、商品的品牌级别、所在店铺的店铺级别、商品价格等。根据这些变量在预测场景中作用不同，可以将其划分为自变变量、目标变量和干扰变量。其中，自变变量是可供调整的(例如用户主动调整)的变量，而目标变量是在自变变量发生变化的情况下，用户指定的待预测变量。
47.本技术的一些实施例中，可以在从与商品相关的特征池中确定同时与自变变量以及目标变量具有相关关系的干扰变量之前，获取本次预测所需的自变变量以及目标变量。例如，用户需要知道将商品的价格从90元调整至100元之后，该商品月平均销售额会因为价格的调整发生怎样的变化，则用户可以选择商品价格作为自变变量，并选择月平均销售额作为目标变量。由此，可以获取本次预测需要的自变变量和目标变量。
48.而干扰变量则是同时与自变变量和目标变量相关的变量。在此，相关是指两个变量之间具有相关关系，相关关系是指两种变量之间存在的相互依存的关系，当一个变量取一定的数值时,与之相对应的另一变量的值虽然不确定,但它仍按某种规律在一定的范围内变化。例如，店铺级别越高的店铺，其销售的商品的流量价值也越高，此时可以认为商品的流量价值与商品所在店铺的店铺级别这两个变量相关。
49.在实际场景中，可以预先将所有与商品相关的商品变量放入特征池中以备选取，当确定需要研究的两种商品变量之后，可以从特征池中遍历所有商品变量，判断特征池中的商品变量是否同时与自变变量以及目标变量具有相关关系，若同时具有相关关系，则可以将该变量确定为干扰变量。
50.图2示出了本技术实施例在确定干扰变量时的处理流程，包括以下的处理步骤：
51.步骤s201，在与商品相关的特征池中遍历所有的干扰变量，作为候选干扰变量。假设在本实施例中，自变变量为优惠方式，目标变量为商品的流量价值，首先可以从特征池中选取至少一个变量来作为候选干扰变量。例如，首次选取的候选干扰变量为商品价格，在通过后续步骤判定商品价格是否为干扰变量之后，即可选取另一个变量(如店铺级别、品牌级别等)直至遍历特征池中所有的干扰变量。
52.步骤s202，确定表征自变变量与候选干扰变量之间相关关系的第一显著性水平，以及确定表征目标变量与候选干扰变量之间相关关系的第二显著性水平。在判定变量之间的相关性时，可以采用线性回归的方式，其中，对于离散的变量可以采用方差分析(analysis of variance，anova)，而对于连续的变量则可以采用线性模型(linear model)进行分析。无论是采用何种方式，都可以确定表征自变变量与候选干扰变量之间相关关系的第一显著性水平α1、以及确定表征目标变量与候选干扰变量之间相关关系的第二显著性水平α2。
53.步骤s203，若第一显著性水平和第二显著性水平均小于显著性阈值，将候选干扰变量确定为同时与自变变量以及目标变量具有相关关系的干扰变量。由于第一显著性水平和第二显著性水平可以表示确定对应变量之间具有相关关系这一假设处于拒绝区间的概率，因此通过设定一个显著性阈值，并与第一显著性水平和第二显著性水平，可以较好地判定对应变量之间是否具有相关关系。例如，在实施例中，显著性阈值可以设定为0.01或者
0.05，若第一显著性水平小于该显著性阈值，则表示自变变量与候选干扰变量具有相关关系这一假设正确的概率达到99％或者95％以上。
54.此外，由于需要在第一显著性水平和第二显著性水平同时小于显著性阈值时，才可以将候选干扰变量确定为最终的干扰变量，因此可以先计算第一显著性水平或第二显著性水平中的一个并进行阈值判定，在一个显著性水平通过判定之后，再计算另一个的显著性水平并进行阈值判定。当第一次的判定未通过时，无需计算另一个显著性水平即可判定该候选变量不可能同时与自变变量以及目标变量具有相关关系，由此可以减少一定的计算量，提高处理效率。
55.例如，特征池里面有30个变量，因此需要遍历30次。对于第i次，假设选取到了商品价格这一变量，由于价格是一个连续的变量，可以使用线性模型进行回归分析，对于商品价格单与优惠方式，发现两者相关的显著性水平符合判定阈值，因此可以认为两者的相关关系是显著的。而后，可以对商品价格与流量价值进行回归分析，若两者之间的相关关系同样是是显著的，则可以把商品价格选入变量集x，作为一个干扰变量。然后，继续遍历特征池中的第j个变量，比如是店铺级别，由于这是一个离散的变量，因此可以使用方差分析的方式，分别分析店铺级别和优惠方式、以及店铺级别与流量价值的关系，同理，若分析得到相关关系是显著的，则可以把店铺级别这个变量也放进变量集x，作为另一个干扰变量。在遍历特征池中的所有变量之后，即可筛选出需要的干扰变量。
56.步骤s102，确定自变变量、目标变量以及干扰变量之间的因果关系图。因果关系图是一种有向无环图(directed acyclic graph，dag)，包括了顶点和连接两个顶点之间的有向连线，其中，顶点表示自变变量、目标变量或干扰变量，有向连线表示两个顶点之间的因果关系。例如图3即为一种因果关系图，例如顶点t为自变变量，顶点y为目标变量，顶点x1、x2和x3分别为三个干扰变量，根据顶点之间的有向连线可知，t与y、t与x、y与x2、t与x3、x1与x3之间均存在因果关系，且前者是因，后者是果。
57.本技术的一些实施例在生成因果关系图时，可以先生成自变变量、目标变量以及干扰变量之间的无向图。无向图中包括顶点和连接两个顶点之间的无向连线，顶点表示自变变量、目标变量或干扰变量，而无向连线表示两个顶点之间存在因果关系。而后通过确定无向图中无向连线的方向，来生成需要的因果关系图。
58.在生成无向图时，可以利用带隐变量的归纳因果算法(inductive causation with latent variables，ic*)的部分步骤。首先，将自变变量、目标变量或干扰变量作为顶点，并两两连接顶点生成无向连线，以形成全联接图。例如，对于以下的几个变量：自变变量t、目标变量y和干扰变量x1、x2、x3，其对应的顶点可以是t、y和x1、x2、x3，首先两两连接这些顶点，可以生成10条无向连线，由此形成一个如图4所示的全联接图。
59.而后，在全联接图中遍历所有的无向连线对应的顶点组，判定是否存在第二变量使得顶点组对应的两个第一变量条件独立，若为是，删除顶点组对应的无向连线，若为否，保留顶点组对应的无向连线。
60.在全联接图中，每个顶点均对应一个商品变量，这些商品变量可以是自变变量、目标变量或干扰变量中的任意一个。对于一条无向连线，会连接两个顶点，这两个顶点即为该无向连线对应的顶点组，例如图4中，无向连线l1对应的顶点组即为顶点t和顶点y，这两个顶点组所对应的变量即为第一变量。而除顶点组之外的其它顶点所对应的变量则为第二变
量，例如对于图4中的无向连线l1，第二变量可以是x1、x2、x3中的至少一个。
61.在判定过程中，若存在第二变量使得顶点组对应的两个第一变量条件独立，可以认为顶点组对应的两个第一变量之间没有因果关系，反之则可以认为顶点组对应的两个第一变量之间有因果关系。因此，可以遍历所有的无向连线，例如遍历到l1对应的顶点t和顶点y时，可以在t和y之外的其它变量x1、x2、x3中寻找到至少一个第二变量，使得变量t和y能够在给定第二变量的情况下条件独立，则可以认为变量t和y之间没有因果关系，从而将这个无向连线l1删除。反之，如果找不到使得变量t和y条件独立的第二变量，则可以保留这个无向连线l1。由此遍历所有无向连线对应的顶点组之后，可以获得自变变量、目标变量以及干扰变量之间的无向图。
62.而在获取到无向图之后，可以将无向图作为输入框架(skeleton)，采用因果生成神经网算法(causal generative neural networks，cgnn)生成因果关系图。由于因果生成神经网算法可以满足数据的非线性、非高斯性，即使数据中存在不可观测的隐藏干扰变量，也可以获得较为准确的结果。
63.本技术实施例在采用因果生成神经网算法时，首先可以判断这些无向连线的方向。以图4所示的全联接图为例，其所生成的无向图如图5所示，在判断方向时，可以遍历各个顶点组对应的变量，以变量t和变量y为例，若对应的顶点t和y之间存在连线，则可以将变量t的样本数据作为输入，变量y的样本数据作为输出，构建神经网络模型，然后基于预先定义好的损失函数计算该神经网络模型的损失函数值loss1。而后，将输出和输出交换，即将变量y作为输入，变量t作为输出，采用同样的方式构神经网络模型，并计算出对应的损失函数值loss2。通过比较两个损失函数值，若损失函数值loss1大于损失函数值loss2，则可以将连线的方向确定为由顶点t指向顶点y，反之，若损失函数值loss2大于损失函数值loss1，则可以将连线的方向确定为由顶点y指向顶点t。由此，通过此种方式可以获得所有无向连线的方向，将无向连线更新为有向连线。
64.但是在实际场景中，需要确保有向图是无环的，因此可以由各个顶点起始按照有向连线的方向遍历整个有向图，若在遍历过程中检测到存在环，则可以按照遍历的顺序将环中的最后一个有向连线的方向变更，从而确保生成的因果关系图为有向无环图。例如，初步获得图5中无向连线的方向后，生成图6所示的有向图，该有向图中顶点t、y、x3和x1之间按照箭头方向形成了一个环，可以将x1和t之间的方向变更，使其由t指向x1，从而形成一有向无环图。
65.此外，还可以在此基础上对这个有向无环图进行优化。优化的方式如下：首先，可以定义一个图的总体打分函数，优化目标可以是最大化这个打分函数值。然后，对于任意两个变量，可以设定3种更新方式，分别为：1、若对应的顶点之间存在有向连线，删除该有向连接，2、若对应的顶点之间存在有向连线，变更有向连接的方向，3、若对应的顶点之间不存在有向连线，增加一个有向连接。对于每一种更新方式，都可以计算此种更新方式更新后的总体打分函数，若更新后的因果关系图的总体打分函数高于更新前，则使用新的因果关系图。通过不断尝试更新的方式，可以得到获得一个总体打分函数的最高的图，该图即为优化后的因果关系图。
66.步骤s103，在根据因果关系图确定自变变量与目标变量之间存在因果关系时，将自变变量的变化值以及干扰变量的样本数据输入因果预测模型，获取目标变量在自变变量
发生变化后的因果预测值。通过前述获得的因果关系图，可以快速判定自变变量和目标变量之间是否存在因果关系，例如在图3中t与y之间存在有t指向y的有向连线，则可以确定自变变量t与目标变量y之间存在因果关系，且t是因，y是果。由此，可以将自变变量的变化值以及干扰变量的样本数据输入因果预测模型，获取目标变量在自变变量发生变化后的因果预测值。
67.相较于常规基于相关关系的单变量预测方式，本技术实施例提供的方案可以应用于对商品变量直接影响进行预测的场景，明确告知用户自变变量与目标变量之间是否存在因果关系，并且当确实存在因果关系时，可以获得目标变量在自变变量发生变化后、因两者之间的因果关系而导致的因果预测值。
68.在本技术的一些实施例中，因果预测模型为因果效应变分自编码器(causal effect variational autoencoder，cevae)。通过将自变变量、目标变量以及各个干扰变量的样本数据，对因果效应变分自编码器模型进行训练，在完成训练之后，即可使用因果效应变分自编码器模型对自变变量发生对目标变量的因果效应进行预测。由于因果效应变分自编码器在进行因果预测时可以避免隐藏干扰因子的影响，因此因果预测值的结果更加准确。
69.例如，本实施例中，用户希望预测当采用的优惠方式从满2件打9折变到满2件打8折时，商品的流量价值会变化为多少。其中，流量价值可以是gmv/ipv_uv，表示每个浏览过商品的人平均为该商品带来的成交额。若干扰变量为x1品牌级别，x2店铺级别以及x3商品价格，向因果预测模型输入干扰变量的数据x1，x2和x3以及自变变量的变化值t＝1(t＝1表示满2件打8折，t＝0表示满2件打9折)后，可以获得一个输出q(y|t＝1,x1,x2,x3)＝y1，即为流量价值y在优惠方式发生变化后的因果预测值，由此可以确定当优惠方式变到满2件打8折时，商品的流量价值受其变化的直接影响，将会变化为y1。
70.在本技术的一些实施例中，还可以将自变变量的初始值以及干扰变量的样本数据输入因果预测模型，获取目标变量在自变变量发生变化前的因果预测值，然后根据目标变量在自变变量发生变化前、以及在自变变量发生变化后的因果预测值，确定自变变量对目标变量的因果效应值。
71.仍以前述的场景为例，将向因果预测模型输入干扰变量的数据x1，x2和x3以及自变变量的变化值t＝0后，可以获得一个输出q(y|t＝0,x1,x2,x3)＝y0，即为流量价值y在优惠方式发生变化前的因果预测值。将q(y|t＝1,x1,x2,x3)-q(y|t＝0,x1,x2,x3)即为自变变量对目标变量的因果效应值。此外，也可以获取干扰变量的多个样本数据进行处理，例如可以从100个销售某一商品的店铺中获取干扰变量的100个样本数据。基于这些样本数据，即可获取到对应数量的y1和y0，将每个样本数据对应的y1-y0记为独立因果效应值ite，计算所有ite的平均值即可获得平均因果效应值ate，可以将该平均因果效应值作为自变变量对目标变量的因果效应值。
72.在本技术的另一些实施例中，除了因果预测的结果之外，还可以提供另一输出结果。即，在生成因果关系图之后，还可以根据因果关系图确定与自变变量存在因果关系的第一干扰变量，并确定第一干扰变量在自变变量发生变化后的因果预测值。以图3所示的因果关系图为例，在所有干扰变量x1、x2和x3中，第一干扰变量为x1，而后可以计算第一干扰变量在自变变量发生变化后的因果预测值。
73.其中，计算该因果预测值的方式可以参考前述目标变量在自变变量发生变化后的因果预测值的方式，将自变变量的变化值以及第三变量的样本数据输入因果预测模型，获取第一干扰变量在自变变量发生变化后的因果预测值。其中，第三变量为目标变量和除第一干扰变量外的其它干扰变量，例如当第一干扰变量为x1，自变变量为t时，第三变量即为x2、x3和y，由此采用前述类似的方式可以获取x1在t发生变化后的因果预测值。
74.而后，可以将自变变量的变化值以及第一干扰变量的因果预测值输入相关预测模型，获取目标变量在自变变量和第一干扰变量发生变化后的相关预测值。其中，相关预测模型即为基于变量间的相关性实现预测的模型，例如该相关预测模型可以是深度神经网络模型，输入为自变变量的变化值t'以及因自变变量变化而导致变化的新的干扰变量x'，输出为y'，即t',x'
→
y'。而现有技术中，是基于自变变量的变化值t'预测输出值y”，即t'
→
y”，两者的输入不同，本方案中考虑了其它一个自变变量对其它干扰变量的因果影响，因此同时考虑这些输入因素后，所获得的相关预测值会更加准确。
75.在本技术的一些实施例中，还提供了另一种商品变量预测方法，该方法可以与用户进行交互，向用户呈现可选的商品变量，并将最终的预测结果呈现给用户，从而为用户提供数据服务，使得用户能够根据预测结果进行决策。在实际场景中，用户可以是使用数据服务的商家，在为商家提供服务时，本方案可以提供数据可视化的形式，商家可调整数据。
76.该方法中，首先可以向用户呈现可选的商品变量。在实际场景中，可以通过可视化的方式向用户呈现这些可选的商品变量，例如图10中用户可以在用户设备以列表的形式呈现这些可选的商品变量，使得用户可以通过勾选的方式从所有商品变量a1～a10中选择需要自变变量和目标变量，从而形成选择信息。
77.在获得选择信息之后，可以根据所述用户的选择信息，从商品变量中确定自变变量和目标变量。例如，用户选择的自变变量为a9，选择的目标变量的a10，由此确定a9即为自变变量，a10即为目标变量，其它商品变量a1～a8则可以放入特征池中作为候选干扰变量。
78.在确定自变变量以及目标变量之后，可以采用前述的方式进行预测处理，经过干扰变量选取、因果关系图确定、因果预测之后，获得预测结果。
79.该预测结果可以是目标变量在自变变量发生变化后的因果预测值，此时用户可以知道a9在变化为一个新的值a9_v1时，目标变量a10会变化为什么值。此外，预测结果还可以包括自变变量对目标变量的因果效应值，由此用户可以a9在由一个旧的值变化为一个新的值a9_v1时，目标变量a10会有什么样的变化，如增长或减少了多少。
80.此外，在根据因果关系图确定自变变量与目标变量之间不存在因果关系时，则表示自变变量与目标变量之间无法进行因果预测，因此可以向用户呈现关于自变变量与目标变量之间不存在因果关系的提示信息，通过该该提示信息，用户可以知道自变变量与目标变量之间不存在因果关系，无法进行预测。其中，向用户呈现结果同样可以采用可视化的呈现方式，例如图10中，可以采用柱状图的方式显示自变变量对目标变量的因果效应值，在自变变量a9从旧值a9_v0变化为新值a9_v1时，目标变量a10增长了34％，此时可以采用高度为1.34的柱状图形表示该因果效应值。
81.在此，本领域技术人应当理解上述呈现的具体方式仅为举例，其他现有的或今后可能出现的其它方式如可适用于本发明，也应包含在本发明保护范围以内，并在此以引用方式包含于此。例如，也可以采用折线图、表格等其它方式向用户可视化的呈现处理结果。
82.图7示出了采用本技术实施提供的方案对商品变量进行因果预测时的处理流程，包括以下几个阶段：
83.第一阶段step1，从特征池里找到所有与t和y均相关的干扰因子集x。具体可以通过方差分析(anova)或线性模型(lm)进行回归分析，分析特征池中的每个变量是否与t和y相关，如果都相关就将其放入干扰因子集x中。
84.第二阶段step2，挖掘x、t、y相互之间的的因果关系，生成因果关系图。在生成因果关系图时，使用ic*与cgnn结合的算法，首先采用带隐变量的归纳因果算法(ic*)生成变量之间的无向图，然后将该无向图作为输入骨架，采用因果生成神经网算法(cgnn)生成需要的有向无环的因果关系图。
85.第三阶段step3，基于因果关系图获得两个输出。
86.第一个输出为y因为t的变化而产生的因果预测结果，其处理过程为：
87.从因果关系图中判断t是否为y的因，如果不是，则不输出因果预测结果；如果是，利用cevae模型，并以t的变化值t'和x作为输入，获得y因为t的变化而产生的因果预测结果。
88.第二个输出为y因为t的变化而产生的相关预测结果，其处理过程为：
89.从因果关系图中查找干扰因子集x中哪些变量是t的果，并以x中其它变量和y作为输入，确定当t变化为t'时，x中的这些果的因果预测结果，作为x'。然后利用深度神经网络模型，并以t'和x'作为输入，获得y因为t的变化而产生的相关预测结果。
90.基于同一发明构思，本技术实施例中还提供了一种商品变量预测设备，设备对应的方法是前述实施例中的商品变量预测方法，并且其解决问题的原理与该方法相似。
91.本技术实施例提供的一种商品变量预测设备中，可以生成各种相关变量之间的因果关系图，通过因果关系图可以确定这些变量之间的因果关系，若自变变量与目标变量之间存在因果关系时，可以将自变变量的变化值以及干扰变量的样本数据输入因果预测模型，获取目标变量在自变变量发生变化后的因果预测值，由此获得的因果预测值并非是基于变量之间的相关性确定的相关预测值，而是能够表示因目标变量的变化直接导致的结果，可以应用于对商品变量直接影响进行预测的场景。
92.图8示出了本技术实施例提供的一种商品变量预测设备的结构，该设备包括特征关联模块810、因果发现模块820和因果效应模块830。其中，特征关联模块810用于从与商品相关的特征池中，确定同时与自变变量以及目标变量具有相关关系的干扰变量；因果发现模块820用于确定自变变量、目标变量以及干扰变量之间的因果关系图；因果效应模块830用于在根据因果关系图确定自变变量与目标变量之间存在因果关系时，将自变变量的变化值以及干扰变量的样本数据输入因果预测模型，获取目标变量在自变变量发生变化后的因果预测值。
93.商品变量为为商业场景中与与和商品相关的变量，例如这些变量可以是销售商品时的优惠方式、商品的流量价值、商品的品牌级别、所在店铺的店铺级别、商品价格等。根据这些变量在预测场景中作用不同，可以将其划分为自变变量、目标变量和干扰变量。其中，自变变量是可供调整的(例如用户主动调整)的变量，而目标变量是在自变变量发生变化的情况下，用户指定的待预测变量。
94.本技术的一些实施例中，可以在从与商品相关的特征池中确定同时与自变变量以
及目标变量具有相关关系的干扰变量之前，由变量获取模块获取本次预测所需的自变变量以及目标变量。例如，用户需要知道将商品的价格从90元调整至100元之后，该商品月平均销售额会因为价格的调整发生怎样的变化，则用户可以选择商品价格作为自变变量，并选择月平均销售额作为目标变量。由此，可以获取本次预测需要的自变变量和目标变量。
95.而其它的干扰变量则是同时与自变变量和目标变量相关的变量。在此，相关是指两个变量之间具有相关关系，相关关系是指两种变量之间存在的相互依存的关系，当一个变量取一定的数值时,与之相对应的另一变量的值虽然不确定,但它仍按某种规律在一定的范围内变化。例如，店铺级别越高的店铺，其销售的商品的流量价值也越高，此时可以认为商品的流量价值与商品所在店铺的店铺级别这两个变量相关。
96.在实际场景中，可以预先将所有与商品相关的商品变量放入特征池中以备选取，当确定需要研究的两种变量之后，特征关联模块可以从与商品相关的特征池中遍历所有商品变量，判断特征池中的商品变量是否同时与自变变量以及目标变量具有相关关系，若同时具有相关关系，则可以将该变量确定为干扰变量。
97.图2示出了本技术实施例中特征关联模块在确定干扰变量时的处理流程，包括以下的处理步骤：
98.步骤s201，特征关联模块在与商品相关的特征池中遍历所有的干扰变量，作为候选干扰变量。假设在本实施例中，自变变量为优惠方式，目标变量为商品的流量价值，首先可以从特征池中选取至少一个变量来作为候选干扰变量。例如，首次选取的候选干扰变量为商品价格，在通过后续步骤判定商品价格是否为干扰变量之后，即可选取另一个变量(如店铺级别、品牌级别等)直至遍历特征池中所有的干扰变量。
99.步骤s202，特征关联模块确定表征自变变量与候选干扰变量之间相关关系的第一显著性水平，以及确定表征目标变量与候选干扰变量之间相关关系的第二显著性水平。在判定变量之间的相关性时，可以采用线性回归的方式，其中，对于离散的变量可以采用方差分析(analysis of variance，anova)，而对于连续的变量则可以采用线性模型(linear model)进行分析。无论是采用何种方式，都可以确定表征自变变量与候选干扰变量之间相关关系的第一显著性水平α1、以及确定表征目标变量与候选干扰变量之间相关关系的第二显著性水平α2。
100.步骤s203，若第一显著性水平和第二显著性水平均小于显著性阈值，特征关联模块将候选干扰变量确定为同时与自变变量以及目标变量具有相关关系的干扰变量。由于第一显著性水平和第二显著性水平可以表示确定对应变量之间具有相关关系这一假设处于拒绝区间的概率，因此通过设定一个显著性阈值，并与第一显著性水平和第二显著性水平，可以较好地判定对应变量之间是否具有相关关系。例如，在实施例中，显著性阈值可以设定为0.01或者0.05，若第一显著性水平小于该显著性阈值，则表示自变变量与候选干扰变量具有相关关系这一假设正确的概率达到99％或者95％以上。
101.此外，由于需要在第一显著性水平和第二显著性水平同时小于显著性阈值时，才可以将候选干扰变量确定为最终的干扰变量，因此可以先计算第一显著性水平或第二显著性水平中的一个并进行阈值判定，在一个显著性水平通过判定之后，再计算另一个的显著性水平并进行阈值判定。当第一次的判定未通过时，无需计算另一个显著性水平即可判定该候选变量不可能同时与自变变量以及目标变量具有相关关系，由此可以减少一定的计算
量，提高处理效率。
102.例如，特征池里面有30个变量，因此需要遍历30次。对于第i次，假设选取到了商品价格这一变量，由于价格是一个连续的变量，可以使用线性模型进行回归分析，对于商品价格单与优惠方式，发现两者相关的显著性水平符合判定阈值，因此可以认为两者的相关关系是显著的。而后，可以对商品价格与流量价值进行回归分析，若两者之间的相关关系同样是是显著的，则可以把商品价格选入变量集x，作为一个干扰变量。然后，继续遍历特征池中的第j个变量，比如是店铺级别，由于这是一个离散的变量，因此可以使用方差分析的方式，分别分析店铺级别和优惠方式、以及店铺级别与流量价值的关系，同理，若分析得到相关关系是显著的，则可以把店铺级别这个变量也放进变量集x，作为另一个干扰变量。在遍历特征池中的所有变量之后，即可筛选出需要的干扰变量。
103.因果关系图是一种有向无环图(directed acyclic graph，dag)，包括了顶点和连接两个顶点之间的有向连线，其中，顶点表示自变变量、目标变量或干扰变量，有向连线表示两个顶点之间的因果关系。例如图3即为一种因果关系图，例如顶点t为自变变量，顶点y为目标变量，顶点x1、x2和x3分别为三个干扰变量，根据顶点之间的有向连线可知，t与y、t与x、y与x2、t与x3、x1与x3之间均存在因果关系，且前者是因，后者是果。
104.本技术的一些实施例在生成因果关系图时，因果发现模块可以先生成自变变量、目标变量以及干扰变量之间的无向图。无向图中包括顶点和连接两个顶点之间的无向连线，顶点表示自变变量、目标变量或干扰变量，而无向连线表示两个顶点之间存在因果关系。而后通过确定无向图中无向连线的方向，来生成需要的因果关系图。
105.在生成无向图时，因果发现模块可以利用带隐变量的归纳因果算法(inductive causation with latent variables，ic*)的部分步骤。首先，将自变变量、目标变量或干扰变量作为顶点，并两两连接顶点生成无向连线，以形成全联接图。例如，对于以下的几个变量：自变变量t、目标变量y和干扰变量x1、x2、x3，其对应的顶点可以是t、y和x1、x2、x3，首先两两连接这些顶点，可以生成10条无向连线，由此形成一个如图4所示的全联接图。
106.而后，因果发现模块在全联接图中遍历所有的无向连线对应的顶点组，判定是否存在第二变量使得顶点组对应的两个第一变量条件独立，若为是，删除顶点组对应的无向连线，若为否，保留顶点组对应的无向连线。
107.在全联接图中，每个顶点均对应一个商品变量，这些商品变量可以是自变变量、目标变量或干扰变量中的任意一个。对于一条无向连线，会连接两个顶点，这两个顶点即为该无向连线对应的顶点组，例如图4中，无向连线l1对应的顶点组即为顶点t和顶点y，这两个顶点组所对应的变量即为第一变量。而除顶点组之外的其它顶点所对应的变量则为第二变量，例如对于图4中的无向连线l1，第二变量可以是x1、x2、x3中的至少一个。
108.在判定过程中，若存在第二变量使得顶点组对应的两个第一变量条件独立，可以认为顶点组对应的两个第一变量之间没有因果关系，反之则可以认为顶点组对应的两个第一变量之间有因果关系。因此，可以遍历所有的无向连线，例如遍历到l1对应的顶点t和顶点y时，可以在t和y之外的其它变量x1、x2、x3中寻找到至少一个第二变量，使得变量t和y能够在给定第二变量的情况下条件独立，则可以认为变量t和y之间没有因果关系，从而将这个无向连线l1删除。反之，如果找不到使得变量t和y条件独立的第二变量，则可以保留这个无向连线l1。由此遍历所有无向连线对应的顶点组之后，可以获得自变变量、目标变量以及
effect variational autoencoder，cevae)。通过将自变变量、目标变量以及各个干扰变量的样本数据，对因果效应变分自编码器模型进行训练，在完成训练之后，即可使用因果效应变分自编码器模型对自变变量发生对目标变量的因果效应进行预测。
116.例如，本实施例中，用户希望预测当采用的优惠方式从满2件打9折变到满2件打8折时，商品的流量价值会变化为多少。其中，流量价值可以是gmv/ipv_uv，表示每个浏览过商品的人平均为该商品带来的成交额。若干扰变量为x1品牌级别，x2店铺级别以及x3商品价格，向因果预测模型输入干扰变量的数据x1，x2和x3以及自变变量的变化值t＝1(t＝1表示满2件打8折，t＝0表示满2件打9折)后，可以获得一个输出q(y|t＝1,x1,x2,x3)＝y1，即为流量价值y在优惠方式发生变化后的因果预测值，由此可以确定当优惠方式变到满2件打8折时，商品的流量价值受其变化的直接影响，将会变化为y1。
117.在本技术的一些实施例中，因果效应模块还可以将自变变量的初始值以及干扰变量的样本数据输入因果预测模型，获取目标变量在自变变量发生变化前的因果预测值，然后根据目标变量在自变变量发生变化前、以及在自变变量发生变化后的因果预测值，确定自变变量对目标变量的因果效应值。
118.仍以前述的场景为例，将向因果预测模型输入干扰变量的数据x1，x2和x3以及自变变量的变化值t＝0后，可以获得一个输出q(y|t＝0,x1,x2,x3)＝y0，即为流量价值y在优惠方式发生变化前的因果预测值。将q(y|t＝1,x1,x2,x3)-q(y|t＝0,x1,x2,x3)即为自变变量对目标变量的因果效应值。此外，也可以获取干扰变量的多个样本数据进行处理，例如可以从100个销售某一商品的店铺中获取干扰变量的100个样本数据。基于这些样本数据，即可获取到对应数量的y1和y0，将每个样本数据对应的y1-y0记为独立因果效应值ite，计算所有ite的平均值即可获得平均因果效应值ate，可以将该平均因果效应值作为自变变量对目标变量的因果效应值。
119.在本技术的另一些实施例中，除了因果预测的结果之外，因果效应模块还可以提供另一输出结果。即，在生成因果关系图之后，还可以根据因果关系图确定与自变变量存在因果关系的第一干扰变量，并确定第一干扰变量在自变变量发生变化后的因果预测值。以图3所示的因果关系图为例，在所有干扰变量x1、x2和x3中，第一干扰变量为x1，而后可以计算第一干扰变量在自变变量发生变化后的因果预测值。
120.其中，计算该因果预测值的方式可以参考前述目标变量在自变变量发生变化后的因果预测值的方式，将自变变量的变化值以及第三变量的样本数据输入因果预测模型，获取第一干扰变量在自变变量发生变化后的因果预测值。其中，第三变量为目标变量和除第一干扰变量外的其它干扰变量，例如当第一干扰变量为x1，自变变量为t时，第三变量即为x2、x3和y，由此采用前述类似的方式可以获取x1在t发生变化后的因果预测值。
121.而后，因果效应模块可以将自变变量的变化值以及第一干扰变量的因果预测值输入相关预测模型，获取目标变量在自变变量和第一干扰变量发生变化后的相关预测值。其中，相关预测模型即为基于变量间的相关性实现预测的模型，例如该相关预测模型可以是深度神经网络模型，输入为自变变量的变化值t'以及因自变变量变化而导致变化的新的干扰变量x'，输出为y'，即t',x'
→
y'。而现有技术中，是基于自变变量的变化值t'预测输出值y”，即t'
→
y”，两者的输入不同，本方案中考虑了其它一个自变变量对其它干扰变量的因果影响，因此同时考虑这些输入因素后，所获得的相关预测值会更加准确。
122.在本技术的一些实施例中，还提供了另一种商品变量预测设备，该设备可以与用户进行交互，向用户呈现可选的商品变量，并将最终的预测结果呈现给用户，从而为用户提供数据服务，使得用户能够根据预测结果进行决策。在实际场景中，用户可以是使用数据服务的商家，在为商家提供服务时，本方案可以提供数据可视化的形式，商家可调整数据。
123.该设备包括了交互模块、变量获取模块、特征关联模块、因果发现模块和因果效应模块。所述交互模块，首先可以向用户呈现可选的商品变量。在实际场景中，交互模块可以通过可视化的方式向用户呈现这些可选的商品变量，例如图10中用户可以在用户设备以列表的形式呈现这些可选的商品变量，使得用户可以通过勾选的方式从所有商品变量a1～a10中选择需要自变变量和目标变量，从而形成选择信息。
124.变量获取模块在获得选择信息之后，可以根据所述用户的选择信息，从商品变量中确定自变变量和目标变量。例如，用户选择的自变变量为a9，选择的目标变量的a10，由此确定a9即为自变变量，a10即为目标变量，其它商品变量a1～a8则可以放入特征池中作为候选干扰变量。
125.在确定自变变量以及目标变量之后，可以采用前述的方式由特征关联模块、因果发现模块和因果效应模块进行预测处理，经过干扰变量选取、因果关系图确定、因果预测之后，获得预测结果。
126.该预测结果可以是目标变量在自变变量发生变化后的因果预测值，此时用户可以知道a9在变化为一个新的值a9_v1时，目标变量a10会变化为什么值。此外，预测结果还可以包括自变变量对目标变量的因果效应值，由此用户可以a9在由一个旧的值变化为一个新的值a9_v1时，目标变量a10会有什么样的变化，如增长或减少了多少。这些预测结果可以由交互模块呈现给用户，以帮助进行相关的决策。
127.此外，在根据因果关系图确定自变变量与目标变量之间不存在因果关系时，则表示自变变量与目标变量之间无法进行因果预测，因此交互模块可以向用户呈现关于自变变量与目标变量之间不存在因果关系的提示信息，通过该该提示信息，用户可以知道自变变量与目标变量之间不存在因果关系，无法进行预测。其中，向用户呈现结果同样可以采用可视化的呈现方式，例如图10中，可以采用柱状图的方式显示自变变量对目标变量的因果效应值，在自变变量a9从旧值a9_v0变化为新值a9_v1时，目标变量a10增长了34％，此时可以采用高度为1.34的柱状图形表示该因果效应值。
128.在此，本领域技术人应当理解上述呈现的具体方式仅为举例，其他现有的或今后可能出现的其它方式如可适用于本发明，也应包含在本发明保护范围以内，并在此以引用方式包含于此。例如，也可以采用折线图、表格等其它方式向用户可视化的呈现处理结果。
129.另外，本技术的一部分可被应用为计算机程序产品，例如计算机程序指令，当其被计算机执行时，通过该计算机的操作，可以调用或提供根据本技术的方法和/或技术方案。而调用本技术的方法的程序指令，可能被存储在固定的或可移动的记录介质中，和/或通过广播或其他信号承载媒体中的数据流而被传输，和/或被存储在根据程序指令运行的计算机设备的工作存储器中。在此，根据本技术的一些实施例包括一个如图9所示的计算设备，该设备包括存储有计算机可读指令的一个或多个存储器910和用于执行计算机可读指令的处理器920，其中，当该计算机可读指令被该处理器执行时，使得设备执行基于前述本技术的多个实施例的方法和/或技术方案。
130.此外，本技术的一些实施例还提供了一种计算机可读介质，其上存储有计算机程序指令，计算机可读指令可被处理器执行以实现前述本技术的多个实施例的方法和/或技术方案。
131.需要注意的是，本技术可在软件和/或软件与硬件的组合体中被实施，例如，可采用专用集成电路(asic)、通用目的计算机或任何其他类似硬件设备来实现。在实施例中，本技术的软件程序可以通过处理器执行以实现上文步骤或功能。同样地，本技术的软件程序(包括相关的数据结构)可以被存储到计算机可读记录介质中，例如，ram存储器，磁或光驱动器或软磁盘及类似设备。另外，本技术的一些步骤或功能可采用硬件来实现，例如，作为与处理器配合从而执行各个步骤或功能的电路。
132.本技术领域技术人员可以理解，可以用计算机程序指令来实现这些结构图和/或框图和/或流图中的每个框以及这些结构图和/或框图和/或流图中的框的组合。本技术领域技术人员可以理解，可以将这些计算机程序指令提供给通用计算机、专业计算机或其他可编程数据处理方法的处理器来实现，从而通过计算机或其他可编程数据处理方法的处理器来执行本发明公开的结构图和/或框图和/或流图的框或多个框中指定的方案。
133.本技术领域技术人员可以理解，本发明中已经讨论过的各种操作、方法、流程中的步骤、措施、方案可以被交替、更改、组合或删除。进一步地，具有本发明中已经讨论过的各种操作、方法、流程中的其他步骤、措施、方案也可以被交替、更改、重排、分解、组合或删除。进一步地，现有技术中的具有与本发明中公开的各种操作、方法、流程中的步骤、措施、方案也可以被交替、更改、重排、分解、组合或删除。
134.对于本领域技术人员而言，显然本技术不限于上述示范性实施例的细节，而且在不背离本技术的精神或基本特征的情况下，能够以其他的具体形式实现本技术。因此，无论从哪一点来看，均应将实施例看作是示范性的，而且是非限制性的，本技术的范围由所附权利要求而不是上述说明限定，因此旨在将落在权利要求的等同要件的含义和范围内的所有变化涵括在本技术内。不应将权利要求中的任何附图标记视为限制所涉及的权利要求。

再多了解一些

1/2 1 2 下一页尾页

本文用于企业家、创业者技术爱好者查询，结果仅供参考。

商品变量预测方法、设备以及计算机可读介质与流程

相关文献

最热文献