一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

确定账号活跃信息的方法、装置、电子设备及存储介质与流程

2022-07-31 03:51:34 来源:中国专利 TAG:
1.本公开涉及互联网
技术领域
:,特别涉及一种确定账号活跃信息的方法、装置、电子设备及存储介质。
背景技术
::2.在互联网
技术领域
:,很多数据都是长尾分布,也可以称为不均衡分布。例如,用户账号在应用程序上的生命周期价值(lifetimevalue,ltv),能够反映用户账号在应用程序的活跃度。而各用户账号的ltv是不均衡分布的,即少部分用户账号的活跃行为占总活跃行为的大部分,而大部分用户账号的活跃行为占总活跃行为的小部分。而应用程序提供商通常会根据用户账号的ltv来进行相应的决策,如投放广告、提供激励以及发放红利等。因此,如何准确的确定用户账号的ltv是需要解决的问题。3.相关技术中,通常是针对每个时间段的ltv分别建模,如三个月的ltv、半年的ltv、一年的ltv以及十年的ltv等,来预估各个用户账号在未来的ltv。然而,这种方式忽略了不同时间段的ltv之间的关联关系,会导致预测到同一用户账号的短期ltv大于长期ltv,如三个月的ltv大于一年的ltv,显然这是不合理的。技术实现要素:4.本公开提供一种确定账号活跃信息的方法、装置、电子设备及存储介质,能够基于相邻的两个时间段之间的顺序关系,来确定用户账号在每个时间段的账号活跃信息,提高了预测得到的账号活跃信息的准确性。本公开的技术方案如下:5.根据本公开实施例的一方面,提供一种确定账号活跃信息的方法,包括:6.对待确定的用户账号在历史时间段内的账号数据进行特征提取,得到账号特征,所述账号数据包括行为数据和属性数据;7.对所述账号特征进行映射,得到多个时间段的多个第一活跃信息,所述第一活跃信息为预测到的所述用户账号在对应的时间段内的活跃度,所述多个时间段中顺序在后的时间段包含顺序在前的时间段,所述多个时间段的结束日期晚于所述历史时间段的结束日期;8.基于第一时间段的第一活跃信息和第二时间段的第一活跃信息,得到所述用户账号在所述第二时间段的账号活跃信息,所述第一时间段与所述第二时间段在所述多个时间段中的顺序相邻,且所述第二时间段包含所述第一时间段,所述账号活跃信息用于表示所述用户账号在所述第二时间段内的活跃度。9.在一些实施例中,所述基于第一时间段的第一活跃信息和第二时间段的第一活跃信息,得到所述用户账号在所述第二时间段的账号活跃信息,包括:10.基于多层感知机,对所述第一时间段的第一活跃信息进行映射,得到所述第一时间段的单调增益信息,所述单调增益信息用于指示所述用户账号在所述第一时间段的活跃行为对所述第二时间段的影响情况;11.对所述第二时间段的第一活跃信息和所述第一时间段的单调增益信息进行融合,得到所述用户账号在所述第二时间段的账号活跃信息。12.通过将第一时间段的第一活跃信息和第二时间段的第一活跃信息进行融合,使得第一时间段的第一活跃信息能够对第二时间段进行增益,从而对用户账号在第二时间段中的活跃信息有正向的影响,提高预测的准确性。13.在一些实施例中,所述对待确定的用户账号在历史时间段内的账号数据进行特征提取,得到账号特征,包括:14.对待确定的所述用户账号在所述历史时间段内的账号数据进行嵌入处理,得到账号嵌入特征;15.对所述账号嵌入特征进行特征交叉,得到所述账号特征。16.通过对样本账号数据进行嵌入处理,能够将样本账号数据中的离散数据转化为稠密嵌入,使离散数据变为连续便于后续处理,再对账号嵌入特征进行特征交叉,提高后续预测的准确性。17.在一些实施例中,所述对所述账号特征进行映射,得到多个时间段的多个第一活跃信息,包括:18.对于任一时间段,基于所述时间段对应的多层感知机,对所述账号特征进行映射,得到所述时间段的第一活跃信息。19.通过针对不同样本时间段分别设置多层感知机,实现了对每个不均衡分布的建模,即每个样本时间段内的数据都是不均衡分布的,基于对应的多层感知机,能够预测用户账号在对应的时间段内的贡活跃度,得到用户账号在多个样本时间段内的活跃度,提高了预测效率。20.在一些实施例中,该确定账号活跃信息的方法基于账号活跃模型实现,该账号活跃模型用于基于用户账号在一段时间内的账号数据,预测该用户账号在未来多个时间段内的账号活跃信息。21.通过基于账号活跃模型来实现该确定账号活跃信息的方法,提高了账号活跃信息的确定效率。22.在一些实施例中,该确定账号活跃信息的方法还包括:23.基于第i轮迭代的账号活跃模型,对样本账号在第一样本时间段内的样本账号数据进行特征提取,得到样本账号特征,所述样本账号数据包括行为数据和属性数据,i为正整数;24.基于所述第i轮迭代的账号活跃模型,对所述样本账号特征进行映射,得到多个样本时间段的多个第二活跃信息,所述第二活跃信息为预测到的所述样本账号在对应的样本时间段内的活跃度,所述多个样本时间段中顺序在后的样本时间段包含顺序在前的样本时间段,所述多个样本时间段的结束日期晚于所述第一样本时间段的结束日期;25.基于所述第i轮迭代的账号活跃模型,对所述多个第二活跃信息进行融合,得到所述样本账号在所述多个样本时间段中的多个第三活跃信息,所述第三活跃信息基于相邻的两个样本时间段的第二活跃信息融合得到;26.基于所述多个第三活跃信息和多个第四活跃信息,对所述第i轮迭代的账号活跃模型进行训练,所述多个第四活跃信息用于表示所述样本账号在所述多个样本时间段内的实际活跃度。27.通过基于账号活跃模型对用户账号在第一样本时间段内的账号特征进行映射,能够预测到该用户账号在多个样本时间段内的多个活跃信息,再基于相邻的两个样本时间段之间的顺序关系,来确定用户账号在每个样本时间段的账号活跃信息,提高了预测得到的第三活跃信息的准确性。28.在一些实施例中,该基于第i轮迭代的账号活跃模型,对样本账号在第一样本时间段内的样本账号数据进行特征提取,得到样本账号特征,包括:29.基于该第i轮迭代的账号活跃模型中的第一网络,对该样本账号在该第一样本时间段内的样本账号数据进行嵌入处理,得到样本嵌入特征,该第一网络用于特征嵌入;30.基于该第i轮迭代的账号活跃模型中的第二网络,对该样本嵌入特征进行特征交叉,得到该样本账号特征,该第二网络用于特征交叉。31.通过基于第一网络对样本账号数据进行嵌入处理,能够将样本账号数据中的离散数据转化为denseembedding(稠密嵌入),使离散数据变为连续便于后续处理,再基于第二网络对第一网络输出的数据进行bit-wise的特征交叉,提高后续预测的准确性。32.在一些实施例中,该基于该第i轮迭代的账号活跃模型,对该样本账号特征进行映射,得到多个样本时间段的多个第二活跃信息,包括:33.对于任一样本时间段,基于该第i轮迭代的账号活跃模型中该样本时间段对应第三网络,对该账号特征进行映射,得到该样本时间段的第二活跃信息,该第三网络用于特征映射,包括多层感知机。34.通过针对不同样本时间段分别设置第三网络,实现了对每个不均衡分布的建模,即每个样本时间段内的数据都是不均衡分布的,基于对应的第三网络,能够预测样本账号在对应的样本时间段内的活跃度,提高了预测范围,进而提高了预测效率。35.在一些实施例中,该对该多个第二活跃信息进行融合,得到该样本账号在该多个样本时间段中的第三活跃信息,包括:36.对第二样本时间段的第二活跃信息和第三样本时间段的第二活跃信息进行融合,得到该样本账号在该第三样本时间段中的第三活跃信息,该第二样本时间段与该第三样本时间段在该多个样本时间段中的顺序相邻,且该第三样本时间段包含该第二样本时间段。37.通过将第二样本时间段的第二活跃信息和第三样本时间段的第二活跃信息进行融合,使得第二样本时间段的第二活跃信息能够对第三样本时间段进行增益,从而对样本账号在第三样本时间段中的活跃信息有正向的影响,提高预测的准确性。38.在一些实施例中,该对第二样本时间段的第二活跃信息和第三样本时间段的第二活跃信息进行融合,得到该样本账号在该第三样本时间段中的第三活跃信息,包括:39.基于该第i轮迭代的账号活跃模型中该第二样本时间段对应的第四网络,对该第二样本时间段的第二活跃信息进行映射,得到该第二样本时间段的单调增益信息,该单调增益信息用于指示该样本账号在该第二样本时间段的活跃对第三样本时间段的影响情况;40.基于该第i轮迭代的账号活跃模型中该第三样本时间段对应的第五网络,对该第三样本时间段的第二活跃信息和该第二时间段的单调增益信息进行融合,得到该样本账号在该第三样本时间段中的第三活跃信息。41.通过第二样本时间段对应的第四网络对第二样本时间段的第二活跃信息进行映射,能够将顺序在前的样本时间段的活跃信息转换为顺序在后的样本时间段的单调增益信息,再基于第五网络将该单调增益信息与顺序在后的样本时间段的活跃信息进行融合,能够提高预测得到的第三活跃信息的准确性。42.在一些实施例中,该确定账号活跃信息的方法还包括:43.对于任一样本时间段,基于该第i轮迭代的账号活跃模型中该样本时间段对应的第五网络,对多个样本账号在该样本时间段内的活跃值进行分桶,得到多个活跃桶,每个活跃桶中样本账号的数量在目标数量范围内,该第五网络用于对用户账号进行分桶;44.获取每个活跃桶所对应的活跃值范围的均值;45.基于该多个样本账号所属的活跃桶的均值,确定该多个样本账号在该样本时间段内的第四活跃信息。46.通过对多个样本账号进行分桶,使得样本账号的标签由原来的活跃值转换为所属的活跃桶的均值,从而将回归问题转换为更易解决的分类问题,即对样本账号进行分类,将样本账号分类到不同的活跃桶中,既能缓解样本账号分布不均衡的问题,又能提高模型的学习效率。47.在一些实施例中,该基于该多个第三活跃信息和多个第四活跃信息,对该第i轮迭代的账号活跃模型进行训练,包括:48.基于该多个第三活跃信息和多个第四活跃信息,确定该多个样本时间段的多个第一损失,该第一损失用于表示预测的活跃度与实际活跃度之间的差异;49.基于该多个第三活跃信息,确定至少一个第二损失,该第二损失用于校准相邻两个样本时间段的两个第三活跃信息之间的顺序关系;50.基于所述多个第一损失和所述至少一个第二损失,调整所述第i轮迭代的账号活跃模型的参数。51.通过计算第一损失,能够基于预测结果与标签结果之间的差异,调整模型的参数,以实现有监督训练,提高模型训练效率和模型分类的准确性,通过计算第二损失,能够度量相邻的两个样本时间段对应的第三活跃信息之间的顺序关系,基于第二损失对顺序关系错误的情况进行惩罚,以修正错误,避免出现不合理的情况,提高模型输出的预测结果的准确率。52.根据本公开实施例的另一方面,提供一种确定账号活跃信息的装置,包括:53.第一提取单元,被配置为对待确定的用户账号在历史时间段内的账号数据进行特征提取,得到账号特征,所述账号数据包括行为数据和属性数据;54.第一映射单元,被配置为对所述账号特征进行映射,得到多个时间段的多个第一活跃信息,所述第一活跃信息为预测到的所述用户账号在对应的时间段内的活跃度,所述多个时间段中顺序在后的时间段包含顺序在前的时间段,所述多个时间段的结束日期晚于所述历史时间段的结束日期;55.第一融合单元,被配置为基于第一时间段的第一活跃信息和第二时间段的第一活跃信息,得到所述用户账号在所述第二时间段的账号活跃信息,所述第一时间段与所述第二时间段在所述多个时间段中的顺序相邻,且所述第二时间段包含所述第一时间段,所述账号活跃信息用于表示所述用户账号在所述第二时间段内的活跃度。56.在一些实施例中,所述第一融合单元,被配置为基于多层感知机,对所述第一时间段的第一活跃信息进行映射,得到所述第一时间段的单调增益信息,所述单调增益信息用于指示所述用户账号在所述第一时间段的活跃行为对所述第二时间段的影响情况;对所述第二时间段的第一活跃信息和所述第一时间段的单调增益信息进行融合,得到所述用户账号在所述第二时间段的账号活跃信息。57.在一些实施例中,所述第一提取单元,被配置为对待确定的所述用户账号在所述历史时间段内的账号数据进行嵌入处理,得到账号嵌入特征;对所述账号嵌入特征进行特征交叉,得到所述账号特征。58.在一些实施例中,所述第一映射单元,被配置为对于任一时间段,基于所述时间段对应的多层感知机,对所述账号特征进行映射,得到所述时间段的第一活跃信息。59.在一些实施例中,所述确定账号活跃信息的装置基于账号活跃模型执行步骤,所述账号活跃模型用于基于用户账号在一段时间内的账号数据,预测该用户账号在未来多个时间段内的账号活跃信息。60.在一些实施例中,所述确定账号活跃信息的装置还包括:61.第二提取单元,被配置为基于第i轮迭代的账号活跃模型,对样本账号在第一样本时间段内的样本账号数据进行特征提取,得到样本账号特征,所述样本账号数据包括行为数据和属性数据,i为正整数;62.第二映射单元,被配置为基于所述第i轮迭代的账号活跃模型,对所述样本账号特征进行映射,得到多个样本时间段的多个第二活跃信息,所述第二活跃信息为预测到的所述样本账号在对应的样本时间段内的活跃度,所述多个样本时间段中顺序在后的样本时间段包含顺序在前的样本时间段,所述多个样本时间段的结束日期晚于所述第一样本时间段的结束日期;63.第二融合单元,被配置为基于所述第i轮迭代的账号活跃模型,对所述多个第二活跃信息进行融合,得到所述样本账号在所述多个样本时间段中的多个第三活跃信息,所述第三活跃信息基于相邻的两个样本时间段的第二活跃信息融合得到;64.模型训练单元,被配置为基于所述多个第三活跃信息和多个第四活跃信息,对所述第i轮迭代的账号活跃模型进行训练,所述多个第四活跃信息用于表示所述样本账号在所述多个样本时间段内的实际活跃度。65.在一些实施例中,所述第二提取单元,被配置为基于所述第i轮迭代的账号活跃模型中的第一网络,对所述样本账号在所述第一样本时间段内的样本账号数据进行嵌入处理,得到样本嵌入特征,所述第一网络用于特征嵌入;基于所述第i轮迭代的账号活跃模型中的第二网络,对所述样本嵌入特征进行特征交叉,得到所述样本账号特征,所述第二网络用于特征交叉。66.在一些实施例中,所述第二映射单元,被配置为对于任一样本时间段,基于所述第i轮迭代的账号活跃模型中所述样本时间段对应第三网络,对所述账号特征进行映射,得到所述样本时间段的第二活跃信息,所述第三网络用于特征映射,包括多层感知机。67.在一些实施例中,所述第二融合单元,被配置为对第二样本时间段的第二活跃信息和第三样本时间段的第二活跃信息进行融合,得到所述样本账号在所述第三样本时间段中的第三活跃信息,所述第二样本时间段与所述第三样本时间段在所述多个样本时间段中的顺序相邻,且所述第三样本时间段包含所述第二样本时间段。68.在一些实施例中,所述第二融合单元,被配置为基于所述第i轮迭代的账号活跃模型中所述第二样本时间段对应的第四网络,对所述第二样本时间段的第二活跃信息进行映射,得到所述第二样本时间段的单调增益信息,所述单调增益信息用于指示所述样本账号在所述第二样本时间段的活跃行为对第三样本时间段的影响情况;基于所述第i轮迭代的账号活跃模型中所述第三样本时间段对应的第五网络,对所述第三样本时间段的第二活跃信息和所述第二时间段的单调增益信息进行融合,得到所述样本账号在所述第三样本时间段中的第三活跃信息。69.在一些实施例中,所述确定账号活跃信息的装置还包括:70.分桶单元,被配置为基于所述第i轮迭代的账号活跃模型中所述样本时间段对应的第五网络,对多个样本账号在所述样本时间段内的活跃值进行分桶,得到多个活跃桶,每个活跃桶中样本账号的数量在目标数量范围内,所述第五网络用于对用户账号进行分桶;71.所述分桶单元,还被配置为获取每个活跃桶所对应的活跃值范围的均值;72.所述分桶单元,还被配置为基于所述多个样本账号所属的活跃桶的均值,确定所述多个样本账号在所述样本时间段内的第四活跃信息。73.在一些实施例中,所述模型训练单元,被配置为基于所述多个第三活跃信息和多个第四活跃信息,确定所述多个样本时间段的多个第一损失,所述第一损失用于表示预测的活跃度与实际活跃度之间的差异;基于所述多个第三活跃信息,确定至少一个第二损失,所述第二损失用于校准相邻两个样本时间段的两个第三活跃信息之间的顺序关系;基于所述多个第一损失和所述至少一个第二损失,调整所述第i轮迭代的账号活跃模型的参数。74.根据本公开实施例的另一方面,提供一种电子设备,该电子设备包括:75.一个或多个处理器;76.用于存储该处理器可执行程序代码的存储器;77.其中,该处理器被配置为执行该程序代码,以实现上述确定账号活跃信息的方法。78.根据本公开实施例的另一方面,提供一种计算机可读存储介质,当该计算机可读存储介质中的程序代码由电子设备的处理器执行时,使得电子设备能够执行上述确定账号活跃信息的方法。79.根据本公开实施例的另一方面,提供了一种计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现上述确定账号活跃信息的方法。80.本公开实施例提供的确定账号活跃信息的方案,通过对用户账号在第一时间段内的账号特征进行映射,能够预测到该用户账号在未来的多个时间段内的多个活跃信息,再基于相邻的两个时间段之间的顺序关系,来确定用户账号在每个时间段的账号活跃信息,提高了预测得到的账号活跃信息的准确性。81.应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。附图说明82.此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例,并与说明书一起用于解释本公开的原理,并不构成对本公开的不当限定。83.图1是根据一示例性实施例示出的一种确定账号活跃信息的方法的实施环境示意图。84.图2是根据一示例性实施例示出的一种确定账号活跃信息的方法的流程图。85.图3是根据一示例性实施例示出的另一种确定账号活跃信息的方法的流程图。86.图4是根据一示例性实施例示出的一种账号活跃模型的结构示意图。87.图5是根据一示例性实施例示出的一种确定账号活跃信息的装置的框图。88.图6是根据一示例性实施例示出的另一种确定账号活跃信息的装置的框图。89.图7是根据一示例性实施例示出的一种终端的框图。90.图8是根据一示例性实施例示出的一种服务器的框图。具体实施方式91.为了使本领域普通人员更好地理解本公开的技术方案,下面将结合附图,对本公开实施例中的技术方案进行清楚、完整地描述。92.需要说明的是,本公开的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本公开的实施例能够以除了在这里图示或描述的那些以外的顺序实施。以下示例性实施例中所描述的实施方式并不代表与本公开相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本公开的一些方面相一致的装置和方法的例子。93.本公开所涉及的账号数据等信息为经用户授权或者经过各方充分授权的信息。94.以下介绍本公开涉及到的名词。95.多层感知机(mlp,multilayerperceptron)是一种前馈人工神经网络模型,其将输入的多个数据集映射到单一的输出的数据集上。96.特征交叉一种合成特征的方法,可以在多维特征数据集上,进行很好的非线性特征拟合。特征交叉包括向量级(vector-wise)的特征交叉和元素级(bit-wise)的特征交叉。其中,元素级是指嵌入向量中的元素用术语bit表示。97.one-hot编码,又称为一位有效编码,主要是采用位状态寄存器来对多个状态进行编码,每个状态都由他独立的寄存器位,并且在任意时候只有一位有效。独热编码利用0和1表示一些参数,使用多位状态寄存器来对多个状态进行编码。98.线性整流函数(rectifiedlinearunit,relu),又称修正线性单元,是一种人工神经网络中常用的激活函数(activationfunction),通常指代以斜坡函数及其变种为代表的非线性函数。99.本公开提供的确定账号活跃信息的方案,由电子设备执行,电子设备能够被提供为终端或者服务器。当电子设备被提供为终端时,由该终端实现该方案;当被提供为服务器时,由该服务器实现该方案,该服务器能够接收终端授权的账号数据,由服务器确定用户账号的账号活跃信息;或者由该服务器和终端交互来实现该方案,由终端向服务器发送携带用户账号的请求,由服务器来确定该用户账号在未来多个时间段内的多个账号活跃信息,然后将多个账号活跃信息反馈给终端,由终端输出该多个账号活跃信息。100.图1是根据一示例性实施例示出的一种确定账号活跃信息的方法的实施环境示意图。以电子设备被提供为服务器为例,参见图1,该实施环境具体包括:终端101和服务器102。101.终端101为智能手机、智能手表、台式电脑、手提电脑、mp3播放器、mp4播放器和膝上型便携计算机等设备中的至少一种。终端101上安装有应用程序,用户能够通过终端101登录该应用程序来获取该应用程序提供的服务。终端101能够通过无线网络或有线网络与服务器102相连,进而将携带有待确定的用户账号的请求发送给服务器102。其中,终端101泛指多个终端中的一个,本实施例以终端101来举例说明。本领域技术人员知晓,上述终端的数量能够更多或更少。比如上述终端为几个,或者上述终端为几十个或几百个,或者更多数量,本公开实施例对终端的数量和设备类型均不加以限定。102.服务器102为一台服务器、多台服务器、云计算平台和虚拟化中心中的至少一种。服务器102能够接收终端101发送请求,该请求携带有待确定的用户账号。服务器102基于本公开提供的确定账号活跃信息的方案,确定该用户账号在未来多个时间段内的账号活跃信息。在一些实施例中,上述服务器的数量能够更多或更少,本公开实施例对此不加以限定。当然,服务器102还能够包括其他功能服务器,如数据库服务器、查询服务器以及统计服务器等,以便提供更全面且多样化的服务。103.图2是根据一示例性实施例示出的一种确定账号活跃信息的方法的流程图,如图2所示,该确定账号活跃信息的方法由电子设备执行,包括以下步骤:104.在步骤s201中,对待确定的用户账号在历史时间段内的账号数据进行特征提取,得到账号特征。105.在本公开实施例中,该账号数据包括用户账号的行为数据和属性数据。其中,行为数据与该方法应用场景相关,如该方法应用于多媒体应用时,该行为数据包括用户账号的观看行为、收藏行为以及点赞行为等;如该方法应用于游戏应用时,该行为数据包括用户账号的登录行为、对局行为以及消费行为等。属性数据包括用户账号的用户画像,如性别、年龄、职业以及登录用户账号的设备等。该历史时间段为过去3天、过去7天或者过去10天等,本公开实施例对此不进行限制。该账号数据由电子设备基于用户账号从数据库查询得到,该数据库用于存储多个用户账号的账号数据;或者,该账号数据由电子设备接收的请求携带,该请求携带该用户账号和该用户账号在历史时间段内的账号数据。106.在一些实施例中,电子设备能够采用对账号数据进行嵌入处理然后特征交叉的方式进行特征提取,本公开实施例对特征处理的方式不进行限制。107.在步骤s202中,对该账号特征进行映射,得到多个时间段的多个第一活跃信息。108.在本公开实施例中通过按照时间段分别对账号特征进行映射,能够得到各个时间段的第一活跃信息,该第一活跃信息为预测到的该用户账号在对应的时间段内的活跃度。该多个第一活跃信息与该多个时间段一一对应,也即不同的时间段对应不同的第一活跃信息。该多个时间段中顺序在后的时间段包含顺序在前的时间段,该多个时间段的结束日期晚于上述历史时间段的结束日期。该多个时间段的起始日期相同,时间长度不同。在一些实施例中,该多个时间段的起始日期相同,且该起始日期在该历史时间段内,也即该多个时间段的起始日期与该历史时间段的起始日期相同,或者该多个时间段的起始日期与历史时间段的结束日期相同,或者该多个时间段的起始日期在该历史时间段的起始日期和结束日期之间。在一些实施例中,该多个时间段的起始日期相同,且该多个时间段的起始日期晚于该历史时间段的结束日期,本公开实施例对此不进行限定。109.例如,以多个时间段的起始日期与历史时间段的起始日期相同为例,假设当前时间为1月8日,历史时间段为过去7天,则历史时间段的起始日期为1月1日。该多个时间段的起始日期与历史时间段相同,即该多个时间段的起始日期均为1月1日,该多个时间段的时间长度分别为30天、60天、90天以及180天,即该多个时间段的结束日期均晚于该历史时间段的结束日期。110.在步骤s203中,对第一时间段的第一活跃信息和第二时间段的第一活跃信息进行融合,得到该用户账号在该第二时间段的账号活跃信息。111.在本公开实施例中,该第一时间段为多个时间段中除顺序在末尾的时间段以外的任一时间段,该第一时间段与该第二时间段在该多个时间段中的顺序相邻,且该第二时间段包含该第一时间段。由于多个时间段中顺序在后的时间段包含顺序在前的时间段,则顺序在前的时间段的第一活跃信息,会对顺序在后的时间段造成影响。因此,将第一时间段的第一活跃信息与该第二时间段的第一活跃信息进行融合,将融合得到的账号活跃信息作为该用户账号在第二时间段内最终的活跃信息,该账号活跃信息用于表示该用户账号在该第二时间段内的活跃度。112.本公开实施例提供的确定账号活跃信息的方案,通过对用户账号在历史时间段内的账号特征进行映射,能够预测到该用户账号在未来的多个时间段内的多个活跃信息,再基于相邻的两个时间段之间的顺序关系,来确定用户账号在每个时间段的账号活跃信息,提高了预测得到的账号活跃信息的准确性。113.上述图2所示为本公开提供的确定账号活跃信息的方案的基本流程,下面基于一种应用场景,来对本公开提供的方案进行进一步描述,在该应用场景中,以预测用户在未来多个时间段内的活跃天数为例进行说明。图3是根据一示例性实施例示出的另一种确定账号活跃信息的方法的流程图。以电子设备被提供为服务器为例,参见图3,该方法包括:114.在本公开实施例中,该确定账号活跃信息的方案基于账号活跃模型实现,该账号活跃模型用于基于用户账号在一段时间内的账号数据,预测该用户账号在未来多个时间段内的账号活跃信息。下面以第i轮迭代为例,基于步骤s301至步骤s304来介绍模型训练的过程,i为正整数。在模型训练完毕后,基于步骤305至步骤s307,来描述基于训练得到账号活跃模型实现该确定账号活跃信息的方案的过程。115.在步骤s301中,服务器基于第i轮迭代的账号活跃模型,对样本账号在第一样本时间段内的样本账号数据进行特征提取,得到样本账号特征。116.在本公开实施例中,服务器能够获取多个样本账号在第一样本时间段内行为数据和属性数据。其中,该样本账号为用户账号,该行为数据包括用户账号的登录行为、观看行为、发布行为、收藏行为以及点赞行为中的至少一种。属性数据包括用户账号的用户画像,如性别、年龄以及设备信息中的至少一种。其中,至少一种是指一种或一种以上。该第一样本时间段的时间长度为3天、7天或者10天等,本公开实施例对此不进行限制。该样本账号在第一时间段内的样本账号数据由服务器基于样本账号从数据库查询得到,该数据库用于存储多个用户账号的账号数据。117.例如,以第一样本时间段的时间长度为7天为例,服务器获取该样本账号在这7天内的行为数据和用户画像。其中,该行为数据表示为序列的形式,序列中包括7个元素,一个元素对应一天。如样本账号在这7天内的“活跃时间”表示为长度为7的序列:[34,23,56,12,14,67,87],该序列表示样本账号在每一天活跃的分钟数。再如,样本账号在这7天内的“点赞数”表示为另一个长度为7的序列:[12,11,23,6,29,35],该序列表示样本账号在每一天点赞的数量。同理,样本账号的浏览行为、收藏行为以及消费行为等行为数据,同样被表示为序列的形式,不再一一列举。当然,服务器还能够获取未处理的行为数据,然后将该行为数据处理为上述序列的形式,本公开实施例对此不进行限制。[0118]服务器能够基于该多个样本账号的样本账号数据进行多轮迭代。对于第i轮迭代,若i=1,则表示首轮迭代,第i轮迭代的账号活跃模型为初始模型;若i>1,则表示非首轮迭代,第i轮迭代的账号活跃模型为第i-1轮迭代结束后进行参数调整的模型。[0119]以下,对账号活跃模型的结构进行介绍。[0120]图4是根据一示例性实施例示出的一种账号活跃模型的结构示意图,参见图4,该账号活跃模型包括第一网络、第二网络、m个第三网络、m-1个第四网络以及m个第五网络。其中,m为正整数,表示时间段的数量。该第一网络用于特征嵌入。该第二网络用于特征交叉。该第三网络用于特征映射,该n个第三网络的结构相同,参数不同。该第四网络用于将一个第五网络的输出变换为另一个第五网络的输入。该第五网络用于输出样本账号在对应时间段预测的活跃信息。[0121]在一些实施例中,在第i轮迭代时,服务器将样本账号在第一样本时间段内的样本账号数据输入第i轮迭代的账号活跃模型中,服务器能够基于第i轮迭代的账号活跃模型对该样本账号数据进行嵌入处理然后特征交叉,得到样本账号特征。服务器基于第i轮迭代的账号活跃模型,对样本账号在第一样本时间段内的样本账号数据进行特征提取,得到样本账号特征的步骤,包括:服务器基于第i轮迭代的账号活跃模型中的第一网络,对样本账号在第一样本时间段内的样本账号数据进行嵌入处理,得到样本嵌入特征,该第一网络用于特征嵌入。然后,服务器基于第i轮迭代的账号活跃模型中的第二网络,对样本嵌入特征进行特征交叉,得到样本账号特征,该第二网络用于特征交叉,该特征交叉的方式为bit-wise的特征交叉。其中,该第二网络包括多层感知机。通过基于第一网络对样本账号数据进行嵌入处理,能够将样本账号数据中的离散数据转化为denseembedding(稠密嵌入),使离散数据变为连续便于后续处理,再基于第二网络对第一网络输出的数据进行bit-wise的特征交叉,提高后续预测的准确性。[0122]例如,服务器基于第一网络对样本数据中的性别、id(identitydocument,账号)以及设备型号等离散特征进行独热编码,然后基于预设的嵌入表格(embeddingtable),将独热编码的结果转换为denseembedding,得到样本嵌入特征。其中,每一个类别对应一个嵌入表格。服务器将第一网络输出的denseembedding输入第二网络,该第二网络包括三层的mlp。服务器基于多层感知对输入的denseembedding进行bit-wise的特征交叉,得到样本账号特征。其中,第二网络中每一层网络的输出会连接一个非线性激活函数relu。[0123]在步骤s302中,服务器基于第i轮迭代的账号活跃模型,对样本账号特征进行映射,得到多个样本时间段的多个第二活跃信息。[0124]在本公开实施例中,服务器能够基于第i轮迭代的账号活跃模型中多个样本时间段对应的多个第三网络,分别对该样本账号特征进行映射,得到该多个样本时间段的多个第二活跃信息。该第二活跃信息为预测到的样本账号在对应的样本时间段内的活跃度,该多个第二活跃信息与该多个样本时间段一一对应,该多个第三网络与该多个样本时间段一一对应。该多个样本时间段中顺序在后的样本时间段包含顺序在前的样本时间段,该多个样本时间段的结束日期晚于该第一样本时间段的结束日期。该多个样本时间段的起始日期相同,时间长度不同。在一些实施例中,该多个样本时间段的起始日期相同,且该起始日期在该第一样本时间段内,或者该多个样本时间段的起始日期晚于该第一样本时间段的结束日期,详见步骤s202,在此不再赘述。[0125]在一些实施例中,由于账号活跃模型中的多个第三网络的结构相同,参数不同。以任一样本时间段为例进行说明。服务器基于第i轮迭代的账号活跃模型,对样本账号特征进行映射,得到多个样本时间段的多个第二活跃信息的步骤,包括:对于任一样本时间段,服务器能够基于第i轮迭代的账号活跃模型中该样本时间段对应第三网络,对该账号特征进行映射,得到样本时间段的第二活跃信息,该第三网络用于特征映射,包括多层感知机,该第三网络中每层网络的输出都会接一个非线性激活函数relu。通过针对不同样本时间段分别设置第三网络,实现了对每个不均衡分布的建模,即每个样本时间段内的数据都是不均衡分布的,基于对应的第三网络,能够预测样本账号在对应的样本时间段内的活跃度,提高了预测范围,进而提高了预测效率。[0126]在步骤s303中,服务器基于第i轮迭代的账号活跃模型,对多个第二活跃信息进行融合,得到样本账号在多个样本时间段中的多个第三活跃信息。[0127]在本公开实施例中,第三活跃信息基于相邻的两个样本时间段的第二活跃信息融合得到,也即服务器能够将相邻的两个样本时间段的第二活跃信息进行融合,得到顺序在后的样本时间段的第三活跃信息。[0128]在一些实施例中,第二样本时间段为多个样本时间段中除顺序在末尾的样本时间段以外的任一样本时间段,该第二样本时间段与该第三样本时间段在该多个样本时间段中的顺序相邻,且该第三样本时间段包含该第二样本时间段。服务器基于第i轮迭代的账号活跃模型对多个第二活跃信息进行融合,得到样本账号在多个样本时间段中的第三活跃信息,包括:服务器对第二样本时间段的第二活跃信息和第三样本时间段的第二活跃信息进行融合,得到样本账号在第三样本时间段中的第三活跃信息。通过将第二样本时间段的第二活跃信息和第三样本时间段的第二活跃信息进行融合,使得第二样本时间段的第二活跃信息能够对第三样本时间段进行增益,从而对样本账号在第三样本时间段中的活跃信息有正向的影响,提高预测的准确性。[0129]例如,第二样本时间段的时间长度为30天,第三样本时间段的时间长度为60天,由于第三样本时间段与第二样本时间段的起始日期相同,也即第三样本时间段包含第二样本时间段,则样本账号在第二样本时间段中的活跃信息对样本账号在第三样本时间段中的活跃信息有正向的影响。因此,服务器通过对第二样本时间段的第二活跃信息和第三样本时间段的第二活跃信息进行融合,来对第三样本时间段进行增益,从而得到该第三活跃信息。[0130]在一些实施例中,服务器能够基于第i轮迭代的账号活跃模型中的第四网络和第五网络,来实现对第二样本时间段的第二活跃信息和第三样本时间段的第二活跃信息的融合。服务器能够基于第i轮迭代的账号活跃模型中第二样本时间段对应的第四网络,对第二样本时间段的第二活跃信息进行映射,得到第二样本时间段的单调增益信息,该单调增益信息用于指示样本账号在该第二样本时间段的活跃行为对第三样本时间段的影响情况。然后,服务器能够基于第i轮迭代的账号活跃模型中第三样本时间段对应的第五网络,对第三样本时间段的第二活跃信息和第二时间段的单调增益信息进行融合,得到样本账号在该第三样本时间段中的第三活跃信息。需要说明的是,该第四网络包括网络参数均为非负的两层mlp,能够串联起相邻的样本时间段对应的第五网络,该第四网络为单调信息单元(monotonicinformationunit,monounit),用于实现顺序在前的样本时间段对应的第五网络输出的第二活跃信息,对顺序在后的样本时间段对应的第五网络输出的第三活跃信息的增益。该第五网络为第三网络的最后一层,第五网络能够用于输出第三网络的结果,也即输出第二活跃信息。通过第二样本时间段对应的第四网络对第二样本时间段的第二活跃信息进行映射,能够将顺序在前的样本时间段的活跃信息转换为顺序在后的样本时间段的单调增益信息,再基于第五网络将该单调增益信息与顺序在后的样本时间段的活跃信息进行融合,能够提高预测得到的第三活跃信息的准确性。[0131]例如,多个样本时间段的起始日期与第一样本时间段的起始日期相同,该多个样本时间段的时间长度分别为30天、60天、90天、180天以及365天。以第二样本时间段为时间长度是30天的样本时间段为例,则第三样本时间段为时间长度是60天的样本时间段。参见图4所示,第二样本时间段对应的第五网络,将第三网络输出的第二增益信息a1输入第二样本时间段对应的第四网络,该第四网络对该第二增益信息进行拟合,得到单调增益信息b,也即b=f(a1),其中f()表示第四网络中的拟合函数。然后,第三样本时间段对应的第五网络,对第三样本时间段对应的第二增益信息a2和单调增益信息b进行融合,得到第三样本时间对应的第三增益信息c,也即c=a2 b。[0132]需要说明的是,账号活跃模型中的第五网络除了用于输出第三网络的结果,还用于计算损失。而在计算损失之前,服务器能够基于该第五网络,采用分桶的方式,确定样本账号在不同样本时间段对应的实际活跃值。由于尾部的样本较少导致模型学习困难,因此将尾部的样本账号全部装在一个桶里,将头部的样本账号也装在一个桶里,桶的宽度限定了将活跃值的取值范围,这种方式称为变宽分桶,即各个桶的宽度不同。不同宽度的桶能够使得各桶内的样本账号的数量保持在目标数量范围内,即各个桶中样本的数量基本相同。对于任一样本时间段,服务器基于第i轮迭代的账号活跃模型中该样本时间段对应的第五网络,对多个样本账号在样本时间段内的活跃值进行分桶,得到多个活跃桶,每个活跃桶中样本账号的数量在目标数量范围内,该第五网络用于对用户账号进行分桶。然后,服务器能够获取每个活跃桶所对应的活跃值范围的均值。最后,服务器基于该多个样本账号所属的活跃桶的均值,确定该多个样本账号在样本时间段内的第四活跃信息。通过对多个样本账号进行分桶,使得样本账号的标签由原来的活跃值转换为所属的活跃桶的均值,从而将回归问题转换为更易解决的分类问题,即对样本账号进行分类,将样本账号分类到不同的活跃桶中,既能缓解样本账号分布不均衡的问题,又能提高模型的学习效率。[0133]例如,以时间长度为30天的样本时间段为例,分桶为5个活跃桶,该5个活跃桶的活跃值取值范围分别为:1,2-5,6-12,13-18,19-30,也即活跃值在19-30范围内的样本账号落在第5个分桶,此时通过该活跃桶的均是表示属于该活跃桶的样本账号的第四活跃信息,也即第5个活跃桶中的样本账号的第四活跃信息为(19 30)/2=24.5。[0134]在步骤s304中,服务器基于该多个第三活跃信息和多个第四活跃信息,对该第i轮迭代的账号活跃模型进行训练。[0135]在本公开实施例中,该多个第四活跃信息用于表示该样本账号在该多个样本时间段内的实际活跃度,也即第四活跃信息表示该样本账号在对应的时间段中所属的活跃桶对应的活跃值。[0136]在一些实施例中,服务器能够基于多个第三活跃信息和多个第四活跃信息之间的差异,调整账号活跃模型的参数。服务器基于多个第三活跃信息和多个第四活跃信息,对第i轮迭代的账号活跃模型进行训练的步骤,包括:服务器基于多个第三活跃信息和多个第四活跃信息,确定多个样本时间段的多个第一损失,该第一损失用于表示预测的活跃度与实际活跃度之间的差异。然后服务器基于多个第一损失和所述至少一个第二损失,调整第i轮迭代的账号活跃模型的参数。服务器能够基于多个第三活跃信息,确定至少一个第二损失,该第二损失用于校准相邻两个样本时间段的两个第三活跃信息之间的顺序关系。其中,该第一损失采用计算顺序回归损失(ordinalregressionloss)的方式得到,该第二损失采用计算有序校准损失的方式得到。通过计算第一损失,能够基于预测结果与标签结果之间的差异,调整模型的参数,以实现有监督训练,提高模型训练效率和模型分类的准确性,通过计算第二损失,能够度量相邻的两个样本时间段对应的第三活跃信息之间的顺序关系,基于第二损失对顺序关系错误的情况进行惩罚,以修正错误,避免出现不合理的情况,提高模型输出的预测结果的准确率。[0137]在一些实施例中,对于任一样本时间段,该样本时间段中有多个活跃桶,为了度量不同活跃桶的对应的活跃值之间的排序关系,通过有序回归损失,也即上述第一损失来建模分桶序准。该样本时间段的第一损失能够通过下述公式(1)-(4)计算得到。[0138][0139][0140][0141][0142]其中,l(x;θ)表示第一损失;x表示样本账号的样本账号特征;θ表示模型参数;n表示样本账号的数量;ψ(x,θ)表示每个样本账号的有序损失;k表示当前样本时间段活跃桶的总数目;k表示第k个活跃桶对应的活跃值;lx表示样本账号真实的活跃值;表示预测样本账号x的活跃值大于第k个活跃桶对应的活跃值的概率;e表示指数函数;y()表示激活函数的输入。[0143]在一些实施例中,为了避免相邻两个样本时间段对应的第三活跃信息的大小关系不合理,通过有序校准损失,也即上述第二损失来对各个样本时间段对应的第三活跃信息的有序关系进行校准。该第二公式能够通过以下公式(5)计算得到。[0144][0145]其中,loc表示第二损失;n表示样本账号的数量;o表示样本时间段的数量,o=1表示多个样本时间段中顺序在首位的样本时间段;x表示样本账号;d表示样本数据集,该样本数据集包括多个样本账号;max()表示最大值函数;表示第o-1个时间段对应的预估值,即示第o-1个时间段对应的第三活跃信息;表示第o个时间段对应的预估值,即示第o个时间段对应的第三活跃信息。[0146]例如,多个样本时间段的时间长度分别为30天,60天以及90天,即建模ltv30、ltv60以及ltv90。理论上ltv90>ltv60大于ltv30,若模型预测ltv30>=ltv60,或者ltv60>=ltv90,则不合理。相应的上述公式(5)会得到该样本时间段对应的一个损失,该损失能够对模型进行惩罚,以使模型学习到不同样本时间段的输出之间的顺序关系。[0147]需要说明的是,为了使上述步骤301-步骤304描述的模型训练步骤更容易理解,下面对模型训练的过程做进一步的介绍。本公开实施例提供的账号活跃模型是一个高效的多标签有序依赖单调网络模型框架(order-dependencymonotonicneuralnetwork,简称odmn)。该账号活跃模型的训练过程包括两部分:前向计算和反向传播。前向计算过程中,经过处理的样本账号数据经过embeddinglayer(嵌入层)&sharedenselayer(共享稠密层)以及多层非线性变换,输出隐层向量。其中,该embeddinglayer为图4中的第一网络,该sharedenselayer为图4中的第二网络。该隐层向量分别输入每个子任务的tower(塔)网络,即图4中的第三网络。每个tower网络建模一个不均衡分布,也即对应一个样本时间段,且这些不均衡分布之间存在有序依赖关系,相应的,这些tower从左到右分别建模loworder(低位)、midorder(中位)以及highorder(高位),需要说明的是,低位、中位以及高位是以三个层次为例进行说明,当具有三个以上的样本时间段时,还能够采用其他方式表示不同样本时间段对应的不均衡分布。例如,在预估样本账号未来一段时间的活跃天数(lifetime,lt)这一场景时,共有5个tower网路,分别用于预估lt30、lt60、lt90、lt180以及lt365。每个tower网络最后的outputlayer(输出层)会输出一个logit(逻辑回归)值。其中,该outputlayer为图4中的第五网络,该logit用于计算上述第一损失和第二损失,还用于输出预测的第二活跃值。outputlayer输出的第二活跃值会输入monounit(单调信息单元),由该monounit将该第二活跃值转换为单调增益信息,作为下一个tower网络的outputlayer的输入之一。其中,该monounit为图4中的第四网络。然后,各个tower网络的outputlayer会采用上述顺序回归损失和有序校准损失来对模型进行训练,在此不再赘述。反向传播的过程中,采用随机梯度下降算法来最小化前向计算中的损失,该损失为上述第一损失和第二损失的和。基于该损失来更新模型的参数和嵌入层的参数。[0148]需要说明的是,本技术实施例以训练账号活跃模型为例进行说明,本技术实施例提供的上述步骤,还能够使用其他不均衡分布的数据,来训练不同应用的模型,如使用用户账号的购物行为,训练账号购物模型,用于预测用户账号的购物情况;或者使用用于账号的游戏行为,训练账号游戏模型,用于预测用户账号的游戏情况,本技术实施例对此不进行限制。[0149]以下步骤s305至步骤s307描述模型的应用过程。账号活跃模型训练至收敛后,服务器接收用户账号基于终端发送的请求,服务器基于该请求获取账号数据,如该用户账号近期的历史行为数据、用户画像等。服务器将该账号数据输入账号活跃模型,由该账号活跃模型基于该账号数据,确定该用户账号在各个时间段对应的账号活跃信息。[0150]在步骤s305中,服务器基于账号活跃模型,对待确定的用户账号在历史时间段内的账号数据进行特征提取,得到账号特征。[0151]在本公开实施例中,该账号数据包括用户账号在历史时间段的行为数据和属性数据。[0152]例如,当前时间为1月8日,该历史时间段为1月1日至1月7日,则服务器能够获取该用户账号在上述7天内的行为数据和用户账号画像。[0153]在一些实施例中,服务器能够基于账号活跃模型中的第一网络和第二网络,对输入模型的账号数据进行特征提取,得到账号特征。服务器对待确定的用户账号在历史时间段内的账号数据进行嵌入处理,得到账号嵌入特征,然后对账号嵌入特征进行特征交叉,得到账号特征。通过基于对样本账号数据进行嵌入处理,能够将样本账号数据中的离散数据转化为稠密嵌入,使离散数据变为连续便于后续处理,再对账号嵌入特征进行特征交叉,提高后续预测的准确性。[0154]在步骤s306中,服务器基于账号活跃模型,对该账号特征进行映射,得到多个时间段的多个第一活跃信息。[0155]在本公开实施例中,该多个时间段与账号活跃模型中的多个第三网络一一对应,该多个时间段中顺序在后的时间段包含顺序在前的时间段,该多个时间段中顺序在首位的时间段包含该历史时间段,该第一活跃信息为账号活跃模型预测到的该用户账号在对应的时间段内的活跃度。其中,该第三网络包括多层感知机,对于任一时间段,基于该时间段对应的多层感知机,对该账号特征进行映射,得到该时间段的第一活跃信息。通过针对不同样本时间段分别设置第三网络,实现了对每个不均衡分布的建模,即每个样本时间段内的数据都是不均衡分布的,基于对应的第三网络,能够预测用户账号在对应的时间段内的活跃度,提高了预测范围,进而提高了预测效率。[0156]在步骤s307中,服务器基于账号活跃模型,对第一时间段的第一活跃信息和第二时间段的第一活跃信息进行融合,得到该用户账号在该第二时间段的账号活跃信息。[0157]在本公开实施例中,该第一时间段与该第二时间段在该多个时间段中的顺序相邻,且该第二时间段包含该第一时间段,该账号活跃信息用于表示该用户账号在该第二时间段内的活跃度。[0158]例如,该第一时间段为1月1日至1月30日,该第二时间段为1月1日至2月29日,即第一时间段的时间长度为30天,第二时间段的时间长度为60天。[0159]在一些实施例中,服务器基于账号活跃模型中的第四网络和第五网络对上述活跃信息进行融合。服务器对第一时间段的第一活跃信息进行映射,得到第一时间段的单调增益信息,该单调增益信息用于指示用户账号在第一时间段的活跃行为对第二时间段的影响情况。然后服务器对第二时间段的第一活跃信息和第一时间段的单调增益信息进行融合,得到用户账号在第二时间段的账号活跃信息。通过将第一时间段的第一活跃信息和第二时间段的第一活跃信息进行融合,使得第一时间段的第一活跃信息能够对第二时间段进行增益,从而对用户账号在第二时间段中的活跃信息有正向的影响,提高预测的准确性。[0160]本公开实施例提供的方案,通过基于与多个时间段对应的多个第一网络,分别对用户账号在第一时间段内的账号特征进行映射,能够预测到该用户账号在未来的多个时间段内的多个活跃信息,再基于相邻的两个时间段之间的顺序关系,来确定用户账号在每个时间段的账号活跃信息,提高了预测得到的账号活跃信息的准确性。并且,经过验证,该账号活跃模型输出的账号活跃信息与真实的账号活跃信息非常接近,且缓解了预测出的短期活跃值大于预测出的长期活跃值的现象,在预测用户账号的ltv这一场景中,取得了良好的效果。[0161]上述所有可选技术方案,可以采用任意结合形成本公开的可选实施例,在此不再一一赘述。[0162]图5是根据一示例性实施例示出的一种确定账号活跃信息的装置的框图。参照图5,该装置包括:第一提取单元501、第一映射单元502以及第一融合单元503。[0163]第一提取单元501,被配置为对待确定的用户账号在历史时间段内的账号数据进行特征提取,得到账号特征,该账号数据包括行为数据和属性数据;[0164]第一映射单元502,被配置为对该账号特征进行映射,得到多个时间段的多个第一活跃信息,该第一活跃信息为预测到的该用户账号在对应的时间段内的活跃度,该多个时间段中顺序在后的时间段包含顺序在前的时间段,该多个时间段的结束日期晚于该历史时间段的结束日期;[0165]第一融合单元503,被配置为基于第一时间段的第一活跃信息和第二时间段的第一活跃信息,得到该用户账号在该第二时间段的账号活跃信息,该第一时间段与该第二时间段在该多个时间段中的顺序相邻,且该第二时间段包含该第一时间段,该账号活跃信息用于表示该用户账号在该第二时间段内的活跃度。[0166]本公开实施例提供的装置,通过基于与多个时间段对应的多个第一网络,分别对用户账号在第一时间段内的账号特征进行映射,能够预测到该用户账号在未来的多个时间段内的多个活跃信息,再基于相邻的两个时间段之间的顺序关系,来确定用户账号在每个时间段的账号活跃信息,提高了预测得到的账号活跃信息的准确性。[0167]在一些实施例中,该第一融合单元503,被配置为基于多层感知机,对该第一时间段的第一活跃信息进行映射,得到该第一时间段的单调增益信息,该单调增益信息用于指示该用户账号在该第一时间段的活跃行为对该第二时间段的影响情况;对该第二时间段的第一活跃信息和该第一时间段的单调增益信息进行融合,得到该用户账号在该第二时间段的账号活跃信息。[0168]在一些实施例中,该第一提取单元501,被配置为对待确定的该用户账号在该历史时间段内的账号数据进行嵌入处理,得到账号嵌入特征;对该账号嵌入特征进行特征交叉,得到该账号特征。[0169]在一些实施例中,该第一映射单元502,被配置为对于任一时间段,基于该时间段对应的多层感知机,对该账号特征进行映射,得到该时间段的第一活跃信息。[0170]在一些实施例中,该确定账号活跃信息的装置基于账号活跃模型执行步骤,该账号活跃模型用于基于用户账号在一段时间内的账号数据,预测该用户账号在未来多个时间段内的账号活跃信息。[0171]在一些实施例中,图6是根据一示例性实施例示出的另一种确定账号活跃信息的装置的框图,参见图6,该确定账号活跃信息的装置还包括:[0172]第二提取单元504,被配置为基于第i轮迭代的账号活跃模型,对样本账号在第一样本时间段内的样本账号数据进行特征提取,得到样本账号特征,该样本账号数据包括行为数据和属性数据,i为正整数;[0173]第二映射单元505,被配置为基于该第i轮迭代的账号活跃模型,对该样本账号特征进行映射,得到多个样本时间段的多个第二活跃信息,该第二活跃信息为预测到的该样本账号在对应的样本时间段内的活跃度,该多个样本时间段中顺序在后的样本时间段包含顺序在前的样本时间段,该多个样本时间段的结束日期晚于该第一样本时间段的结束日期;[0174]第二融合单元506,被配置为基于该第i轮迭代的账号活跃模型,对该多个第二活跃信息进行融合,得到该样本账号在该多个样本时间段中的多个第三活跃信息,该第三活跃信息基于相邻的两个样本时间段的第二活跃信息融合得到;[0175]模型训练单元507,被配置为基于该多个第三活跃信息和多个第四活跃信息,对该第i轮迭代的账号活跃模型进行训练,该多个第四活跃信息用于表示该样本账号在该多个样本时间段内的实际活跃度。[0176]在一些实施例中,该第二提取单元504,被配置基于该第i轮迭代的账号活跃模型中的第一网络,对该样本账号在该第一样本时间段内的样本账号数据进行嵌入处理,得到样本嵌入特征,该第一网络用于特征嵌入;基于该第i轮迭代的账号活跃模型中的第二网络,对该样本嵌入特征进行特征交叉,得到该样本账号特征,该第二网络用于特征交叉。[0177]在一些实施例中,该第二映射单元505,被配置为对于任一样本时间段,基于该第i轮迭代的账号活跃模型中该样本时间段对应第三网络,对该账号特征进行映射,得到该样本时间段的第二活跃信息,该第三网络用于特征映射,包括多层感知机。[0178]在一些实施例中,该第二融合单元506,被配置为对第二样本时间段的第二活跃信息和第三样本时间段的第二活跃信息进行融合,得到该样本账号在该第三样本时间段中的第三活跃信息,该第二样本时间段与该第三样本时间段在该多个样本时间段中的顺序相邻,且该第三样本时间段包含该第二样本时间段。[0179]在一些实施例中,该第二融合单元506,被配置为基于该第i轮迭代的账号活跃模型中该第二样本时间段对应的第四网络,对该第二样本时间段的第二活跃信息进行映射,得到该第二样本时间段的单调增益信息,该单调增益信息用于指示该样本账号在该第二样本时间段的活跃行为对第三样本时间段的影响情况;基于该第i轮迭代的账号活跃模型中该第三样本时间段对应的第五网络,对该第三样本时间段的第二活跃信息和该第二时间段的单调增益信息进行融合,得到该样本账号在该第三样本时间段中的第三活跃信息。[0180]在一些实施例中,参见图6所示,该确定账号活跃信息的装置还包括:[0181]分桶单元508,被配置为基于该第i轮迭代的账号活跃模型中该样本时间段对应的第五网络,对多个样本账号在该样本时间段内的活跃值进行分桶,得到多个活跃桶,每个活跃桶中样本账号的数量在目标数量范围内,该第五网络用于对用户账号进行分桶;[0182]该分桶单元508,还被配置为获取每个活跃桶所对应的活跃值范围的均值;[0183]该分桶单元508,还被配置为基于该多个样本账号所属的活跃桶的均值,确定该多个样本账号在该样本时间段内的第四活跃信息。[0184]在一些实施例中,该模型训练单元507,被配置为基于该多个第三活跃信息和多个第四活跃信息,确定该多个样本时间段的多个第一损失,该第一损失用于表示预测的活跃度与实际活跃度之间的差异;基于该多个第三活跃信息,确定至少一个第二损失,该第二损失用于校准相邻两个样本时间段的两个第三活跃信息之间的顺序关系;基于该多个第一损失和该至少一个第二损失,调整该第i轮迭代的账号活跃模型的参数。[0185]需要说明的是,上述实施例提供的确定账号活跃信息的装置在确定账号活跃信息时,仅以上述各功能单元的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能单元完成,即将电子设备的内部结构划分成不同的功能单元,以完成以上描述的全部或者部分功能。另外,上述实施例提供的确定账号活跃信息的装置与确定账号活跃信息的方法实施例属于同一构思,其具体实现过程详见方法实施例,这里不再赘述。[0186]关于上述实施例中的装置,其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述,此处将不做详细阐述说明。[0187]电子设备被提供为终端时,图7是根据一示例性实施例示出的一种终端700的框图。该终端700可以是:智能手机、平板电脑、mp3播放器(movingpictureexpertsgroupaudiolayeriii,动态影像专家压缩标准音频层面3)、mp4(movingpictureexpertsgroupaudiolayeriv,动态影像专家压缩标准音频层面4)播放器、笔记本电脑或台式电脑。终端700还可能被称为用户设备、便携式终端、膝上型终端、台式终端等其他名称。[0188]通常,终端700包括有:处理器701和存储器702。[0189]处理器701可以包括一个或多个处理核心,比如4核心处理器、8核心处理器等。处理器701可以采用dsp(digitalsignalprocessing,数字信号处理)、fpga(field-programmablegatearray,现场可编程门阵列)、pla(programmablelogicarray,可编程逻辑阵列)中的至少一种硬件形式来实现。处理器701也可以包括主处理器和协处理器,主处理器是用于对在唤醒状态下的数据进行处理的处理器,也称cpu(centralprocessingunit,中央处理器);协处理器是用于对在待机状态下的数据进行处理的低功耗处理器。在一些实施例中,处理器701可以在集成有gpu(graphicsprocessingunit,图像处理器),gpu用于负责显示屏所需要显示的内容的渲染和绘制。一些实施例中,处理器701还可以包括ai(artificialintelligence,人工智能)处理器,该ai处理器用于处理有关机器学习的计算操作。[0190]存储器702可以包括一个或多个计算机可读存储介质,该计算机可读存储介质可以是非暂态的。存储器702还可包括高速随机存取存储器,以及非易失性存储器,比如一个或多个磁盘存储设备、闪存存储设备。在一些实施例中,存储器702中的非暂态的计算机可读存储介质用于存储至少一个程序代码,该至少一个程序代码用于被处理器701所执行以实现本公开中方法实施例提供的确定账号活跃信息的方法。[0191]在一些实施例中,终端700还可选包括有:外围设备接口703和至少一个外围设备。处理器701、存储器702和外围设备接口703之间可以通过总线或信号线相连。各个外围设备可以通过总线、信号线或电路板与外围设备接口703相连。具体地,外围设备包括:显示屏704、音频电路705和电源706中的至少一种。[0192]外围设备接口703可被用于将i/o(input/output,输入/输出)相关的至少一个外围设备连接到处理器701和存储器702。在一些实施例中,处理器701、存储器702和外围设备接口703被集成在同一芯片或电路板上;在一些其他实施例中,处理器701、存储器702和外围设备接口703中的任意一个或两个可以在单独的芯片或电路板上实现,本实施例对此不加以限定。[0193]显示屏704用于显示ui(userinterface,用户界面)。该ui可以包括图形、文本、图标、视频及其它们的任意组合。当显示屏704是触摸显示屏时,显示屏704还具有采集在显示屏704的表面或表面上方的触摸信号的能力。该触摸信号可以作为控制信号输入至处理器701进行处理。此时,显示屏704还可以用于提供虚拟按钮和/或虚拟键盘,也称软按钮和/或软键盘。在一些实施例中,显示屏704可以为一个,设置终端700的前面板;在另一些实施例中,显示屏704可以为至少两个,分别设置在终端700的不同表面或呈折叠设计;在再一些实施例中,显示屏704可以是柔性显示屏,设置在终端700的弯曲表面上或折叠面上。甚至,显示屏704还可以设置成非矩形的不规则图形,也即异形屏。显示屏704可以采用lcd(liquidcrystaldisplay,液晶显示屏)、oled(organiclight-emittingdiode,有机发光二极管)等材质制备。[0194]音频电路705可以包括麦克风和扬声器。麦克风用于采集用户及环境的声波,并将声波转换为电信号输入至处理器701进行处理,或者输入至射频电路704以实现语音通信。出于立体声采集或降噪的目的,麦克风可以为多个,分别设置在终端700的不同部位。麦克风还可以是阵列麦克风或全向采集型麦克风。扬声器则用于将来自处理器701或射频电路704的电信号转换为声波。扬声器可以是传统的薄膜扬声器,也可以是压电陶瓷扬声器。当扬声器是压电陶瓷扬声器时,不仅可以将电信号转换为人类可听见的声波,也可以将电信号转换为人类听不见的声波以进行测距等用途。在一些实施例中,音频电路705还可以包括耳机插孔。[0195]电源706用于为终端700中的各个组件进行供电。电源706可以是交流电、直流电、一次性电池或可充电电池。当电源706包括可充电电池时,该可充电电池可以支持有线充电或无线充电。该可充电电池还可以用于支持快充技术。[0196]本领域技术人员可以理解,图7中示出的结构并不构成对终端700的限定,可以包括比图示更多或更少的组件,或者组合某些组件,或者采用不同的组件布置。[0197]电子设备被提供为服务器时,图8是根据一示例性实施例示出的一种服务器800的框图,该服务器800可因配置或性能不同而产生比较大的差异,可以包括一个或一个以上处理器(centralprocessingunits,cpu)801和一个或一个以上的存储器802,其中,该存储器802中存储有至少一条程序代码,该至少一条程序代码由该处理器801加载并执行以实现上述各个方法实施例提供的确定账号活跃信息的方法。当然,该服务器还可以具有有线或无线网络接口、键盘以及输入输出接口等部件,以便进行输入输出,该服务器800还可以包括其他用于实现设备功能的部件,在此不做赘述。[0198]在示例性实施例中,还提供了一种包括指令的计算机可读存储介质,例如包括指令的存储器702或者存储器802,上述指令可由终端700的处理器701或者服务器800的处理器801执行以完成上述方法。可选地,计算机可读存储介质可以是rom、随机存取存储器(ram)、cd-rom、磁带、软盘和光数据存储设备等。[0199]在示例性实施例中,还提供了一种计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现上述确定账号活跃信息的方法。[0200]本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本公开的其它实施方案。本公开旨在涵盖本公开的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本
技术领域
:中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本公开的真正范围和精神由下面的权利要求指出。[0201]应当理解的是,本公开并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本公开的范围仅由所附的权利要求来限制。当前第1页12当前第1页12
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献