一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

信息召回方法、装置及存储介质与流程

2022-06-22 17:29:18 来源:中国专利 TAG:


1.本公开涉及计算机技术领域,尤其涉及一种信息召回方法、装置及存储介质。


背景技术:

2.在信息推荐或信息投放领域中,往往需要经历信息召回和信息排序等阶段。其中,信息召回阶段的目的是从海量信息中筛选出一定数量的资源。信息排序阶段的目的是对信息召回阶段所筛选出的资源进行排序,以根据排序结果进行资源展示。
3.相关技术中,信息召回阶段通常是根据信息特征和用户特征直接从海量信息进行信息召回的,难免会召回一些低质量的信息,甚至会遗漏一些高质量的信息,从而降低了信息召回效果。此外,由于信息排序阶段非常依赖于信息召回阶段的召回结果,若信息召回阶段的召回效果不佳,将直接影响后续展示资源的推荐或投放准确率,从而降低了用户体验。


技术实现要素:

4.本公开提供一种信息召回方法、装置及存储介质,以至少解决相关技术中在召回阶段难免会召回一些低质量的信息,甚至会遗漏一些高质量的信息,从而降低了信息召回效果,以及降低了用户体验中至少一种问题。本公开的技术方案如下:
5.根据本公开实施例的第一方面,提供一种信息召回方法,包括:
6.获取用户特征数据以及信息池中每个待召回信息的信息特征数据;
7.确定所述用户特征数据和信息特征数据中各特征数据的特征重要度序列;所述特征重要度序列至少表征每个特征对提升信息点击率的准确程度的贡献大小;
8.基于所述特征重要度序列分别对所述用户特征数据和信息特征数据进行数据更新,对应获得用户目标特征数据和信息目标特征数据;
9.根据每个待召回信息的信息目标特征数据与所述用户目标特征数据,对每个待召回信息进行预测,得到每个待召回信息的召回评估结果;所述召回评估结果至少表征每个待召回信息被召回的概率;
10.基于所述召回评估结果,从所述信息池中召回信息。
11.作为一种可选的实施方式,所述确定所述用户特征数据和信息特征数据中各特征数据的特征重要度序列步骤包括:
12.对所述用户特征数据和信息特征数据中各特征数据进行压缩处理,获得所有特征数据对应的全量特征向量;
13.对所述全量特征向量进行非线性变换处理,获得各特征数据的特征重要度序列。
14.作为一种可选的实施方式,所述对所述用户特征数据和信息特征数据中各种特征数据进行压缩处理,获得所有特征数据对应的特征向量包括:
15.分别对用户特征数据和信息特征数据分别进行编码,得到用户特征向量和信息特征向量;
16.分别对所述用户特征向量和信息特征向量进行全局池化处理,获得第一特征向量
分量;
17.分别对所述用户特征向量和信息特征向量进行一维卷积处理,获得第二特征向量分量;
18.基于所述第一特征向量分量和所述第二特征向量分量,获得所有特征数据对应的全量特征向量。
19.作为一种可选的实施方式,所述对所述全量特征向量进行非线性变换处理,获得各种特征数据的特征重要度序列包括:
20.对所述全量特征向量进行降维处理,获得第一描述特征;
21.将所述第一描述特征进行升维处理,获得第二描述特征;所述第二描述特征的特征维度与所述全量特征向量的特征维度相同;
22.将所述第二描述特征映射至概率空间,获得各种特征数据的特征重要度序列。
23.作为一种可选的实施方式,所述将所述第一描述特征进行升维处理,获得第二描述特征步骤包括:
24.将所述第一描述特征进行全连接处理,得到全连接描述特征;
25.将所述第一描述特征和所述全连接描述特征进行残差处理,得到残差描述特征;
26.根据所述全连接描述特征和所述残差描述特征,获得所述第二描述特征。
27.作为一种可选的实施方式,所述基于所述特征重要度序列分别对所述用户特征数据和信息特征数据进行数据更新,对应获得用户目标特征数据和信息目标特征数据步骤包括:
28.获取当前召回场景对应的特征重要阈值;
29.确定所述特征重要度的数值小于等于所述特征重要阈值的所有特征重要度,作为目标特征重要度;
30.将所述特征重要度序列中,所确定的目标特征重要度均调整为预设特征重要度,得到更新的特征重要度序列;所述预设特征重要度小于所述特征重要阈值;
31.基于更新的特征重要度序列,分别对所述用户特征数据和信息特征数据进行逐特征相乘,对应获得用户目标特征数据和信息目标特征数据。
32.作为一种可选的实施方式,所述根据每个待召回信息的信息目标特征数据与所述用户目标特征数据,对每个待召回信息进行预测,得到每个待召回信息的召回评估结果步骤包括:
33.将每个待召回信息的信息目标特征数据分别与所述用户目标特征数据进行至少一次全连接操作,预测得到每个待召回信息的召回分值;所述召回分值与信息点击率呈正相关;
34.将每个待召回信息的召回分值作为所述每个待召回信息的召回评估结果。
35.作为一种可选的实施方式,所述基于所述召回评估结果,从所述信息池中召回信息步骤包括:
36.基于所述召回分值的高低顺序,从所述信息池中确定预设数量的目标召回信息;
37.召回所述目标召回信息;或
38.确定召回分值大于等于预设召回分值的待召回信息,作为目标召回信息;
39.召回所述目标召回信息。
40.根据本公开实施例的第二方面,提供一种信息召回装置,包括:
41.获取模块,被配置为执行获取用户特征数据以及信息池中每个待召回信息的信息特征数据;
42.序列确定模块,被配置为执行确定所述用户特征数据和信息特征数据中各特征数据的特征重要度序列;所述特征重要度序列至少表征每个特征对提升信息点击率的准确程度的贡献大小;
43.更新模块,被配置为执行基于所述特征重要度序列对所述用户特征数据和信息特征数据进行数据更新,对应获得用户目标特征数据和信息目标特征数据;
44.处理模块,被配置为执行根据每个待召回信息的信息目标特征数据分别与所述用户目标特征数据,对每个待召回信息进行预测,得到每个待召回信息的召回评估结果;所述召回评估结果至少表征每个待召回信息被召回的概率;
45.召回模块,被配置为执行基于所述召回评估结果,从所述信息池中召回信息。
46.作为一种可选的实施方式,所述确序列确定模块包括:
47.向量获取子模块,被配置为执行对所述用户特征数据和信息特征数据中各特征数据进行压缩处理,获得所有特征数据对应的全量特征向量;
48.序列获取子模块,被配置为执行对所述全量特征向量进行非线性变换处理,获得各特征数据的特征重要度序列。
49.作为一种可选的实施方式,所述向量获取子模块包括:
50.编码单元,被配置为执行分别对用户特征数据和信息特征数据分别进行编码,得到用户特征向量和信息特征向量;
51.第一分量单元,被配置为执行分别对所述用户特征向量和信息特征向量进行全局池化处理,获得第一特征向量分量;
52.第二分量单元,被配置为执行分别对所述用户特征向量和信息特征向量进行一维卷积处理,获得第二特征向量分量;
53.向量获取单元,被配置为执行基于所述第一特征向量分量和所述第二特征向量分量,获得所有特征数据对应的全量特征向量。
54.作为一种可选的实施方式,所述序列获取子模块包括:
55.第一处理单元,被配置为执行对所述全量特征向量进行降维处理,获得第一描述特征;
56.第二处理单元,被配置为执行将所述第一描述特征进行升维处理,获得第二描述特征;所述第二描述特征的特征维度与所述全量特征向量的特征维度相同;
57.序列获取单元,被配置为执行将所述第二描述特征映射至概率空间,获得各种特征数据的特征重要度序列。
58.作为一种可选的实施方式,所述第二处理单元包括:
59.第一处理子单元,被配置为执行将所述第一描述特征进行全连接处理,得到全连接描述特征;
60.第二处理子单元,被配置为执行将所述第一描述特征和所述全连接描述特征进行残差处理,得到残差描述特征;
61.第三处理子单元,被配置为执行根据所述全连接描述特征和所述残差描述特征,
获得所述第二描述特征。
62.作为一种可选的实施方式,所述更新模块包括:
63.阈值获取子模块,被配置为执行获取当前召回场景对应的特征重要阈值;
64.目标确定子模块,被配置为执行确定所述特征重要度的数值小于等于所述特征重要阈值的所有特征重要度,作为目标特征重要度;
65.序列确定子模块,被配置为执行将所述特征重要度序列中,所确定的目标特征重要度均调整为预设特征重要度,得到更新的特征重要度序列;所述预设特征重要度小于所述特征重要阈值;
66.更新子模块,被配置为执行基于更新的特征重要度序列,分别对所述用户特征数据和信息特征数据进行逐特征相乘,对应获得用户目标特征数据和信息目标特征数据。
67.作为一种可选的实施方式,所述处理模块包括:
68.第一处理子模块,被配置为执行将每个待召回信息的信息目标特征数据分别与所述用户目标特征数据进行至少一次全连接操作,预测得到每个待召回信息的召回分值;所述召回分值与信息点击率呈正相关;
69.第二处理子模块,被配置为执行将每个待召回信息的召回分值作为所述每个待召回信息的召回评估结果。
70.作为一种可选的实施方式,所述召回模块包括:
71.第一确定子模块,被配置为执行基于所述召回分值的高低顺序,从所述信息池中确定预设数量的目标召回信息;
72.第一召回子模块,被配置为执行召回所述目标召回信息;或
73.第二确定子模块,被配置为执行确定召回分值大于等于预设召回分值的待召回信息,作为目标召回信息;
74.第二召回子模块,被配置为执行召回所述目标召回信息
75.根据本公开实施例的第三方面,提供一种存储介质,当所述存储介质中的指令由所述电子设备的处理器执行时,使得电子设备能够执行如上述中任一实施方式所述的信息召回方法。
76.根据本公开实施例的第四方面,提供一种电子设备,包括:
77.处理器;
78.用于存储所述处理器可执行指令的存储器;
79.其中,所述处理器被配置为执行所述指令,以实现如上述任一实施方式所述的信息召回方法。
80.根据本公开实施例的第五方面,提供一种计算机程序产品,该计算机程序产品包括计算机指令,该计算机指令存储在计算机可读存储介质中。电子设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该电子设备执行上述任一种实施方式中提供的信息召回方法。
81.本公开的实施例提供的技术方案至少带来以下有益效果:
82.本公开实施例通过确定获取的用户特征数据和信息特征数据中各特征数据的特征重要度序列;基于该特征重要度序列分别对用户特征数据和信息特征数据进行数据更新,之后基于更新的目标特征数据,预测得到表征每个待召回信息被召回的概率的召回评
估结果,以根据该召回评估结果进行信息召回。由于特征重要度序列是至少表征每个特征对提升信息点击率的准确程度的贡献大小,通过该特征重要序列对获取的各特征数据进行更新,可以对利于提升信息点击率的准确程度的特征进行加权,对不利于提升信息点击率的准确程度的特征进行减权,如此通过该信息召回方法所召回的信息为更符合用户需求的信息,从而提高了后续依赖该召回信息进行信息推荐或信息投放的准确率和效果,可以有效避免召回一些低质量的信息以及避免遗漏一些高质量的信息,且提升了用户体验。
83.应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。
附图说明
84.此处的附图被并入说明书中并构成本公开的一部分,示出了符合本公开的实施例,并与说明书一起用于解释本公开的原理,并不构成对本公开的不当限定。
85.图1是根据一示例性实施例示出的一种应用信息召回方法的系统的架构图。
86.图2是根据一示例性实施例示出的一种信息召回方法的流程图。
87.图3是根据一示例性实施例示出的一种信息召回方法中特征重要度序列确定步骤的流程图。
88.图4是根据一示例性实施例示出的一种信息召回方法中全量特征向量获取步骤的流程图。
89.图5是根据一示例性实施例示出的一种信息召回方法中获得各种特征数据的特征重要度序列步骤的流程图。
90.图6是根据一示例性实施例示出的一种信息召回方法中数据更新步骤的流程图。
91.图7是根据一示例性实施例示出的一种信息召回模型的网络结构图。
92.图8是根据一示例性实施例示出的一种信息召回装置框图。
93.图9是根据一示例性实施例示出的另一种信息召回装置框图。
94.图10是根据一示例性实施例示出的一种电子设备的框图。
具体实施方式
95.为了使本领域普通人员更好地理解本公开的技术方案,下面将结合附图,对本公开实施例中的技术方案进行清楚、完整地描述。
96.需要说明的是,本公开的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本公开的实施例能够以除了在这里图示或描述的那些以外的顺序实施。以下示例性实施例中所描述的实施方式并不代表与本公开相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本公开的一些方面相一致的装置和方法的例子。
97.图1是根据一示例性实施例示出的一种应用信息召回方法的系统的架构图,参见图1,该架构图可以包括终端101和服务器102。
98.其中,终端101可以是但不限于为智能移动终端、便携式计算机、台式计算机、智能穿戴设备、智能家居等一种或多种。终端101上可以搭载有支持信息处理方法的应用程序,
如社交应用、新闻应用、搜索应用、购物应用、游戏应用等,本公开实施例对此不进行具体限定。终端101的数量可以为至少一个,例如数个,或者更多数量。
99.服务器102可以是但不限于为独立的服务器、服务器集群、分布式系统、云服务器和虚拟化中心等一种或多种。目标用户可以通过终端101中安装的应用程序来浏览信息页面,服务器可以根据目标用户的用户特征数据以及每个待召回信息的信息特征数据,来从信息池中确定召回信息,之后可以基于该召回信息向该目标用户展示推荐信息或投放信息。该终端101以及服务器102之间可以通过有线或无线通信方式进行直接或间接地连接,从而实现信息处理流程,本公开实施例在此不作限制。
100.本公开实施例提供的信息召回方法,可以由信息召回装置来执行,该信息召回装置可以是硬件形式或软件形式集成在终端或服务器等电子设备中,也可以由服务器或终端单独执行实现,或者可以由终端和服务器协同执行实现。
101.图2是根据一示例性实施例示出的一种信息召回方法的流程图,如图2所示,信息召回方法应用于电子设备,以该电子设备为上述实施环境示意图中服务器为例进行说明,包括以下步骤。
102.在步骤s201中,获取用户特征数据以及信息池中每个待召回信息的信息特征数据。
103.用户特征数据可以是反映目标用户的特征或属性的数据,例如用户的基本属性(比如性别、年龄、职业、地域等)、用户的画像特征(比如用户标签等)、用户的行为特征(比如历史浏览信息的类别、历史互动行为、历史购买行为等)。
104.信息特征数据可以是反映信息池中待召回信息的特征或属性的数据,例如信息类别、信息标签、信息创建时间、信息发布主的特征、信息投放主的特征等中至少一种。该信息池中可以存储海量待召回信息,待召回信息可以为多媒体资源,比如广告、视频、新闻、文章、服务等,本公开实施例对此不作具体限定。
105.在一些可选实施方式中,所述获取用户特征数据可以包括:服务器监听到目标用户访问终端上安装的目标应用程序时,触发服务器从终端获取目标用户的用户标识信息,之后根据该用户标识信息从用户对应的日志记录中获取目标用户的用户特征数据。该访问终端上安装的目标应用程序可以为以下至少一种操作:打开目标应用程序准备进入信息页面、成功登录后进入信息页面、在目标应用程序中信息页面的指定位置进行输入操作、在信息界面的刷新操作或浏览操作等。该目标应用程序可以为实现本公开实施例的信息召回方法的应用,例如包括社交应用、新闻应用、搜索应用、购物应用、游戏应用等。该用户标识信息可以为反映目标用户的身份信息的唯一标识,比如可以为用户名、登陆账号、社交账号、登陆时间、终端标识等中一种或至少两种的组合。
106.在一些可选实施方式中,所述获取信息池中每个待召回信息的信息特征数据可以包括:服务器监听到目标用户访问终端上安装的目标应用程序时,从信息池中获取每个待召回信息的信息特征数据。当然,为了减少召回阶段的计算量,可以先根据用户基本属性(比如性别、地域等)对信息池中所有待召回信息进行粗筛,之后获取经粗筛的符合条件的每个待召回信息的信息特征数据。该信息池可以为信息发布主上传的信息(比如视频、新闻等)所构成的,也可为信息投放主投放的信息(比如广告、文章等)所构成的;或者,该信息池也可为根据用户基本属性(比如性别、地域等)对原始信息池中所有待召回信息进行粗筛,
之后基于获取经粗筛的符合条件的每个待召回信息的信息特征数据所构成的;或者,该信息池也可为基于目标用户的历史召回信息确定的个性化信息所构成的。
107.在步骤s202中,确定所述用户特征数据和信息特征数据中各特征数据的特征重要度序列。
108.在一些可选实施方式中,可以将用户特征数据和信息特征数据中各特征数据输入至信息召回模型中特征重要度确定网络,利用该特征重要度确定网络确定各特征数据的特征重要度序列。
109.其中,所述特征重要度序列至少表征每个特征对提升信息点击率的准确程度的贡献大小。信息点击率(click through rate,ctr)是描述信息展示后被用户点击的概率。该特征重要度序列可以包括多个特征重要度,每个特征重要度与一种特征数据一一对应,特征重要度越大反映该特征对提升信息点击率的准确程度的奉献越大,反之越小。示例性的,该特征重要度序列w可以表示为[w1,w2,...,wn],其中wi表示第i个特征数据的特征数据,n表示用户特征数据和信息特征数据中所有特征数据的总数。示例性的,特征重要度序列w中所有特征重要度wi之和可以为1。
[0110]
在一些可选实施方式中,特征重要度确定网络可以包括第一处理模块和第二处理模块,如图3所示,所述确定所述用户特征数据和信息特征数据中各特征数据的特征重要度序列可以包括:
[0111]
在步骤s301中,对所述用户特征数据和信息特征数据中各特征数据进行压缩处理,获得所有特征数据对应的全量特征向量。
[0112]
在获取到用户特征数据和信息池中每个待召回信息的信息特征数据之后,可以特征重要度确定网络中的第一处理模块对各特征数据进行编码,之后对经编码后的特征数据进行压缩处理,输出所有特征数据对应的全量特征向量zc=[z1,z2…
,zc],其中,zi为第i个特征向量经过全局池化后的值。该数据压缩处理可以为池化处理、嵌入处理、低维编码空间映射等至少一种处理方式。通过将用户特征数据和信息特征数据中各特征数据进行数据压缩处理,得到所有特征数据对应的全量特征向量,可以避免不同类型特征存在特征稀疏的问题,提高召回特征的表达能力,更好且全面的体现用户特征和信息特征,有利于提高信息召回效果。
[0113]
在一些可选实施方式中,如图4所示,上述步骤s301,对所述用户特征数据和信息特征数据中各特征数据进行压缩处理,获得所有特征数据对应的全量特征向量可以包括:
[0114]
在步骤s3011中,分别对用户特征数据和信息特征数据分别进行编码,得到用户特征向量和信息特征向量。
[0115]
可选地,对用户特征数据和信息特征数据分别进行编码,得到每个特征数据对应的向量形式,进而得到对应的用户特征向量和信息特征向量。例如,对于任一用户特征向量yn=[y1,y2,...y
h1
],其中yn表示第n个用户特征向量,yi表示用户特征向量yn中的第i个向量值,h1表示用户特征向量的向量维度。又例如,对于任一信息特征向量xm=[v1,v2,...v
h2
],其中xm表示第m个用户特征向量,vi表示信息特征向量xm中的第i个向量值,h2表示信息特征向量的向量维度。
[0116]
在步骤s3012中,分别对所述用户特征向量和信息特征向量进行全局池化处理,获得第一特征向量分量。
[0117]
可选地,在得到每个特征数据对应的向量形式之后,分别对每个用户特征向量和信息特征向量进行全局池化处理,这里的全局池化处理包括但不限于为全局最大池化处理、全局平均池化处理等。通过全局池化处理,每个用户特征向量和信息特征向量分别对应统一为一个第一特征值,之后合并各第一特征值得到一个一维向量,也即该第一特征向量分量。
[0118]
在步骤s3013中,分别对所述用户特征向量和信息特征向量进行一维卷积处理,获得第二特征向量分量。
[0119]
可选地,在得到每个特征数据对应的向量形式之后,还可分别对每个用户特征向量和信息特征向量进行一维卷积处理,得到每个特征向量对应的一个第二特征值,之后合并各第二特征值得到一个一维向量,也即该第二特征向量分量。该第二特征向量分量中每个第二特征值对应的特征向量与第一特征向量分量中每个第一特征值对应的特征向量相对应。
[0120]
在步骤s3014中,基于所述第一特征向量分量和所述第二特征向量分量,获得所有特征数据对应的全量特征向量。
[0121]
可选地,在获取第一特征向量分量和第二特征向量分量之后,可以对两个特征向量分量进行数学运算,得到所有特征数据对应的全量特征向量zc。这里的数学运算包括但不限于加法运算、减法运算、乘法运算、均值运算等。
[0122]
下面以全局最大池化处理为例,给出该全量特征向量zc的一种示例性的表达式:
[0123][0124]
其中,u为所有用户特征和信息特征的向量表示,u=[y1,y2,...yn...x1,x2...xm];uc为第c个特征的向量表示,uc(i)为第c个特征向量的第i个向量值;h为第c个特征的向量维度;max(uc(i))为第c个特征向量的全局最大池化值,fwi为一维卷积。
[0125]
上述实施例,通过对分别对用户特征数据和信息特征数据分别进行编码,得到用户特征向量和信息特征向量,之后对编码后的各特征向量分别进行全局池化处理和一维卷积操作,能够感知各特征的最大全局信息,减少计算量,利于后续学习各特征之间的差异性和相关性。
[0126]
在步骤s302中,对所述全量特征向量进行非线性变换处理,获得各特征数据的特征重要度序列。
[0127]
在获得全量特征向量zc之后,可以利用信息召回模型中特征重要度确定网络的第二处理模块对全量特征向量进行激发处理,得到个特征数据对应的特征重要度序列。
[0128]
上述实施例,通过将用户特征数据和信息特征数据中各特征数据进行数据压缩处理,得到所有特征数据对应的全量特征向量,之后对将压缩处理得到的全量特征向量进行非线性变换处理,通过将全量特征向量变换为对应的特征重要度值的表达,进而生成各特征数据的特征重要度序列。可以避免不同类型特征存在特征稀疏的问题,提高召回特征的表达能力,更好且全面的体现用户特征和信息特征,也使得特征重要度序列能够更准确的反映每个特征对提升信息点击率的准确程度的贡献大小,有利于提高信息召回效果和效率。
[0129]
在一些可选实施方式中,如图5所示,上述步骤s302,对所述全量特征向量进行非
线性变换处理,获得各种特征数据的特征重要度序列可以包括:
[0130]
在步骤s3021中,对所述全量特征向量进行降维处理,获得第一描述特征。
[0131]
可选地,将全量特征向量输入至第二处理模块中的降维层中,通过该降维层对全量特征向量进行降维处理,得到第一描述特征。这里的降维层可以为至少一个全连接层,所得到的第一描述特征的特征维度小于全量特征向量的特征维度。通过对全量特征向量进行降维处理,可以减少计算量,提高信息召回效率。
[0132]
在步骤s3022中,将所述第一描述特征进行升维处理,获得第二描述特征;所述第二描述特征的特征维度与所述全量特征向量的特征维度相同。
[0133]
可选地,将第一描述特征输入至第二处理模块中的升维层中,通过该升维层对第一描述特征升维至与全量特征向量的特征维度相同,得到第二描述特征。该升维层可以包括至少一个全连接层。
[0134]
在另一可选的,在将第一描述特征输入至第二处理模块中的升维层之前,还可先将第一描述特征输入至第一激活函数(比如relu函数)中,之后将经该第一激活函数处理后的特征输入至第二处理模块中的升维层中,进而得到该第二描述特征。
[0135]
在步骤s3023中,将所述第二描述特征映射至概率空间,获得各种特征数据的特征重要度序列。
[0136]
可选地,将第二描述特征输入至第二处理模块中的激活层中,通过该激活层将第二描述特征映射至(0,1)的概率空间,输出各种特征数据对应的特征重要度序列wc=[w1,w2…
,wc]。该激活层包括第二激活函数,比如但不限于为sigmoid函数。
[0137]
上述实施例,通过对全量特征向量先进行降维处理以减少计算量,再对降维处理得到的第一描述特征进行升维处理,使得升维处理得到的第二描述特征的特征维度与全量特征向量的特征维度相同,接着将该第二描述特征映射至概率空间,可以获得每个特征数据的概率值,该概率值的大小可以反映每个特征数据对应的特征重要度值的大小,基于该概率值可以快速确定各种特征数据对应的特征重要度序列,从而能够有效地提高特征重要度序列获取效率,有利于进一步提高信息召回效率。
[0138]
在另一可选实施方式中,该第二处理模块中的升维层还可以包括至少一个全连接层和至少一个残差层。此时,继续参见图5,上述步骤s3022,将所述第一描述特征进行升维处理,获得第二描述特征可以包括:
[0139]
在步骤s501中,将所述第一描述特征进行全连接处理,得到全连接描述特征;
[0140]
在步骤s502中,将所述第一描述特征和所述全连接描述特征进行残差处理,得到残差描述特征;
[0141]
在步骤s503中,根据所述全连接描述特征和所述残差描述特征,获得所述第二描述特征。
[0142]
仅作为示例,该信息召回模型中的第二处理模块s的计算表达式可为:
[0143]
s=σ(w2(m) m)
[0144]
m=δ(w1z)
[0145]
其中,w1为第一激活函数的权重矩阵,其维度为[c,c,r],r为经验值。δ为relu函数,计算方法为y=relu(x)=max(0,x)。w2为第二激活函数的权重矩阵,其维度为[c,c]。σ为sigmoid函数。
[0146]
上述实施例,通过将第一描述特征进行全连接处理所得的全连接描述特征做进一步残差处理,得到残差描述特征,接着再根据全连接描述特征和残差描述特征得到该第二描述特征,如此在原来第二处理模块的基础上,通过增加了一层残差,即w2(m) m,从而通过增加该残差处理可以使得网络的效果更加敏感,进而利于提高信息召回效果和效率。
[0147]
在步骤s203中,基于所述特征重要度序列分别对所述用户特征数据和信息特征数据进行数据更新,对应获得用户目标特征数据和信息目标特征数据。
[0148]
可以通过信息召回模型中的特征重确定模块,利用特征重要度序列分别对用户特征数据和信息特征数据进行数据更新,对应获得用户目标特征数据和信息目标特征数据。
[0149]
在一些可选实施方式中,如图6所示,上述步骤s203,基于所述特征重要度序列分别对所述用户特征数据和信息特征数据进行数据更新,对应获得用户目标特征数据和信息目标特征数据可以包括:
[0150]
在步骤s601中,获取当前召回场景对应的特征重要阈值;
[0151]
在步骤s602中,确定所述特征重要度的数值小于等于所述特征重要阈值的所有特征重要度,作为目标特征重要度;
[0152]
在步骤s603中,将所述特征重要度序列中,所确定的目标特征重要度均调整为预设特征重要度,得到更新的特征重要度序列;所述预设特征重要度小于所述特征重要阈值;
[0153]
在步骤s604中,基于更新的特征重要度序列,分别对所述用户特征数据和信息特征数据进行逐特征相乘,对应获得用户目标特征数据和信息目标特征数据。
[0154]
可选地,特征重要阈值thre的取值范围可以为[0.2,0.8]中任意值,其可以根据当前环境而定,该特征重要阈值thre可以为经联合训练学习得到的阈值,也可为预设固定阈值。通过不同的召回场景确定不同的特征重要阈值,可以使得召回结果呈现多样性,召回效果更灵活。在确定当前召回场景对应的特征重要阈值之后,可以将特征重要度序列中小于等于该特征重要阈值的目标特征重要度调整为预设特征重要度,该预设特征重要度小于特征重要阈值,例如该预设特征重要度wg的取值范围可为[0,0.1]中任意值。之后,根据该预设特征重要度来更新特征重要度序列,进而得到更新的特征重要度序列。接着,基于更新的特征重要度序列,分别对所述用户特征数据和信息特征数据进行逐特征相乘,对应获得用户目标特征数据和信息目标特征数据。
[0155]
在实际应用中,预设特征重要度wg可以取零。此时,第c个目标特征数据nc可以表示为:
[0156]
nc=[v1*w'
c1
,v2*w'
c2
,...vh*w'
ch
]
[0157]
其中,
[0158][0159]
通过将预设特征重要度wg设置为零,这样相当于对特征重要度的数值小于特征重要阈值thre的特征重要度进行舍弃,也即在信息召回阶段舍弃较低特征重要度对应的特征数据,仅考虑特征重要度较高的特征数据。
[0160]
上述实施例,通过确定小于等于特征重要阈值的特征重要度为目标特征重要度,并通过预设特征重要度来替代目标特征重要度的实际特征重要度,从而可以在信息召回阶段降低较低特征重要度对应的特征数据的比重,如此,不仅可以降低计算量,而且可以避免
特征重要度较低的特征数据对高质量的信息召回的不利影响,有利于信息召回模型学习到更有利于对提升信息点击率的准确程度更有奉献的特征,从而进一步提高召回的信息质量和信息召回效果,进而后续展示资源的推荐或投放准确率,从而提升了用户体验和满意度。
[0161]
在步骤s204中,根据每个待召回信息的信息目标特征数据与所述用户目标特征数据,对每个待召回信息进行预测,得到每个待召回信息的召回评估结果;所述召回评估结果至少表征每个待召回信息被召回的概率。
[0162]
在对每个待召回信息的信息特征数据和用户特征数据进行权重更新之后,得到对应的信息目标特征数据和用户目标特征数据,接着,可以将每个待召回信息的信息目标特征数据分别与所述用户目标特征数据输入至信息召回模型中的至少一个隐含层中,输出得到每个待召回信息的召回评估结果。召回评估结果至少表征每个待召回信息被召回的概率。该召回评估结果可以包括召回分值、召回概率。
[0163]
仅作为示例,该隐含层可以包括至少一个全连接层。在一些可选实施方式中,上述步骤s204,根据每个待召回信息的信息目标特征数据分别与所述用户目标特征数据,得到每个待召回信息的召回评估结果步骤可以包括:将每个待召回信息的信息目标特征数据分别与所述用户目标特征数据进行至少一次全连接操作,预测得到每个待召回信息的召回分值;所述召回分值与信息点击率呈正相关;将每个待召回信息的召回分值作为所述每个待召回信息的召回评估结果。当然,在其他示例,该隐含层还可包括至少一个激活层。
[0164]
上述实施例,通过将每个待召回信息的信息目标特征数据分别与用户目标特征数据进行至少一次全连接操作,预测得到每个待召回信息的召回分值。由于综合了用户特征和信息特征,且利用特征重要度序列对户特征和信息特征进行了优化调整,在信息召回阶段,充分考虑了用户特征、信息特征以及每个特征对提升信息点击率的准确程度的贡献大小,因此基于目标特征数据所预测得到的每个待召回信息的召回分值,能够准确且全面的体现召回分值与信息点击率的关系,进而能够进一步提高信息召回效果。
[0165]
在步骤s205中,基于所述召回评估结果,从所述信息池中召回信息。
[0166]
可选地,所述基于所述召回评估结果,从所述信息池中召回信息可以包括以下至少一种实现方式:
[0167]
(a)基于所述召回分值的高低顺序,从所述信息池中确定预设数量的目标召回信息;召回所述目标召回信息。
[0168]
(b)确定召回分值大于等于预设召回分值的待召回信息,作为目标召回信息;召回所述目标召回信息。该预设召回分值可根据实际情况进行设置,本公开实施例对此不作具体限定。
[0169]
上述实施例,通过召回分值的高低确定预设数量的目标召回信息进行召回,或者通过满足预设召回分值条件的待召回信息作为目标召回信息进行召回,能够灵活的调控召回信息的数量,也有利于降低后续信息排序阶段的计算量。此外,还可提高召回信息的召回质量,避免召回一些质量较低的信息,也有利于提高整个信息推荐系统或信息投放系统的精准性、可靠性和效率。
[0170]
上述实施例通过确定获取的用户特征数据和信息特征数据中各特征数据的特征重要度序列;基于该特征重要度序列分别对用户特征数据和信息特征数据进行数据更新,之后基于更新的目标特征数据,得到表征每个待召回信息被召回的概率的召回评估结果,
以根据该召回评估结果进行信息召回。由于特征重要度序列是至少表征每个特征对提升信息点击率的准确程度的奉献大小,通过该特征重要序列对获取的各特征数据进行更新,可以对利于提升信息点击率的准确程度的特征进行加权,对不利于提升信息点击率的准确程度的特征进行减权,如此通过该信息召回方法所召回的信息为更符合用户需求的信息,从而提高了后续依赖该召回信息进行信息推荐或信息投放的准确率和效果,可以有效避免召回一些低质量的信息以及避免遗漏一些高质量的信息,且提升了用户体验。
[0171]
在一示例性实施例,服务器在执行信息召回之前,可以构建信息召回模型。该信息召回模型至少包括特征重要度确定网络和全连接神经网络。该全连接神经网络可以为轻量级网络模型,例如多层感知机(mlp,multi-layer perceptron)。该信息召回模型的网络结构可以如图7所示。
[0172]
在训练过程中,可以使用样本曝光未被点击的信息作为负样本,使用样本曝光被点击的信息作为正样本,通过构建的正负样本联合训练特征重要度确定网络和全连接神经网络,直至达到训练结束条件,获得训练好的信息召回模型。信息召回模型的训练过程与上述方法实施例相似,仅训练过程中用到的是正、负样本对应的用户特征数据和信息特征数据,这里对具体网络训练过程不再赘述。
[0173]
图8是根据一示例性实施例示出的一种信息召回装置框图。参照图8,该装置包括:
[0174]
获取模块810,被配置为执行获取用户特征数据以及信息池中每个待召回信息的信息特征数据;
[0175]
序列确定模块820,被配置为执行确定所述用户特征数据和信息特征数据中各特征数据的特征重要度序列;所述特征重要度序列至少表征每个特征对提升信息点击率的准确程度的贡献大小;
[0176]
更新模块830,被配置为执行基于所述特征重要度序列分别对所述用户特征数据和信息特征数据进行数据更新,对应获得用户目标特征数据和信息目标特征数据;
[0177]
处理模块840,被配置为执行根据每个待召回信息的信息目标特征数据与所述用户目标特征数据,对每个待召回信息进行预测,得到每个待召回信息的召回评估结果;所述召回评估结果至少表征每个待召回信息被召回的概率;
[0178]
召回模块850,被配置为执行基于所述召回评估结果,从所述信息池中召回信息。
[0179]
在一示例性的实施例,如图9所示,所述序列确定模块820包括:
[0180]
向量获取子模块821,被配置为执行对所述用户特征数据和信息特征数据中各特征数据进行压缩处理,获得所有特征数据对应的全量特征向量;
[0181]
序列获取子模块822,被配置为执行对所述全量特征向量进行非线性变换处理,获得各特征数据的特征重要度序列。
[0182]
在一示例性的实施例,所述向量获取子模块821包括:
[0183]
编码单元,被配置为执行分别对用户特征数据和信息特征数据分别进行编码,得到用户特征向量和信息特征向量;
[0184]
第一分量单元,被配置为执行分别对所述用户特征向量和信息特征向量进行全局池化处理,获得第一特征向量分量;
[0185]
第二分量单元,被配置为执行分别对所述用户特征向量和信息特征向量进行一维卷积处理,获得第二特征向量分量;
[0186]
向量获取单元,被配置为执行基于所述第一特征向量分量和所述第二特征向量分量,获得所有特征数据对应的全量特征向量。
[0187]
在一示例性的实施例,所述序列获取子模块822包括:
[0188]
第一处理单元,被配置为执行对所述全量特征向量进行降维处理,获得第一描述特征;
[0189]
第二处理单元,被配置为执行将所述第一描述特征进行升维处理,获得第二描述特征;所述第二描述特征的特征维度与所述全量特征向量的特征维度相同;
[0190]
序列获取单元,被配置为执行将所述第二描述特征映射至概率空间,获得各种特征数据的特征重要度序列。
[0191]
在一示例性的实施例,所述第二处理单元包括:
[0192]
第一处理子单元,被配置为执行将所述第一描述特征进行全连接处理,得到全连接描述特征;
[0193]
第二处理子单元,被配置为执行将所述第一描述特征和所述全连接描述特征进行残差处理,得到残差描述特征;
[0194]
第三处理子单元,被配置为执行根据所述全连接描述特征和所述残差描述特征,获得所述第二描述特征。
[0195]
在一示例性的实施例,继续如图9所示,所述更新模块830包括:
[0196]
阈值获取子模块831,被配置为执行获取当前召回场景对应的特征重要阈值;
[0197]
目标确定子模块832,被配置为执行确定所述特征重要度的数值小于等于所述特征重要阈值的所有特征重要度,作为目标特征重要度;
[0198]
序列确定子模块833,被配置为执行将所述特征重要度序列中,所确定的目标特征重要度均调整为预设特征重要度,得到更新的特征重要度序列;所述预设特征重要度小于所述特征重要阈值;
[0199]
更新子模块834,被配置为执行基于更新的特征重要度序列,分别对所述用户特征数据和信息特征数据进行逐特征相乘,对应获得用户目标特征数据和信息目标特征数据。
[0200]
在一示例性的实施例,所述处理模块840包括:
[0201]
第一处理子模块,被配置为执行将每个待召回信息的信息目标特征数据分别与所述用户目标特征数据进行至少一次全连接操作,预测得到每个待召回信息的召回分值;所述召回分值与信息点击率呈正相关;
[0202]
第二处理子模块,被配置为执行将每个待召回信息的召回分值作为所述每个待召回信息的召回评估结果。
[0203]
在一示例性的实施例,所述召回模块850包括:
[0204]
第一确定子模块,被配置为执行基于所述召回分值的高低顺序,从所述信息池中确定预设数量的目标召回信息;
[0205]
第一召回子模块,被配置为执行召回所述目标召回信息;或
[0206]
第二确定子模块,被配置为执行确定召回分值大于等于预设召回分值的待召回信息,作为目标召回信息;
[0207]
第二召回子模块,被配置为执行召回所述目标召回信息。
[0208]
上述实施例通过确定获取的用户特征数据和信息特征数据中各特征数据的特征
重要度序列;基于该特征重要度序列分别对用户特征数据和信息特征数据进行数据更新,之后基于更新的目标特征数据,得到表征每个待召回信息被召回的概率的召回评估结果,以根据该召回评估结果进行信息召回。由于特征重要度序列是至少表征每个特征对提升信息点击率的准确程度的奉献大小,通过该特征重要序列对获取的各特征数据进行更新,可以对利于提升信息点击率的准确程度的特征进行加权,对不利于提升信息点击率的准确程度的特征进行减权,如此通过该信息召回方法所召回的信息为更符合用户需求的信息,从而提高了后续依赖该召回信息进行信息推荐或信息投放的准确率和效果,可以有效避免召回一些低质量的信息以及避免遗漏一些高质量的信息,且提升了用户体验。
[0209]
关于上述实施例中的装置,其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述,此处将不做详细阐述说明。
[0210]
图10是根据一示例性实施例示出的一种电子设备的框图。参照图10,电子设备包括处理器;用于存储处理器可执行指令的存储器;其中,处理器被配置为执行存储器上所存放的指令时,实现上述实施例中任一信息召回方法的步骤。
[0211]
该电子设备可以终端、服务器或者类似的运算装置,以该电子设备是服务器为例,图10是根据一示例性实施例示出的一种用于信息召回的电子设备的框图,该电子设备1000可因配置或性能不同而产生比较大的差异,可以包括一个或一个以上中央处理器(central processing units,cpu)1010(处理器1010可以包括但不限于微处理器mcu或可编程逻辑器件fpga等的处理装置)、用于存储数据的存储器1030,一个或一个以上存储应用程序1023或数据1022的存储介质1020(例如一个或一个以上海量存储设备)。其中,存储器1030和存储介质1020可以是短暂存储或持久存储。存储在存储介质1020的程序可以包括一个或一个以上模块,每个模块可以包括对电子设备中的一系列指令操作。更进一步地,中央处理器1010可以设置为与存储介质1020通信,在电子设备1000上执行存储介质1020中的一系列指令操作。
[0212]
电子设备1000还可以包括一个或一个以上电源1060,一个或一个以上有线或无线网络接口1050,一个或一个以上输入输出接口1040,和/或,一个或一个以上操作系统1021,例如windows server,mac os x,unix,linux,freebsd等等。
[0213]
输入输出接口1040可以用于经由一个网络接收或者发送数据。上述的网络具体实例可包括电子设备1000的通信供应商提供的无线网络。在一个实例中,输入输出接口1040包括一个网络适配器(network interface controller,nic),其可通过基站与其他网络设备相连从而可与互联网进行通讯。在一个示例性实施例中,输入输出接口1040可以为射频(radio frequency,rf)模块,其用于通过无线方式与互联网进行通讯。
[0214]
本领域普通技术人员可以理解,图10所示的结构仅为示意,其并不对上述电子设备的结构造成限定。例如,电子设备1000还可包括比图10中所示更多或者更少的组件,或者具有与图10所示不同的配置。
[0215]
在示例性实施例中,还提供了一种包括指令的存储介质,例如包括指令的存储器,上述指令可由电子设备1000的处理器执行以完成上述方法。可选地,存储介质可以是非临时性计算机可读存储介质,例如,所述非临时性计算机可读存储介质可以是rom、随机存取存储器(ram)、cd-rom、磁带、软盘和光数据存储设备等。
[0216]
在示例性实施例中,还提供了一种计算机程序产品,该计算机程序产品包括计算
机指令,该计算机指令存储在计算机可读存储介质中。电子设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该电子设备执行上述任一种实施方式中提供的信息召回方法。
[0217]
本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本公开的其它实施方案。本技术旨在涵盖本公开的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本公开的真正范围和精神由下面的权利要求指出。
[0218]
应当理解的是,本公开并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本公开的范围仅由所附的权利要求来限制。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献