一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

查询词处理方法、装置、电子设备及可读存储介质与流程

2022-11-12 01:04:53 来源:中国专利 TAG:


1.本发明属于网络技术领域,特别是涉及一种查询词处理方法、装置、电子设备及可读存储介质。


背景技术:

2.目前,为了方便用户在网络平台进行网络对象搜索,往往会为用户推荐查询词,用户可以将推荐的查询词作为搜索关键词,进行网络对象搜索。
3.现有方式中,往往是基于用户的历史数据,生成与用户适配的原始查询词,以直接向用户推荐原始查询词。这种方式中,查询词的推荐效果较差。


技术实现要素:

4.本发明提供一种查询词处理方法、装置、电子设备及可读存储介质,以解决查询词的推荐效果较差的问题。
5.第一方面,本发明提供一种查询词处理方法,所述方法包括:
6.获取与待推荐用户适配的原始查询词;
7.根据辅助特征对所述原始查询词进行调整,以生成目标查询词;所述辅助特征包括所述原始查询词所命中网络对象的对象特征、所述待推荐用户的用户属性特征和/或当前的时空特征;所述目标查询词的语义与所述原始查询词的语义以及所述辅助特征的语义存在关联;
8.向所述待推荐用户推荐所述目标查询词。
9.第二方面,本发明提供一种查询词处理装置,所述装置包括:
10.第一获取模块,用于获取与待推荐用户适配的原始查询词;
11.生成模块,用于根据辅助特征对所述原始查询词进行调整,以生成目标查询词;所述辅助特征包括所述原始查询词所命中网络对象的对象特征、所述待推荐用户的用户属性特征和/或当前的时空特征;所述目标查询词的语义与所述原始查询词的语义以及所述辅助特征的语义存在关联;
12.推荐模块,用于向所述待推荐用户推荐所述目标查询词。
13.第三方面,本发明提供一种电子设备,包括:处理器、存储器以及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现上述方法。
14.第四方面,本发明提供一种可读存储介质,当所述存储介质中的指令由电子设备的处理器执行时,使得电子设备能够执行上述方法。
15.在本发明实施例中,获取与待推荐用户适配的原始查询词,根据辅助特征对原始查询词进行调整,以生成目标查询词。其中,辅助特征包括原始查询词所命中网络对象的对象特征、待推荐用户的用户属性特征和/或当前的时空特征,目标查询词的语义与原始查询词的语义以及辅助特征的语义存在关联。最后,向待推荐用户推荐目标查询词。这样,按照
辅助特征自动对原始推荐词进一步改写,使得最终生成的目标查询词所传达的语义信息更加丰富,进而一定程度上可以使得目标查询词更具吸引力,从而提高以该目标查询词进行推荐时的推荐效果。
附图说明
16.为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
17.图1是本发明实施例提供的一种查询词处理方法的步骤流程图;
18.图2是本发明实施例提供的一种处理流程示意图;
19.图3是本发明实施例提供的另一种处理流程示意图;
20.图4是本发明实施例提供的一种查询词处理装置的结构图;
21.图5是本发明实施例提供的一种电子设备的结构图。
具体实施方式
22.下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
23.图1是本发明实施例提供的一种查询词处理方法的步骤流程图,如图1所示,该方法可以包括:
24.步骤101、获取与待推荐用户适配的原始查询词。
25.本发明实施例中,待推荐用户可以为一个或多个,示例的,待推荐用户可以是网络平台中的部分用户或者全部用户。对于任一待推荐用户,原始查询词可以是基于该待推荐用户的用户历史行为数据确定的。示例的,可以根据待推荐用户的用户历史行为数据,召回该待推荐用户搜索过的历史搜索词、待推荐用户感兴趣的热搜词和/或待推荐用户感兴趣的主题特征词,并将这些词语加入备选查询词集合。当然,也可以直接将网络平台中用户所处区域的热搜词加入备选查询词集合。其中,热搜词可以是网络平台被搜索次数高于预设阈值的词,主题特征词可以用于表征待推荐用户感兴趣的网络对象所具备的主题。示例的,假设待推荐用户经常下单购买清淡口味的食物,那么主题特征词可以为“清淡口味”,假设待推荐用户经常下单购买具有满减的物品,那么主题特征词可以为“大额满减”。
26.进一步地,可以对备选查询词集合中的备选词语进行粗排序,例如,按照词语的被搜索时间、点击率等参数,将被搜索时间更近,点击率更高的词语排在更靠前的位置。然后,对排序后的备选词语进行截断,以得到原始查询词。例如,将前n个备选词语确定为原始查询词,将第n个备选词语之后的备选词语剔除。这样,一定程度上可以在确保原始查询词的质量的同时,避免由于原始查询词过多导致后续工作量过大的问题。
27.步骤102、根据辅助特征对所述原始查询词进行调整,以生成目标查询词;所述辅助特征包括所述原始查询词所命中网络对象的对象特征、所述待推荐用户的用户属性特征
和/或当前的时空特征;所述目标查询词的语义与所述原始查询词的语义以及所述辅助特征的语义存在关联。
28.本发明实施例中,辅助特征的具体种类可以是根据实际需求设置的。对于辅助特征中原始查询词所命中网络对象的对象特征,由于原始查询词所命中网络对象可以视为原始查询词可以提供给用户的供给,因此,对象特征又可以视为原始查询词的供给特征。进一步地,由于所命中网络对象的对象特征可以表征这些网络对象的特点。因此,基于对象特征对原始查询词进行调整,可以使得调整后的目标查询词能够在传达原始查询词基本语义的同时,进一步传达能够体现对象特征的语义,进而使得待推荐用户基于目标查询词即可便捷的获取以该目标查询词所能搜索到的网络对象的特征,从而可以提高对待推荐用户的吸引力,方便待推荐用户进行选择,提高目标推荐词的点击率以及用户的浏览时长。
29.进一步地,对于辅助特征中待推荐用户的用户属性特征以及当前的时空特征,由于用户属性特征可以表征待推荐用户的个人属性,当前的时空特征可以表征待推荐用户当前所处时间的特征以及所处空间位置的特征。因此,基于用户属性特征对原始查询词进行调整,可以使得调整后的目标查询词能够在传达原始查询词基本语义的同时,进一步传达符合待推荐用户本身属性的语义或者进一步传达贴合当前外界环境的语义,进而一定程度上可以提高对待推荐用户的吸引力,方便待推荐用户进行选择,提高目标推荐词的点击率以及用户的浏览时长。
30.步骤103、向所述待推荐用户推荐所述目标查询词。
31.本发明实施例中,可以在预设界面中向待推荐用户显示目标查询词,以实现推荐。示例的,可以在网络平台界面中的历史搜索栏、搜索发现栏、进店词栏或者排行榜栏进行显示。通过给待推荐用户推荐其可能感兴趣的目标查询词,待推荐用户可以通过进一步点击目标查询词,以在落地页面中显示该目标查询词命中的网络对象,即,使得通过点击目标查询词进入的落地页面与目标查询词之间互相联动。
32.本发明实施例提供的查询词处理方法,获取与待推荐用户适配的原始查询词,根据辅助特征对原始查询词进行调整,以生成目标查询词。其中,辅助特征包括原始查询词所命中网络对象的对象特征、待推荐用户的用户属性特征和/或当前的时空特征,目标查询词的语义与原始查询词的语义以及辅助特征的语义存在关联。最后,向待推荐用户推荐目标查询词。这样,按照辅助特征自动对原始推荐词进一步改写,使得最终生成的目标查询词所传达的语义信息更加丰富,进而一定程度上可以使得目标查询词更具吸引力,从而提高以该目标查询词进行推荐时的推荐效果。
33.进一步地,相较于通过手动配置进行改写的方式,本发明实施例中通过自动对原始推荐词进行改写,一定程度上可以节省人力成本,提高改写效率。同时可以避免人工改写受到个人主观看法的影响,导致改写效果较差的问题。
34.可选的,上述获取与待推荐用户适配的原始查询词之后,根据辅助特征对原始查询词进行调整,以生成目标查询词之前,还可以执行下述步骤:
35.步骤s21、对于任一所述原始查询词,确定所述原始查询词所命中网络对象的目标数量。
36.本步骤中,可以将该原始查询词与预设索引库中各网络对象的关键词进行匹配,然后将相匹配的网络对象确定为该原始查询词所命中网络对象。接着,可以基于所命中网
络对象的数量,以确定目标数量。其中,预设索引库可以包括poi索引以及spu索引。在一种实现方式中,poi可以指向网络平台中的店铺,spu可以指向网络平台中店铺中的物品。店铺以及店铺中的物品可以均为前述中的网络对象。进一步地,可以预先基于poi的关键词建立倒排索引以及正排索引,基于spu的关键词建立倒排索引以及正排索引,以构建索引库。
37.步骤s22、在所述目标数量小于预设数量阈值的情况下,剔除所述原始查询词。
38.本步骤中,预设数量阈值可以是根据实际需求设置,本发明实施例对此不作限定。进一步地,如果目标数量越大,则可以说明以该原始查询词进行搜索时所能搜索到的网络对象的数量越多,该原始查询词的供给量越大。反之,如果目标数量越小,则可以说明以该原始查询词进行搜索时所能搜索到的网络对象的数量越少,该原始查询词的供给量越小。进一步地,如果目标数量小于预设数量阈值,可以确定该原始查询词的供给量过小,因此,可以将该原始查询词删除。其中,剔除后剩余的原始查询词可以组成原始查询词有效集合。相应地,后续可以仅对原始查询词有效集合中的原始查询词进行处理。
39.进一步地,本发明实施例中的查询词可以作为一跳词,用户点击一跳词的动作可以称之为二跳,相应地,跳转到的页面可以称为二跳页。二跳页中可以限制查询词命中的网络对象。本发明实施例中,通过提前将供给量较少的原始查询词剔除,即,将所命中网络对象的目标数量小于预设数量阈值的原始查询词剔除,可以避免后续向待推荐用户推荐供给量较少的查询词,导致二跳页中可展示内容较过少,无法较为高效的承接一跳词的需求,从而导致查询词的搜索效果较差的问题。同时,通过在对原始查询词进行调整之前,过滤供给量较少的原始查询词,一定程度上可以减少后续调整操作的工作量,进而可以节省后续所需的处理资源。
40.可选的,上述确定原始查询词所命中网络对象的目标数量的操作,可以具体包括:
41.步骤s31、获取预设推荐时段;所述预设推荐时段用于表征推荐所述目标查询词的时段。
42.本步骤中,预设推荐时段可以是根据实际需求设置的,示例的,预设推荐时刻可以设置为当前时刻往后的x小时。进一步地,获取预设推荐时段时,可以直接读取预先设置好的时段值,以作为预设推荐时段。
43.步骤s32、确定所述原始查询词所命中网络对象中目标网络对象的数量,以作为所述目标数量;所述目标网络对象在所述预设推荐时段处于在线状态。
44.本步骤中,可以将该原始查询词与预设索引库中各网络对象的关键词进行匹配,以确定相匹配的网络对象。然后,将相匹配的网络对象中在预设推荐时段内处于在线状态的网络对象确定为目标网络对象。接着,可以统计目标网络对象的数量,得到目标数量。
45.其中,预设索引库中的正排索引可以基于各个网络对象的在线状态构建,即,基于正排索引可以确定网络对象的在线时段,进而方便确定网络对象在预设推荐时段是否处于在线状态。其中,网络对象处于在线状态可以指的是网络对象处于可用状态。例如,外卖平台中的店铺或物品在营业时间内处于可下单状态,即,处于在线状态。在营业时间之外处于不可下单状态,即,处于非在线状态。
46.本发明实施例中,获取预设推荐时段,确定所命中网络对象中在预设推荐时段处于在线状态的网络对象数量,以作为目标数量。这样,一定程度上可以使得目标数量可以更准确的表征基于目标查询词搜索时所能搜索到的网络对象的实际数量,即,可以更准确的
表征真实的供给量,进而一定程度上可以使得过滤后的原始查询词的更适配实际推荐需求。
47.可选的,上述向所述待推荐用户推荐所述目标查询词的操作,可以包括:
48.步骤s41、对于任一所述目标查询词,确定所述目标查询词对应的点击率分值;所述点击率分值与所述目标查询词的第一预估点击率正相关。
49.本步骤中,第一预估点击率可以是基于预设的点击通过率(click-through-rate,ctr)预估模型确定。具体的,可以将目标查询词的相关信息作为ctr预估模型的输入,然后将ctr预估模型的输出作为第一预估点击率pctri。进一步地,可以基于目标查询词的第一预估点击率确定目标查询词的点击率分值。
50.步骤s42、选取点击率分值最大的前m个目标查询词,并向所述待推荐用户推荐所述前m个目标查询词。
51.本步骤中,可以先根据各目标查询词对应的点击率分值,对各目标查询词进行排序,得到排序结果。然后,根据排序结果,选取点击率分值最大的前m个目标查询词。其中,m的具体值可以根据实际需求设置,本发明实施例对此不作限定。示例的,可以按照点击率分值由大至小的顺序进行排序,相应地,取排序结果中的前m个目标查询词,即可得到点击率分值最大的前m个目标查询词。进一步地,也可以按照点击率分值由小至大的顺序进行排序,相应地,取排序结果中的后m个目标查询词,即可得到点击率分值最大的前m个目标查询词。
52.本发明实施例中,通过确定目标查询词对应的点击率分值,点击率分值可以与目标查询词的第一预估点击率正相关,选取点击率分值最大的前m个目标查询词,并向待推荐用户推荐前m个目标查询词,一定程度上可以在避免所推荐的目标查询词过多,导致待推荐用户的选择难度较大的同时,提升推荐的目标查询词的点击率。
53.可选的,上述确定所述目标查询词对应的点击率分值的操作,可以包括:
54.步骤s51、确定所述对象特征对应的特征点击率;所述特征点击率与目标网络对象的第二预估点击率正相关,所述目标网络对象是所述所命中网络对象中具备所述对象特征的网络对象。
55.本步骤中,对于任一对象特征,可以将具备该对象特征的目标网络对象的相关信息作为ctr预估模型的输入,然后将ctr预估模型的输出作为该目标网络对象的第二预估点击率。进一步地,可以将所有目标网络对象的第二预估点击率之和,确定为该对象特征对应的特征点击率。
56.示例的,假设目标查询词queryi命中的网络对象包括poi1,poi2,...,,poi
x
。对象特征包括c1、c2,

,cn。其中,具备c1的目标网络对象包括[poi1,poi2,...,,poi
x
],具备c2的目标网络对象包括[poi1,poi2,...,,poi
x]
,具备cn的目标网络对象包括[poi1,poi2,...,,poin]。那么可以将poi1,poi2,...,,poi
x
的第二预估点击率之和,确定为该c1以及c2对应的特征点击率,将poi1,poi2,...,,poin的第二预估点击率之和,确定为该c3对应的特征点击率。其中,目标查询词所命中网络对象具备的对象特征,又可以称为供给特征。目标查询词、所命中网络对象以及所具备的对象特征可以以集合的形式表示为:
[0057]
queryi:{c1:[poi1,poi2,...,,poin],c2:[poi1,poi2,...,,poin],

,cn:[poi1,poi2,...,,poin]}
[0058]
步骤s52、根据所述第一预估点击率、所述特征点击率以及所述原始查询词所命中网络对象的目标数量,生成所述点击率分值;所述点击率分值与所述特征点击率正相关且与所述目标数量负相关。
[0059]
本步骤中,可以将第一预估点击率、特征点击率以及目标数量作为参数输入预设的分值计算公式,然后将该分值计算公式的值作为点击率分值。其中,该分值计算公式可以是根据实际需求设置的。示例的,该分值计算公式可以为:
[0060][0061]
其中,pctri表示第一预估点击率,ctr
ij
表示第i个目标查询词的第j个
[0062]
对象特征,posweight
ij
表示第i个目标查询词的第j个对象特征的预设权重,leni表示第i个目标查询词的目标数量。由于每个目标查询词的目标数量可能不同,而目标数量一定程度上会影响点击率。因此,本发明实施例中以点击率分值与目标数量负相关的方式计算点击率分值,一定程度上可以使得点击率分值可以更公平的表征点击率。
[0063]
需要说明的是,本发明实施例中还可以将用户对展示的目标查询词的曝光数据以及点击数据作为埋点数据。在展示目标查询词之后,获取目标查询词的展示数据以及埋点数据。接着,将展示数据以及埋点数据回传至ctr预估模型,以优化ctr预估模型,进而提高预测的点击率的准确性。
[0064]
本发明实施例中,确定原始查询词对应的特征点击率,特征点击率是对象特征对应的点击率,对象特征对应的点击率与具备对象特征的网络对象的第二预估点击率正相关。然后,根据第一预估点击率、特征点击率以及原始查询词所命中网络对象的目标数量,生成点击率分值;点击率分值与特征点击率正相关且与目标数量负相关。这样,进一步结合特征点击率以及目标数量,计算点击率分值,一定程度上可以使得点击率分值能够更为精准的衡量目标查询词本身所能带来的点击率,进而可以提高后续选择操作的准确性。
[0065]
可选的,本发明实施例还可以在根据辅助特征对所述原始查询词进行调整,以生成目标查询词之前,通过下述步骤获取辅助特征:
[0066]
步骤s61、获取所述对象特征标签、所述待推荐用户的用户属性标签、当前时间信息和/或当前位置信息;所述对象特征标签用于表征所述对象特征;所述用户属性标签用于表征所述用户属性特征;所述当前时间信息以及所述当前位置信息用于表征所述时空特征。
[0067]
本步骤中,对象特征的具体种类可以根据实际需求设置,对象特征可以包括多个维度下的特征,不同对象特征可以以不同的对象特征标签表征。示例的,对象特征标签可以包括“品牌”、“促销”、“高复购”、“口味”,等等。各个网络对象所具备的对象特征可以由该网络对象本身的特点决定,不同网络对象所具备的对象特征标签可以不同。进一步地,待推荐用户的用户属性标签可以根据用户的个人相关信息,为用户预先设置的。相应地,可以基于待推荐用户的用户标识,从预设的数据管理平台(dmp)中查找待推荐用户的用户属性标签。示例的,“用户属性标签”可以包括“年轻人”、“白领”、“小资青年”,等等。
[0068]
进一步地,可以实时获取当前时间信息和/或当前位置信息。其中,当前时间信息可以是当前的具体时间点,也可以是与当前时刻存在关联的信息。示例的,当前时间信息可以包括当前所处的饭点时间(例如,早餐,午餐,晚餐,夜宵,下午茶),当前所处的季节(例
如,春天、夏天、秋天、冬天),当前所处的节气(例如,冬至,谷雨,秋分,等等),当前所处的节日(七夕,春节,情人节,等等)。进一步地,当前位置信息可以是当前的具体位置,也可以是与当前具体位置存在关联的信息。示例的,当前位置信息可以包括当前位置所在的商圈、街道、城市等地址。当前时间信息以及当前位置信息可以通过当前环境信息获取。
[0069]
本发明实施例中,以对象特征标签表征对象特征,以用户属性标签表征用户属性特征,以当前时间信息以及当前位置信息表征时空特征,通过获取对象特征标签、待推荐用户的用户属性标签、当前时间信息和/或当前位置信息,即可便捷的获取到辅助特征,进而一定程度上可以降低获取成本,提高获取效率。
[0070]
同时,待推荐用户的用户属性标签、当前时间信息以及当前位置信息与待推荐用户存在一定关联,因此,后续以及用户属性标签、当前时间信息以及当前位置信息作为辅助特征,一定程度上可以使得基于辅助特征改写后的目标查询词能够符合用户偏好,进而确保改写效果。
[0071]
可选的,本发明实施例还可以在获取所述对象特征标签之前,执行下述操作:
[0072]
步骤s71、根据各个网络对象的相关信息,检测所述网络对象是否具备各指定维度的对象特征。
[0073]
本步骤中,相关信息的具体类型以及指定维度可以均是根据实际需求设置的。示例的,相关信息可以包括名字、所参与的活动,销量、复购率、满减额度、打折方式、品牌资质,等等。进一步地,可以根据相关信息确定网络对象是否满足该指定维度的特征所需满足规则,进而确保确定是否具备该指定维度的对象特征。示例的,对于指定维度的对象特征“高复购”,可以从相关信息中获取网络对象的月销量以及复购率,如果网络对象的月销量》x且复购率》y,则可以确定该网络对象满足规则,具备对象特征:“高复购”。对于指定维度的对象特征“促销”,可以基于相关信息确定网络对象是否存在折扣活动,如果有,则可以确定该网络对象满足规则,具备对象特征:“促销”。对于指定维度的对象特征“品牌”,可以基于相关信息确定网络对象是否具有品牌资质,如果有,则可以确定该网络对象满足规则,具备对象特征:“品牌”。对于指定维度的对象特征“川菜”,可以从相关信息中获取网络对象中属于川菜的数量,如果该数量满足预设规则,则可以确定该网络对象满足规则,具备对象特征:“川菜”。
[0074]
步骤s72、对于任一所述指定维度,若所述网络对象具备所述指定维度的对象特征,则为所述网络对象设置所述指定维度的对象特征标签,以生成特征数据库。
[0075]
示例的,对于具备对象特征“高复购”的网络对象,可以为其设置“高复购”标签。对于具备对象特征“品牌”的网络对象,可以为其设置“品牌”标签。对于具备对象特征“促销”的网络对象,可以为其设置“促销”标签。进一步地,可以基于网络对象具备的对象特征标签生成特征向量,以便于快速确定网络对象具备的对象特征。其中,特征向量的每一个元素可以对应一个指定维度的对象特征。在网络对象具备该元素对应的指定维度的对象特征时,可以将该元素的值设置为第一预设值。反着,在网络对象不具备该元素对应的指定维度的对象特征时,可以将该元素的值设置为第二预设值。示例的,第一预设值可以为1,第二预设值可以为0。对于特征向量(1,0,1,0,0)可以表征该网络对象具备第1个元素以及第3个元素对应的指定维度的对象特征。进一步地,本发明实施例中还可以直接将相关信息作为预设模型的输入,基于预设模型为网络对象映射特征标签。
[0076]
相应地,上述获取所述对象特征标签的操作,可以具体包括:从所述特征数据库中,查找所述原始查询词所命中网络对象对应的对象特征标签。具体的,可以先根据原始查询词所命中网络对象的标识,从特征数据库中查找该网络对象的特征向量。例如,将原始查询词所命中网络对象的标识输入预设查询算法,以从特征数据库中进行查找。然后获取特征向量中值为第一预设值的元素所对应的对象特征的标签,进而得到原始查询词所命中网络对象对应的对象特征标签。
[0077]
本发明实施例中,通过预先根据各个网络对象的相关信息,检测网络对象是否具备各指定维度的对象特征。然后对于任一指定维度,在网络对象具备指定维度的对象特征的情况下,为网络对象设置指定维度的对象特征标签,以生成特征数据库。相应地,在获取对象特征标签时,仅需从特征数据库中,查找原始查询词所命中网络对象对应的对象特征标签,即可实现获取操作,进而一定程度上可以确保获取对象特征标签的便捷度,从而提高处理效率。
[0078]
可选的,本发明实施例中根据辅助特征对所述原始查询词进行调整,以生成目标查询词的操作,可以具体包括:
[0079]
步骤s81、在所述原始查询词用于表征网络对象的情况下,确定所述网络对象所属的类型,得到目标类型。
[0080]
本步骤中,如果原始查询词用于表征网络对象,则可以确定该原始查询词为关联了用户相关属性的普通查询词。进一步地,原始查询词表征的网络对象可以是该原始查询词的语义所指向的对象。示例的,原始查询词所表征的语义对象可以为实体。例如,饺子,奶茶、手机,电脑,等等。进一步地,语义对象的类型可以是预先设定的。示例的,语义对象的类型可以包括主食、饮品、电子产品,等等。具体的,可以按照预先设置类型与实体对应关系,确定原始查询词所表征网络对象所属的类型,进而得到目标类型。
[0081]
步骤s82、根据预设的类型与辅助特征之间的对应关系以及所述目标类型,确定所述原始查询词对应的目标辅助特征;所述目标辅助特征是与所述原始查询词的搭配程度满足预设条件的辅助特征。
[0082]
本步骤中,预设的类型与辅助特征之间的对应关系可以通过预设的规则库实现,在该规则库中,可以定义类型与辅助特征之间的对应关系,即,查询词和特征的组合关系。在预先设定该对应关系时,可以为类型对应设置与该类型的网络对象搭配程度满足预设条件的辅助特征。其中,预设条件可以是根据实际需求设定的。进一步地,可以在该对应关系中查找目标类型对应的辅助特征,以作为目标辅助特征。示例的,假设“主食”类型对应时空特征:“节气”,“饮品”类型对应时空特征:“季节”以及“用户属性特征”。那么在原始查询词表征网络对象为“饺子”的情况下,将时空特征“节气”确定为目标辅助特征。在原始查询词表征网络对象为“奶茶”“咖啡”的情况下,将时空特征“季节”以及“用户属性特征”确定为目标辅助特征。
[0083]
步骤s83、根据所述目标辅助特征所表征的语义,对所述原始查询词进行改写,以获取所述目标查询词。
[0084]
由于目标辅助特征与原始查询词的搭配程度满足预设条件,即,搭配程度较高,因此,基于目标辅助特征所表征的语义,对所述原始查询词进行改写的方式,一定程度上可以确保改写得到的目标查询词的质量。
[0085]
本发明实施例中,在原始查询词用于表征网络对象的情况下,确定网络对象所属的类型,得到目标类型;根据预设的类型与辅助特征之间的对应关系以及目标类型,确定原始查询词对应的目标辅助特征;目标辅助特征是与原始查询词的搭配程度满足预设条件的辅助特征;根据目标辅助特征所表征的语义,对原始查询词进行改写,以获取目标查询词。这样,通过预先定义类型与辅助特征之间的对应关系,为原始查询词匹配搭配效果更好的目标辅助特征,并基于目标辅助特征对原始查询词进行改写,进而一定程度上可以确保查询词改写效果。
[0086]
可选的,上述根据所述目标辅助特征所表征的语义,对所述原始查询词进行改写,以获取所述目标查询词的操作,可以具体包括:将所述目标辅助特征与所述原始查询词进行组合,得到所述目标查询词。这样,通过组合即可实现改写,进而一定程度上可以确保改写效率。具体的,可以将目标辅助特征以及原始查询词作为预设改写算法的输入,该预设改写算法可以将目标辅助特征与原始查询词通过预设的衔接词语组合,以确保最终得到目标查询词的流畅度。或者,也可以是对目标辅助特征的内容进行调整,并将调整后的内容与原始查询词通过预设的衔接词语组合。其中,调整后的内容与目标辅助特征之间存在语义关联。最后,可以将预设改写算法的输出作为目标查询词。示例的,假设当前所处的节气为“冬至”,那么可以将原始查询词“饺子”与“冬至”组合,得到目标查询词“冬至吃饺子”。假设当前所处的季节为“秋天”,那么可以将原始查询词“奶茶”与“秋天”组合,得到目标查询词“秋天的第一杯奶茶”。假设用户属性标签为“白领”,那么可以将原始查询词“咖啡”与“白领”组合,得到目标查询词“白领都爱喝的咖啡”。进一步地,还可以将原始查询词“奶茶”与对象特征“品质”组合,得到目标查询词“品质奶茶”,或者和对象特征“高复购”组合,得到目标查询词“你常喝的奶茶”。将原始查询词“咖啡”与时空特征“下午”组合,得到目标查询词“午睡后来杯咖啡”。
[0087]
可选的,上述根据辅助特征对所述原始查询词进行调整,以生成目标查询词的操作,还可以进一步地包括下述步骤:
[0088]
步骤s91、在所述原始查询词用于表征网络对象所具备的主题的情况下,获取与所述主题相匹配的对象特征。
[0089]
步骤s92、根据所述相匹配的对象特征的特征值,对所述原始查询词进行改写,以获取所述目标查询词。
[0090]
本发明实施例中,如果原始查询词用于表征网络对象所具备的主题的,则可以确定该原始查询词为来源于用户相关属性的主体查询词。进一步地,可以从原始查询词所命中网络对象具备的对象特征中,获取与该主题相适配,即,所表征语义相似的对象特征。例如,在主题为“大额满减”的情况下,可以获取与主题“大额满减”相匹配的对象特征“满减额度”。在主题为“大额折扣”的情况下,可以获取与主题“大额折扣”相匹配的对象特征“折扣”。进一步地,可以从原始查询词所命中网络对象的相关信息,获取相匹配的对象特征的特征值。示例的,可以获取所命中网络对象的满减额度的具体值,折扣的具体值。进一步地,可以将原始查询词替换为对象特征的特征值。示例的,可以将“大额满减”替换为“满50减20”,将“大额折扣”替换为“最低1折起”。将原始查询词“川菜”替换为相匹配的对象特征“口味”的具体值“无辣不欢”。需要说明的是,由于所命中网络对象往往为多个,因此,对象特征的特征值的具体值可能为多个,相应地,可以随机选择一个具体值或者选择一个出现频率
最高的具体值又或者选择数值最小的具体值,进行替换。
[0091]
本发明实施例中,在原始查询词用于表征网络对象所具备的主题的情况下,获取与主题相匹配的对象特征;根据相匹配的对象特征的特征值,对原始查询词进行改写,以获取目标查询词。由于与主题相匹配的对象特征能够更为精细精准的表征该主题,因此,基于该相匹配的对象特征的特征值,对原始查询词进行改写,一定程度上可以确保改写效果。
[0092]
需要说明的是,本发明实施例还可以在得到目标查询词之后,基于各目标查询词所命中的网络对象的数量,对目标查询词进行重过滤,得到最终的目标查询词有效集合,以进一步确保向用户的展示的目标查询词具备充足的供给。其中,基于各目标查询词所命中的网络对象的数量,对目标查询词进行重过滤的实现方式可以参照上述基于各原始查询词所命中的网络对象的数量对原始查询词进行过滤的实现方式。示例的,图2是本发明实施例提供的一种处理流程示意图,如图2所示,可以先由查询词召回模块,获取原始查询词。然后由供给过滤模块根据预设索引库对原始查询词进行过滤。接着,由语料改写模块对过滤后的原始查询词进行改写,以获取目标查询词,最后,由预估排序模块根据各目标查询词对应的点击率分值,对各目标查询词进行排序。通过“前端展示”环节展示点击率分值最大的前m个目标查询词。
[0093]
进一步地,图3是本发明实施例提供的另一种处理流程示意图,如图3所示,对于与待推荐用户适配的原始查询词:奶茶,可以将其改写为虚线框内的目标查询词。接着,通过排序以及输出的环节,向待推荐用户最终展示目标查询词“优质品牌奶茶店”。最后,可以基于待推荐用户的点击操作,获取埋点数据,以优化ctr预估模型
[0094]
图4是本发明实施例提供的一种查询词处理装置的结构图,该装置20可以包括:
[0095]
第一获取模块201,用于获取与待推荐用户适配的原始查询词;
[0096]
生成模块202,用于根据辅助特征对所述原始查询词进行调整,以生成目标查询词;所述辅助特征包括所述原始查询词所命中网络对象的对象特征、所述待推荐用户的用户属性特征和/或当前的时空特征;所述目标查询词的语义与所述原始查询词的语义以及所述辅助特征的语义存在关联;
[0097]
推荐模块203,用于向所述待推荐用户推荐所述目标查询词。
[0098]
可选的,所述装置20还包括:
[0099]
确定模块,用于对于任一所述原始查询词,确定所述原始查询词所命中网络对象的目标数量;
[0100]
剔除模块,用于在所述目标数量小于预设数量阈值的情况下,剔除所述原始查询词。
[0101]
可选的,所述确定模块,具体用于:
[0102]
获取预设推荐时段;所述预设推荐时段用于表征推荐所述目标查询词的时段;
[0103]
确定所述原始查询词所命中网络对象中目标网络对象的数量,以作为所述目标数量;所述目标网络对象在所述预设推荐时段处于在线状态。
[0104]
可选的,所述推荐模块203,具体用于:
[0105]
对于任一所述目标查询词,确定所述目标查询词对应的点击率分值;所述点击率分值与所述目标查询词的第一预估点击率正相关;
[0106]
选取点击率分值最大的前m个目标查询词,并向所述待推荐用户推荐所述前m个目
标查询词。
[0107]
可选的,所述推荐模块203,还具体用于:
[0108]
确定所述对象特征对应的特征点击率;所述特征点击率与目标网络对象的第二预估点击率正相关,所述目标网络对象是所述所命中网络对象中具备所述对象特征的网络对象;
[0109]
根据所述第一预估点击率、所述特征点击率以及所述原始查询词所命中网络对象的目标数量,生成所述点击率分值;所述点击率分值与所述特征点击率正相关且与所述目标数量负相关。
[0110]
可选的,所述生成模块202,具体用于:
[0111]
在所述原始查询词用于表征网络对象的情况下,确定所述网络对象所属的类型,得到目标类型;
[0112]
根据预设的类型与辅助特征之间的对应关系以及所述目标类型,确定所述原始查询词对应的目标辅助特征;所述目标辅助特征是与所述原始查询词的搭配程度满足预设条件的辅助特征;
[0113]
根据所述目标辅助特征所表征的语义,对所述原始查询词进行改写,以获取所述目标查询词。
[0114]
可选的,所述生成模块202,还具体用于:
[0115]
将所述目标辅助特征与所述原始查询词进行组合,得到所述目标查询词。
[0116]
可选的,所述生成模块202,还具体用于:
[0117]
在所述原始查询词用于表征网络对象所具备的主题的情况下,获取与所述主题相匹配的对象特征;
[0118]
根据所述相匹配的对象特征的特征值,对所述原始查询词进行改写,以获取所述目标查询词。
[0119]
可选的,所述装置20还包括:
[0120]
第二获取模块,用于获取所述对象特征标签、所述待推荐用户的用户属性标签、当前时间信息和/或当前位置信息;所述对象特征标签用于表征所述对象特征;所述用户属性标签用于表征所述用户属性特征;所述当前时间信息以及所述当前位置信息用于表征所述时空特征。
[0121]
可选的,所述装置20还包括:
[0122]
检测模块,用于根据各个网络对象的相关信息,检测所述网络对象是否具备各指定维度的对象特征;
[0123]
设置模块,用于对于任一所述指定维度,若所述网络对象具备所述指定维度的对象特征,则为所述网络对象设置所述指定维度的对象特征标签,以生成特征数据库;
[0124]
所述第二获取模块,具体用于:从所述特征数据库中,查找所述原始查询词所命中网络对象对应的对象特征标签。
[0125]
本发明实施例提供的查询词处理装置,获取与待推荐用户适配的原始查询词,根据辅助特征对原始查询词进行调整,以生成目标查询词。其中,辅助特征包括原始查询词所命中网络对象的对象特征、待推荐用户的用户属性特征和/或当前的时空特征,目标查询词的语义与原始查询词的语义以及辅助特征的语义存在关联。最后,向待推荐用户推荐目标
查询词。这样,按照辅助特征自动对原始推荐词进一步改写,使得最终生成的目标查询词所传达的语义信息更加丰富,进而一定程度上可以使得目标查询词更具吸引力,从而提高以该目标查询词进行推荐时的推荐效果。
[0126]
进一步地,相较于通过手动配置进行改写的方式,本发明实施例中通过自动对原始推荐词进行改写,一定程度上可以节省人力成本,提高改写效率。同时可以避免人工改写受到个人主观看法的影响,导致改写效果较差的问题。
[0127]
本发明还提供了一种电子设备,参见图5,包括:处理器301、存储器302以及存储在所述存储器上并可在所述处理器上运行的计算机程序3021,所述处理器执行所述程序时实现前述实施例的方法。
[0128]
本发明还提供了一种可读存储介质,当所述存储介质中的指令由电子设备的处理器执行时,使得电子设备能够执行前述实施例的方法。
[0129]
对于装置实施例而言,由于其与方法实施例基本相似,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
[0130]
在此提供的算法和显示不与任何特定计算机、虚拟系统或者其它设备固有相关。各种通用系统也可以与基于在此的示教一起使用。根据上面的描述,构造这类系统所要求的结构是显而易见的。此外,本发明也不针对任何特定编程语言。应当明白,可以利用各种编程语言实现在此描述的本发明的内容,并且上面对特定语言所做的描述是为了披露本发明的最佳实施方式。
[0131]
在此处所提供的说明书中,说明了大量具体细节。然而,能够理解,本发明的实施例可以在没有这些具体细节的情况下实践。在一些实例中,并未详细示出公知的方法、结构和技术,以便不模糊对本说明书的理解。
[0132]
类似地,应当理解,为了精简本发明并帮助理解各个发明方面中的一个或多个,在上面对本发明的示例性实施例的描述中,本发明的各个特征有时被一起分组到单个实施例、图、或者对其的描述中。然而,并不应将该公开的方法解释成反映如下意图:即所要求保护的本发明要求比在每个权利要求中所明确记载的特征更多的特征。更确切地说,如下面的权利要求书所反映的那样,发明方面在于少于前面公开的单个实施例的所有特征。因此,遵循具体实施方式的权利要求书由此明确地并入该具体实施方式,其中每个权利要求本身都作为本发明的单独实施例。
[0133]
本领域那些技术人员可以理解,可以对实施例中的设备中的模块进行自适应性地改变并且把它们设置在与该实施例不同的一个或多个设备中。可以把实施例中的模块或单元或组件组合成一个模块或单元或组件,以及此外可以把它们分成多个子模块或子单元或子组件。除了这样的特征和/或过程或者单元中的至少一些是相互排斥之外,可以采用任何组合对本说明书(包括伴随的权利要求、摘要和附图)中公开的所有特征以及如此公开的任何方法或者设备的所有过程或单元进行组合。除非另外明确陈述,本说明书(包括伴随的权利要求、摘要和附图)中公开的每个特征可以由提供相同、等同或相似目的的替代特征来代替。
[0134]
本发明的各个部件实施例可以以硬件实现,或者以在一个或者多个处理器上运行的软件模块实现,或者以它们的组合实现。本领域的技术人员应当理解,可以在实践中使用微处理器或者数字信号处理器(dsp)来实现根据本发明的排序设备中的一些或者全部部件
的一些或者全部功能。本发明还可以实现为用于执行这里所描述的方法的一部分或者全部的设备或者装置程序。这样的实现本发明的程序可以存储在计算机可读介质上,或者可以具有一个或者多个信号的形式。这样的信号可以从因特网网站上下载得到,或者在载体信号上提供,或者以任何其他形式提供。
[0135]
应该注意的是上述实施例对本发明进行说明而不是对本发明进行限制,并且本领域技术人员在不脱离所附权利要求的范围的情况下可设计出替换实施例。在权利要求中,不应将位于括号之间的任何参考符号构造成对权利要求的限制。单词“包含”不排除存在未列在权利要求中的元件或步骤。位于元件之前的单词“一”或“一个”不排除存在多个这样的元件。本发明可以借助于包括有若干不同元件的硬件以及借助于适当编程的计算机来实现。在列举了若干装置的单元权利要求中,这些装置中的若干个可以是通过同一个硬件项来具体体现。单词第一、第二、以及第三等的使用不表示任何顺序。可将这些单词解释为名称。
[0136]
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统、装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
[0137]
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。
[0138]
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以权利要求的保护范围为准。
再多了解一些

本文用于创业者技术爱好者查询,仅供学习研究,如用于商业用途,请联系技术所有人。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献