一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种物品信息推送方法、装置、设备及存储介质与流程

2021-12-07 20:38:00 来源:中国专利 TAG:


1.本发明实施例涉及计算机应用技术领域,尤其涉及一种物品信息推送方法、装置、设备及存储介质。


背景技术:

2.随着电子商务平台的蓬勃发展,越来越多的用户选择线上获取物品,为了提升物品点击率和用户获取体验,电子商务平台会根据用户的历史浏览记录确定用户感兴趣的物品,并将物品库中与这些物品相同或者相似的物品的物品信息推送给用户,即“浏览什么推送什么”。
3.在实现本发明的过程中,发明人发现现有技术中存在以下技术问题:在用户经过浏览并且获取到某物品后,现有的推送方案也会持续向该用户推送与该物品相同或者相似的物品的物品信息,物品信息推送的精确度有待提高。


技术实现要素:

4.本发明实施例提供了一种物品信息推送方法、装置、设备及存储介质,以提高物品信息推送的精确度。
5.第一方面,本发明实施例提供了一种物品信息推送方法,可以包括:
6.获取待推送用户的待推送物品和已获取物品,根据待推送物品和已获取物品的相似度,从待推送物品中筛选出候选过滤物品;
7.基于预设豁免因素从候选过滤物品中筛选出目标过滤物品,其中,预设豁免因素包括待推送用户的复获周期和/或第一用户行为,复获周期是获取同种物品的时间间隔周期;
8.将待推送物品中除目标过滤物品以外的待推送物品的物品信息,推送给待推送用户。
9.第二方面,本发明实施例还提供了一种物品信息推送装置,可以包括:
10.候选过滤物品筛选模块,用于获取待推送用户的待推送物品和已获取物品,根据待推送物品和已获取物品的相似度,从待推送物品中筛选出候选过滤物品;
11.目标过滤物品筛选模块,用于基于预设豁免因素从候选过滤物品中筛选出目标过滤物品,其中,预设豁免因素包括待推送用户的复获周期和/或第一用户行为,复获周期是获取同种物品的时间间隔周期;
12.物品信息推送模块,用于将待推送物品中除目标过滤物品以外的待推送物品的物品信息,推送给待推送用户。
13.第三方面,本发明实施例还提供了一种设备,该设备可以包括:
14.一个或多个处理器;
15.存储器,用于存储一个或多个程序;
16.当一个或多个程序被一个或多个处理器执行,使得一个或多个处理器实现本发明
任意实施例所提供的物品信息推送方法。
17.第四方面,本发明实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现本发明任意实施例所提供的物品信息推送方法。
18.本发明实施例的技术方案,通过获取待推送用户的待推送物品和已获取物品,可以根据待推送物品和已获取物品的相似度,从待推送物品中筛选出候选过滤物品;考虑到候选过滤物品可能是待推送用户无需再次获取的物品,也可能是待推送用户需要再次获取的物品,可以基于预设豁免因素从候选过滤物品中筛选出待推送用户无需再次获取的目标过滤物品;将待推送物品中除目标过滤物品以外的待推送物品的物品信息推送给待推送用户。上述技术方案,基于待推送物品和已获取物品间的相似度从待推送物品中筛选出候选过滤物品,解决了“获取后继续推送”的问题,并且基于待推送用户的个性化需求从候选过滤物品中筛选出目标过滤物品,解决了“获取后不再推送”的问题,“过滤”和“豁免”两阶段的有效配合,在较大程度上提高了物品信息推送的精确度,进而提升了用户获取体验且增加了物品点击率。
附图说明
19.图1是本发明实施例一中的一种物品信息推送方法的流程图;
20.图2是本发明实施例二中的一种物品信息推送方法的流程图;
21.图3是本发明实施例三中的一种物品信息推送方法的流程图;
22.图4是本发明实施例四中的一种物品信息推送方法的流程图;
23.图5是本发明实施例五中的一种物品信息推送装置的结构框图;
24.图6是本发明实施例六中的一种设备的结构示意图。
具体实施方式
25.下面结合附图和实施例对本发明作进一步详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本发明,而非对本发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本发明相关的部分而非全部结构。
26.在介绍本发明实施例之前,先对本发明实施例的应用场景进行示例性说明:物品库中存储有多个物品,每个物品具有各自的核心物品词,其是物品标题中最能够体现出物品名称的名词,而物品标题中的其余名词有可能是干扰信息,如物品标题是“购买数据线赠送手机壳”,数据线是核心物品词,而手机壳则是干扰信息。需要说明的是,核心物品词的获取方式有多种,例如,可以先对物品库中各物品的物品标题进行分词,每个分词结果都是最小的有意义的语法单元;在此基础上,考虑到每个物品具有多种属性信息,可以根据各物品的属性信息从各自的分词结果中抽取出核心物品词。
27.示例性的,某物品的属性信息如表1所示,该属性信息包括但不限于物品标题、价格、风格、材质等等,其中,物品标题“yaya鸭鸭服饰针织连衣裙女2019秋新款假两件套高腰修身包臀开叉一步裙的毛衣裙过膝秋冬女装”的分词结果是“yaya鸭鸭服饰针织连衣裙女2019秋新款假两件套高腰修身包臀开叉一步裙的毛衣裙过膝秋冬女装”,从各分词结果中筛选出可能是核心物品词的分词结果“连衣裙、一步裙、毛衣裙和女装”;进一步,根据其余属性信息可以确定出“毛衣裙”是该物品的核心物品词。当然,还可以基于其余方案获取到
物品库中每个物品的核心物品词,在此不再赘述。在此以3个物品为例,它们的核心物品词的抽取结果如表2所示。
28.需要说明的是,本发明各实施例涉及到的物品可能是已获取物品、待推送物品、候选过滤物品、目标过滤物品等等,由于物品库中各物品的核心物品词已预先获取得到,后续为便于区分这些物品的核心物品词,在此,可选的,将已获取物品的核心物品词作为已获取物品词,待推送物品的核心物品词作为待推送物品词,候选过滤物品的核心物品词作为候选物品词,且目标过滤物品的核心物品词作为目标物品词,等等。另外,在实际应用中,可选的,物品可以是商品,已获取物品可以是已购买商品。
29.表1物品的属性信息
[0030][0031]
表2物品的核心物品词
[0032][0033]
实施例一
[0034]
图1是本发明实施例一中提供的一种物品信息推送方法的流程图。本实施例可适用于将符合用户兴趣的物品的物品信息推送给用户的情况。该方法可以由本发明实施例提供的物品信息推送装置来执行,该装置可以由软件和/或硬件的方式实现,该装置可以集成
在设备上,该设备可以是各种终端或服务器。
[0035]
参见图1,本发明实施例的方法具体包括如下步骤:
[0036]
s110、获取待推送用户的待推送物品和已获取物品,根据待推送物品和已获取物品的相似度,从待推送物品中筛选出候选过滤物品。
[0037]
其中,待推送用户是预向其推送物品信息的用户,已获取物品是待推送用户已经获取到的物品,待推送物品是根据预设推送算法计算得到的可能符合用户兴趣的物品,该预设推送算法可以是item-based、user-based等等。已获取物品的数量可以是一个、两个或是多个,类似的,待推送物品的数量也可以是一个、两个或是多个,在此未做具体限定。在实际应用中,可选的,待推送物品和已获取物品可以通过列表形式进行存储,列表中的每个元素可以记录有某待推送物品或是某已获取物品的属性信息。
[0038]
根据待推送物品和已获取物品间的相似度,将与已获取物品相同或是相似的待推送物品作为候选过滤物品,该候选过滤物品是待推送物品中可能需要过滤掉的物品,由此避免了将与已获取物品相同或是相似的待推送物品的物品信息再次推送给待推送用户的情况,解决了“获取后继续推送”的问题。
[0039]
需要说明的是,首先,与已获取物品相同的候选过滤物品可以是与待推送物品完全相同的物品,如二者均是xx品牌的洗发水,而与已获取物品相似的候选过滤物品可以是与待推送物品的种类相同的物品,如二者中的一个是a品牌的洗发水且另一个是b品牌的洗发水,可选的,可以将具有同一核心物品词的两个物品认为是相似物品。其次,相似度的计算方式有多种,如可以基于物品语义和/或待推送用户的第三用户行为判断待推送物品和已获取物品间的相似度,该第三用户行为可以是搜索行为、点击行为、待获取行为等等,示例性的,若已获取物品是已购买商品,那么,该第三用户行为可以是购前搜索浏览行为、购中货比三家行为、购后浏览售后行为等等。
[0040]
s120、基于预设豁免因素从候选过滤物品中筛选出目标过滤物品,其中,预设豁免因素包括待推送用户的复获周期和/或第一用户行为,复获周期是获取同种物品的时间间隔周期。
[0041]
其中,虽然候选过滤物品是与已获取物品相同或是相似的物品,但是,其也有可能是待推送用户需要再次获取的物品,比如,采销用户在获取到某手机后可能存在再次获取其余手机的需求,而普通用户在获取某手机后并不存在再次获取其余手机的需求;再比如,某用户在获取到洗发水后,其可能在某时间段后需要再次获取洗发水。因此,如果将待推送物品中除候选过滤物品以外的待推送物品的物品信息推送给待推送用户,这就存在“获取后不再推送”的问题,其依然会对用户获取体验和物品点击率产生较大影响。
[0042]
为了解决这一问题,可以基于预设豁免因素从候选过滤物品中筛选出目标过滤物品,该目标过滤物品是需要从待推送物品中过滤掉的待推送用户无需再次获取的物品。其中,预设豁免因素可以是待推送用户的第一用户行为,如搜索行为、点击行为、待获取行为等等。预设豁免因素还可以是待推送用户的复获周期,该复获周期是获取同种物品的时间间隔周期,该物品可以是物品库中的任一物品,即待推送用户从获取到某种类的物品到下次再次获取到该种类的物品的时间间隔周期。另外,由于物品的种类可以通过物品的核心物品词进行表示,因此,复获周期还可以理解为两次获取到具有同一核心物品词的物品的时间间隔周期,如待推送用户从上一次获取到核心物品词为a的物品到下一次获取到核心
物品词为a的物品的时间间隔周期,如1个星期、1个月等等。不同种类的物品的复获周期可能相同也可能不同,不同的待推送用户对同一种类的物品的复获周期可能相同也可能不同,在此未做具体限定。
[0043]
上述步骤设置的好处在于,可以基于待推送用户的个性化需求判断候选过滤物品是否为待推送用户需要再次获取的物品,这种针对待推送用户的个性化需求进行针对性过滤的方式,解决了“获取后不再推送”的问题,可以在提升用户获取体验的同时,增加了电子商务平台的物品点击率和物品转化率。特别地,当基于第一用户行为和复获周期对候选过滤物品共同进行筛选时,在较大程度上保证了豁免结果的精准性和全面性。
[0044]
s130、将待推送物品中除目标过滤物品以外的待推送物品的物品信息,推送给待推送用户。
[0045]
其中,待推送物品中除目标过滤物品以外的待推送物品是需要推送给待推送用户的符合其兴趣的物品,将这些物品的物品信息推送给待推送用户,该物品信息可以通过多种形式进行呈现,如属性信息、图像信息、视频信息、文字信息等等,该物品信息可以通过多种方式进行推送,如链接推送、二维码推送、视频推送、文字推送等等。
[0046]
本发明实施例的技术方案,通过获取待推送用户的待推送物品和已获取物品,可以根据待推送物品和已获取物品的相似度,从待推送物品中筛选出候选过滤物品;考虑到候选过滤物品可能是待推送用户无需再次获取的物品,也可能是待推送用户需要再次获取的物品,可以基于预设豁免因素从候选过滤物品中筛选出待推送用户无需再次获取的目标过滤物品;将待推送物品中除目标过滤物品以外的待推送物品的物品信息推送给待推送用户。上述技术方案,基于待推送物品和已获取物品间的相似度从待推送物品中筛选出候选过滤物品,解决了“获取后继续推送”的问题,并且基于待推送用户的个性化需求从候选过滤物品中筛选出目标过滤物品,解决了“获取后不再推送”的问题,“过滤”和“豁免”两阶段的有效配合,在较大程度上提高了物品信息推送的精确度,进而提升了用户获取体验且增加了物品点击率。
[0047]
实施例二
[0048]
图2是本发明实施例二中提供的一种物品信息推送方法的流程图。本实施例以上述各技术方案为基础进行优化。在本实施例中,可选的,在预设豁免因素是第一用户行为时,基于预设豁免因素从候选过滤物品中筛选出目标过滤物品,具体可以包括:获取已获取物品的已获取物品词和候选过滤物品的候选物品词,根据第一用户行为从已获取物品词中筛选出豁免物品词;将候选物品词中除豁免物品词以外的候选物品词作为目标物品词,并将目标物品词对应的候选过滤物品作为目标过滤物品。其中,与上述各实施例相同或相应的术语的解释在此不再赘述。参见图2,本实施例的方法具体可以包括如下步骤:
[0049]
s210、获取待推送用户的待推送物品和已获取物品,根据待推送物品和已获取物品的相似度,从待推送物品中筛选出候选过滤物品。
[0050]
s220、获取已获取物品的已获取物品词和候选过滤物品的候选物品词,根据第一用户行为从已获取物品词中筛选出豁免物品词。
[0051]
其中,已获取物品词是已获取物品的核心物品词,候选物品词是候选过滤物品的核心物品词,豁免物品词是根据第一用户行为从已获取物品词中筛选出的核心物品词,其对应的物品是可以继续推送给待推送用户的物品。示例性的,以上文所述的表2为例,表2中
的物品均是已获取物品,它们的已获取物品词分别是[淡奶油、打蛋器、刮刀],则豁免物品词可以是来源于[淡奶油、打蛋器、刮刀]中的至少一个。当然,豁免物品词的数量也可能是0,即根据第一用户行为从已获取物品词中未筛选出豁免物品词。
[0052]
在此基础上,可选的,在根据第一用户行为从已获取物品词中筛选出豁免物品词时,可以基于不同的预设豁免策略筛选出不同的豁免物品词,该预设豁免策略可以基于第一用户行为预先设定。示例性的,可以获取待推送用户的搜索浏览行为,该搜索浏览行为是待推送用户进行搜送后对搜索结果进行浏览的行为,其中,搜索后对某搜索结果进行浏览的行为可以作为一次搜索浏览行为,搜索后对多个搜索结果进行浏览的行为也可以作为一次搜索浏览行为,等等,在此未做具体限定。由此,若搜索浏览行为的执行次数超过预设次数阈值,则可以将这样的搜索浏览行为对应的已获取物品词作为豁免物品词,比如,将这样的搜索浏览行为中的搜索词对应的已获取物品词作为豁免物品词。
[0053]
s230、将候选物品词中除豁免物品词以外的候选物品词作为目标物品词,并将目标物品词对应的候选过滤物品作为目标过滤物品。
[0054]
其中,考虑到豁免物品词是可以豁免的无需过滤的核心物品词,因此,可以将候选物品词中除豁免物品词以外的候选物品词作为目标物品词,并将目标物品词对应的候选过滤物品作为目标过滤物品。
[0055]
s240、将待推送物品中除目标过滤物品以外的待推送物品的物品信息,推送给待推送用户。
[0056]
本发明实施例的技术方案,通过第一用户行为从已获取物品词中筛选出豁免物品词,并对候选物品词中除豁免物品词以外的候选物品词对应的候选过滤物品作为目标过滤物品,由于第一用户行为可以呈现出待推送用户的个性化需求,这种基于个性化需求对候选物品词进行豁免的方式,避免了“获取后不再推送”的现象的出现,由此提升了用户获取体验和物品点击率。
[0057]
为了更好地理解上述步骤的具体实现过程,下面继续结合具体示例,对本实施例的目标过滤物品的筛选过程进行示例性的说明。示例性的,第一用户行为可以是待推送用户在近段时间的购前行为,如搜索行为、浏览行为、加购行为、搜索浏览行为、浏览加购行为等等,该第一用户行为可以呈现出待推送用户在近段时间的兴趣所在。以第一用户行为是搜索浏览行为为例,假设待推送用户在近1天内以某搜索词进行搜索、并对该搜索词下对应的至少三个商品进行点击浏览,则认为待推送用户对该搜索词感兴趣,可以将各个已获取物品词中与该搜索词一致的已获取物品词作为豁免物品词。具体的,以表2为例,若待推送用户近期购买的已获取物品的编号为[5615776、3369356、2856105],它们对应的已获取物品词分别是[淡奶油、打蛋器、刮刀]。待推送用户在近1天内通过搜索词“安佳淡奶油”进行了搜索,并对搜索词下对应的商品点击浏览的次数超过三次,那么可以将“淡奶油”作为豁免物品词,并将“打蛋器”和“刮刀”对应的候选过滤物品作为目标过滤物品。
[0058]
实施例三
[0059]
图3是本发明实施例三中提供的一种物品信息推送方法的流程图。本实施例以上述各技术方案为基础进行优化。在本实施例中,可选的,在预设豁免因素是待推送用户的复获周期时,基于预设豁免因素从候选过滤物品中筛选出目标过滤物品,具体可包括:获取待推送用户对候选过滤物品的候选物品词的复获周期;根据与候选物品词对应的候选过滤物
品的待推送时间和已获取物品的已获取时间、以及复获周期,确定与候选物品词对应的候选过滤物品是否为目标过滤物品。其中,与上述各实施例相同或相应的术语的解释在此不再赘述。
[0060]
参见图3,本实施例的方法具体可以包括如下步骤:
[0061]
s310、获取待推送用户的待推送物品和已获取物品,根据待推送物品和已获取物品的相似度,从待推送物品中筛选出候选过滤物品。
[0062]
s320、获取待推送用户对候选过滤物品的候选物品词的复获周期,其中,复获周期是获取同种物品的时间间隔周期。
[0063]
其中,由于待推送用户对物品库中各种类物品的复获周期已预先计算得到,即待推送用户对各核心物品词的复获周期已预先计算得到,因此,从中可以获取待推送用户对候选过滤物品的候选物品词的复获周期,不同的候选物品词的复获周期可能相同也可能不同,如,待推送用户对“洗发水”的复获周期可以是1个月,而对“啤酒”和“烟草”的复获周期可以均是1星期。
[0064]
s330、根据与候选物品词对应的候选过滤物品的待推送时间和已获取物品的已获取时间、以及复获周期,确定与候选物品词对应的候选过滤物品是否为目标过滤物品。
[0065]
其中,待推送时间是预将候选物品词对应的候选过滤物品推送给待推送用户的时间,已获取时间是获取到已获取物品的时间。在已获取物品的已获取物品词和候选过滤物品的候选物品词是同一核心物品词时,根据待推送时间、已获取时间和复获周期,可以确定出候选物品词对应的候选过滤物品是否为目标过滤物品,如在待推送时间和已获取时间的时间差大于等于复获周期时,这说明待推送用户可能需要再次获取与该已获取物品属于同一种类的物品,则候选物品词对应的候选过滤物品不是目标过滤物品;否则,候选物品词对应的候选过滤物品是目标过滤物品。示例性的,假设待推送用户对“洗发水”复获周期是63天,已获取物品包括a品牌的洗发水,其已获取时间是1月1日,候选过滤物品包括b品牌的洗发水,其待推送日期是5月1日,两者之差超过63天,因此,“洗发水”对应的b品牌的洗发水不是目标过滤物品。
[0066]
s340、将待推送物品中除目标过滤物品以外的待推送物品的物品信息,推送给待推送用户。
[0067]
本发明实施例的技术方案,通过待推送用户对候选过滤物品的候选物品词的复获周期、与候选物品词对应的候选过滤物品的待推送时间和已获取物品的已获取时间,在已获取物品词和候选物品词是同一核心物品词时,根据待推送时间和已获取时间之间的时间差是否超过复获周期,可以确定出候选过滤物品是否为目标过滤物品,由于豁免周期可以呈现出待推送用户的个性化需求,这种基于个性化需求对候选物品词进行豁免的方式,避免了“获取后不再推送”的现象的出现,提升了用户获取体验和物品点击率。
[0068]
在此基础上,一种可选的技术方案,电子商务平台通常涉及到多个用户,考虑到单个用户的获取前、获取中和获取后的行为较为稀疏,无法覆盖电子商务平台或是说物品库中的各个种类物品,如某用户在某电子商务平台上只浏览过电子产品,那么就无从得知该用户对服饰箱包等等其它种类物品的喜好程度。为了得到每个用户对各种类物品/各核心物品词的喜好程度,可以对各个用户进行聚类得到用户簇,该用户簇中的每个用户彼此相似;进一步,以用户簇为单位,获取用户簇中每个用户的已获得物品的物品获得时间和已获
得物品词,其中,已获得物品是用户已经获得的物品,物品获得时间是用户获得已获得物品的时间,已获得物品词是已获得物品的核心物品词;根据物品获得时间和已获得物品词,可以分别得到用户簇中每个用户对各种类物品的复获时间。需要说明的是,由于用户簇中各用户的用户行为共享,因此,用户簇中不同用户对同种物品的复获时间是相同的。那么,待推送用户对候选过滤物品的候选物品词的复获周期,即为待推送用户所在的用户簇中各用户对该候选物品词的复获周期,其可以根据该用户簇中各用户对已获得物品词是候选物品词的已获得物品的物品获得时间计算得到。这样设置的好处在于,这既能考虑到每个用户的个性化需求,又能通过相似用户的信息互补计算出每个用户对电子商务平台内全部核心物品词的复获周期,提高了复获周期的覆盖面。
[0069]
需要说明的是,本发明实施例二和实施例三从不同角度阐述了基于预设豁免因素从候选过滤物品中筛选出目标过滤物品的具体实现方式。在实际应用中,可以基于其中的任一种方式筛选目标过滤物品,也可以将两种方式筛选出的目标过滤物品取并集,得到最终的目标过滤物品,在此未做具体限定。
[0070]
为了更好地理解上述步骤的具体实现过程,下面结合具体示例,对本实施例的复获周期的计算过程进行示例性的说明。示例性的,获取电子商务平台上各用户的用户画像,该用户画像可以是用户的性别、年龄、学历、婚姻状况等等各种用户信息。由于用户画像均为离散信息,可以将从用户画像中提取出的用户特征进行向量化,得到用户向量。以表3为例,第一列为某用户的用户画像,第二列为特征离散依据,第三列为特征离散依据的特征离散值,由此,该用户的用户向量为[1,2,1,0]。
[0071]
表3用户画像的向量化
[0072][0073][0074]
进一步,基于笛卡尔积、近邻搜索技术如annoy、faiss、kd-tree等等计算任意两个用户的用户向量间的用户向量距离;根据用户向量距离和预设距离阈值间的数值关系,可以判断出这两个用户是否为相似用户,该用户向量距离可以是欧氏距离、余弦距离等。可选的,以欧式距离为例,假设用户a的用户向量为[x1,x2,x3,x4],用户b的用户向量为[y1,y2,y3,y4],那么,即为这两个用户之间的用户向量距离,假设预设距离阈值为0.8,则当用户向量距离大于0.8时,用户a和用户b是相似用户,否则二者不是相似用户。
[0075]
进一步,将相似用户通过聚类算法聚合为一个用户簇,该聚类算法可以是k-means聚类算法、连通子图聚类算法等等,该用户簇中全部用户的用户行为共享,由此实现了用户信息互补。以连通子图聚类算法为例,其以用户为节点,基于用户向量距离建立任意两个用户之间的边,若两个用户之间存在相似关系,则认为这两个节点之间存在一条无向边,由此
得到构图;基于连通子图聚类算法识别连通子图,并将同属于同一个连通子图的用户归为一个用户簇。
[0076]
再进一步,为每个用户簇的全部核心物品词统计复获周期,每一个用户簇中各个用户均共享用户簇中每个核心物品词的复获周期。以某个用户簇为例,基于用户簇中全部用户的已获得物品的物品获得时间和已获得物品词,计算出各个核心物品词的个性化的复获周期。具体的,针对某用户簇,从电子商务平台获取到用户簇中全部用户的近期的已获得物品的已获得物品词和物品获得时间;计算用户簇中每个用户在每个已获得物品词下的平均复获周期,进而根据每个用户在每个已获得物品词下的平均复获周期计算每个已获得物品词下全部用户的平均复获周期,并将每个已获得物品词下全部用户的平均复获周期作为该用户簇下该已获得物品词的复获周期。
[0077]
需要说明的是,如果有些已获得物品词只出现在用户簇中的部分用户,则在计算用户簇对该已获得物品词的复获周期时,只对该部分用户对该已获得物品词的平均复获周期进行计算。例如,某用户簇仅包括用户a和用户b,用户a的已获得物品词和物品获得时间为[洗头水:2020-01-19,洗面奶:2020-01-9,洗头水:2020-03-19],用户b的已获得物品词和物品获得时间为[洗头水:2019-07-12,洗面奶:2019-08-15,洗头水:2019-08-15,洗面奶:2019-09-15],那么,用户a对各已获得物品词的复获周期为:洗头水:60天,洗面奶:0天;用户b对各已获得物品词的复获周期为:洗头水:63天,洗面奶:30天。由于用户a和用户b都再次获得过洗头水,且只有用户b再次获得过洗面奶,因此,在计算用户簇对“洗面奶”的复获周期时不涉及到用户a,这样一来,该用户簇对各已获得物品词的复获周期为:洗头水:61.5天,洗面奶:30天。
[0078]
实施例四
[0079]
图4是本发明实施例四中提供的一种物品信息推送方法的流程图。本实施例以上述各技术方案为基础进行优化。在本实施例中,可选的,根据待推送物品和已获取物品的相似度,从待推送物品中筛选出候选过滤物品,具体可以包括:获取已获取物品的已获取物品词的相似物品词集合,基于相似物品词集合,对已获取物品词进行扩展,得到已扩展物品词;获取待推送物品的待推送物品词,将隶属于已扩展物品词中的待推送物品词对应的待推送物品作为候选过滤物品。其中,与上述各实施例相同或相应的术语的解释在此不再赘述。
[0080]
参见图4,本实施例的方法具体可以包括如下步骤:
[0081]
s410、获取待推送用户的待推送物品和已获取物品,以及已获取物品的已获取物品词的相似物品词集合,并基于相似物品词集合,对已获取物品词进行扩展,得到已扩展物品词。
[0082]
其中,已获取物品词的相似物品词集合包括至少一个相似物品词,该相似物品词是与已获取物品词较为相似的核心物品词,该相似物品词对应的物品很可能是待推送用户已经获取过同种类别的物品。相似物品词集合可以基于物品语义计算得到,可以基于第三用户行为计算得到;还可以基于物品语义和第三用户行为分别计算得到,并将二者的计算结果取并集作为最终的相似物品词集合,这样设置的好处在于,即可以充分对比物品库中全部物品之间的关联性,又可以充分考虑到待推送用户的第三用户行为,由此提高了对相似或是相同的物品进行识别时的准确性和全面性,进而提高了物品过滤的精确性。
[0083]
在获取到某已获取物品词的相似物品词集合后,可以基于该相似物品词集合对该已获取物品词进行扩展来得到已扩展物品词,该已扩展物品词有可能是已获取物品词,也有可能是相似物品词,这有助于提高后续候选过滤物品的筛选精度。示例性的,比如已获取物品词是[淡奶油、打蛋器、刮刀],其中,“淡奶油”和“打蛋器”未存在相似物品词集合,“刮刀”的相似物品词集合是[刀片,刮刀,玻璃刮,抹刀,铲刀,玻璃刷],则已扩展物品词是[淡奶油、打蛋器、刮刀、刀片、玻璃刮、抹刀、铲刀、玻璃刷]。
[0084]
在此基础上,可选的,考虑到电子商务平台上的各用户的获取行为较为稀疏,这难以全面覆盖物品库中数以亿计的物品种类,由此,可以考虑将已获取物品词的复获周期扩展到其相似物品词上,比如,待推送用户对“洗发水”的复获周期是61.5天,“洗发水”的相似物品词包括“洗头水”和“护发素”,那么,“洗头水”和“护发素”的复获周期也是61.5天,由此增加了复获周期在物品库中的覆盖率,且为冷启动的待推送用户提供了较为完整的先验知识。
[0085]
s420、获取待推送物品的待推送物品词,将隶属于已扩展物品词中的待推送物品词对应的待推送物品作为候选过滤物品。
[0086]
其中,待推送物品词是待推送物品的核心物品词,若某待推送物品词是已扩展物品词中的一个,这说明待推送物品词对应的待推送物品是待推送用户已经获取过同种类别的物品,这样的待推送物品的物品信息可能无需再次推送给待推送用户,因此,可以将这样的待推送物品作为候选过滤物品。
[0087]
s430、基于预设豁免因素从候选过滤物品中筛选出目标过滤物品,其中,预设豁免因素包括待推送用户的复获周期和/或第一用户行为,复获周期是获取同种已获取物品的时间间隔周期。
[0088]
s440、将待推送物品中除目标过滤物品以外的待推送物品的物品信息,推送给待推送用户。
[0089]
本发明实施例的技术方案,通过已获取物品的已获取物品词的相似物品词集合对已获取物品词进行扩展,得到已扩展物品词,该已扩展物品词中的每个核心物品词对应的物品很可能是待推送用户已经获取过同种类别的物品;由此,可以将隶属于已扩展物品词中的待推送物品词对应的待推送物品作为候选过滤物品,由此提高了候选过滤物品的筛选精度。
[0090]
一种可选的技术方案,以第三用户行为是浏览行为为例,获取已获取物品的已获取物品词的相似物品词集合,具体可以包括:获取各用户在预设时间区间内的已浏览物品集合的已浏览物品词集合,基于预设频繁项挖掘算法从各已浏览物品词集合中筛选出频繁物品词集合;将频繁物品词集合作为频繁物品词集合中任一频繁物品词的相似物品词集合,并根据频繁物品词的相似物品词集合,得到已获取物品的已获取物品词的相似物品词集合。
[0091]
其中,已浏览物品集合是电子商务平台上的各个用户在预设时间区间内已经浏览完成的各已浏览物品的集合,该已浏览物品集合中的已浏览物品的数量可以是一个、两个或是多个。已浏览物品词集合是各已浏览物品的核心物品词的集合,其可以呈现出各用户在预设时间期间内的兴趣所在,且用户在预设时间区间内浏览的各已浏览物品物品通常存在相似性。因此,可以基于预设频繁项挖掘算法从各已浏览物品词集合中挖掘出频繁出现
的、经常一起出现的频繁物品词集合,该预设频繁项挖掘算法可以是apriori算法、fpgrowth算法等等,该频繁物品词集合是各已浏览物品词集合中的一个或是多个,该频繁物品词集合中的频繁物品词的数量可以是至少一个。由于频繁物品词集合中的各频繁物品词间存在相似性,因此,可以将频繁物品词集合作为频繁物品词集合中任一频繁物品词的相似物品词集合。进一步,根据频繁物品词的相似物品词集合,可以得到已获取物品的已获取物品词的相似物品词集合,如某频繁物品词和某已获取物品词相一致,则该频繁物品词的相似物品词集合即为该已获取物品词的相似物品词集合。
[0092]
示例性的,假设各用户的浏览结果是[物品a:2020-01-19 15:31,物品b:2020-01-19 16:29,物品c:2020-01-19 18:59,物品d:2020-01-19 19:07],以3小时为间隔对浏览结果进行切分,由此得到的已浏览物品集合是[物品a,物品b]和[物品b,物品c,物品d]),而已浏览物品词集合是[核心物品词a,核心物品词b]和[核心物品词b,核心物品词c,核心物品词d]。基于预设频繁项挖掘算法认为[核心物品词a,核心物品词b]是频繁物品词集合,则[核心物品词a,核心物品词b]既是核心物品词a的相似物品词集合,也是核心物品词b的相似物品词集合。
[0093]
一种可选的技术方案,获取已获取物品的已获取物品词的相似物品词集合,具体可以包括:获取物品库中各物品的核心物品词,以及已获取物品的已获取物品词;将核心物品词输入至已训练完成的文字向量转换模型中,并根据文字向量转换模型的输出结果,得到核心物品词的分词向量;根据各分词向量间的距离,得到已获取物品词的相似物品词集合。
[0094]
其中,文字向量转换模型可以将核心物品词转换为分词向量,文字向量转换模型可以是word2vec模型,分词向量可以是固定维数的数组,数组中的每个数值均可以是[-1,1]之间的数值,以三维向量为例,“针织衫”的分量向量可以是[0.5,0.2,-0.1],“连帽衫”的分词向量可以是[-0.1,0.8,0.2]。进一步,基于笛卡尔积、近邻搜索技术比如annoy、faiss、kd-tree等等计算任意两个核心物品词的分词向量间的距离,以便根据各核心物品词的分词向量间的距离得到每个核心物品词的相似物品词集合,该距离可以是欧氏距离、余弦距离等等。进而,可以根据每个核心物品词的相似物品词集合,得到已获取物品词的相似物品词集合,即将与已获取物品词一致的核心物品词的相似物品词集合作为该已获取物品词的相似物品词集合。示例性的,若“洗头水”的分词向量和“洗发水”的分词向量间的余弦距离大于预设距离阈值,则可以认为二者互为彼此的相似物品词;若“洗头水”的分词向量和“牙膏”的分词向量间的余弦距离小于等于预设距离阈值,则可以认为二者不是彼此的相似物品词。以此类推,示例性的,“洗发水”的相似物品词集合可以是[洗发水,洗发露,护发素,洗发液,洗头膏,洗发乳,润发乳,护发乳,洗头水,护素]。
[0095]
在此基础上,可选的,文字向量转换模型可以通过如下步骤预先训练得到:对物品库中各物品的物品标题进行分词,得到分词结果;基于预设工具将分词结果转换为分词向量,该预设工具可以是无监督算法工具fasttext;将分词结果和相应的分词向量作为一组训练样本,基于多组训练样本对未经训练的文字向量转换模型进行训练,由此得到已训练完成的文字向量转换模型。基于文字向量转换模型预测核心物品词的分词向量的原因在于,有些核心物品词的分词向量是无法基于预设工具直接得到,只能通过文字向量转换模型进行预测。
[0096]
在此基础上,可选的,为了进一步提高相似物品词集合和待推送用户间的匹配度,在得到已获取物品词的相似物品词集合之后,上述物品信息推送方法,还可以包括:获取待推送用户的第二用户行为,基于第二用户行为对相似物品词集合进行过滤,并根据过滤结果更新相似物品词集合。其中,第二用户行为可以是搜索行为、点击行为、待获取行为、获取行为等等,示例性的,若已获取物品是已购买商品,那么,第二用户行为可以是搜索行为、点击行为、浏览行为、添加购物车行为、购买行为等等。基于待推送用户的第二用户行为,对相似物品词集合中的各相似物品词进行过滤,将与第二用户行为差距较大的相似物品词从相似物品词集合中过滤出去,由此得到过滤后的相似物品词集合,其既与已获取物品词较为相似、又与第二用户行为较为匹配。
[0097]
在此基础上,可选的,基于第二用户行为对相似物品词集合进行过滤,包括:基于第二用户行为确定已获取物品词的第一搜索词集合和相似物品词集合中各相似物品词的第二搜索词集合,对与第一搜索词集合未存在交集的第二搜索词集合对应的相似物品词进行过滤。其中,第一搜索词集合和第二搜索词集合可以通过如下步骤得到:获取待推送用户的搜索行为和作用于搜索结果上的点击行为,根据搜索行为得到搜索词且根据点击行为得到已点击物品的已点击物品词,该已点击物品词是已点击物品的核心物品词;考虑到待推送用户在预设时间区间内的已点击物品词和搜索词间存在相关关系,由此可以得到已点击物品词的搜索词集合;由此,将与已获取物品词相一致的已点击物品词的搜索词集合作为该已获取物品词的第一搜索词集合,且将与相似物品词相一致的已点击物品词的搜索词集合作为该相似物品词的第二搜索词集合。这样一来,若某相似物品词的第二搜索词集合与第一搜索词集合间未存在交集,这说明该相似物品词与第二用户行为的匹配度较低,可将其从相似物品词集合中过滤。
[0098]
为了更好地理解上述步骤的具体实现过程,下面结合具体示例对本实施例的对相似物品词集合进行过滤的具体实现过程进行示例性的说明。示例性的,假设搜索词是“清扬”时,已点击物品的物品标题分别是[清扬(clear)洗发水男士去屑洗发露清爽控油型500g(新老包装随机发)(氨基酸洗发)、清扬(clear)洗发露男士去屑型700g、清扬(clear)洗发精男士平衡控油活力运动型200g],它们的已点击物品词分别是[洗发水、洗发露、洗发精],这说明“清扬”和[洗发水、洗发露、洗发精]间存在相关关系,即洗发水->清扬、洗发露->清扬、洗发精->清扬。由于“洗发水”的相似物品词集合是[洗发水,洗发露,护发素,洗发液,洗头膏,洗发乳,润发乳,护发乳,洗头水,护素],且“洗发水”、“洗发露”、“洗发精”都对应着同一搜索词“清扬”,这意味第一搜索词集合中存在“清扬”,且“洗发露”和“洗发精”的各自的第二搜索词集合中也存在“清扬”,因此,“洗发水”、“洗发露”和“洗发精”互为相似关系,“洗发水”的相似物品词集合中可以保留“洗发露”和“洗发精”。类似的,其余的相似物品词还需要确定其对应的第二搜索词集合是否与第一搜索词集合间存在交集,由此实现了“洗发水”的相似物品词集合的筛选过程,得到了“洗发水”的更为精准的相似物品词集合。
[0099]
需要说明的是,本发明各实施例所述的“第一用户行为”、“第二用户行为”以及“第三用户行为”中的“第一”、“第二”以及“第三”仅仅是用于区分各个用户行为,并非是对各用户行为的内容的限定。
[0100]
实施例五
[0101]
图5为本发明实施例五提供的物品信息推送装置的结构框图,该装置用于执行上
述任意实施例所提供的物品信息推送方法。该装置与上述各实施例的物品信息推送方法属于同一个发明构思,在物品信息推送装置的实施例中未详尽描述的细节内容,可以参考上述物品信息推送方法的实施例。参见图5,该装置具体可包括:候选过滤物品筛选模块510、目标过滤物品筛选模块520和物品信息推送模块530。
[0102]
其中,候选过滤物品筛选模块510,用于获取待推送用户的待推送物品和已获取物品,根据待推送物品和已获取物品的相似度,从待推送物品中筛选出候选过滤物品;
[0103]
目标过滤物品筛选模块520,用于基于预设豁免因素从候选过滤物品中筛选出目标过滤物品,其中,预设豁免因素包括待推送用户的复获周期和/或第一用户行为,复获周期是获取同种物品的时间间隔周期;
[0104]
物品信息推送模块530,用于将待推送物品中除目标过滤物品以外的待推送物品的物品信息,推送给待推送用户。
[0105]
可选的,目标过滤物品筛选模块520,具体可以包括:
[0106]
豁免物品词删选单元,用于获取已获取物品的已获取物品词和候选过滤物品的候选物品词,根据第一用户行为从已获取物品词中筛选出豁免物品词;
[0107]
目标过滤物品得到单元,用于将候选物品词中除豁免物品词以外的候选物品词作为目标物品词,并将目标物品词对应的候选过滤物品作为目标过滤物品。
[0108]
可选的,豁免物品词删选单元,具体可以用于:
[0109]
获取待推送用户的搜索浏览行为,将执行次数超过预设次数阈值的搜索浏览行为对应的已获取物品词作为豁免物品词。
[0110]
可选的,目标过滤物品筛选模块520,具体可以包括:
[0111]
复获周期获取单元,用于获取待推送用户对候选过滤物品的候选物品词的复获周期;
[0112]
目标过滤物品筛选单元,用于根据与候选物品词对应的候选过滤物品的待推送时间和已获取物品的已获取时间、以及复获周期,确定与候选物品词对应的候选过滤物品是否为目标过滤物品。
[0113]
可选的,复获周期获取单元,具体可以用于:
[0114]
获取待推送用户所在的用户簇中各用户的已获得物品的物品获得时间和已获得物品词,以及候选过滤物品的候选物品词;
[0115]
根据已获得物品词是候选物品词的已获得物品的物品获得时间,确定待推送用户对候选物品词的复获周期。
[0116]
可选的,候选过滤物品筛选模块510,具体可以包括:
[0117]
已扩展物品词得到单元,用于获取已获取物品的已获取物品词的相似物品词集合,基于相似物品词集合,对已获取物品词进行扩展,得到已扩展物品词;
[0118]
候选过滤物品筛选单元,用于获取待推送物品的待推送物品词,将隶属于已扩展物品词中的待推送物品词对应的待推送物品作为候选过滤物品。
[0119]
可选的,已扩展物品词得到单元,具体可以包括:
[0120]
已获取物品词获取子单元,用于获取物品库中各物品的核心物品词,以及已获取物品的已获取物品词;
[0121]
分词向量得到子单元,用于将核心物品词输入至已训练完成的文字向量转换模型
中,并根据文字向量转换模型的输出结果,得到核心物品词的分词向量;
[0122]
第一相似物品词集合得到子单元,用于根据各分词向量间的距离,得到已获取物品词的相似物品词集合。
[0123]
可选的,在上述装置的基础上,该装置还可包括:
[0124]
相似物品词集合过滤模块,用于获取待推送用户的第二用户行为,基于第二用户行为对相似物品词集合进行过滤,并根据过滤结果更新相似物品词集合。
[0125]
可选的,相似物品词集合过滤模块,具体可以包括:
[0126]
相似物品词集合过滤单元,用于基于第二用户行为确定已获取物品词的第一搜索词集合和相似物品词集合中各相似物品词的第二搜索词集合,对与第一搜索词集合未存在交集的第二搜索词集合对应的相似物品词进行过滤。
[0127]
可选的,已扩展物品词得到单元,具体可以包括:
[0128]
频繁物品词集合挖掘子单元,用于获取各用户在预设时间区间内的已浏览物品集合的已浏览物品词集合,基于预设频繁项挖掘算法从各已浏览物品词集合中筛选出频繁物品词集合;
[0129]
第二相似物品词集合得到子单元,用于将频繁物品词集合作为频繁物品词集合中任一频繁物品词的相似物品词集合,并根据频繁物品词的相似物品词集合,得到已获取物品的已获取物品词的相似物品词集合。
[0130]
本发明实施例五提供的物品信息推送装置,通过候选过滤物品筛选模块获取待推送用户的待推送物品和已获取物品,可以根据待推送物品和已获取物品的相似度,从待推送物品中筛选出候选过滤物品;目标过滤物品筛选模块考虑到候选过滤物品可能是待推送用户无需再次获取的物品,也可能是待推送用户需要再次获取的物品,可以基于预设豁免因素从候选过滤物品中筛选出待推送用户无需再次获取的目标过滤物品;物品信息推送模块将待推送物品中除目标过滤物品以外的待推送物品的物品信息推送给待推送用户。上述装置,基于待推送物品和已获取物品间的相似度从待推送物品中筛选出候选过滤物品,解决了“获取后继续推送”的问题,并且基于待推送用户的个性化需求从候选过滤物品中筛选出目标过滤物品,解决了“获取后不再推送”的问题,“过滤”和“豁免”两阶段的有效配合,在较大程度上提高了物品信息推送的精确度,进而提升了用户获取体验且增加了物品点击率。
[0131]
本发明实施例所提供的物品信息推送装置可执行本发明任意实施例所提供的物品信息推送方法,具备执行方法相应的功能模块和有益效果。
[0132]
值得注意的是,上述物品信息推送装置的实施例中,所包括的各个单元和模块只是按照功能逻辑进行划分的,但并不局限于上述的划分,只要能够实现相应的功能即可;另外,各功能单元的具体名称也只是为了便于相互区分,并不用于限制本发明的保护范围。
[0133]
实施例六
[0134]
图6为本发明实施例六提供的一种设备的结构示意图,如图6所示,该设备包括存储器610、处理器620、输入装置630和输出装置640。设备中的处理器620的数量可以是一个或多个,图6中以一个处理器620为例;设备中的存储器610、处理器620、输入装置630和输出装置640可以通过总线或其它方式连接,图6中以通过总线650连接为例。
[0135]
存储器610作为一种计算机可读存储介质,可用于存储软件程序、计算机可执行程
序以及模块,如本发明实施例中的物品信息推送方法对应的程序指令/模块(例如,物品信息推送装置中的候选过滤物品筛选模块510、目标过滤物品筛选模块520和物品信息推送模块530)。处理器620通过运行存储在存储器610中的软件程序、指令以及模块,从而执行设备的各种功能应用以及数据处理,即实现上述的物品信息推送方法。
[0136]
存储器610可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序;存储数据区可存储根据设备的使用所创建的数据等。此外,存储器610可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他非易失性固态存储器件。在一些实例中,存储器610可进一步包括相对于处理器620远程设置的存储器,这些远程存储器可以通过网络连接至设备。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
[0137]
输入装置630可用于接收输入的数字或字符信息,以及产生与装置的用户设置以及功能控制有关的键信号输入。输出装置640可包括显示屏等显示设备。
[0138]
实施例七
[0139]
本发明实施例七提供一种包含计算机可执行指令的存储介质,所述计算机可执行指令在由计算机处理器执行时用于执行一种物品信息推送方法,该方法包括:
[0140]
获取待推送用户的待推送物品和已获取物品,根据待推送物品和已获取物品的相似度,从待推送物品中筛选出候选过滤物品;
[0141]
基于预设豁免因素从候选过滤物品中筛选出目标过滤物品,其中,预设豁免因素包括待推送用户的复获周期和/或第一用户行为,复获周期是获取同种物品的时间间隔周期;
[0142]
将待推送物品中除目标过滤物品以外的待推送物品的物品信息,推送给待推送用户。
[0143]
当然,本发明实施例所提供的一种包含计算机可执行指令的存储介质,其计算机可执行指令不限于如上所述的方法操作,还可以执行本发明任意实施例所提供的物品信息推送方法中的相关操作。
[0144]
通过以上关于实施方式的描述,所属领域的技术人员可以清楚地了解到,本发明可借助软件及必需的通用硬件来实现,当然也可以通过硬件实现,但很多情况下前者是更佳的实施方式。依据这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如计算机的软盘、只读存储器(read-only memory,rom)、随机存取存储器(random access memory,ram)、闪存(flash)、硬盘或光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述的方法。
[0145]
注意,上述仅为本发明的较佳实施例及所运用技术原理。本领域技术人员会理解,本发明不限于这里所述的特定实施例,对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本发明的保护范围。因此,虽然通过以上实施例对本发明进行了较为详细的说明,但是本发明不仅仅限于以上实施例,在不脱离本发明构思的情况下,还可以包括更多其他等效实施例,而本发明的范围由所附的权利要求范围决定。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献