一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

基于标签向量化的商品推荐方法及装置与流程

2022-02-24 17:19:07 来源:中国专利 TAG:


1.本发明涉及文本分类技术领域,具体涉及一种基于标签向量化的商品推荐方法及装置。


背景技术:

2.现有对商品进行推荐的方法一般采用如下方式:
3.1、通过收集用户对不同类商品的评价信息,然后根据用户评价信息对不同类商品进行画像分析处理,再根据用户交易记录和社交信息对不同用户进行画像分析处理,然后将不同类商品的画像匹配不同用户的画像,为用户推荐商品。
4.2、根据所有商品信息建立商品模型,形成商品向量,再根据用户购买记录获取已购买商品信息,通过已购买商品和商品模型中的商品属性计算用户的偏好向量,从用户尚未购买的商品中,基于商品向量与偏好向量接近程度向用户推荐商品。
5.3、通过用户的行为记录(浏览、下单、收藏、支付和加入购物车等)来对用户进行画像;根据用户和商品的关系生成用户对商品的评分,然后根据协同过滤生成一个用户对商品的评分矩阵;结合用户画像和用户对商品的评分矩阵生成推荐数据。
6.但以上对商品进行推荐时,存在以下问题:
7.1、根据用户对商品的评价信息、购买记录、行为记录等来匹配商品需求,使得必须要求用户曾在平台购买过商品或产生评价,或者有浏览、下单等行为,对新上线的商品或新注册的用户无法识别匹配;
8.2、只能对平台用户进行识别匹配推荐商品,对未注册的用户及未在平台购买过商品的用户不能识别,无法挖掘潜在客户需求,技术功能单一,经济效益较低。


技术实现要素:

9.鉴于上述问题,提出了本发明以便提供一种克服上述问题或者至少部分地解决上述问题的基于标签向量化的商品推荐方法及装置。
10.根据本发明的一个方面,提供了一种基于标签向量化的商品推荐方法,其包括:
11.对待投放的商品推荐文本进行向量化处理,得到待投放的商品推荐文本向量;
12.获取与待投放的商品推荐文本向量相似的历史商品推荐文本向量,并获取历史商品推荐文本向量的历史商品投放用户标签以及历史投放用户响应信息;
13.将待投放的商品推荐文本向量以及历史投放用户响应信息输入至训练得到的深度神经网络中,得到待投放的商品投放用户标签;
14.将历史商品投放用户标签与待投放的商品投放用户标签按照权重进行排序处理,并根据排序结果确定待投放的商品对应的用户。
15.根据本发明的另一方面,提供了一种基于标签向量化的商品推荐装置,其包括:
16.向量化模块,适于对待投放的商品推荐文本进行向量化处理,得到待投放的商品推荐文本向量;
17.获取模块,适于获取与待投放的商品推荐文本向量相似的历史商品推荐文本向量,并获取历史商品推荐文本向量的历史商品投放用户标签以及历史投放用户响应信息;
18.标签模块,适于将待投放的商品推荐文本向量以及历史投放用户响应信息输入至训练得到的深度神经网络中,得到待投放的商品投放用户标签;
19.排序模块,适于将历史商品投放用户标签与待投放的商品投放用户标签按照权重进行排序处理,并根据排序结果确定待投放的商品对应的用户。
20.根据本发明的又一方面,提供了一种电子设备,包括:处理器、存储器、通信接口和通信总线,所述处理器、所述存储器和所述通信接口通过所述通信总线完成相互间的通信;
21.所述存储器用于存放至少一可执行指令,所述可执行指令使所述处理器执行上述基于标签向量化的商品推荐方法对应的操作。
22.根据本发明的再一方面,提供了一种计算机存储介质,所述存储介质中存储有至少一可执行指令,所述可执行指令使处理器执行如上述基于标签向量化的商品推荐方法对应的操作。
23.根据本发明的基于标签向量化的商品推荐方法及装置,对待投放的商品推荐文本进行向量化处理,得到待投放的商品推荐文本向量;获取与待投放的商品推荐文本向量相似的历史商品推荐文本向量,并获取历史商品推荐文本向量的历史商品投放用户标签以及历史投放用户响应信息;将待投放的商品推荐文本向量以及历史投放用户响应信息输入至训练得到的深度神经网络中,得到待投放的商品投放用户标签;将历史商品投放用户标签与待投放的商品投放用户标签按照权重进行排序处理,并根据排序结果确定待投放的商品对应的用户。通过待投放的商品推荐文本本身以及与待投放的商品推荐文本向量相似的历史商品推荐文本向量,基于历史商品、历史商品投放用户等信息得到待投放商品对应的用户,无需用户必须具备对商品的历史行为、也无需商品必须具备被投放的历史数据等,从而解决用户或商品冷启动问题。
24.上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,而可依照说明书的内容予以实施,并且为了让本发明的上述和其它目的、特征和优点能够更明显易懂,以下特举本发明的具体实施方式。
附图说明
25.通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本发明的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:
26.图1示出了根据本发明一个实施例的基于标签向量化的商品推荐方法的流程图;
27.图2示出了根据本发明一个实施例的基于标签向量化的商品推荐装置的功能框图;
28.图3示出了根据本发明一个实施例的一种电子设备的结构示意图。
具体实施方式
29.下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例
所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。
30.图1示出了根据本发明一个实施例的基于标签向量化的商品推荐方法的流程图。如图1所示,基于标签向量化的商品推荐方法具体包括如下步骤:
31.步骤s101,对待投放的商品推荐文本进行向量化处理,得到待投放的商品推荐文本向量。
32.对于待投放的商品推荐文本进行向量化处理时,可以利用bert网络进行向量化处理,得到待投放的商品推荐文本向量。
33.bert网络可以采用如seq2seq序列模式和attention机制来对待投放的商品推荐文本进行向量化处理,依次读入待投放的商品推荐文本中的每个字,而无需对其进行分词,可以直接以待投放的商品推荐文本整体进行向量化处理,提高向量化处理的准确率。向量化处理过程可以不受待投放的商品推荐文本中可能包含的停用词、语气词等特殊词的影响,无需预先设置分词词典等,更准确高效。bert网络可以直接使用现有通用的语料库、维基百科语料等文本信息进行训练,使其可以适用于不同的商品推荐文本,也可以根据实际需求增加新的商品推荐文本等,通过积累分析历史商品推荐文本,来实现可持续优化bert网络的向量化处理准确度。
34.进一步,在对待投放的商品推荐文本进行向量化处理前,为保障待投放的商品推荐文本可以更好地匹配用户,可以先对待投放的商品推荐文本进行文本检查。文本检查可以根据具体实施情况设置,如文本检查包括使用的字词语句是否规范、是否符合推荐标准、是否包含非标准用语等,此处不做限定。
35.步骤s102,获取与待投放的商品推荐文本向量相似的历史商品推荐文本向量,并获取历史商品推荐文本向量的历史商品投放用户标签以及历史投放用户响应信息。
36.在得到待投放的商品推荐文本向量后,根据历史商品推荐文本向量,计算历史商品推荐文本向量与待投放的商品推荐文本向量间的向量距离。向量距离的计算可以采用如向量距离公式等方式计算,此处不做展开说明。根据向量距离确定历史商品推荐文本向量与待投放的商品推荐文本向量的相似度。其中,相似度与向量距离成反比。当向量距离越小时,说明相似度越高,向量距离越大时,相似度越低。获取相似度高于预设阈值的历史商品推荐文本向量,并同时获取历史商品推荐文本向量的历史商品投放用户标签以及历史投放用户响应信息。
37.其中,商品投放用户标签包括用户所属行业标签、用户行为标签、用户位置标签、时间标签等。商品投放用户标签可以借助运营商大数据,在用户授权许可的情况下获取用户的基本属性、消费习惯、商品偏好的信息,根据以上的用户信息,可以创建用户标签库,记录用户所属行业标签、用户行为标签、用户位置标签、时间标签等。在商品投放后,可以根据商品所投放的用户,记录商品投放用户标签。用户所属行业标签可以根据用户职业、用户喜好、用户兴趣等确定;用户行为标签可以根据用户对商品的浏览、点击、购买等行为确定;用户位置标签根据用户使用的移动设备获取对应的位置信息确定;时间标签可以根据用户使用移动设备对商品进行行为操作的时间来确定合适的时间进行商品投放,避免用户忽略投放商品,提高用户浏览商品的可能性,时间标签可以记录商品投放时间。历史投放用户响应信息为将商品投放给用户后,用户对投放的商品的响应信息。具体的,历史投放用户响应信
息包括了用户对投放的商品进行浏览、点击、购买等行为信息,如浏览时间、浏览停留时间、浏览频次、点击时间、购买时间、购买次数、购买数量等等。以上为举例说明,实施时可以根据具体实施情况,选取合适的商品投放用户标签和历史投放用户响应信息。
38.商品投放用户标签和历史投放用户响应信息为历史商品在投放后,借助运营商大数据,收集投放的用户的各种信息后,确定的商品投放用户标签和历史投放用户响应信息。
39.步骤s103,将待投放的商品推荐文本向量以及历史投放用户响应信息输入至训练得到的深度神经网络中,得到待投放的商品投放用户标签。
40.深度神经网络可以预先进行训练,深度神经网络的训练过程具体包括:先获取历史商品推荐文本,将历史商品推荐文本进行向量化处理,得到历史商品推荐文本向量。此处,在进行向量化处理时,可以利用bert网络进行向量化处理,得到历史商品推荐文本向量。然后将历史商品推荐文本向量以及收集到的历史投放用户响应信息作为样本数据,输入至待训练的深度神经网络中,根据历史商品投放用户标签来调整深度神经网络的训练参数,得到训练后的深度神经网络。
41.在得到训练后的深度神经网络后,将待投放的商品推荐文本向量以及历史投放用户响应信息输入至训练得到的深度神经网络中,可以得到待投放的商品投放用户标签。此处,根据与待投放的商品推荐文本向量相似的历史商品推荐文本向量的历史投放用户响应信息,考虑到待投放的商品推荐文本向量与历史商品推荐文本向量的相似度,来预测待投放的商品投放用户标签。
42.步骤s104,将历史商品投放用户标签与待投放的商品投放用户标签按照权重进行排序处理,并根据排序结果确定待投放的商品对应的用户。
43.在得到待投放的商品投放用户标签后,先根据历史商品推荐文本向量与待投放的商品推荐文本向量的相似度,结合历史商品投放用户标签中各个标签的权重,计算得到历史商品投放用户标签中各标签对应的权重。然后根据历史商品投放用户标签中各标签对应的权重和待投放的商品投放用户标签的权重进行排序处理,得到待投放的商品所对应的用户标签序列,从中可以确定待投放的商品对应的用户行业标签、用户行为标签、用户位置标签、时间标签等。根据待投放的商品所对应的用户标签序列中包含的以上标签,结合用户标签库可以从中确定待投放的商品对应的用户,从而可以将待投放的商品推荐文本投放给对应的用户。
44.根据本发明提供的基于标签向量化的商品推荐方法,对待投放的商品推荐文本进行向量化处理,得到待投放的商品推荐文本向量;获取与待投放的商品推荐文本向量相似的历史商品推荐文本向量,并获取历史商品推荐文本向量的历史商品投放用户标签以及历史投放用户响应信息;将待投放的商品推荐文本向量以及历史投放用户响应信息输入至训练得到的深度神经网络中,得到待投放的商品投放用户标签;将历史商品投放用户标签与待投放的商品投放用户标签按照权重进行排序处理,并根据排序结果确定待投放的商品对应的用户。通过待投放的商品推荐文本本身以及与待投放的商品推荐文本向量相似的历史商品推荐文本向量,基于历史商品、历史商品投放用户等信息得到待投放商品对应的用户,无需用户必须具备对商品的历史行为、也无需商品必须具备被投放的历史数据等,从而解决用户或商品冷启动问题。
45.图2示出了根据本发明一个实施例的基于标签向量化的商品推荐装置的功能框
图。如图2所示,基于标签向量化的商品推荐装置包括如下模块:
46.向量化模块210适于:对待投放的商品推荐文本进行向量化处理,得到待投放的商品推荐文本向量;
47.获取模块220适于:获取与待投放的商品推荐文本向量相似的历史商品推荐文本向量,并获取历史商品推荐文本向量的历史商品投放用户标签以及历史投放用户响应信息;
48.标签模块230适于:将待投放的商品推荐文本向量以及历史投放用户响应信息输入至训练得到的深度神经网络中,得到待投放的商品投放用户标签;
49.排序模块240适于:将历史商品投放用户标签与待投放的商品投放用户标签按照权重进行排序处理,并根据排序结果确定待投放的商品对应的用户。
50.可选地,装置还包括:训练模块250。
51.训练模块250适于:获取历史商品推荐文本,将历史商品推荐文本进行向量化处理,得到历史商品推荐文本向量;将历史商品推荐文本向量,历史投放用户响应信息作为样本数据,输入至待训练的深度神经网络中,根据历史商品投放用户标签调整深度神经网络的训练参数,得到训练后的深度神经网络。
52.可选地,获取模块220进一步适于:计算历史商品推荐文本向量与待投放的商品推荐文本向量间的向量距离;根据向量距离确定历史商品推荐文本向量与待投放的商品推荐文本向量的相似度;相似度与向量距离成反比;获取相似度高于预设阈值的历史商品推荐文本向量,并获取历史商品推荐文本向量的历史商品投放用户标签以及历史投放用户响应信息。
53.可选地,排序模块240进一步适于:根据历史商品推荐文本向量与待投放的商品推荐文本向量的相似度,结合历史商品投放用户标签中各个标签的权重,计算得到历史商品投放用户标签中各标签对应的权重;根据历史商品投放用户标签中各标签对应的权重和待投放的商品投放用户标签的权重进行排序处理,得到待投放的商品所对应的用户标签序列;根据待投放的商品所对应的用户标签序列确定待投放的商品对应的用户。
54.可选地,装置还包括:检查模块260。
55.检查模块260适于:对待投放的商品推荐文本进行文本检查。
56.以上各模块的描述参照方法实施例中对应的描述,在此不再赘述。
57.本技术还提供了一种非易失性计算机存储介质,所述计算机存储介质存储有至少一可执行指令,该计算机可执行指令可执行上述任意方法实施例中的基于标签向量化的商品推荐方法。
58.图3示出了根据本发明一个实施例的一种电子设备的结构示意图,本发明具体实施例并不对电子设备的具体实现做限定。
59.如图3所示,该电子设备可以包括:处理器(processor)302、通信接口(communications interface)304、存储器(memory)306、以及通信总线308。
60.其中:
61.处理器302、通信接口304、以及存储器306通过通信总线308完成相互间的通信。
62.通信接口304,用于与其它设备比如客户端或其它服务器等的网元通信。
63.处理器302,用于执行程序310,具体可以执行上述基于标签向量化的商品推荐方
法实施例中的相关步骤。
64.具体地,程序310可以包括程序代码,该程序代码包括计算机操作指令。
65.处理器302可能是中央处理器cpu,或者是特定集成电路asic(application specific integrated circuit),或者是被配置成实施本发明实施例的一个或多个集成电路。电子设备包括的一个或多个处理器,可以是同一类型的处理器,如一个或多个cpu;也可以是不同类型的处理器,如一个或多个cpu以及一个或多个asic。
66.存储器306,用于存放程序310。存储器306可能包含高速ram存储器,也可能还包括非易失性存储器(non-volatile memory),例如至少一个磁盘存储器。
67.程序310具体可以用于使得处理器302执行上述任意方法实施例中的基于标签向量化的商品推荐方法。程序310中各步骤的具体实现可以参见上述基于标签向量化的商品推荐实施例中的相应步骤和单元中对应的描述,在此不赘述。所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的设备和模块的具体工作过程,可以参考前述方法实施例中的对应过程描述,在此不再赘述。
68.在此提供的算法和显示不与任何特定计算机、虚拟系统或者其它设备固有相关。各种通用系统也可以与基于在此的示教一起使用。根据上面的描述,构造这类系统所要求的结构是显而易见的。此外,本发明也不针对任何特定编程语言。应当明白,可以利用各种编程语言实现在此描述的本发明的内容,并且上面对特定语言所做的描述是为了披露本发明的最佳实施方式。
69.在此处所提供的说明书中,说明了大量具体细节。然而,能够理解,本发明的实施例可以在没有这些具体细节的情况下实践。在一些实例中,并未详细示出公知的方法、结构和技术,以便不模糊对本说明书的理解。
70.类似地,应当理解,为了精简本公开并帮助理解各个发明方面中的一个或多个,在上面对本发明的示例性实施例的描述中,本发明的各个特征有时被一起分组到单个实施例、图、或者对其的描述中。然而,并不应将该公开的方法解释成反映如下意图:即所要求保护的本发明要求比在每个权利要求中所明确记载的特征更多的特征。更确切地说,如权利要求书所反映的那样,发明方面在于少于前面公开的单个实施例的所有特征。因此,遵循具体实施方式的权利要求书由此明确地并入该具体实施方式,其中每个权利要求本身都作为本发明的单独实施例。
71.本领域那些技术人员可以理解,可以对实施例中的设备中的模块进行自适应性地改变并且把它们设置在与该实施例不同的一个或多个设备中。可以把实施例中的模块或单元或组件组合成一个模块或单元或组件,以及此外可以把它们分成多个子模块或子单元或子组件。除了这样的特征和/或过程或者单元中的至少一些是相互排斥之外,可以采用任何组合对本说明书(包括伴随的权利要求、摘要和附图)中公开的所有特征以及如此公开的任何方法或者设备的所有过程或单元进行组合。除非另外明确陈述,本说明书(包括伴随的权利要求、摘要和附图)中公开的每个特征可以由提供相同、等同或相似目的的替代特征来代替。
72.此外,本领域的技术人员能够理解,尽管在此所述的一些实施例包括其它实施例中所包括的某些特征而不是其它特征,但是不同实施例的特征的组合意味着处于本发明的范围之内并且形成不同的实施例。例如,在权利要求书中,所要求保护的实施例的任意之一
都可以以任意的组合方式来使用。
73.本发明的各个部件实施例可以以硬件实现,或者以在一个或者多个处理器上运行的软件模块实现,或者以它们的组合实现。本领域的技术人员应当理解,可以在实践中使用微处理器或者数字信号处理器(dsp)来实现根据本发明实施例的基于标签向量化的商品推荐装置中的一些或者全部部件的一些或者全部功能。本发明还可以实现为用于执行这里所描述的方法的一部分或者全部的设备或者装置程序(例如,计算机程序和计算机程序产品)。这样的实现本发明的程序可以存储在计算机可读介质上,或者可以具有一个或者多个信号的形式。这样的信号可以从因特网网站上下载得到,或者在载体信号上提供,或者以任何其他形式提供。
74.应该注意的是上述实施例对本发明进行说明而不是对本发明进行限制,并且本领域技术人员在不脱离所附权利要求的范围的情况下可设计出替换实施例。在权利要求中,不应将位于括号之间的任何参考符号构造成对权利要求的限制。单词“包含”不排除存在未列在权利要求中的元件或步骤。位于元件之前的单词“一”或“一个”不排除存在多个这样的元件。本发明可以借助于包括有若干不同元件的硬件以及借助于适当编程的计算机来实现。在列举了若干装置的单元权利要求中,这些装置中的若干个可以是通过同一个硬件项来具体体现。单词第一、第二、以及第三等的使用不表示任何顺序。可将这些单词解释为名称。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献