一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

商品营销文本生成方法、装置、存储介质及计算机设备与流程

2022-06-29 22:38:20 来源:中国专利 TAG:


1.本技术涉及自然语言处理技术领域,尤其涉及一种商品营销文本生成方法、装置、存储介质及计算机设备。


背景技术:

2.现如今,随着互联网的兴起,人们每天都能够通过各种渠道接收到海量的互联网信息。例如电商领域,商家为了让自己的商品能够吸引用户的眼球,进而为商品构建了商品营销文本,该商品营销文本可以将商品的相关信息提炼出来供用户参考,从而辅助用户快速了解商品。
3.目前,在生成商品营销文本时,主要是通过生成式方法进行文本摘要生成操作。生成式方法生成商品营销文本时,容易受词表容量大小的约束,导致生成的商品营销文本不能够准确表达商品的相关信息,进而无法吸引用户眼球。


技术实现要素:

4.本技术的目的旨在至少能解决上述的技术缺陷之一,特别是现有技术中生成的商品营销文本不能够准确表达商品的相关信息,进而无法吸引用户眼球的技术缺陷。
5.本技术提供了一种商品营销文本生成方法,应用于指针生成器网络,所述方法包括:
6.获取商品数据;
7.提取所述商品数据中与商品属性相关的商品要素,得到目标词表;
8.利用所述目标词表对所述商品数据进行商品营销文本生成操作,得到商品营销文本。
9.可选地,所述提取所述商品数据中与商品属性相关的商品要素,得到目标词表,包括:
10.获取预先构建的原始词表;
11.当所述原始词表中缺少所述商品数据中与商品属性相关的商品要素时,从所述商品数据中提取所述商品要素;
12.利用提取到的商品要素对所述原始词表进行扩充,得到目标词表。
13.可选地,所述目标词表包括原始词表;
14.所述利用所述目标词表对所述商品数据进行商品营销文本生成操作,得到商品营销文本,包括:
15.计算所述商品数据中的所有字符在每一时间步下的注意力分布;
16.根据所述注意力分布确定每一时间步下从所述原始词表中生成字符的第一概率分布;
17.基于所述第一概率分布以及所述注意力分布,得到每一时间步下从所述目标词表中生成字符的第二概率分布;
18.利用所述第二概率分布生成与所述商品数据对应的商品营销文本。
19.可选地,所述指针生成器网络包括指针网络;
20.所述基于所述第一概率分布以及所述注意力分布,得到每一时间步下从所述目标词表中生成字符的第二概率分布,包括:
21.将所述第一概率分布以及所述注意力分布输入到所述指针网络中,通过所述指针网络确定与所述注意力分布对应的平衡系数;
22.利用所述平衡系数对所述第一概率分布以及所述注意力分布进行计算,得到每一时间步下从所述目标词表中生成字符的第二概率分布。
23.可选地,所述指针生成器网络包括编解码框架,所述编解码框架包括编解码层和注意力机制层;
24.所述计算所述商品数据中的所有字符在每一时间步下的注意力分布,包括:
25.将所述商品数据输入至所述编解码层中,得到所述编解码层中的编码器输出的隐藏状态,以及所述编解码层中的解码器在每一时间步输出的解码状态;
26.将所述编码器输出的隐藏状态,以及所述解码器在每一时间步输出的解码状态输入至所述注意力机制层,通过所述注意力机制层计算商品数据中的所有字符在每一时间步下的注意力分布。
27.可选地,所述指针生成器网络包括编解码框架,所述编解码框架包括编解码层和注意力机制层;
28.所述根据所述注意力分布确定每一时间步下从所述原始词表中生成字符的第一概率分布,包括:
29.通过所述注意力机制层对所述注意力分布以及所述编解码层中的编码器输出的隐藏状态进行计算,得到所述编码器在每一时间步的上下文向量;
30.通过所述注意力机制层对所述编码器在每一时间步的上下文向量,以及所述编解码层中的解码器在每一时间步输出的解码状态进行计算,得到每一时间步下从所述原始词表中生成字符的第一概率分布。
31.可选地,所述商品数据为多模态数据,所述多模态数据包括商品文本信息和商品图像信息;
32.所述计算所述商品数据中的所有字符在每一时间步下的注意力分布,包括:
33.计算所述商品文本信息中的所有字符在每一时间步下的第一注意力分布;
34.计算所述商品图像信息中的所有字符在每一时间步下的第二注意力分布;
35.所述根据所述注意力分布确定每一时间步下从所述原始词表中生成字符的第一概率分布,包括:
36.将所述第一注意力分布与所述第二注意力分布进行融合后,得到融合注意力分布;
37.利用所述融合注意力分布确定每一时间步下从所述原始词表中生成字符的第一概率分布。
38.可选地,所述利用所述目标词表对所述商品数据进行商品营销文本生成操作,得到商品营销文本,包括:
39.利用所述目标词表对所述商品数据进行商品营销文本生成操作,并在商品营销文
本的生成过程中,利用覆盖率机制对待生成的商品营销文本中的商品要素进行去冗余操作,得到商品营销文本。
40.本技术还提供了一种指针生成器网络的训练方法,所述方法包括:
41.获取若干商品数据,并将所述商品数据作为训练样本,将所述商品数据的商品营销文本,以及所述商品数据中与所述商品属性相关的商品要素作为样本标签;
42.提取所述训练样本中与商品属性相关的训练商品要素,得到训练目标词表;
43.利用所述训练目标词表对所述训练样本进行商品营销文本生成操作,得到训练商品营销文本;
44.以所述训练商品要素和所述训练商品营销文本趋近于所述样本标签为目标进行迭代训练,得到最终的指针生成器网络。
45.本技术还提供了一种商品营销文本生成装置,应用于指针生成器网络,包括:
46.数据获取模块,用于获取商品数据;
47.词表构建模块,用于提取所述商品数据中与商品属性相关的商品要素,得到目标词表;
48.商品营销文本生成模块,用于利用所述目标词表对所述商品数据进行商品营销文本生成操作,得到商品营销文本。
49.本技术还提供了一种存储介质,包括:所述存储介质中存储有计算机可读指令,所述计算机可读指令被一个或多个处理器执行时,使得一个或多个处理器执行如上述实施例中任一项所述的商品营销文本生成方法,以及如上述实施例中所述的指针生成器网络的训练方法。
50.本技术还提供了一种计算机设备,包括:一个或多个处理器,以及存储器;
51.所述存储器中存储有计算机可读指令,所述计算机可读指令被所述一个或多个处理器执行时,执行如上述实施例中任一项所述的商品营销文本生成方法,以及如上述实施例中所述的指针生成器网络的训练方法。
52.从以上技术方案可以看出,本技术实施例具有以下优点:
53.本技术提供的商品营销文本生成方法、装置、存储介质及计算机设备,当获取到某一商品的商品数据时,考虑到使用生成式方法生成文摘要时,无法准确复述原文的缺陷,本技术可以选用指针生成器网络来生成与商品数据对应的商品营销文本,指针生成器网络采用了生成式 抽取式结合的方式来生成商品营销文本;当某一商品的商品数据中包含有一些不常用的、与商品属性相关的商品要素时,可以通过指针生成器网络从商品数据中提取与商品属性相关的商品要素来构成目标词表,这样使得目标词表中不仅包含了常用的高频词汇,还包含了当前商品数据中出现的与商品属性相关的商品要素,指针生成器网络利用该目标词表进行商品营销文本生成操作时,便可以准确地复述商品的商品属性,从而有效吸引用户眼球。
附图说明
54.为了更清楚地说明本技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可
以根据这些附图获得其它的附图。
55.图1为本技术实施例提供的一种商品营销文本生成方法的流程示意图;
56.图2为本技术实施例提供的商品参数展示图;
57.图3为本技术实施例提供的商品图片展示图;
58.图4为本技术实施例提供的吹风机商品要素的体系结构展示图;
59.图5为本技术实施例提供的指针生成器网络的架构示意图;
60.图6为本技术实施例提供的一种商品营销文本生成装置的结构示意图;
61.图7为本技术实施例提供的一种计算机设备的内部结构示意图。
具体实施方式
62.下面将结合本技术实施例中的附图,对本技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本技术一部分实施例,而不是全部的实施例。基于本技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本技术保护的范围。
63.目前,在为商品构建商品营销文本时,主要是通过生成式方法进行文本摘要生成操作。生成式方法生成商品营销文本时,容易受词表容量大小的约束,导致生成的商品营销文本不能够准确表达商品的相关信息,进而无法吸引用户眼球。
64.基于此,本技术提出了如下技术方案,具体参见下文:
65.在一个实施例中,如图1所示,图1为本技术实施例提供的一种商品营销文本生成方法的流程示意图;本技术提供了一种商品营销文本生成方法,应用于指针生成器网络,所述方法可以包括:
66.s110:获取商品数据。
67.本步骤中,在使用指针生成器网络针对某一商品生成商品营销文本之前,可以预先获取与该商品对应的商品数据,并将该商品数据输入至指针生成器网络中。
68.该商品数据可以是从商城平台中采集的各类与该商品相关的商品信息、商品参数以及商品图片等,也可以是从该商品对应的商品库中获取的与该商品相关的商品参数,本实施例对此不做限制。
69.示意性地,如图2、3所示,图2为本技术实施例提供的商品参数展示图,图3为本技术实施例提供的商品图片展示图;由图2可知,本技术可以获取的商品参数包括但不限于商品介绍、规格与包装、售后保障、商品评估等多个方面的商品参数。例如,商品介绍中的商品参数可以包括商品名称、材质、功能、尺码、款式等,商品评价可以包括好评数、中评数等。本技术还可以获取如图3所示的商品的外观图片,该商品的外观图片中既包括有商品的外观和颜色,又包括有对该商品的简单描述,如“低帮设计、方便穿脱”、“宽边鞋带,时尚减龄”等。
70.s120:提取商品数据中与商品属性相关的商品要素,得到目标词表。
71.本步骤中,通过s110获取到商品数据后,指针生成器网络可以提取该商品数据中与商品属性相关的商品要素,以此来得到目标词表。
72.具体地,本技术在获取商品数据时,不仅考虑到商品数据中需要包含用于体现该商品的商品属性的商品要素,以便让用户更为直观地了解商品,还考虑到在生成商品营销
文本的过程中,若原始词表因词表大小的限制导致一些低频字符未被收录到原始词表中,而未被收录的低频字符又可能是描述商品属性的商品要素,此时依据该原始词表生成的商品营销文本中则缺少了对该商品的全面化描述。
73.例如,使用传统的注意力模型生成商品营销文本时,商品营销文本中不会出现原始词表中不存在的词,文本生成内容受原始词表大小限制,比如原始词表中不存在“匹”这个词,那么空调的营销文案便无法生成“1.5匹”这个参数,从而导致最终生成的空调的营销文案中缺少必要的商品属性,使用户无法直观地了解该款空调产品。
74.因此,本技术中,指针生成器网络获取到商品数据后,可以提取该商品数据中与商品属性相关的商品要素来构成目标词表,即,本技术的商品数据中与商品属性相关的商品要素可以被配置为:在生成商品营销文本的过程中作为未登录词进行复制。比如针对空调商品的标题输入,如果存在属性词“变频”,且该属性词并未出现在原始词表中,此时则可以将该属性词作为未登录词直接进行复制,从而实现对原始词表进行扩充后得到目标词表的操作。
75.可以理解的是,本技术中的原始词表指的是在模型训练的过程中,对训练数据进行自然语言处理后学习到的字符集合,字符集合中的字符可以是名词、代词、形容词、动词,或数词等,如“欣赏”、“的”、“若干”、“高效”等,字符集合中的字符还可以是标点符号,如“!”、“?”、“。”、“,”“:”、“%”、“@”等,在此不做限制;本技术中的未登录词指的是不包含在原始词表中的字符。
76.进一步地,由图2和图3中的内容可知,本技术获取的商品数据中包含与商品相关的商品属性,如商品的材质、尺码、款式、名称、功能等,这些商品属性构成了该商品的商品要素,用户可以通过了解该商品的商品要素来形成对该商品的认知,从而判断是否需要进一步了解该商品的具体信息。
77.因此,本技术在获取商品数据之前,可以对待生成商品营销文本的各个商品的商品要素进行构建,并将与各商品对应的商品要素分别添加至各商品的商品数据中,以使指针生成器网络能够从商品数据中提取与商品的商品属性相关的商品要素。
78.具体地,在构建商品要素时,可以事先定义完整的商品要素体系,该商品要素体系能够梳理商品要素与商品属性之间的关联关系(例如每一类商品属性下包含几种商品要素,不同类的商品要素占据同一商品属性的权重比例,不同/同一商品要素在同一商品中出现的频次,等等),利用该商品要素体系可以确认与商品属性相关程度较高的商品要素,以便于从商品数据中提取商品要素,比如针对吹风机这类商品所定义的完整体系如图4所示,图4为本技术实施例提供的吹风机商品要素的体系结构展示图;图4中,将吹风机这一商品的要素按照商品属性划分为“静音”、“温度”、“风速”、“外观”、“能效”和“质量”这九个方面,并且,针对每一商品要素,还设定了与该商品要素相关的要素词,如“能效”这一要素下,设置有“省电”、“节能”、、“低耗”、“省钱”等要素词,通过商品要素和要素词共同构成吹风机这一商品的商品要素体系。
79.可以理解的是,不同类型的商品有其特定的商品属性,因此,针对不同类型的商品可以构建不同的商品要素体系;而针对同一类型的各个商品之间也有不同的商品属性,因此,针对同一类型的商品可以在某一商品的商品要素基础上进行删减或新增,或重新构建一套商品要素体系,具体可视实际情况而定,在此不做限制。
80.s130:利用目标词表对商品数据进行商品营销文本生成操作,得到商品营销文本。
81.本步骤中,通过s120得到目标词表后,指针生成器网络还可以利用目标词表来对商品数据进行商品营销文本生成操作,从而得到最终的商品营销文本。
82.可以理解的是,本技术中的指针生成器网络指的是在序列到序列(sequence to sequence)模型架构的基础上结合指针网络(pointer network)所得到的混合模型,该混合模型既保留了序列到序列模型架构的特性,又融合了指针网络的特点,也即,当本技术中的指针生成器网络利用目标词表对商品数据进行商品营销文本生成操作,并得到商品营销文本时,该商品营销文本既是一段对商品数据进行自然语言处理后得到的、能够反映该商品数据的核心思想的文本摘要,同时又全面反映了某一商品的商品属性的文本表达,从而使得生成的商品营销文本能够更加突出商品的商品属性,从而达到吸引用户的目的。
83.在一种具体的实现方式中,本技术中指针生成器网络的输入可以是:男装*都市*特工*连帽*插*肩袖*运动*卫衣*黑色*执行*标准*,*产地:广东省广州市*,*品名:卫衣*,(*直接*接触*皮肤*类*,*安全*类别:,*面料:70%*棉*,*成份:,*颜色:灰色*,*更*有*运动感*,*门襟*拉链*,*,*30%聚苯*纤维*,*吊牌*介绍*,*领口*、*下摆*、*袖口*采用*罗纹*设计*,*防风*紧致*,*洗水*咳*标识*注释*,*不可*于*洗厚度*常规*材质*其它*袖型常规袖*面料材质*棉*领型*圆领*流行元素*其它*款式*开衫*上市时间*2018年春季*图案*其它*版型*标准型*袖长*长袖*基础风格*青春流行*适用人群青年*适用场景*其它*风格*青春休闲。
84.贪心算法模型输出:这款*卫衣*选用*优质*面料*制作*,*触感*细腻*顺滑*,*具有*良好*的*适穿*性*。*精致*的*连帽*设计*,*穿脱*便捷*,*提升*穿着*体验*。*精心*的*缝线*工艺*,*走线*细密*流畅*,*牢固*耐穿*。
85.指针生成器输出:连帽*的*设计*,能*起到*修饰*脸型*的*作用*。*宽松*的*版型*设计*,*能够*很*好*的*修饰*你*的*身材*,*让你*看起来*更加*的*有*精气神*。
86.上述示例中的“*”表示两个单词或两句话之间的间隔符,本技术将相同的商品数据输入至不同的模型中,可以得到不同的输出结果,将不同的输出结果进行对比可见,本技术所使用的指针生成器网络输出的商品营销文本,不仅使用较为简练的语言展示了该商品数据的核心思想,而且还充分体现了该商品数据中的多个商品属性,如“连帽”、“修饰脸型”、“版型宽松”、“修饰身材”、“有精气神”,用户阅读该商品营销文本后,能够迅速抓取该商品的核心内容,从而有效提升阅读体验。
87.上述实施例中,当获取到某一商品的商品数据时,考虑到使用生成式方法生成文摘要时,无法准确复述原文的缺陷,本技术可以选用指针生成器网络来生成与商品数据对应的商品营销文本,指针生成器网络采用了生成式 抽取式结合的方式来生成商品营销文本;当某一商品的商品数据中包含有一些不常用的、与商品属性相关的商品要素时,可以通过指针生成器网络从商品数据中提取与商品属性相关的商品要素来构成目标词表,这样使得目标词表中不仅包含了常用的高频词汇,还包含了当前商品数据中出现的与商品属性相关的商品要素,指针生成器网络利用该目标词表进行商品营销文本生成操作时,便可以准确地复述商品的商品属性,从而有效吸引用户眼球。
88.在一个实施例中,s120中提取所述商品数据中与商品属性相关的商品要素,得到目标词表,可以包括:
89.s121:获取预先构建的原始词表。
90.s122:当所述原始词表中缺少所述商品数据中与商品属性相关的商品要素时,从所述商品数据中提取所述商品要素。
91.s123:利用提取到的商品要素对所述原始词表进行扩充,得到目标词表。
92.本实施例中,指针生成器网络在进行商品营销文本生成操作的过程中,可以获取预先构建的原始词表,通过该原始词表来确定每一时间步下输出的字符。并且,当指针生成器网络判断原始词表中缺少商品数据中与商品属性相关的商品要素时,可以直接从商品数据中提取该商品要素,并利用提取到的商品要素来对原始词表进行扩充,从而得到目标词表。
93.可以理解的是,原始词表在构建的过程中,考虑到词表的容量大小,一般会考虑将常见的高频字符作为词表中的已登录词进行使用,而一些不常见的低频字符则未被收录进原始词表中,这样便会导致一些低频字符无法被表达出来,即使这些低频字符可能存在与目标对象(如商品)联系紧密的特征;而本技术选用指针生成器网络来生成商品营销文本时,由于指针生成器网络具有复制原文中非正式单词的能力,因此,当指针生成器网络判断原始词表中缺少商品数据中与商品属性相关的商品要素时,便可以直接从商品数据中提取该商品要素,这样既可以对原始词表进行精准扩充,使得指针生成器网络利用扩充后的原始词表对商品数据进行商品营销文本生成操作后得到的商品营销文本,能够精确表达商品数据的核心思想,同时,指针生成器网络在生成其他商品的文本摘要时还可以继续使用小规模的原始词表,达到节约计算资源与存储空间的目的。
94.在一个实施例中,所述目标词表可以包括原始词表。
95.s130中利用所述目标词表对所述商品数据进行商品营销文本生成操作,得到商品营销文本,可以包括:
96.s131:计算所述商品数据中的所有字符在每一时间步下的注意力分布。
97.s132:根据所述注意力分布确定每一时间步下从所述原始词表中生成字符的第一概率分布。
98.s133:基于所述第一概率分布以及所述注意力分布,得到每一时间步下从所述目标词表中生成字符的第二概率分布。
99.s134:利用所述第二概率分布生成与所述商品数据对应的商品营销文本。
100.本实施例中,指针生成器网络在利用目标词表对商品数据进行商品营销文本生成操作时,由于该目标词表中包含原始词表,因此,指针生成器网络可以先计算商品数据中所有字符在每一时间步下的注意力分布,接着通过该注意力分布来计算每一时间步下从原始词表中生成字符的第一概率分布,然后基于该第一概率分布以及注意力分布,来计算每一时间步下从目标词表中生成字符的第二概率分布。
101.可以理解的是,注意力分布可以看作是建立在商品数据中所有字符上的一个概率分布,通过注意力分布可以得知当前时间步下商品数据中所有字符的关注程度,指针生成器网络可以根据商品数据中关注程度较高的一个或多个字符来决定当前时间步下从原始词表中生成字符的第一概率分布。
102.当指针生成器网络对商品数据中的商品要素进行提取,并利用提取得到的商品要素对原始词表进行扩充并得到目标词表后,由于该目标词表中既包含了原始词表中的字
符,又包含了商品数据中提取的商品要素,因此,指针生成器网络在得到第一概率分布后,可以利用该第一概率分布以及注意力分布,来得到每一时间步下从目标词表中生成字符的第二概率分布。
103.例如,当原始词表中缺少商品数据中的某一商品要素,而当前时间步下的注意力分布明确表示指针生成器网络在当前时间步下生成的字符与该商品要素高度相关,此时,指针生成器网络可以在第一概率分布以及注意力分布的基础上,计算每一时间步下从目标词表中生成字符的第二概率分布,以此来将与商品数据的商品属性相关的商品要素包含进最终的字符生成过程,从而有效提高商品营销文本的准确度和全面度。
104.在一个实施例中,所述指针生成器网络可以包括指针网络。
105.s133中基于所述第一概率分布以及所述注意力分布,得到每一时间步下从所述目标词表中生成字符的第二概率分布,可以包括:
106.s1331:将所述第一概率分布以及所述注意力分布输入到所述指针网络中,通过所述指针网络确定与所述注意力分布对应的平衡系数。
107.s1332:利用所述平衡系数对所述第一概率分布以及所述注意力分布进行计算,得到每一时间步下从所述目标词表中生成字符的第二概率分布。
108.本实施例中,指针生成器网络在根据第一概率分布以及注意力分布,得到每一时间步下从目标词表中生成字符的第二概率分布的过程中,可以将第一概率分布以及注意力分布输入到指针网络中,通过指针网络确定与注意力分布对应的平衡系数,接着再利用平衡系数对第一概率分布以及注意力分布进行计算,从而得到每一时间步下从目标词表中生成字符的第二概率分布。
109.具体地,在一个示例中,如图5所示,图5为本技术实施例提供的指针生成器网络的架构示意图;图5中,指针生成器网络的encoder(编码器)部分采用单个双向lstm(bidirectional lstm)单元构成的层,商品数据中的token(词语或一些切割后的符号)wi被一个个地喂入编码器,从而产生编码器的隐藏状态hi的序列。而decoder(解码器)部分,采用单个单向lstm(unidirectional lstm)单元构成的层,在时间步为t时接收上一个词的嵌入(embedding)(训练阶段这是前一个参考摘要中的词,测试阶段这是前一个decoder产生的词),从而生成解码状态s
t

110.当得到注意力分布后,可以将该注意力分布与编码器输出的隐藏状态相结合,进一步计算出编码器在每一时间步的上下文向量
[0111][0112]
进一步地,在时间步t时,可以由上下文向量解码器的解码状态s
t
,以及解码器在时间步t之前的时间步的输出结果x
t
共同计算后生成平衡系数p
gen
,具体计算过程如下:
[0113][0114]
其中,ws、w
x
与标量b
ptr
都是可学习参数;σ是sigmoid函数,使计算结果落在[0,1]之间;平衡系数p
gen
可以用于决定从原始词表中生成一个字符,还是从商品数据中复制一个字符(即对注意力分布进行采样以得到商品数据中的一个字符),平衡系数可以作为权重,来平衡第一概率分布以及注意力分布在第二概率分布中的比重,以此来达到最终的
第二概率分布的加权和不大于1的目的。
[0115]
而解码器在时间步t时从目标词表中生成字符的第二概率分布可以通过如下计算公式获得:
[0116][0117]
该公式在应用过程中,若w是一个未登录词,则p
vocab
(w)为0,若w在商品数据中未出现,但在词表中出现,则为0;若平衡系数为0.5时,表示有二分之一的可能性是从原始词表中生成一个字符,也有二分之一的可能性是从商品数据中复制一个字符。
[0118]
在一个实施例中,所述指针生成器网络可以包括编解码框架,所述编解码框架可以包括编解码层和注意力机制层。
[0119]
s131中计算所述商品数据中的所有字符在每一时间步下的注意力分布,可以包括:
[0120]
s1311:将所述商品数据输入至所述编解码层中,得到所述编解码层中的编码器输出的隐藏状态,以及所述编解码层中的解码器在每一时间步输出的解码状态。
[0121]
s1312:将所述编码器输出的隐藏状态,以及所述解码器在每一时间步输出的解码状态输入至所述注意力机制层,通过所述注意力机制层计算商品数据中的所有字符在每一时间步下的注意力分布。
[0122]
本实施例中,指针生成器网络中的编解码框架可以包括编解码层和注意力机制层,其中,编解码层主要用于对输入的商品数据进行编解码操作,而注意力机制层可以看作是建立在商品数据中的所有字符上的一个概率分布,并通过此概率分布告知编解码层中的解码器如何生成下一个词,以此来提高指针生成器网络复述原文的能力。
[0123]
具体地,如图5所示,当得到编解码层中的编码器对该商品数据中的各个单词进行编码后输出隐藏状态hi的序列,以及编解码层中的解码器在时间步t时输出的解码状态s
t
后,可以进一步通过注意力机制层计算得到相应的注意力分布a
t
,具体计算过程如下:
[0124][0125]at
=softmax(e
t
)
[0126]
其中,v、wh、ws、b
attn
都是可学习参数。
[0127]
在一个实施例中,所述指针生成器网络可以包括编解码框架,所述编解码框架可以包括编解码层和注意力机制层。
[0128]
s132中根据所述注意力分布确定每一时间步下从所述原始词表中生成字符的第一概率分布,可以包括:
[0129]
s1321:通过所述注意力机制层对所述注意力分布以及所述编解码层中的编码器输出的隐藏状态进行计算,得到所述编码器在每一时间步的上下文向量。
[0130]
s1322:通过所述注意力机制层对所述编码器在每一时间步的上下文向量,以及所述编解码层中的解码器在每一时间步输出的解码状态进行计算,得到每一时间步下从所述原始词表中生成字符的第一概率分布。
[0131]
本实施例中,指针生成器网络在计算每一时间步下从原始词表中生成字符的第一概率分布时,可以通过注意力机制层来对注意力分布以及编解码层中的编码器输出的隐藏
状态进行计算,得到编码器在每一时间步的上下文向量,接着再通过注意力机制层对编码器在每一时间步的上下文向量,以及编解码层中的解码器在每一时间步输出的解码状态进行计算,从而得到每一时间步下从原始词表中生成字符的第一概率分布,通过该第一概率分布可以明确每一时间步下要生成的字符。
[0132]
示意性地,如图5所示,当得到注意力分布后,可以将该注意力分布与编码器输出的隐藏状态相结合,进一步计算出编码器在每一时间步的上下文向量
[0133][0134]
依靠这个上下文向量和解码器的解码状态s
t
,共同决定时间步t时从原始词表中生成字符的第一概率分布p
vocab

[0135][0136]
其中,v、v

、b、b

都是可学习参数,p
vocab
是建立在整个原始词表上的概率分布,从而得到最终的预测词的概率分布可以表示为:
[0137]
p(w)=p
vocab
(w)
[0138]
在一个实施例中,所述商品数据可以为多模态数据,所述多模态数据可以包括商品文本信息和商品图像信息。
[0139]
s131中计算所述商品数据中的所有字符在每一时间步下的注意力分布,可以包括:
[0140]
s311:计算所述商品文本信息中的所有字符在每一时间步下的第一注意力分布。
[0141]
s312:计算所述商品图像信息中的所有字符在每一时间步下的第二注意力分布。
[0142]
本实施例中,商品数据可以为多模态数据,且该多模态数据可以包括商品文本信息和商品图像信息。当本技术中获取的商品数据为多模态数据时,可以将商品数据中的商品文本信息和商品图像信息分别输入至指针生成器网络的编解码框架中,从而得到商品文本信息中的所有字符在每一时间步下的第一注意力分布,以及商品图像信息中的所有字符在每一时间步下的第二注意力分布。
[0143]
需要说明的是,这里的多模态数据指的是输入多种模态信息,通常包括文本,语音,图像,视频等信息。本技术使用不同模态的信息进行相互补充和验证,从而帮助指针生成器网络更好的定位关键内容,生成更好的商品营销文本。
[0144]
s132中根据所述注意力分布确定每一时间步下从所述原始词表中生成字符的第一概率分布,可以包括:
[0145]
s321:将所述第一注意力分布与所述第二注意力分布进行融合后,得到融合注意力分布。
[0146]
s322:利用所述融合注意力分布确定每一时间步下从所述原始词表中生成字符的第一概率分布。
[0147]
本技术中,当指针生成器网络得到商品文本信息中的所有字符在每一时间步下的第一注意力分布,以及商品图像信息中的所有字符在每一时间步下的第二注意力分布后,为了进一步得到每一时间步下从原始词表中生成字符的第一概率分布,本技术可以将第一注意力分布和第二注意力分布进行融合,并使用融合注意力分布来计算第一概率分布。
[0148]
具体地,本技术选用多模态数据作为编解码框架的输入时,该编解码框架可以选择序列到序列框架,在该框架下,编码之后的每一个模态的商品数据都会有一个向量序列隐层表示,将各模态的向量序列隐层表示进行融合后,便可以得到最终的向量序列隐层表示。其中,融合过程可以通过多种方式进行实现,第一种方法是flat,即平滑所有编码器端隐层表示,使用解码器隐层状态对平滑后的编码器隐层表示计算注意力得分,最终得到注意力向量;第二种方法是concat,利用解码器隐层状态分别对两个序列计算得分,并分别得到注意力向量,然后将多个注意力向量进行拼接并转换到统一维度;第三种方法是hierarchical,首先得到两个模态的商品数据对应的注意力向量,然后再利用解码器隐层表示计算两个注意力向量的权重分布,最后根据权重融合多个注意力向量。具体选用何种方式进行融合,可视实际情况进行选择,在此不做限制。
[0149]
进一步地,本技术使用多模态数据作为指针生成器网络的输入时,对应生成的商品营销文本中既包含有商品文本信息的相关内容,又包含了商品图像信息的相关内容,从而使得该商品营销文本中的商品要素更多样,更加吸引用户注意。
[0150]
例如,本技术可以将图2和图3中的商品文本信息以及商品图像信息输入至指针生成器网络中进行商品营销文本生成操作,最终可以得到商品营销文本为:“它以透气的面料、增厚的鞋底、低帮的设计,为使用者提供舒适的穿着体验,一体色渲染鞋面,同时配上宽边鞋带又可以彰显时尚品味”。由该商品营销文本可知,本技术利用指针生成器网络提取商品文本信息以及商品图像信息中的内容后生成的商品营销文本,既包含了该商品的商品属性,又包含了该商品的颜色、外形描述等,使得用户阅读该商品营销文本后,能够在脑海中刻画出该商品的样貌特征等,从而达到有效吸引用户的目的。
[0151]
在一个实施例中,s130中利用所述目标词表对所述商品数据进行商品营销文本生成操作,得到商品营销文本,可以包括:
[0152]
利用所述目标词表对所述商品数据进行商品营销文本生成操作,并在商品营销文本的生成过程中,利用覆盖率机制对待生成的商品营销文本中的商品要素进行去冗余操作,得到商品营销文本。
[0153]
本实施例中,当获取到商品数据后,本技术可以采用指针生成器网络来对商品数据进行商品营销文本生成操作,并且在生成商品营销文本的过程中,指针生成器网络可以利用覆盖率机制来对待生成的商品营销文本中的商品要素进行去冗余操作,以此来得到最终的商品营销文本,该商品营销文本中既包含商品的商品要素,又避免因商品要素重复导致阅读体验不佳的情况发生,这样用户便可以快速抓取该商品的核心信息。
[0154]
可以理解的是,传统的覆盖率机制仅能进行词维度的去冗余操作,若使用传统的覆盖率机制对本技术中待生成的商品营销文本进行去冗余操作,得到的商品营销文本中可能会包含有描述同一商品要素的词汇。例如,描述“运行声音”这一商品要素的词汇可以包括“噪音”、“安静”和“平静”等,若仅对“噪音”进行去冗余,则难以保证“安静”和“平静”不出现在最终的商品营销文本中。
[0155]
因此,本技术在使用覆盖率机制时,通过商品要素维度进行去冗余,这样可以在一定程度上避免同一商品要素下的不同词汇同时出现在生成的商品营销文本中,从而导致用户阅读该商品营销文本时,将重点错认为某一商品要素,而忽略了商品中的其他商品要素。
[0156]
作为一种优选的实施方式,本技术中的指针生成器网络可以包括覆盖率层,该覆
盖率层可以被配置为:根据商品数据中的所有单词在每一时间步的注意力分布,确定商品要素在每一时间步之前的所有时间步累积的覆盖程度,并利用商品要素在每一时间步之前的所有时间步累积的覆盖程度,来对商品数据中的所有字符在每一时间步的注意力分布进行调整,以确保注意力机制层在做当前决策时(下一步选择关注哪个词)会考量其先前的决定。该方式可以避免重复关注同一商品要素的问题,因此能避免生成重复摘要的问题。
[0157]
具体地,确定商品要素在时间步t之前的所有时间步累积的覆盖程度的过程可以是:
[0158][0159][0160]
接着,本技术可以将计算得到的商品要素在时间步t之前的所有时间步累积的覆盖程度带入到注意力分布a
t
的计算公式中,具体如下:
[0161][0162]
当得到调整后的商品数据中的所有字符在每一时间步的注意力分布后,可以利用调整后的商品数据中的所有字符在每一时间步的注意力分布,以及编码器输出的隐藏状态,来确定编码器在每一时间步的上下文向量,并对编码器在每一时间步的上下文向量,以及解码器在每一时间步输出的解码状态进行计算,得到解码器在每一时间步下从原始词表中生成字符的第一概率分布。并进一步通过第一概率分布得到解码器在每一时间步下从目标词表中生成字符的第二概率分布,最终解码器可以通过第二概率分布来生成每一时间步下的字符。
[0163]
在一个实施例中,本技术还提供了一种指针生成器网络的训练方法,所述方法可以包括:
[0164]
s410:获取若干商品数据,并将所述商品数据作为训练样本,将所述商品数据的商品营销文本,以及所述商品数据中与所述商品属性相关的商品要素作为样本标签。
[0165]
s420:提取所述训练样本中与商品属性相关的训练商品要素,得到训练目标词表。
[0166]
s430:利用所述训练目标词表对所述训练样本进行商品营销文本生成操作,得到训练商品营销文本。
[0167]
s440:以所述训练商品要素和所述训练商品营销文本趋近于所述样本标签为目标进行迭代训练,得到最终的指针生成器网络。
[0168]
本实施例中,在使用指针生成器网络来生成与商品数据对应的商品营销文本之前,本技术还可以对指针生成器网络进行训练,以使训练后得到的指针生成器网络可以提取输入的商品数据中与商品属性相关的商品要素,并在得到目标词表后,利用该目标词表对商品数据进行商品营销文本生成操作,从而得到商品营销文本。
[0169]
作为一种优选的实施方式,本技术在对指针生成器网络进行训练时,可以将获取到的若干商品数据作为训练样本,并将各商品数据对应的商品营销文本,以及各商品数据中与商品属性相关的商品要素作为样本标签,当指针生成器网络提取到训练样本中的训练商品要素,并得到训练目标词表后,可以利用该训练目标词表来对训练样本进行商品营销
文本生成操作,并在每一次训练的过程中,以训练商品要素趋近于样本标签中标记的商品要素,以及训练商品营销文本趋近于样本标签中标记的商品营销文本为目标对指针生成器网络进行迭代训练,并在达到训练条件时,得到最终的指针生成器网络。
[0170]
本技术中,在对指针生成器网络进行训练时,对训练样本中与商品属性相关的商品要素进行标记,以使指针生成器网络最终被训练为能够自主识别输入数据中的商品要素。这样在使用训练好的指针生成器网络进行商品营销文本生成操作时,便可以对输入的商品数据中的商品要素进行识别,并将识别到的商品要素与原始词表中的已登录词进行匹配,若原始词表中未匹配到与该商品要素相关的字符,则表示该商品要素为未登录词,此时指针生成器网络便可以根据注意力分布来决定是否对该商品要素进行复制,以扩充原始词表。
[0171]
另外,本技术中对指针生成器网络进行训练之前,还可以对训练数据进行预处理,预处理的过程包括但不限于对文本进行增强,增加样本数据量,具体可以使用回译 embedding的方式进行,还可以使用transformer作为特征提取器,而非适用传统的静态词向量或者lstm等。训练过程中,也可以对模型进行优化,例如,通过scheduled sampling(计划性采样)解决模型的exposure bias(曝光误差)问题、通过weight tying(权重绑定)加快模型收敛、通过coverage mechanism(覆盖率机制)解决重复生成文本问题。在解码过程中,可以合理控制营销文案的文本长度,鼓励输出序列尽可能含有输入序列的信息,还可以对eos token(发币合约)的概率进行标准化操作等。
[0172]
下面对本技术实施例提供的商品营销文本生成装置进行描述,下文描述的商品营销文本生成装置与上文描述的商品营销文本生成方法可相互对应参照。
[0173]
在一个实施例中,如图6所示,图6为本技术实施例提供的一种商品营销文本生成装置的结构示意图;本技术还提供了一种商品营销文本生成装置,应用于指针生成器网络,包括数据获取模块210、词表构建模块220和商品营销文本生成模块230,具体包括如下:
[0174]
数据获取模块210,用于获取商品数据。
[0175]
词表构建模块220,用于提取所述商品数据中与商品属性相关的商品要素,得到目标词表。
[0176]
商品营销文本生成模块230,用于利用所述目标词表对所述商品数据进行商品营销文本生成操作,得到商品营销文本。
[0177]
上述实施例中,当获取到某一商品的商品数据时,考虑到使用生成式方法生成文摘要时,无法准确复述原文的缺陷,本技术可以选用指针生成器网络来生成与商品数据对应的商品营销文本,指针生成器网络采用了生成式 抽取式结合的方式来生成商品营销文本;当某一商品的商品数据中包含有一些不常用的、与商品属性相关的商品要素时,可以通过指针生成器网络从商品数据中提取与商品属性相关的商品要素来构成目标词表,这样使得目标词表中不仅包含了常用的高频词汇,还包含了当前商品数据中出现的与商品属性相关的商品要素,指针生成器网络利用该目标词表进行商品营销文本生成操作时,便可以准确地复述商品的商品属性,从而有效吸引用户眼球。
[0178]
在一个实施例中,所述词表构建模块220,可以包括:
[0179]
原始词表获取模块,用于获取预先构建的原始词表。
[0180]
商品要素判断模块,用于当所述原始词表中缺少所述商品数据中与商品属性相关
的商品要素时,从所述商品数据中提取所述商品要素。
[0181]
词表扩充模块,用于利用提取到的商品要素对所述原始词表进行扩充,得到目标词表。
[0182]
在一个实施例中,所述目标词表可以包括原始词表。
[0183]
所述商品营销文本生成模块230,可以包括:
[0184]
注意力分布计算模块,用于计算所述商品数据中的所有字符在每一时间步下的注意力分布。
[0185]
第一概率分布计算模块,用于根据所述注意力分布确定每一时间步下从所述原始词表中生成字符的第一概率分布。
[0186]
第二概率分布计算模块,用于基于所述第一概率分布以及所述注意力分布,得到每一时间步下从所述目标词表中生成字符的第二概率分布。
[0187]
文本生成模块,用于利用所述第二概率分布生成与所述商品数据对应的商品营销文本。
[0188]
在一个实施例中,所述指针生成器网络可以包括指针网络。
[0189]
所述第二概率分布计算模块,可以包括:
[0190]
平衡系数计算模块,用于将所述第一概率分布以及所述注意力分布输入到所述指针网络中,通过所述指针网络确定与所述注意力分布对应的平衡系数。
[0191]
第二概率分布计算子模块,用于利用所述平衡系数对所述第一概率分布以及所述注意力分布进行计算,得到每一时间步下从所述目标词表中生成字符的第二概率分布。
[0192]
在一个实施例中,所述指针生成器网络可以包括编解码框架,所述编解码框架可以包括编解码层和注意力机制层。
[0193]
所述注意力分布计算模块,可以包括:
[0194]
编解码模块,用于将所述商品数据输入至所述编解码层中,得到所述编解码层中的编码器输出的隐藏状态,以及所述编解码层中的解码器在每一时间步输出的解码状态。
[0195]
注意力计算模块,用于将所述编码器输出的隐藏状态,以及所述解码器在每一时间步输出的解码状态输入至所述注意力机制层,通过所述注意力机制层计算商品数据中的所有字符在每一时间步下的注意力分布。
[0196]
在一个实施例中,所述指针生成器网络可以包括编解码框架,所述编解码框架可以包括编解码层和注意力机制层。
[0197]
所述第一概率分布计算模块,可以包括:
[0198]
上下文向量计算模块,用于通过所述注意力机制层对所述注意力分布以及所述编解码层中的编码器输出的隐藏状态进行计算,得到所述编码器在每一时间步的上下文向量。
[0199]
第一概率分布计算子模块,用于通过所述注意力机制层对所述编码器在每一时间步的上下文向量,以及所述编解码层中的解码器在每一时间步输出的解码状态进行计算,得到每一时间步下从所述原始词表中生成字符的第一概率分布。
[0200]
在一个实施例中,所述商品数据可以为多模态数据,所述多模态数据可以包括商品文本信息和商品图像信息。
[0201]
所述注意力分布计算模块,可以包括:
[0202]
第一计算模块,用于计算所述商品文本信息中的所有字符在每一时间步下的第一注意力分布。
[0203]
第二计算模块,用于计算所述商品图像信息中的所有字符在每一时间步下的第二注意力分布。
[0204]
所述第一概率分布计算模块,可以包括:
[0205]
融合模块,用于将所述第一注意力分布与所述第二注意力分布进行融合后,得到融合注意力分布。
[0206]
概率计算模块,用于利用所述融合注意力分布确定每一时间步下从所述原始词表中生成字符的第一概率分布。
[0207]
在一个实施例中,所述商品营销文本生成模块230,可以包括:
[0208]
去冗余模块,用于利用所述目标词表对所述商品数据进行商品营销文本生成操作,并在商品营销文本的生成过程中,利用覆盖率机制对待生成的商品营销文本中的商品要素进行去冗余操作,得到商品营销文本。
[0209]
在一个实施例中,本技术还提供了一种存储介质,包括:所述存储介质中存储有计算机可读指令,所述计算机可读指令被一个或多个处理器执行时,使得一个或多个处理器执行如上述实施例任一项所述的商品营销文本生成方法。
[0210]
在一个实施例中,本技术还提供了一种计算机设备,包括:一个或多个处理器,以及存储器。
[0211]
所述存储器中存储有计算机可读指令,所述计算机可读指令被所述一个或多个处理器执行时,执行如上述实施例中任一项所述的商品营销文本生成方法。
[0212]
示意性地,如图7所示,图7为本技术实施例提供的一种计算机设备的内部结构示意图,该计算机设备300可以被提供为一服务器。参照图7,计算机设备300包括处理组件302,其进一步包括一个或多个处理器,以及由存储器301所代表的存储器资源,用于存储可由处理组件302的执行的指令,例如应用程序。存储器301中存储的应用程序可以包括一个或一个以上的每一个对应于一组指令的模块。此外,处理组件302被配置为执行指令,以执行上述任意实施例的商品营销文本生成方法。
[0213]
计算机设备300还可以包括一个电源组件303被配置为执行计算机设备300的电源管理,一个有线或无线网络接口304被配置为将计算机设备300连接到网络,和一个输入输出(i/o)接口305。计算机设备300可以操作基于存储在存储器301的操作系统,例如windows server tm、mac os xtm、unix tm、linux tm、free bsdtm或类似。
[0214]
本领域技术人员可以理解,图7中示出的结构,仅仅是与本技术方案相关的部分结构的框图,并不构成对本技术方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
[0215]
最后,还需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个
……”
限定的要素,并不排
除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
[0216]
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间可以根据需要进行组合,且相同相似部分互相参见即可。
[0217]
对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本技术。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本技术的精神或范围的情况下,在其它实施例中实现。因此,本技术将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献