一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

文案生成方法、装置、存储介质及计算机设备与流程

2022-11-16 07:46:47 来源:中国专利 TAG:


1.本技术涉及自然语言处理技术领域,更具体地,涉及一种文案生成方法、装置、存储介质及计算机设备。


背景技术:

2.广告投放作为一种推广方式,即根据广告内容在数字媒体交容易平台、在线广告投放平台或者网络营销系统平台上,选择特定的目标用户和区域,采用文字、图片或视频的形式将广告投放给用户。例如,电商领域借助广告文案的投放可以帮助企业吸引流量以及促进用户购买行为。
3.广告文案的创作需要经历商品理解、卖点提炼以及组织表达等复杂的步骤。有关技术中,提出了将商品信息填充到预制广告模板中来生成广告文案的方法以及基于循环神经网络生成广告文案的方法。而上述两种方案生的广告文案均无法准确地体现商品信息,且广告文案生成效率较低。


技术实现要素:

4.本技术实施例提供一种文案生成方法、装置、存储介质以及计算机设备。旨在提升广告文案与商品信息的贴合度及生成效率。
5.一方面,本技术实施例提供一种文案生成方法,该方法包括:获取商品标题;对商品标题进行分词处理,得到标题分词序列;将标题分词序列输入至预先训练得到的文案生成模型,通过文案生成模型输出商品标题对应的目标文案,文案生成模型为基于商品样本标题和广告标注文案,并结合商品样本标题的标题训练分词训练得到。
6.另一方面,本技术实施例还提供一种文案生成装置,该装置包括:标题获取模块,用于获取商品标题;分词处理模块,用于对商品标题进行分词处理,得到标题分词序列;文案生成模块,用于将标题分词序列输入至预先训练得到的文案生成模型,通过文案生成模型输出商品标题对应的目标文案,文案生成模型为基于商品样本标题和广告标注文案,并结合商品样本标题的标题训练分词训练得到。
7.另一方面,本技术实施例还提供一种计算机可读存储介质,该计算机可读存储介质存储有程序代码,其中,在所述程序代码被处理器运行时执行上述的文案生成方法。
8.另一方面,本技术实施例还提供一种计算机设备,该计算机设备包括处理器以及存储器,存储器存储有计算机程序指令,计算机程序指令被处理器调用时执行上述的文案生成方法。
9.另一方面,本技术实施例还提供一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,所述计算机指令存储在存储介质中。计算机设备的处理器从存储介质读取所述计算机指令,处理器执行所述计算机指令,使得所述计算机设备执行上述文案生成方法中的步骤。
10.本技术提供的一种文案生成方法,可以获取商品标题,并对商品标题进行分词处
理,得到标题分词序列,进而将标题分词序列输入至预先训练得到的文案生成模型,通过文案生成模型输出商品标题对应的目标文案。由于文案生成模型可以从商品标题中选取分词构建目标文案,所以能够避免因模型词典限制出现的登录词且能够生成生僻词,从而降低广告文案的生成难度,提高广告文案生成的效率,并且从商品标题中选取的分词使得生成的广告文案能准确地体现商品信息,提高广告文案与商品信息的贴合度。
附图说明
11.为了更清楚地说明本技术实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本技术的一些实施例,对于本领域技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
12.图1示出了本技术实施例提供的一种系统架构示意图。
13.图2示出了本技术实施例提供的一种文案生成方法的流程示意图。
14.图3示出了本技术实施例提供的另一种文案生成方法的流程示意图。
15.图4示出了本技术实施例提供的一种应用场景示意图。
16.图5示出了本技术实施例提供的一种预设文案生成网络的架构图。
17.图6是本技术实施例提供的一种文案生成装置的模块框图。
18.图7是本技术实施例提供的一种计算机设备的模块框图。
19.图8是本技术实施例提供的一种计算机可读存储介质的模块框图。
具体实施方式
20.下面详细描述本技术的实施方式,实施方式的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施方式是示例性地,仅用于解释本技术,而不能理解为对本技术的限制。
21.在说明书、权利要求书和上述附图所描述的一些流程中,包含了按照特定顺序出现的多个步骤,但应该清楚了解,这些步骤可以不按照其在本文中出现的顺序来执行或并行执行,步骤序号仅仅是用于区分开各个不同的步骤,序号本身不代表任何的执行顺序。此外,本文中的“第一”和“第二”等描述,是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。
22.为了使本技术领域的人员更好地理解本技术的方案,下面将结合本技术实施例中的附图,对本技术实施例中的技术方案进行清楚、完整的描述。显然,所描述的实施例仅仅是本技术一部分实施例,而不是全部的实施例。基于本技术中的实施例,本领域技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本技术保护的范围。
23.广告投放是产品推广过程中的重要环节,高质量的广告投放在宣传产品的同时,可以促进消费者的购买行为。其中,广告文案是广告投放的核心组成部分,对广告投放的最终效果有直接影响。广告文案具有突出商品信息和卖点、加深消费者印象以及吸引消费者的作用。
24.由于,广告文案的创作是一个十分耗时耗力的任务。而且商品种类的繁多,很容易出现对商品卖点不了解的情况,从而产生创作失误,影响广告效果。因此,有关技术提出了
自动化的广告文案创作方案。自动化方案主要包括基于模板填充的方法和基于端到端模型学习方法。
25.例如,基于模板填充的方法主要是依赖提前制定好的模板,根据商品信息进行填充,操作过程繁琐,广告生成的效率较低,并且生成的广告文案比较生硬缺乏吸引力,不够贴合商品信息。基于端到端模型学习方法,因模型词典的限制,存在未登录词问题(outofvocabulary,oov),容易导致广告文案中未包含商品信息。总言之,自动化方案生成广告文案均无法准确地体现商品信息,且广告文案生成效率较低。
26.为了解决上述问题,发明人经过研究,提出了本技术实施例提供的文案生成方法,该方法可以获取商品标题,并对商品标题进行分词处理,得到标题分词序列,进而将标题分词序列输入至预先训练得到的文案生成模型,通过文案生成模型输出商品标题对应的目标文案。如此,利用文案生成模型可以从商品标题中选取分词构建目标文案,能够避免因模型词典限制出现的登录词且能够生成生僻词,从而降低广告文案的生成难度,提高广告文案生成的效率,并且从商品标题中选取的分词使得生成的广告文案能准确地体现商品信息
27.下面先对本技术所涉及到文案生成方法的系统的架构进行介绍。
28.如图1所示,本技术实施例提供的文案生成方法可以应用在系统300中,数据采集设备320用于采集训练数据。针对本技术实施例的文案生成方法来说,训练数据可以包括用于训练的商品样本标题和每个商品样本标题对应的广告标注文案。在采集到训练数据之后,数据采集设备320可以将这些训练数据存入数据库340,训练设备360基于数据库340中维护的训练数据可以训练得到目标模型301。
29.训练设备360基于商品样本标题和广告标注文案对预设文案生成网络进行训练,直至预设文案生成网络满足预设条件,得到训练后的目标模型301,也即文案生成模型。其中,预设条件可以为:目标损失函数的损失值小于预设值、目标损失函数的损失值不再变化、或者训练次数达到预设次数等。
30.上述目标模型301能够用于实现本技术实施例的文案生成方法。本技术实施例中的目标模型301具体可以为深度神经网络模型,例如,循环神经网络(recurrent neural networks,rnn)。需要说明的是,在实际的应用中,数据库340中维护的训练数据不一定都来自于数据采集设备320的采集,也有可能是从其他设备接收得到的。另外需要说明的是,训练设备360也不一定完全基于数据库340维护的训练数据进行目标模型301的训练,也有可能从云端或其他地方获取训练数据进行模型训练,上述描述不应该作为对本技术实施例的限定。
31.根据训练设备360训练得到的目标模型301可以应用于不同的系统或设备中,如应用于图1所示的执行设备310,所述执行设备310可以是终端,如手机终端,平板电脑,笔记本电脑,增强现实(augmented reality,ar)/虚拟现实(virtual reality,vr)等,还可以是服务器或者云端等。
32.在图1中,执行设备310可以用于与外部设备进行数据交互,例如,用户可以使用客户设备330通过网络向执行设备310输入数据。该输入的数据在本技术实施例中可以包括:客户设备输入的商品标题。在执行设备310对输入数据进行预处理,或者在执行设备310的计算模块312执行计算等相关的处理过程中,执行设备310可以调用数据存储系统350中的数据、代码等以用于相应的计算处理,也可以将相应计算处理得到的数据、指令等存入数据
存储系统350中。
33.最后,执行设备310将处理结果,例如,目标模型301生成的商品标题对应的目标文案,返回给客户设备330,从而提供给用户。值得说明的是,训练设备360可以针对不同的目标或不同的任务,基于不同的训练数据生成相应的目标模型301,该相应的目标模型301即可以用于实现上述目标或或者完成上述任务,从而为用户提供所需的结果。
34.可选地,图1所示的系统可以为client-server(c/s)系统架构,执行设备310可以为服务端(如,云服务器),客户设备330可以为客户端(如,笔记本电脑)。用户可以利用笔记本电脑中的广告管理平台,通过网络上传商品标题至云服务器,云服务器在接受到商品标题时,利用目标模型301生成对应的目标文案,并将目标文案返回至笔记本电脑,进而用户即可在广告管理平台上获取目标文案。
35.值得注意的是,图1仅是本技术实施例提供的一种系统架构的示意图,本发明实施例描述的系统的架构以及应用场景是为了更加清楚的说明本发明实施例的技术方案,并不构成对于本发明实施例提供的技术方案的限定。本领域普通技术人员可知,随着系统架构的演变和新的应用场景的出现,本发明实施例提供的技术方案对于类似的技术问题,同样适用。
36.请参阅图2,图2示出了本技术一个实施例提供的文案生成方法的流程示意图。在具体的实施例中,所述文案生成方法应用于如图6所示的文案生成装置500以及配置有文案生成装置500的计算机设备600(图7)。
37.下面将以计算机设备为例,说明本实施例的具体流程,可以理解的是,本实施例所应用的计算机设备可以为服务器或者终端等,服务器可以是独立的物理服务器,也可以是多个物理服务器构成的服务器集群或者分布式系统,还可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、cdn、区块链以及大数据和人工智能平台等基础云计算服务的云服务器。终端可以是智能手机、平板电脑、笔记本电脑、台式计算机等,但并不局限于此。所述文案生成方法具体可以包括以下步骤:
38.步骤s110:获取商品标题。
39.其中,商品标题是标明商品的简短语句,商品标题可以使消费者了解到商品的主要信息,例如,商品a的标题为“一种人工智能控制的扫地机器人”。由于商品标题所包含的商品信息有限,所以需要为商品创作广告文案以便突出商卖点,从而增强广告效应,为此,本技术实施例提出了文案生成方法,该方法可以基于商品标题生成对应的广告文案。
40.作为一种实施方式,可以从广告投放平台获取商品标题。具体地,用户为了推广商品,可以利用将商品标题上传至广告投放平台,以便生成并投放广告文案。进一步地,广告投放平台可以将用户上传的商品标题存放至本地数据库或云数据库中,进而可以从数据库中获取商品标题。
41.步骤s120:对商品标题进行分词处理,得到标题分词序列。
42.在本技术实施例中,分词处理(tokenization)指的是将句子按照不同粒度切分成多个分词(token),从而构成分词序列。为了便于生成文案,可以对商品标题进行分词处理,从而得到商品标题对应的分词序列,也即标题分词序列,例如,商品a的标题对应的标题分词序列:“一种/人工智能/控制的/扫地/机器人”。
43.作为一种实施方式,可以根据商品标题的语言类型,使用不同方式的分词处理。示
例性地,对于中文的商品标题,考虑到粒度越大,分词表达的意思就越准确,且商品标题的句式长度较短,在获取商品标题之后,可以基于词粒度对该商品标题进行分词处理,进而得到由多个词语构成的标题分词序列。
44.步骤s130:将标题分词序列输入至预先训练得到的文案生成模型,通过文案生成模型输出商品标题对应的目标文案。
45.目前,有关技术中,因模型词典的限制,基于端到端模型学习生成广告文案的方法,难以准确复述商品标题的细节、无法处理商品标题中的未登录词。导致广告文案中无法准确地包含商品信息。例如,某个具有独特原料x的食品品牌,由于模型词典中没有“独特原料x”的相关词汇,所以利用模型生成的广告文案无法包含商品的特殊信息——独特原料x,从而导致广告文案无法突出商品卖点和重要信息,使得广告文案起不到有效的传播作用。
46.为此,本技术实施例提供了一种文案生成模型,该文案生成模型为基于商品样本标题和广告标注文案,并结合商品样本标题的标题训练分词训练得到。如此,文案生成模型可以直接从商品标题中复制一些词到目标文案中,进而使得文案能准确地包含商品信息。
47.其中,文案生成模型可以包括编码器、解码器以及词汇选择器。其中,编码器用于对商品标题的分词进行特征提取,解码器用于生成模型词典中每个词典词汇的选择概率,词汇选择器用于从标题分词序列或模型词典中选择文案词汇,以便生成目标文案。
48.作为一种实施方式,可以将标题分词序列输入至预先训练得到的文案生成模型的编码器,编码器可以对标题分词序列的每个分词进行特征提取得到特征向量,并将特征向量输入至解码器,进而解码器解码并预测出标题中每个分词关于模型词典的概率分布。
49.进一步地,词汇选择器可以基于每个分词关于模型词典的概率分布和标题分词序列的概率分布,得到结合标题分词序列和模型词典的一个合并的概率分布。同时词汇选择器可以基于合并的概率分布决定当前预测是直接从标题分词序列中复制一个词还是从模型词典中生成一个词来作为构成目标文案的词语,如此,根据合并的概率分布得到多个词语最终组成目标文案。
50.本技术实施例中,可以获取商品标题,并对商品标题进行分词处理,得到标题分词序列,进而将标题分词序列输入至预先训练得到的文案生成模型,通过文案生成模型输出商品标题对应的目标文案。由于文案生成模型可以从商品标题中选取分词构建目标文案,所以能够避免因模型词典限制出现的登录词且能够生成生僻词,从而降低广告文案生成难度,提高广告文案生成的效率,并且从商品标题中选取的分词使得生成的广告文案能准确地体现商品信息。
51.结合上述实施例所描述的方法,以下将举例作进一步详细说明。
52.本实施例提供的文案生成方法具体涉及人工智能(artificial intelligence,ai)中的自然语言处理(nature language processing,nlp)等技术,下面将以文案生成装置具体集成在计算机设备中为例进行说明,并将针对图3所示的流程结合图4所示的应用场景进行详细地阐述,该计算机设备可以为服务器或者终端设备等。请参阅图3,图3示出了本技术实施例提供的另一种文案生成方法,在具体的实施例中,该文案生成方法可以运用到如图4所示的广告投放场景中。
53.广告投放服务供应商提供服务端,该服务端包括云训练服务器410以及云执行服务器430。云训练服务器410用于训练出文案生成模型。服务端可以将该文案生成模型部署
在云执行服务器430上,云执行服务器430用于对客户端发送的商品标题生成对应的广告文案,并对广告文案进行投放。其中,客户端为用户使用广告投放服务时,在笔记本电脑上打开的广告管理平台420。所述文案生成方法具体可以包括以下步骤:
54.步骤s210:计算机设备获取训练样本集合。
55.其中,训练样本集合包括商品样本标题和每个商品样本标题对应的广告标注文案。本技术实施例中提供的文案生成方法包括对预设文案生成网络的训练,值得说明的是,对预设文案生成网络的训练可以是根据获取的训练样本数据集合预先进行的,后续在每次需要执行广告文案生成的任务时,可以利用训练得到的文案生成模型直接计算,而无需每次执行广告文案生成的任务时,再次进行网络训练。
56.作为一种实施方式,该计算机设备获取训练样本集合的步骤可以包括:
57.(1)计算机设备获取广告历史数据。
58.其中,广告历史数据包括广告服务系统中存储的历史商品标题以及历史广告文案。示例性地,云训练服务器410可以在得到数据调用的授权后,通过广告服务系统开放的应用程序接口(application program interface,api)获取广告服务系统中存储的历史商品标题以及历史广告文案。
59.(2)计算机设备对历史商品标题以及历史广告文案进行数据处理,得到商品样本标题和广告标注文案。
60.由于真实世界的数据通常包含噪声和缺失值等问题,并且可能是无法直接用于神经网络的数据格式,所以在对预设文案生成网络进行训练前,可以对获取的广告历史数据进行数据处理,使得数据处理后的数据可以适用于预设文案生成网络的训练,并且提高网络训练的准确性和效率。
61.示例性地,云训练服务器410可以对历史商品标题以及历史广告文案进行数据清洗、数据集成以及数据变换等处理步骤,在此不做限定,例如,数据清洗可以处理历史商品标题和历史广告文案中数据的不一致性,如缺失值处理、光滑噪声数据、平滑或删除离群点。数据变换可以对广告历史数据进行标准化、离散化、稀疏化等处理。
62.(3)计算机设备基于商品样本标题和广告标注文案,生成训练样本集合。
63.示例性地,云训练服务器410在对历史商品标题以及历史广告文案进行数据处理,得到商品样本标题和广告标注文案之后,可以基于商品样本标题xi和广告标注文案生成训练样本集合其中n为样本数,n《0&n∈*。
64.步骤s220:计算机设备获取预设文案生成网络。
65.在本技术实施例中,预设文案生成网络包括编码器、解码器以及词汇选择器,其中,编码器用于对商品标题的分词进行特征提取,解码器用于生成模型词典中每个词典词汇的选择概率,词汇选择器用于从标题文本序列或模型词典中选择文案词汇,以便生成目标文案。
66.请参阅图5,图5示出了一种预设文案生成网络的架构图。可选地,可以基于长短期记忆网络(long short-term memory,lstm)作为网络子结构来构建编码器(encoder)和解码器(decoder)。示例性地,云训练服务器410可以部署有该预设文案生成网络。
67.步骤s230:计算机设备基于训练样本集合对预设文案生成网络进行训练,直至预设文案生成网络满足预设条件,得到训练后的文案生成模型。
68.当获取训练样本集合和预设文案生成网络后,可以将该训练样本集合输入预设文案生成网络得到广告预测文案,并基于广告预测文案确定损失函数,进而根据损失函数对预设文案生成网络进行迭代训练,最终得到文案生成模型。
69.在一些实施例中,该计算机设备基于训练样本集合对预设文案生成网络进行训练,直至预设文案生成网络满足预设条件,得到训练后的文案生成模型可以包括:
70.(1)计算机设备获取商品样本标题的标题训练序列。
71.示例性地,云训练服务器410可以从存储有训练样本集合中获取商品样本标题,并对该商品样本标题进行分词处理,得到商品样本标题对应的标题训练序列,该标题训练序列包括多个标题训练分词。
72.(2)计算机设备将标题训练序列输入至预设文案生成网络,通过预设文案生成网络生成广告预测文案。
73.作为一种实施方式,该计算机设备将标题训练序列输入至预设文案生成网络,通过预设文案生成网络生成广告预测文案的步骤可以包括:
74.(2.1)计算机设备将标题训练分词输入至编码器,通过编码器生成标题训练分词对应的第一特征向量。
75.(2.2)计算机设备将第一特征向量输入至解码器,通过解码器生成模型词典中每个词典词汇的被选中作为文案词汇的选中概率,以及输出对第一特征向量进行解码后的第二特征向量。
76.(2.3)计算机设备将第一特征向量和第二特征向量输入至词汇选择器,通过词汇选择器生成词汇选择权重和注意力权重。
77.示例性地,云训练服务器410可以将标题训练分词输入至编码器,通过编码器生成标题训练分词对应的第一特征向量hi,将第一特征向量hi输入至解码器,通过解码器生成模型词典中每个词典词汇的被选中作为文案词汇的选中概率pv,以及输出对第一特征向量hi进行解码后的第二特征向量s
t
,t表示时间状态,i表示样本序列。
78.进一步地,云训练服务器410可以基于第一特征向量hi和第二特征向量s
t
,利用第一激活函数计算出词汇选择权重pc,其中,第一激活函数可以使用sigmoid函数,具体计算公式如下:
79.pc=sigmoid(w1hi w2s
t
)
80.其中,w1和w2为待训练参数,词汇选择权重pc用于确定t时刻生成的文案的词语,有多大的概率是直接从商品样本标题中直接复制的。
81.进一步地,云训练服务器410可以基于第一特征向量hi和第二特征向量s
t
,利用第二激活函数计算出注意力权重pa,其中,第二激活函数可以使用softmax函数,具体计算公式如下:
82.pa=softmax(w1hi w2s
t
)
83.其中,注意力权重pa用于确定预设文案生成网络在当前步的预测过程中,商品样本标题中的哪些词更重要。
84.(2.4)计算机设备根据选中概率、词汇选择权重以及注意力权重,生成广告预测文案。
85.示例性地,云训练服务器410可以根据选中概率pv、词汇选择权重pc以及注意力权
重pa,生成广告预测文案。具体地,根据选中概率pv和词汇选择权重pc,确定从模型词典中选择文案预测词汇的第一选择概率pcpv。进一步地,根据注意力权重pa和词汇选择权重pc,确定从标题训练序列中选择文案预测词汇的第二选择概率(1-pc)pa。
86.进一步地,云训练服务器410可以基于第一选择概率和第二选择概率,确定多个文案预测词汇,并基于多个文案预测词汇生成广告预测文案,具体计算公式如下:
87.pw=pcpv (1-pc)pa88.其中,pw为当前词语作为组成文案的词语的概率,pcpv表示从模型词典生成文案的词语的概率,如果当前词语不在模型词典中,则pcpv=0。(1-pc)pa表示从商品样本标题中复制词语作为文案的词语的概率,如果当前词语不在商品样本标题中,则(1-pc)pa=0。最终根据pw的概率分布,选取最大概率的词语构成广告预测文案。
89.(3)计算机设备基于广告预测文案和广告标注文案,获取预设文案生成网络的损失值,并根据损失值对预设文案生成网络进行迭代训练,直至预设文案生成网络满足预设条件。
90.示例性地,云训练服务器410在获取广告预测文案y后,可以基于广告预测文案和广告标注文案确定损失函数可选地,可以利用交叉熵(cross-entropy)损失函数。
91.进一步地,云训练服务器410可以基于损失函数计算出预设文案生成网络的损失值,并根据损失值对预设文案生成网络进行迭代训练,直至预设文案生成网络满足预设条件。
92.需要说明的是,预设条件可以为:目标损失函数的总损失值小于预设值、目标损失函数的总损失值不再变化、或者训练次数达到预设次数等。可选的,可以采用优化器去优化目标损失函数,基于实验经验设置学习率(learning rate)、训练时的批量大小(batch size)以及训练的时期(epoch)。
93.云训练服务器410在训练结束,得到文案生成模型后,可以将文案生成模型部署在云执行服务器430上,以便云执行服务器430对客户端发送的商品标题生成对应的广告文案。
94.步骤s240:计算机设备获取商品标题。
95.示例性地,用户利用广告管理平台420进行广告时,广告管理平台420可以将用户输入的商品标题上传至云执行服务器430,进而云执行服务器430接收到来自广告管理平台420的商品标题。
96.步骤s250:计算机设备对商品标题进行分词处理,得到标题文本序列。
97.示例性地,云执行服务器430可以基于词粒度对该商品标题进行分词处理,进而得到由多个词语构成的标题分词序列。例如,云执行服务器430基于词粒度对商品标题“x1x2x3x4x5x6x7x8x
9”进行分词处理后,可以得到该商品标题对应的标题分词序列{x1,x2x3x4,x5x6,x7x8,x9}。
98.步骤s260:计算机设备将标题文本序列输入至预先训练得到的文案生成模型,通过文案生成模型输出商品标题对应的目标文案。
99.示例性地,云执行服务器430可以将标题文本序列输入至预先训练得到的文案生成模型,通过文案生成模型生成商品标题对应的目标文案,进而云执行服务器430可以对生成的目标文案进行广告投放。
100.本技术实施例中,可以获取训练样本集合和预设文案生成网络,并基于训练样本集合对预设文案生成网络进行训练,直至预设文案生成网络满足预设条件,得到训练后的文案生成模型,进而获取商品标题,并对商品标题进行分词处理,得到标题分词序列,进而将标题分词序列输入至预先训练得到的文案生成模型,通过文案生成模型输出商品标题对应的目标文案。由于文案生成模型可以从商品标题中选取分词构建目标文案,所以能够避免因模型词典限制出现的登录词且能够生成生僻词,从而降低广告文案生成难度,提高广告文案的生成效率,并且从商品标题中选取的分词使得生成的广告文案能准确地体现商品信息。
101.请参阅图6,其示出了本技术实施例提供的一种文案生成装置500的结构框图。该文案生成装置500可以包括:标题获取模块510,用于获取商品标题;分词处理模块520,用于对商品标题进行分词处理,得到标题分词序列;文案生成模块530,用于将标题分词序列输入至预先训练得到的文案生成模型,通过文案生成模型输出商品标题对应的目标文案,文案生成模型为基于商品样本标题和广告标注文案,并结合商品样本标题的标题训练分词训练得到。
102.在一些实施例中,文案生成装置500还可以包括:样本获取模块,用于获取训练样本集合,训练样本集合包括商品样本标题和每个商品样本标题对应的广告标注文案;网络获取模块,用于获取预设文案生成网络,预设文案生成网络包括编码器、解码器以及词汇选择器;网络训练模块,用于基于训练样本集合对预设文案生成网络进行训练,直至预设文案生成网络满足预设条件,得到训练后的文案生成模型;其中,编码器用于对商品标题的分词进行特征提取,解码器用于生成模型词典中每个词典词汇的选择概率,词汇选择器用于从标题分词序列或模型词典中选择文案词汇,以便生成目标文案。
103.在一些实施例中,网络训练模块可以包括:序列获取单元,用于获取商品样本标题的标题训练序列;文案生成单元,用于将标题训练序列输入至预设文案生成网络,通过预设文案生成网络生成广告预测文案;网络训练单元,用于基于广告预测文案和广告标注文案,获取预设文案生成网络的损失值,并根据损失值对预设文案生成网络进行迭代训练,直至预设文案生成网络满足预设条件。
104.在一些实施例中,标题训练序列可以包括多个标题训练分词,文案生成单元可以包括:第一生成子单元,用于将标题训练分词输入至编码器,通过编码器生成标题训练分词对应的第一特征向量;第一生成子单元,用于将第一特征向量输入至解码器,通过解码器生成模型词典中每个词典词汇的被选中作为文案词汇的选中概率,以及输出对第一特征向量进行解码后的第二特征向量;第三生成子单元,用于将第一特征向量和第二特征向量输入至词汇选择器,通过词汇选择器生成词汇选择权重和注意力权重;第四生成子单元,用于根据选中概率、词汇选择权重以及注意力权重,生成广告预测文案。
105.在一些实施例中,词汇选择器可以包括第一激活函数和第二激活函数,第三生成子单元可以具体用于:基于第一特征向量和第二特征向量,利用第一激活函数计算出词汇选择权重,第一激活函数包括sigmoid函数;基于第一特征向量和第二特征向量,利用第二激活函数计算出注意力权重,第二激活函数包括softmax函数。
106.在一些实施例中,第四生成子单元可以具体用于:根据选中概率和词汇选择权重,确定从模型词典中选择文案预测词汇的第一选择概率;根据注意力权重和词汇选择权重,
确定从标题训练序列中选择文案预测词汇的第二选择概率;基于第一选择概率和第二选择概率,确定多个文案预测词汇,并基于多个文案预测词汇生成广告预测文案。
107.在一些实施例中,样本获取模块可以具体用于:获取广告历史数据,广告历史数据包括广告服务系统中存储的历史商品标题以及历史广告文案;对历史商品标题以及历史广告文案进行数据处理,得到商品样本标题和广告标注文案;基于商品样本标题和广告标注文案,生成训练样本集合。
108.所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述装置和模块的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
109.在本技术所提供的几个实施例中,模块相互之间的耦合可以是电性,机械或其它形式的耦合。
110.另外,在本技术各个实施例中的各功能模块可以集成在一个处理模块中,也可以是各个模块单独物理存在,也可以两个或两个以上模块集成在一个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。
111.本技术提供的方案,可以获取商品标题,并对商品标题进行分词处理,得到标题分词序列,进而将标题分词序列输入至预先训练得到的文案生成模型,通过文案生成模型输出商品标题对应的目标文案。由于文案生成模型可以从商品标题中选取分词构建目标文案,所以能够避免因模型词典限制出现的登录词且能够生成生僻词,从而降低广告文案生成难度,提高广告文案生成效率较低,并且从商品标题中选取的分词使得生成的广告文案能准确地体现商品信息。
112.如图7所示,本技术实施例还提供一种计算机设备600,该计算机设备600包括处理器610、存储器620、电源630和输入单元640,存储器620存储有计算机程序指令,计算机程序指令被处理器610调用时,可实执行上述的实施例提供的各种方法步骤。本领域技术人员可以理解,图中示出的计算机设备的结构并不构成对计算机设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。其中:
113.处理器610可以包括一个或多个处理核。处理器610利用各种接口和线路连接整个电池管理系统内的各种部分,通过运行或执行存储在存储器620内的指令、程序、代码集或指令集,调用存储在存储器620内的数据,执行电池管理系统的各种功能和处理数据,以及执行计算机设备的各种功能和处理数据,从而对计算机设备进行整体控制。可选地,处理器610可以采用数字信号处理(digital signal processing,dsp)、现场可编程门阵列(field-programmable gate array,fpga)、可编程逻辑阵列(programmable logic array,pla)中的至少一种硬件形式来实现。处理器610可集成中央处理器610(central processing unit,cpu)、图像处理器610(graphics processing unit,gpu)和调制解调器等中的一种或几种的组合。其中,cpu主要处理操作系统、用户界面和应用程序等;gpu用于负责显示内容的渲染和绘制;调制解调器用于处理无线通信。可以理解的是,上述调制解调器也可以不集成到处理器610中,单独通过一块通信芯片进行实现。
114.存储器620可以包括随机存储器620(random access memory,ram),也可以包括只读存储器620(read-only memory)。存储器620图可用于存储指令、程序、代码、代码集或指令集。存储器620可包括存储程序区和存储数据区,其中,存储程序区可存储用于实现操作系统的指令、用于实现至少一个功能的指令(比如触控功能、声音播放功能、图像播放功能
等)、用于实现下述各种方法实施例的指令等。存储数据区还可以存储计算机设备在使用中所创建的数据(比如电话本和音视频数据)等。相应地,存储器620还可以包括存储器控制器,以提供处理器610对存储器620的访问。
115.电源630可以通过电源管理系统与处理器610逻辑相连,从而通过电源管理系统实现管理充电、放电、以及功耗管理等功能。电源630还可以包括一个或一个以上的直流或交流电源、再充电系统、电源故障检测电路、电源转换器或者逆变器、电源状态指示器等任意组件。
116.输入单元640,该输入单元640可用于接收输入的数字或字符信息,以及产生与用户设置以及功能控制有关的键盘、鼠标、操作杆、光学或者轨迹球信号输入。
117.尽管未示出,计算机设备600还可以包括显示单元等,在此不再赘述。具体在本实施例中,计算机设备中的处理器610会按照如下的指令,将一个或一个以上的应用程序的进程对应的可执行文件加载到存储器620中,并由处理器610来运行存储在存储器620中的应用程序,从而实现前述实施例提供的各种方法步骤。
118.如图8所示,本技术实施例还提供一种计算机可读存储介质700,该计算机可读存储介质700中存储有计算机程序指令610,计算机程序指令710可被处理器调用以执行上述实施例中所描述的方法。
119.计算机可读存储介质可以是诸如闪存、eeprom(电可擦除可编程只读存储器)、eprom、硬盘或者rom之类的电子存储器。可选地,计算机可读存储介质包括非易失性计算机可读存储介质(non-transitory computer-readable storage medium)。计算机可读存储介质700具有执行上述方法中的任何方法步骤的程序代码的存储空间。这些程序代码可以从一个或者多个计算机程序产品中读出或者写入到这一个或者多个计算机程序产品中。程序代码可以例如以适当形式进行压缩。
120.根据本技术的一个方面,提供了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行上述实施例提供的各种可选实现方式中提供的方法。
121.以上,仅是本技术的较佳实施例而已,并非对本技术作任何形式上的限制,虽然本技术已以较佳实施例揭示如上,然而并非用以限定本技术,任何本领域技术人员,在不脱离本技术技术方案范围内,当可利用上述揭示的技术内容做出些许更动或修饰为等同变化的等效实施例,但凡是未脱离本技术技术方案内容,依据本技术的技术实质对以上实施例所作的任何简介修改、等同变化与修饰,均仍属于本技术技术方案的范围内。
再多了解一些

本文用于创业者技术爱好者查询,仅供学习研究,如用于商业用途,请联系技术所有人。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献