一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

物品的摘要生成方法、装置和设备与流程

2021-12-07 20:56:00 来源:中国专利 TAG:


1.本技术涉及信息处理技术领域,尤其涉及一种物品的摘要生成方法、装置和设备。


背景技术:

2.随着计算机技术的发展,深度学习技术迅速发展,其在信息推送、大数据分析和摘要自动生成等领域都有广泛的应用,在进行摘要自动生成时,计算机设备可以根据输入的描述物品的详细介绍文本,自动的生成短摘要,用户通过阅读该短摘要即可以快速的对该物品进行初步了解,方便进行物品的挑选。
3.现有技术中,摘要自动生成技术主要是采用自动摘要生成模型,通过复制机制从一个大小固定的词典中,选取出组成短摘要的词语,这种方式由于词典中存储的用于描述物品属性值的词语很多,而物品的一个属性往往只对应有一个用于描述当前属性值的词语,当描述物品属性值的词语较多时,容易产生混乱,使得最后生成的短摘要中描述物品属性值的词语混乱,导致短摘要不能够准确的描述物品信息,容易对用户产生误导。


技术实现要素:

4.本技术提供一种物品的摘要生成方法、装置和设备,用于解决现有摘要自动生成技术无法准确描述物品信息的问题。
5.第一方面,本技术实施例提供一种物品的摘要生成方法,包括:
6.获取用户输入的物品的标识和用于描述所述物品关联信息的文本信息;
7.基于数据库中存储的所述物品的属性以及所述物品的标识,根据预设的知识图谱获取所述物品的当前属性值;
8.根据所述物品的属性以及属性对应的当前属性值,从预设词典中确定对应的当前属性词,所述当前属性词为用于描述所述当前属性值的词语;
9.根据所述当前属性词和所述文本信息,生成所述物品的摘要。
10.在第一方面的一种可能设计中,所述根据所述当前属性词和所述文本信息,生成所述物品的摘要,包括:
11.将所述文本信息进行编码,得到编码器隐层序列;
12.根据预设模型和所述编码器隐层序列,计算得到从所述文本信息中输出摘要词的第一概率,所述摘要词用于构建所述物品的摘要;
13.根据预设模型和所述编码器隐层序列,计算得到从所述预设词典的当前属性词中输出所述摘要词的第二概率;
14.根据所述第一概率和第二概率之和的大小,对所述摘要词进行选取,生成所述物品的摘要。
15.在第一方面的另一种可能设计中,所述根据预设模型和所述编码器隐层序列,计算得到从所述文本信息中输出摘要词的第一概率,包括:
16.对所述文本信息中的词汇进行注意力加权,获取所述文本信息中的每一个词汇的
注意力权重;
17.从所述文本信息中生成摘要词,根据所述预设模型和所述编码器隐层序列,计算得到所述摘要词的输出概率;
18.根据所述文本信息中每一个词汇的注意力权重和所述摘要词的输出概率,计算得到所述第一概率。
19.在第一方面的再一种可能设计中,所述根据预设模型和所述编码器隐层序列,计算得到从所述预设词典的当前属性词中输出所述摘要词的第二概率,包括:
20.根据所述编码器隐层序列和所述文本信息中每一个词汇的注意力权重,计算得到上下文向量;
21.根据所述预设模型和所述上下文向量,获取解码器隐层序列;
22.根据所述预设模型、所述解码器隐层序列和所述上下文向量,计算得到从所述预设词典的当前属性词中生成所述摘要词的概率;
23.根据所述从所述预设词典的当前属性词中生成所述摘要词的概率和所述摘要词的输出概率,计算得到从所述预设词典的当前属性词中输出所述摘要词的第二概率。
24.在第一方面的又一种可能设计中,所述根据所述文本信息中每一个词汇的注意力权重和所述摘要词的输出概率,计算得到所述第一概率,包括:
25.获取所述文本信息中相同的词汇分别对应的注意力权重;
26.将所述相同的词汇对应的注意力权重之和与所述摘要词的输出概率相乘,计算得到所述第一概率。
27.在第一方面的又一种可能设计中,所述根据所述物品的属性以及属性对应的当前属性值,从预设词典中确定对应的当前属性词,包括:
28.根据所述物品的标识,获取所述数据库中存储的所述物品的属性;
29.根据所述物品的属性,获取所述物品的每一个属性对应的属性词全集,所述属性词全集包括用于描述物品的属性值的属性词;
30.根据所述物品的属性对应的当前属性值,从所述属性词全集中确定所述物品的当前属性词。
31.在第一方面的又一种可能设计中,所述基于数据库中存储的所述物品的属性以及所述物品的标识,根据预设的知识图谱获取所述物品的当前属性值,包括:
32.获取所述物品的标识,从所述数据库中获取所述物品的每一个属性;
33.根据所述物品的每一个属性,查找所述预设的知识图谱,得到所述物品每一个属性对应的当前属性值,所述预设知识图谱包括所述物品的规格描述和包装描述。
34.第二方面,本技术实施例提供一种物品的摘要生成装置,包括:
35.信息获取模块,用于获取用户输入的物品的标识和用于描述所述物品关联信息的文本信息;
36.属性值获取模块,用于基于数据库中存储的所述物品的属性以及所述物品的标识,根据预设的知识图谱获取所述物品的当前属性值;
37.属性词确定模块,用于根据所述物品的属性以及属性对应的当前属性值,从预设词典中确定对应的当前属性词,所述当前属性词为用于描述所述当前属性值的词语;
38.摘要生成模块,用于根据所述当前属性词和所述文本信息,生成所述物品的摘要。
39.在第二方面的一种可能设计中,所述摘要生成模块,具体用于:
40.将所述文本信息进行编码,得到编码器隐层序列;
41.根据预设模型和所述编码器隐层序列,计算得到从所述文本信息中输出摘要词的第一概率,所述摘要词用于构建所述物品的摘要;
42.根据预设模型和所述编码器隐层序列,计算得到从所述预设词典的当前属性词中输出所述摘要词的第二概率;
43.根据所述第一概率和第二概率之和的大小,对所述摘要词进行选取,生成所述物品的摘要。
44.在第二方面的另一种可能设计中,所述摘要生成模块,具体用于:
45.对所述文本信息中的词汇进行注意力加权,获取所述文本信息中的每一个词汇的注意力权重;
46.从所述文本信息中生成摘要词,根据所述预设模型和所述编码器隐层序列,计算得到所述摘要词的输出概率;
47.根据所述文本信息中每一个词汇的注意力权重和所述摘要词的输出概率,计算得到所述第一概率。
48.在第二方面的再一种可能设计中,所述摘要生成模块,具体用于:
49.根据所述编码器隐层序列和所述文本信息中每一个词汇的注意力权重,计算得到上下文向量;
50.根据所述预设模型和所述上下文向量,获取解码器隐层序列;
51.根据所述预设模型、所述解码器隐层序列和所述上下文向量,计算得到从所述预设词典的当前属性词中生成所述摘要词的概率;
52.根据所述从所述预设词典的当前属性词中生成所述摘要词的概率和所述摘要词的输出概率,计算得到从所述预设词典的当前属性词中输出所述摘要词的第二概率。
53.在第二方面的又一种可能设计中,所述摘要生成模块,具体用于:
54.获取所述文本信息中相同的词汇分别对应的注意力权重;
55.将所述相同的词汇对应的注意力权重之和与所述摘要词的输出概率相乘,计算得到所述第一概率。
56.在第二方面的又一种可能设计中,所述属性词确定模块,具体用于:
57.根据所述物品的标识,获取所述数据库中存储的所述物品的属性;
58.根据所述物品的属性,获取所述物品的每一个属性对应的属性词全集,所述属性词全集包括用于描述物品的属性值的属性词;
59.根据所述物品的属性对应的当前属性值,从所述属性词全集中确定所述物品的当前属性词。
60.在第二方面的又一种可能设计中,所述属性值获取模块,具体用于:
61.获取所述物品的标识,从所述数据库中获取所述物品的每一个属性;
62.根据所述物品的每一个属性,查找所述预设的知识图谱,得到所述物品每一个属性对应的当前属性值,所述预设知识图谱包括所述物品的规格描述和包装描述。
63.第三方面,本技术实施例提供一种处理设备,包括存储器和至少一个处理器;
64.所述存储器存储计算机执行指令;
65.所述至少一个处理器执行所述存储器存储的计算机执行指令,使得所述至少一个处理器执行如上所述的方法。
66.第四方面,本技术实施例提供一种可读存储介质,其上存储有计算机程序,所述可读存储介质中存储有计算机指令,所述计算机指令被处理器执行时用于实现如上述的方法。
67.第五方面,本技术实施例提供一种计算机程序产品,包括计算机程序/指令,该计算机程序/指令被处理器执行时实现如上所述的方法。
68.本技术实施例提供的物品的摘要生成方法、装置和设备,通过获取物品每一个属性对应的当前属性值,根据当前属性值从预设词典的所有属性词中确定用于描述物品当前属性值的当前属性词,以及根据用户输入的文本信息和预设词典中的当前属性词,生成物品的摘要,能够避免预设词典中的属性词发生混乱,造成摘要中存在非当前属性词,对用户产生误导的问题,提高物品摘要描述的准确度。
附图说明
69.图1为本技术实施例提供的物品的摘要生成方法的场景示意图;
70.图2为本技术实施例提供的物品的摘要生成方法实施例一的流程示意图;
71.图3为本技术实施例提供的物品的摘要生成方法实施例二的流程示意图;
72.图4为本技术实施例提供的物品的摘要生成装置的结构示意图;
73.图5为本技术实施例提供的处理设备的结构示意图。
具体实施方式
74.为使本技术实施例的目的、技术方案和优点更加清楚,下面将结合本技术实施例中的附图,对本技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本技术一部分实施例,而不是全部的实施例。基于本技术中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本技术保护的范围。
75.摘要是用于简要描述对象的短语,用户通过阅读摘要可以快速的形成一个初步的了解,摘要的生成主要是通过从对象的详细介绍文本中提炼得到的。
76.为了节省人工提炼摘要所耗费的人工,现有技术中使用自动摘要生成技术来生成摘要,其主要是输入一段对象的详细介绍文本至计算机等处理设备,通过计算机使用双向长短期记忆网络(lstm,long short

term memory)作为编码器对文本进行编码,生成一个编码器隐层序列;使用单向lstm作为解码器,基于注意力机制和复制机制,利用编码器隐层序列生成对象的摘要,其中,注意力机制是指在生成某一个摘要词时,对源端输入信息的注意力大小是不同的,需要通过注意力机制对源端每次词进行加权,复制机制是指生成的摘要词除了可以在固定大小的词典中选取之外,还可以在输入文本的词中进行复制选取,生成的摘要词的概率是词典中词的生成概率和在源端复制词的概率的叠加,最终根据生成的摘要词的概率,选取摘要词以生成摘要。但是现有技术中,在基于复制机制的生成式自动摘要模型在生成摘要词时,由于生成的摘要词有可能会来自于一个固定大小的词典中,可能会导致生成的摘要词与输入的文本不一致的问题,而根据这些摘要词构建得到的摘要就会出现描述偏差,使得摘要无法准确描述对象,容易误导用户。
77.针对上述问题,本技术实施例提供一种物品的摘要生成方法、装置和设备,其具体技术构思如下:通过获取物品的每一个属性对应的当前属性值,从预设词典中确定出描述当前属性值的属性词,在摘要生成过程中,基于注意力机制和复制机制,利用生成式自动摘要模型,从这些属性词和用户输入的文本信息中选取得到摘要词,组合得到物品的摘要,如此就可以避免来自于预设词典中词语与输入的文本信息中的词语不一致的情况,保证最后生成的摘要不会出现描述偏差,提高摘要描述的准确度。
78.图1为本技术实施例提供的物品的摘要生成方法的场景示意图,如图1所示,该方法可以应用于云端的服务器12上,用户可以通过本地的计算机11输入物品的标识和描述物品关联信息的文本信息,通过本地的计算机11上传到服务器12,由服务器12来完成摘要的自动生成,最后由服务器12将生成的摘要返回给本地的计算机11。
79.服务器12在摘要自动生成的过程中,通过物品的标识来获取物品的属性以及属性对应的当前属性值,从预设词典中确定用于描述当前属性值的词语(即当前属性词),服务器12可以调用预设模型,例如现有的生成式自动摘要模型,基于复制上述的注意力机制和复制机制,从当前属性词和文本信息中生成物品的摘要。
80.示例性的,该方法也可以应用于本地的计算机11中,用户直接输入物品的标识和文本信息至本地的计算机11,由本地的计算机来完成摘要的自动生成,并通过计算机11的显示屏幕输出物品的摘要。
81.下面,通过具体实施例对本技术的技术方案进行详细说明。需要说明的是,下面这几个具体的实施例可以相互结合,对于相同或相似的概念或过程可能在某些实施例中不再赘述。
82.图2为本技术实施例提供的物品的摘要生成方法实施例一的流程示意图,如图2所示,该方法可以应用于计算机或服务器等处理设备,以计算机作为执行主体为例,该方法具体可以包括以下步骤:
83.s201、获取用户输入的物品的标识和用于描述物品关联信息的文本信息。
84.具体的,物品关联信息包括有物品的颜色、尺寸和生产制造方信息等等,文本信息用于对物品进行详细的介绍,示例性的,文本信息可以是一段对物品进行详细介绍的文字。
85.物品的标识可以是数字编码,不同的物品对应有一个不同的数字编码,计算机通过该数字编码来对物品进行识别。
86.s202、基于数据库中存储的物品的属性以及物品的标识,根据预设的知识图谱获取物品的当前属性值。
87.在本实施例中,数据库可以是预先设置在计算机缓存中的,每一个物品都有其对应的各种不同的属性,示例性的,属性包括有颜色、尺寸、品牌和制造材料等等,每一个属性的属性值可以有多个,例如颜色对应的属性值包括有白色、黑色、红色、绿色和紫色等。一个物品的每一个属性都对应有一个当前属性值,预设的知识图谱中包括有物品的属性以及该属性对应的当前属性值。
88.s203、根据物品的属性以及属性对应的当前属性值,从预设词典中确定对应的当前属性词。
89.其中,当前属性词为用于描述当前属性值的词语。
90.示例性的,预设词典中包括有若干个描述属性值的词语,例如当属性为颜色时,则
对应的描述该属性的属性值的词语有白色、黑色、、红色、绿色和紫色等,可以理解,物品的属性虽然具有多个,但是每一条属性对应的当前属性值只有一个,例如白色或者黑色等,通过当前属性值,即可从预设词典中确定出当前属性词。
91.示例性的,在从预设词典中确定出当前属性词之后,会将描述该属性的属性值的其他属性词作为矛盾属性词,示例性的,当属性为颜色时,若物品为白色,则当前属性词为白色,黑色、绿色、蓝色和紫色等都会作为矛盾属性词。
92.s204、根据当前属性词和文本信息,生成物品的摘要。
93.具体的,文本信息中包括有详细介绍物品的词语,物品的每一个属性都会对应有一个当前属性词,根据物品的属性的数量,当前属性词的数量对应为一个或多个,示例性的,可以采用现有的基于复制机制的生成式自动摘要模型,从文本信息以及预设词典的当前属性词中选取出摘要词,将选取出的摘要词组合形成物品的摘要。
94.示例性的,在采用基于复制机制的生成式自动摘要模型选取摘要词时,也可以从文本信息以及预设词典中的当前属性词、矛盾属性词中进行选取,在选取的过程中,再将矛盾属性词筛除,最终得到摘要词。
95.示例性的,可以采用双向lstm作为编码器,对文本信息进行编码,生成一个编码器隐层序列,具体的编码过程如下:
96.h
i
=f
enc
(x
i
,h
i
‑1)
97.上式中,x
i
为文本信息,f
enc
表示双向lstm编码器,用于对x
i
进行编码,h
i
表示编码器隐层序列,i取值为正整数。
98.使用单向lstm解码器f
dec
,基于注意力机制和复制机制,通过预设模型逐词生成物品的摘要,具体公式如下:
99.s
t
=f
dec
(s
t
‑1,y
t
‑1,c
t
)
[0100][0101]
α
t
=softmax(e
t
)
[0102]
c
t
=∑
i
α
t,i
h
i
[0103]
上式中,s
t
是解码器隐层序列,y是目标摘要,由用户输入,可以用于预设模型的训练,c
t
是t时刻的上下文向量,通过注意力机制计算得到,α
t,i
为t时刻对源端词汇x
i
的注意力,e
t,i
为输出第t个词时,对于输入的第i个词的重要性打分,softmax为归一化指数函数,α
t
为归一化之后第t个词的重要性得分,u
a
、w
a
、v
a
、w
b
和v
b
为预设模型的参数矩阵。
[0104]
解码器从预设词典中生成摘要词w的概率计算公式如下:
[0105]
p
vocab
(w)=softmax(w
b
s
t
v
b
c
t
)
[0106]
最终解码器生成摘要词w的概率是从预设词典中生成摘要词w的概率p
vocab
(w)和从输入的文本信息的词汇中的复制概率的叠加:
[0107][0108]
其中p
gen
表示通过从预设词典中生成摘要词w的方式输出摘要词w的概率,(1

p
gen
)表示通过从输入的文本信息中复制摘要词w的方式输出摘要词w的概率,计算公式如下:
[0109]
[0110]
其中向量w
c
,w
s
,w
x
和标量b
c
是预设模型的参数,σ是sigmoid函数。
[0111]
本技术实施例通过获取物品每一个属性对应的当前属性值,根据当前属性值从预设词典中确定用于描述当前属性值的当前属性词,从当前属性词和用户输入的文本信息中生成物品的摘要,避免从预设词典中选取出于文本信息不一致的词语作为物品的摘要,提高摘要的描述准确性。
[0112]
在上述实施例的基础上,在一些实施例中,上述步骤s204具体可以包括如下步骤:
[0113]
将文本信息进行编码,得到编码器隐层序列;
[0114]
根据预设模型和编码器隐层序列,计算得到从文本信息中输出摘要词的第一概率;
[0115]
根据预设模型和编码器隐层序列,计算得到从预设词典的当前属性词中输出摘要词的第二概率;
[0116]
根据第一概率和第二概率之和的大小,对摘要词进行选取,生成物品的摘要。
[0117]
其中,摘要词用于构建物品的摘要,示例性的,摘要词包括有多个,可以从这些摘要词中选取两个以上的摘要词共同构建得到物品的摘要。
[0118]
具体的,可以采用上述的双向lstm作为编码器,对文本信息进行编码,得到编码器隐层序列,具体的编码过程如下:
[0119]
h
i
=f
enc
(x
i
,h
i
‑1)
[0120]
上式中,x
i
为文本信息,f
enc
表示双向lstm编码器,用于对x
i
进行编码,h
i
表示编码器隐层序列,i取值为正整数。
[0121]
预设模型可以是现有的基于复制机制的生成式自动摘要模型,将编码器隐层序列输入至预设模型中,基于复制机制,由预设模型计算得到从文本信息中输出摘要词的第一概率,以及从预设词典的当前属性词中输出摘要词的第二概率,选取第一概率和第二概率之和最大的摘要词,构建得到物品的摘要。
[0122]
示例性的,以摘要词为白色为例,从文本信息中输出“白色”的概率作为第一概率,从预设词典的当前属性词中输出“白色”的概率作为第二概率,将第一概率和第二概率相加,得到“白色”的总概率,根据该总概率的大小,确定是否选取“白色”作为构建物品的摘要的词语。
[0123]
本技术实施例通过计算从物品词汇中输出摘要词的概率和从预设词典的当前属性词中输出摘要词的概率,然后将这两个概率求和,以确定是否选取该摘要词构建物品的摘要,可以提高摘要生成的准确度。
[0124]
在上述实施例的基础上,在一些实施例中,上述步骤“根据预设模型和编码器隐层序列,计算得到从文本信息中输出摘要词的第一概率”,具体可以通过如下步骤实现:
[0125]
对文本信息中的词汇进行注意力加权,获取文本信息中的每一个词汇的注意力权重;
[0126]
从文本信息中生成摘要词,根据预设模型和编码器隐层序列,计算得到摘要词的输出概率;
[0127]
根据文本信息中每一个词汇的注意力权重和摘要词的输出概率,计算得到第一概率。
[0128]
具体的,通过注意力机制,对文本信息进行注意力进行加权,得到文本信息中每一
个词的注意力权重,从文本信息中生成的摘要词需要参考从预设词典的当前属性词中生成的摘要词,即从预设词典的当前属性词中生成的摘要词w,则从文本信息中生成的也为摘要词w,文本信息中包括有若干词汇,摘要词w可以是若干词汇中的任一词汇,根据文本信息中每一个词汇的注意力权重,可以得到该摘要词的注意力权重,最后将摘要词w的输出概率和该摘要词的注意力权重相乘,计算得到第一概率。
[0129]
示例性的,通过预设模型和编码器隐层序列,根据如下计算公式计算可以得到摘要词的输出概率:
[0130][0131]
上式中,1

p
gen
为摘要词的输出概率,σ是sigmoid函数,向量w
c
,w
s
,w
x
和标量b
c
是预设模型的参数,预设模型和预设模型的参数可以通过训练得到。
[0132]
本技术实施例通过对文本信息中每一个词汇进行注意力加权,然后根据每一个词汇的注意力权重,确定从文本信息中输出摘要词的概率,使用了注意力机制进行摘要词的输出,能够提高摘要词输出的准确度。
[0133]
在上述实施例的基础上,上述“根据文本信息中每一个词汇的注意力权重和摘要词的输出概率,计算得到第一概率”,具体可以通过如下步骤实现:
[0134]
获取文本信息中相同的词汇分别对应的注意力权重;
[0135]
将相同的词汇对应的注意力权重之和与摘要词的输出概率相乘,计算得到第一概率。
[0136]
具体的,文本信息中存在有若干词汇,这些词汇中可以存在相同的词汇,这些相同的词汇在进行注意力加权时也会分别获得注意力权重,若摘要词w为这些相同的词汇,则将这些相同的词汇对应的注意力权重求和,并与上述的摘要词的输出概率1

p
gen
相乘,计算得到第一概率。
[0137]
本技术实施例通过求和相同词汇的注意力权重,当文本信息中存在有相同的词汇,选取这些相同的词汇作为摘要词时,避免选取出的摘要词出现重复的情况。
[0138]
在上述实施例的基础上,上述“根据预设模型和编码器隐层序列,计算得到从预设词典的当前属性词中输出摘要词的第二概率”,具体可以通过如下步骤实现:
[0139]
根据编码器隐层序列和文本信息中每一个词汇的注意力权重,计算得到上下文向量;
[0140]
根据预设模型和上下文向量,获取解码器隐层序列;
[0141]
根据预设模型、解码器隐层序列和上下文向量,计算得到从预设词典的当前属性词中生成摘要词的概率;
[0142]
根据从预设词典的当前属性词中生成摘要词的概率和摘要词的输出概率,计算得到从预设词典的当前属性词中输出摘要词的第二概率。
[0143]
具体的,上下文向量可以取值为上文提到的c
t
,解码器隐层序列可以为上文提到的s
t
,在获取解码器隐层序列之后,可以通过前文的公式计算得到从预设词典的当前属性词中生成摘要词的概率p
vocab
(w),将p
vocab
(w)与p
gen
相乘,即得到从预设词典的当前属性词中输出摘要词的第二概率。
[0144]
本技术实施例通过计算从预设词典中的当前属性词中生成摘要词的概率,再结合
摘要词的输出概率,最终得到从预设词典的当前属性词中输出摘要词的概率,能够更准确的从预设词典的选取当前属性词。
[0145]
示例性的,在上述实施例的基础上,图3为本技术实施例提供的物品的摘要生成方法实施例二的流程示意图,如图3所示,上述步骤s203具体可以通过如下步骤实现:
[0146]
s301、根据物品的标识,获取数据库中存储的物品的属性;
[0147]
s302、根据物品的属性,获取物品的每一个属性对应的属性词全集;
[0148]
s303、根据物品的属性对应的当前属性值,从属性词全集中确定物品的当前属性词。
[0149]
其中,属性词全集包括用于描述物品的属性值的属性词。
[0150]
在本实施例中,物品的属性可以具有多个,不同的属性都一一对应一个属性词全集,数据库中可以存放有物品标识与物品属性的键值对,通过物品的标识查找数据库,从而确定物品有哪些属性。
[0151]
示例性的,以物品的属性为颜色为例,颜色对应的属性词全集包括有白色、黑色、蓝色、绿色、红色等等,若物品的当前颜色为白色,即可以从属性词全集中确定白色为当前属性词,属性词全集中的其他词为矛盾属性词。
[0152]
本技术实施例通过物品的标识确定物品的属性以及每一个属性对应的属性词全集,可以根据物品的当前属性值,从属性词全集中找出哪些是物品的当前属性词,哪些不是当前属性词(即矛盾属性词),后续可以避免从矛盾属性词中生成物品的摘要,提高摘要描述的准确性。
[0153]
在上述实施例的基础上,在一个实施例中,上述步骤s202具体可以通过如下步骤实现:
[0154]
获取物品的标识,从数据库中获取物品的每一个属性;
[0155]
根据物品的每一个属性,查找预设的知识图谱,得到物品每一个属性对应的当前属性值。
[0156]
其中,预设知识图谱包括物品的规格描述和包装描述。示例性的,规格描述包括有系列型号、颜色、材质、尺寸、功率、额定电压、功能中的至少一种描述,包装描述包括有物品的包装清单描述等。
[0157]
在本实施例中,预设的指示图谱可以包括有属性与当前属性值一一对应的关系表格,当确定物品的属性之后,可以直接从关系表格中查找到该属性对应的当前属性值。
[0158]
本技术实施例通过每一个物品对应有相应的标识,通过该标识可以查询到物品具有哪些属性,然后根据预设知识图谱找到每一条属性对应的当前属性值,以确定物品的当前属性词,避免存在从预设词典的矛盾属性词中生成摘要的可能,提高摘要生成的准确度,避免对用户产生误导。
[0159]
综上,通过物品的标识可以获取物品的属性,并确定物品的每一个属性对应的当前属性值,根据当前属性值能够从预设词典中确定出哪些是当前属性词,哪些是矛盾属性词,从而使得计算机等处理设备能够从文本信息和当前属性词中准确的生成出物品的摘要,避免从矛盾属性词中生成物品的摘要,提高摘要描述的准确度,避免对用户产生误导。
[0160]
下述为本技术装置实施例,可以用于执行本技术方法实施例。对于本技术装置实施例中未披露的细节,请参照本技术方法实施例。
[0161]
图4为本技术实施例提供的物品的摘要生成装置的结构示意图,如图4所示,该摘要生成装置40包括信息获取模块41、属性值获取模块42、属性词确定模块43和摘要生成模块44,其中,
[0162]
信息获取模块41用于获取用户输入的物品的标识和用于描述物品关联信息的文本信息;属性值获取模块42,用于基于数据库中存储的物品的属性以及物品的标识,根据预设的知识图谱获取物品的当前属性值;属性词确定模块43,用于根据物品的属性以及属性对应的当前属性值,从预设词典中确定对应的当前属性词;摘要生成模块44,用于根据当前属性词和文本信息,生成物品的摘要。
[0163]
其中,当前属性词为用于描述当前属性值的词语。
[0164]
示例性的,在一些实施例中,摘要生成模块44,具体用于:
[0165]
将文本信息进行编码,得到编码器隐层序列;
[0166]
根据预设模型和编码器隐层序列,计算得到从文本信息中输出摘要词的第一概率;
[0167]
根据预设模型和编码器隐层序列,计算得到从预设词典的当前属性词中输出摘要词的第二概率;
[0168]
根据第一概率和第二概率之和的大小,对摘要词进行选取,生成物品的摘要。
[0169]
其中,摘要词用于构建物品的摘要。
[0170]
可选的,在一些实施例中,摘要生成模块44,具体用于:
[0171]
对文本信息中的词汇进行注意力加权,获取文本信息中的每一个词汇的注意力权重;
[0172]
从文本信息中生成摘要词,根据预设模型和编码器隐层序列,计算得到摘要词的输出概率;
[0173]
根据文本信息中每一个词汇的注意力权重和摘要词的输出概率,计算得到第一概率。
[0174]
可选的,在一些实施例中,摘要生成模块44,具体用于:
[0175]
根据编码器隐层序列和文本信息中每一个词汇的注意力权重,计算得到上下文向量;
[0176]
根据预设模型和上下文向量,获取解码器隐层序列;
[0177]
根据预设模型、解码器隐层序列和上下文向量,计算得到从预设词典的当前属性词中生成摘要词的概率;
[0178]
根据从预设词典的当前属性词中生成摘要词的概率和摘要词的输出概率,计算得到从预设词典的当前属性词中输出摘要词的第二概率。
[0179]
可选的,在一些实施例中,摘要生成模块44,具体用于:
[0180]
获取文本信息中相同的词汇分别对应的注意力权重;
[0181]
将相同的词汇对应的注意力权重之和与摘要词的输出概率相乘,计算得到第一概率。
[0182]
示例性的,在一些实施例中,属性词确定模块43,具体用于:
[0183]
根据物品的标识,获取数据库中存储的物品的属性;
[0184]
根据物品的属性,获取物品的每一个属性对应的属性词全集,属性词全集包括用
于描述物品的属性值的属性词;
[0185]
根据物品的属性对应的当前属性值,从属性词全集中确定物品的当前属性词。
[0186]
示例性的,在一些实施例中,属性值获取模块42,具体用于:
[0187]
获取物品的标识,从数据库中获取物品的每一个属性;
[0188]
根据物品的每一个属性,查找预设的知识图谱,得到物品每一个属性对应的当前属性值,预设知识图谱包括物品的规格描述和包装描述。
[0189]
本发明实施例提供的物品的摘要生成装置,可用于执行上述的方法实施例,其实现原理和技术效果类似,本实施例此处不再赘述。
[0190]
图5为本技术实施例提供的处理设备的结构示意图,如图5所示,该处理设备50包括存储器51和至少一个处理器52,其中,处理器52、存储器51通过总线53连接,存储器51存储计算机执行指令;
[0191]
在具体的实现过程中,至少一个处理器52执行存储器51存储的计算机执行指令,使得至少一个处理器52执行如上物品的摘要生成方法的步骤。
[0192]
处理器52的具体实现过程可参见上述方法实施例,其实现原理和技术效果类似,本实施例此处不再赘述。
[0193]
本技术实施例还提供一种可读存储介质,该可读存储介质中存储有计算机执行指令,当处理器执行计算机执行指令时,实现如上的物品的摘要生成方法。
[0194]
上述的计算机可读存储介质,上述可读存储介质可以是由任何类型的易失性或非易失性存储设备或者它们的组合实现,如静态随机存取存储器(sram),电可擦除可编程只读存储器(eeprom),可擦除可编程只读存储器(eprom),可编程只读存储器(prom),只读存储器(rom),磁存储器,快闪存储器,磁盘或光盘。可读存储介质可以是通用或专用计算机能够存取的任何可用介质。
[0195]
本技术实施例还提供一种计算机程序产品,包括计算机程序/指令,该计算机程序/指令被处理器执行时实现如上物品的摘要生成方法的步骤。
[0196]
本技术中,“至少一个”是指一个或者多个,“多个”是指两个或两个以上。“和/或”,描述关联对象的关联关系,表示可以存在三种关系,例如,a和/或b,可以表示:单独存在a,同时存在a和b,单独存在b的情况,其中a,b可以是单数或者复数。字符“/”一般表示前后关联对象是一种“或”的关系;在公式中,字符“/”,表示前后关联对象是一种“相除”的关系。“以下至少一项(个)”或其类似表达,是指的这些项中的任意组合,包括单项(个)或复数项(个)的任意组合。例如,a,b,或c中的至少一项(个),可以表示:a,b,c,a

b,a

c,b

c,或a

b

c,其中,a,b,c可以是单个,也可以是多个。
[0197]
可以理解的是,在本技术实施例中涉及的各种数字编号仅为描述方便进行的区分,并不用来限制本技术的实施例的范围。在本技术的实施例中,上述各过程的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本技术的实施例的实施过程构成任何限定。
[0198]
最后应说明的是:以上各实施例仅用以说明本技术的技术方案,而非对其限制;尽管参照前述各实施例对本技术进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本技术各实施例技术
方案的范围。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献