一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

商品短名称生成方法、电子价签系统及介质与流程

2022-02-25 18:16:50 来源:中国专利 TAG:


1.本公开涉及电子技术领域,更具体地,涉及一种商品短名称生成方法、电子价签系统及介质。


背景技术:

2.商品名称通常是品牌词 类目词 颜色 型号等字段按照一定规则拼装而成,随着营销场景的丰富,加之seo等手段的需要,商家越来越多的会将某个商品的特性、某个品类的核心卖点或者当下营销热门词汇融合进来,造成名称越来越长。而在某个特定场景下,譬如电子价签或特殊尺寸的显示屏,受限于屏幕尺寸,无法完整展现整个商品名称,此时需要提取商品名称核心字段展示。
3.现有技术中,提取商品名称核心字段的一种解决思路,也即基于商品分类构建分类下的关键词词库,用标题分词后进行关键词匹配提取标准中的关键词,最终根据词性拼接组成商品短标题。
4.在实现本公开构思的过程中,发明人发现现有技术中至少存在如下问题:现有技术通过商品录入时填写的属性字段按照规则进行拼接或者直接简单暴力的按字符长度截断,这种方法需要不断地罗列规则去适配大量不同的句式,才能提取出商品中关键的指标数据;且需要事先设定好关键指标名称,而对于之前未提及过的指标,并不能智能识别出来。


技术实现要素:

5.有鉴于此,本公开提供了一种商品短名称生成方法、电子价签系统及介质。
6.本公开的一个方面提供了一种商品短名称生成方法,包括:获取电子货架上的待识别的商品全名称;将待识别的商品全名称输入目标关键词识别模型,预测待识别的商品全名称的实体标签序列;利用拼接规则拼接实体标签序列对应的关键词,生成商品短名称,商品短名称显示于电子货架中。
7.根据本公开的实施例,目标关键词识别模型是通过如下方式进行训练的:搜集电子货架中的商品全名称;对搜集的商品全名称逐字进行实体标注,作为待训练样本;利用待训练样本对关键词识别模型进行训练,得到目标关键词识别模型。
8.根据本公开的实施例,对搜集的商品全名称逐字进行实体标注,包括:按照预设的不同实体类型,采用bio标注模式对商品全名称逐字进行实体标注。
9.根据本公开的实施例,预设的不同实体类型包括:商品品牌、型号、颜色、网络类型、内存、商品编码、计量单位、重量或单价中的至少一种。
10.根据本公开的实施例,利用待训练样本对关键词识别模型进行训练,包括:将待训练样本进行文本向量化后,输入关键词识别模型进行训练;其中,将待训练样本进行文本向量化,包括:利用分布式词向量表示方法word2vec或全局词频统计glove通过预训练获取向量矩阵,或者随机初始化形成向量矩阵。
11.根据本公开的实施例,关键词识别模型为bilstm-crf模型,依次包括:look-up层、双向lstm层和crf层,双向lstm层用于自动提取句子特征,crf层用于标注类别标签序列。
12.根据本公开的实施例,look-up层利用预训练或随机初始化形成的向量矩阵将待训练样本中的每个字由独热编码映射为低维稠密的字向量。
13.根据本公开的实施例,得到目标关键词识别模型的步骤之前,还包括:构建损失函数,将预测的实体标签序列和经过实体标注的商品全名称输入至损失函数中,计算损失值以确定迭代训练次数,直至损失值小于预设阈值。
14.根据本公开的实施例,拼接规则是预先创建的拼接规则。
15.根据本公开的实施例,拼接规则还包括:抽取预设的不同实体类型中的至少两种实体类型,将至少两种实体类型按照预设顺序排列。
16.本公开的另一个方面提供了一种电子价签系统,包括:名称获取模块,用于获取电子货架上的待识别的商品全名称;标签识别模块,用于将待识别的商品全名称输入目标关键词识别模型,预测待识别的商品全名称的实体标签序列;以及拼接显示模块,用于利用拼接规则拼接实体标签序列对应的关键词,生成商品短名称,商品短名称显示于电子货架中。
17.根据本公开的实施例,标签识别模块还包括:名称搜集单元,用于搜集电子货架中的商品全名称;实体标注单元,用于对搜集的商品全名称逐字进行实体标注,作为待训练样本;模型训练单元,用于利用待训练样本对关键词识别模型进行训练,得到目标关键词识别模型。
18.根据本公开的实施例,实体标注单元还用于按照预设的不同实体类型,采用bio标注模式对商品全名称逐字进行实体标注。
19.根据本公开的实施例,关键词识别模型为bilstm-crf模型,依次包括:look-up层、双向lstm层和crf层,双向lstm层用于自动提取句子特征,crf层用于标注类别标签序列。
20.根据本公开的实施例,模型训练单元还用于构建损失函数,将预测的实体标签序列和经过实体标注的商品全名称输入至损失函数中,计算损失值以确定迭代训练次数,直至损失值小于预设阈值,得到目标关键词识别模型。
21.根据本公开的实施例,拼接规则是预先创建的拼接规则。
22.本公开的另一方面提供了一种计算机程序,所述计算机程序包括计算机可执行指令,所述指令在被执行时用于实现如上所述的方法。
23.本公开的另一方面提供了一种计算机可读存储介质,存储有计算机可执行指令,所述指令在被执行时用于实现如上所述的方法。
24.根据本公开的实施例,因为采用了双向长短时记忆网络bilstm 和条件随机场crf创建关键词识别模型的技术手段,所以至少部分地克服了需要人工更换的繁琐和不能通过自然语言的学习智能地识别出来的技术问题,进而达到了自动实现电子货架自动化管理,保证收银台与电子货架之间的价格一致性,提高用户的便利性的技术效果。
附图说明
25.通过以下参照附图对本公开实施例的描述,本公开的上述以及其他目的、特征和优点将更为清楚,在附图中:
26.图1示意性示出了可以应用本公开的商品短名称生成方法和电子价签系统的示例
性系统架构;
27.图2示意性示出了根据本公开实施例的商品短名称生成方法的流程图;
28.图3示意性示出了根据本公开实施例的目标关键词识别模型的训练方法流程图;
29.图4a示意性示出了根据本公开实施例的实体标注过程的示意图;
30.图4b示意性示出了根据本公开实施例的关键词识别模型的架构图;
31.图4c示意性示出了根据本公开实施例的标签识别过程的示意图;
32.图5a示意性示出了根据本公开实施例的电子价签系统的框图;
33.图5b示意性示出了根据本公开实施例的标签识别模块的框图;以及
34.图6示意性示出了根据本公开实施例的适于实现商品短名称生成方法的计算机系统的框图。
具体实施方式
35.以下,将参照附图来描述本公开的实施例。但是应该理解,这些描述只是示例性的,而并非要限制本公开的范围。在下面的详细描述中,为便于解释,阐述了许多具体的细节以提供对本公开实施例的全面理解。然而,明显地,一个或多个实施例在没有这些具体细节的情况下也可以被实施。此外,在以下说明中,省略了对公知结构和技术的描述,以避免不必要地混淆本公开的概念。
36.在此使用的术语仅仅是为了描述具体实施例,而并非意在限制本公开。在此使用的术语“包括”、“包含”等表明了所述特征、步骤、操作和/或部件的存在,但是并不排除存在或添加一个或多个其他特征、步骤、操作或部件。
37.在此使用的所有术语(包括技术和科学术语)具有本领域技术人员通常所理解的含义,除非另外定义。应注意,这里使用的术语应解释为具有与本说明书的上下文相一致的含义,而不应以理想化或过于刻板的方式来解释。
38.在使用类似于“a、b和c等中至少一个”这样的表述的情况下,一般来说应该按照本领域技术人员通常理解该表述的含义来予以解释 (例如,“具有a、b和c中至少一个的系统”应包括但不限于单独具有a、单独具有b、单独具有c、具有a和b、具有a和c、具有 b和c、和/或具有a、b、c的系统等)。在使用类似于“a、b或c 等中至少一个”这样的表述的情况下,一般来说应该按照本领域技术人员通常理解该表述的含义来予以解释(例如,“具有a、b或c中至少一个的系统”应包括但不限于单独具有a、单独具有b、单独具有c、具有a和b、具有a和c、具有b和c、和/或具有a、b、c 的系统等)。
39.本公开的实施例提供了一种商品短名称生成方法,包括:获取电子货架上的待识别的商品全名称;将待识别的商品全名称输入目标关键词识别模型,预测待识别的商品全名称的实体标签序列;利用拼接规则拼接实体标签序列对应的关键词,生成商品短名称,商品短名称显示于电子货架中。
40.图1示意性示出了根据本公开实施例的可以应用商品短名称生成方法和电子价签系统的示例性系统架构100。需要注意的是,图1所示仅为可以应用本公开实施例的系统架构的示例,以帮助本领域技术人员理解本公开的技术内容,但并不意味着本公开实施例不可以用于其他设备、系统、环境或场景。
41.如图1所示,根据该实施例的系统架构100可以包括电子价签101、 102、103,网络
104和服务器105。网络104用以在电子价签101、102、 103和服务器105之间提供通信链路的介质。网络104可以包括各种连接类型,例如有线和/或无线通信链路等等。
42.电子价签101、102、103可以包括多个电子价签(electronic shelflabel,esl),且多个电子价签用于和商品建立一对一的对应关系,并显示商品价格。电子价签是一种带有信息收发功能的电子显示装置,主要应用于超市、便利店、药房等显示价格信息的电子类标签,放置于电子货架上,作为一种可替代传统纸质价格标签的电子显示装置。
43.服务器105可以包括商场计算机数据库。服务器105用于处理商场计算机数据库修改需求,并且将对应的基本信息和价格信息的修改任务信息分发给网络104。电子价签101、102、103通过网络104接收服务器105的修改任务信息,修改并显示每一个商品的价格和基本信息。
44.服务器105也可以是提供各种服务的服务器,例如对用户利用电子价签101、102、103所收发的商品基本信息和价格信息提供支持的后台管理服务器。后台管理服务器可以对接收到的商品基本信息和价格信息等数据进行分析等处理,并将处理结果(例如根据用户请求获取或生成的商品基本信息和价格信息等)反馈给电子价签。
45.需要说明的是,本公开实施例所提供的商品短名称生成方法一般可以由服务器105执行。相应地,本公开实施例所提供的电子价签系统一般可以设置于服务器105中。本公开实施例所提供的商品短名称生成方法也可以由不同于服务器105且能够与电子价签101、102、103和/或服务器105通信的服务器或服务器集群执行。相应地,本公开实施例所提供的电子价签系统也可以设置于不同于服务器105且能够与电子价签 101、102、103和/或服务器105通信的服务器或服务器集群中。或者,本公开实施例所提供的商品短名称生成方法也可以由电子价签101、102、或103执行,或者也可以由不同于电子价签101、102、或103的其他终端设备执行。相应地,本公开实施例所提供的电子价签系统也可以设置于电子价签101、102、或103中,或设置于不同于电子价签101、102、或103的其他终端设备中。
46.例如,待处理的商品基本信息和价格信息可以原本存储在电子价签 101、102、或103中的任意一个(例如,电子价签101,但不限于此) 之中,或者存储在外部存储设备上并可以导入到电子价签101中。然后,电子价签101可以在本地执行本公开实施例所提供的商品短名称生成方法,或者将待处理的商品基本信息和价格信息发送到其他终端设备、服务器、或服务器集群,并由接收该待处理的商品基本信息和价格信息的其他终端设备、服务器、或服务器集群来执行本公开实施例所提供的商品短名称生成方法。
47.应该理解,图1中的电子价签、网络和服务器的数目仅仅是示意性的。根据实现需要,可以具有任意数目的电子价签、网络和服务器。
48.为了便于理解,以下对本公开实施例中的主要术语属于进行解释。
49.循环神经网络(recurrent neural network,rnn)是一类以序列数据为输入,在序列的演进方向进行递归且所有节点按链式连接的递归神经网络。
50.双向长短时记忆网络(bi-directional long short-term memory, bilstm):是一种特殊结构的rnn,能够解决普通rnn不能解决的长期依赖问题。
51.条件随机场(conditional random field,crf)是一种序列标注算法,用于把一个词序列的每个词打上一个标记。crf不仅可以考虑词语本身和上下文特征,还可以加入词典等外部特征,具有较好的实体识别效果。
52.图2示意性示出了根据本公开实施例的商品短名称生成方法的流程图。
53.如图2所示,该方法包括操作s210~s230。
54.在操作s210,获取电子货架上的待识别的商品全名称。
55.在操作s220,将待识别的商品全名称输入目标关键词识别模型,预测待识别的商品全名称的实体标签序列。
56.在操作s230,利用拼接规则拼接实体标签序列对应的关键词,生成商品短名称,商品短名称显示于电子货架中。
57.本公开的实施例把商品名称识别问题转换为词序列的实体命名识别(named entity recognition,ner)问题,命名实体识别又称为“专名识别”,用于指识别文本中具有特定意义的实体,主要包括人名、地名、机构名、专有名词等。
58.本公开的实施例将实体命名识别应用于超市、便利店、药房等需要价值属性和商品属性显示的电子货架中,避免人工更换的繁琐,实现了收银台与电子货架之间的商品名称和价格一致性,实现电子货架自动化管理,提高用户的便利性。
59.图3示意性示出了根据本公开实施例的目标关键词识别模型的训练方法流程图。
60.如图3所示,目标关键词识别模型是通过如下方式进行训练的:
61.在操作s310,搜集电子货架中的商品全名称;
62.在操作s320,对搜集的商品全名称逐字进行实体标注,作为待训练样本;
63.在操作s330,利用待训练样本对关键词识别模型进行训练,得到目标关键词识别模型。
64.通过本公开的实施例,通过搜集大量的真实数据训练该关键词识别模型,在一定程度上解决了标注数据少的情况下使用深度神经网络做实体识别的问题,能有效的对输入文本信息进行准确识别。
65.下面参考图4a~图4c,结合具体实施例对图2和图3所示的方法做进一步说明。
66.图4a示意性示出了根据本公开实施例的实体标注过程的示意图。
67.如图4a所示,本实施例中,待训练样本所采用的原始语料来源于货架中的搜集的商品全名称。例如,搜集的商品全名称可以包括:“华为,nova6前置广角双摄,超感光,麒麟990芯片,亮黑色,5g版全网通(8gb 128gb)”。
68.在对商品全名称逐字进行实体标注的步骤前,还需对搜集的商品全名称进行数据预处理。预处理方式例如可以包括:去除停用字、特殊标点符号、无关符号或英文大小写转换等。
69.数据预处理可减少实体标注中无关因素,进而减少人工实体标注的工作量。
70.根据本公开的实施例,按照预设的不同实体类型,采用bio标注模式对经过数据预处理的商品全名称逐字进行实体标注,得到标注文本,作为待训练样本。其中,bio标注模式是指,使用{b,i,o}标签对处理后的文本进行人工标注,生成标签序列,其中b表示一个实体词的开始,i表示这个一个单词除了开始的其他部分,o表示其他。
71.根据本公开的实施例,预设的不同实体类型例如可以分为:商品品牌、型号、颜色、网络类型、内存、商品编码、计量单位、重量或单价中的至少两种。
72.为了便于区分,设置与不同实体类型对应的实体标签名称,例如,预设的不同实体类型包括:品牌、型号、颜色、网络类型和内存。相应地,实体标签名称可以设置为:brand、
model、color、type和 memory。可以理解的是,与不同实体类型对应的实体标签名称可以设置为其他的实体标签名称,只需区分出不同实体类型即可,具体本发明不做限制。
73.参阅图4a,对于上述示例搜集的商品全名称,其标签序列为 {b-brand,i-brand,o,b-model,i-model,i-model,i-model, o,o,o,o,o,o,o,o,o,o,o,o,o,o,o,o,o,o, o,b-color,i-color,i-color,o,b-type,i-type,i-type, o,o,o,o,b-memory,i-memory,i-memory,i-memory, i-memory,i-memory,i-memory,i-memory,i-memory, o}。其中,“b-brand,i-brand”表示品牌类实体,即“华为”,其中,b-brand中的b表示该品牌类实体附加的开始词标签,i-brand 中的i表示该品牌类实体附加的后继词标签。同理,“b-model, i-model,i-model,i-model”表示型号类实体,即“nova6”;“b-color,i-color,i-color”表示颜色类实体,即“亮黑色”。 o表示无关部分,也即不属于预设的不同实体类型中的任意一种。
74.通过本公开的实施例,通过逐字分类型标注,并区分起止符,可以准确对商品全名称进行特征提取。
75.根据本公开的实施例,将待训练样本进行文本向量化后,输入关键词识别模型进行训练。将待训练样本进行文本向量化,包括:利用分布式词向量表示方法word2vec或全局词频统计glove通过预训练获取向量矩阵,或者随机初始化形成向量矩阵。
76.其中,分布式词向量表示方法word2vec是一种用于训练词向量的软件工具,可根据给定的语料库,通过优化后的训练模型快速有效地将一个词语表达成向量形式,词向量捕获了自然语言中词语之间的语义特征。全局词频统计glove是一种可以通过利用共现矩阵分解的方式得到的词向量表示方法,可以捕获词语的语法和语义信息。
77.图4b示意性示出了根据本公开实施例的关键词识别模型的架构图。
78.如图4b所示,本实施例的关键词识别模型为bilstm-crf模型,依次包括:look-up层、双向lstm层和crf层,其中,双向lstm层用于自动提取句子特征,crf层用于标注类别标签序列。
79.具体地,关键词识别模型基于bilstm-crf模型构成,关键词识别模型属于双向循环神经网络,能够根据上下文信息对输入的字给以预测标签的概率。
80.本实施例中,关键词识别模型分为三层,第一层为look-up层,第二层为双向lstm层(也即bilstm层),第三层为crf层。
81.如图4b所示,向该关键词识别模型中输入经过文本向量化后的待训练样本的字的独热编码。也即,以句子为单位,将一个含有n个字的句子(也即字的序列)记作x=(x1,x2,
……
xn),其中,xi(i=1,2
……
, n)表示该句子的第i个字在待训练样本中的id,进而得到向量 (embedding)矩阵。该向量矩阵的维度为待训练样本的文件大小。
82.look-up层作为关键词识别模型中的第一层,利用预训练或随机初始化形成的向量矩阵将待训练样本中的每个字由独热编码(one-hot vector)映射为低维稠密的字向量(character embedding)。其中,xi∈rd,d 为embedding的维度。在输入下一层之前,设置dropout以缓解过拟合。
83.双向lstm层作为关键词识别模型中的第二层,用于自动提取句子特征。将一个句子各个字的character embedding序列(x1,x2,
……ꢀ
xn)作为双向lstm层各个时间步的输入,再将正向lstm(forwardlstm)输出的隐状态序列与反向lstm(backward lstm)的序列
在各个位置输出的隐状态进行按位置拼接得到完整的隐状态序列(h1, h2,
……
hn)。在设置dropout后,接入一个线性层,将隐状态向量从m 维映射到k维,k是最终实体类别的标签数目。由此得到自动提取的句子特征,记作矩阵o=(o1,o2,
……
on)∈rn×k。
84.由于双向lstm层可以学习到观测序列(输入的字)之间的依赖,在训练过程中,双向lstm层能够根据识别实体自动提取观测序列的特征,但是无法学习到状态序列(输出的标注)之间的关系。然而,在实际应用中,标注词之间是有一定的逻辑关系的,比如b类标注后面不会再接一个b类标注,双向lstm层在这方面不能很好捕捉相互关系。
85.crf层作为关键词识别模型中的第三层,用于标注类别标签序列。也即,将上述矩阵o=(o1,o2,
……
on)中的每一个字向量都对应一个类别标签序列。
86.crf层能从训练数据中获得约束性的规则,为最终预测的标签添加一些约束来保证预测的标签是合法的,在训练数据过程中,这些约束可以通过crf层自动学习。
87.例如,这些约束可以是:
88.(1)句子中的第一个词总是以标签“b
‑”
开始,而不是“i
‑”

89.(2)标签序列“b-model,i-model,i-model,i-model”属于同一类实体,是合法的序列,而标签“b-model,i-type”是非法标签序列;
90.(3)标签序列“oi-model”是非法的,因为实体标签的首个标签应该是以标签“b
‑”
开始,而非“i
‑”
,例如,有效的标签序列应该是“o b-model”。
91.有了这些约束,标签序列预测中非法序列出现的概率将会大大降低,由于bilstm的输出为单元的每一个标签分值,可以挑选分值最高的一个作为该单元的标签。
92.bilstm-crf模型整合了双向长短时记忆模型和条件随机场模型。该模型首先利用bilstm层提取词语的内在特征,然后将向量化的词语输入crf层。与bilstm模型相比,引入crf层后,模型综合考虑了待标注序列中所有位置的标注得分以及相邻位置标注之间的转移得分,能更好地利用上下文信息,提高标注效果。由此,crf层能对隐含状态建模,学习到状态序列,正好可以弥补双向lstm层的不足,将双向lstm层结果进行纠偏,输出准确的标注。
93.为确保该训练过程中的每一轮输出的类别标签序列的准确性,在得到目标关键词识别模型的步骤之前,还包括:构建损失函数,将提取后的关键词和经过实体标注的商品全名称输入至该损失函数中,计算损失值以确定迭代训练次数,直至该损失值小于预设阈值。
94.也就是说,通过每一轮输出的类别便签序列与经过实体标注待训练样本之间的损失值与预设阈值的比较,若损失值大于等于预设阈值,就迭代训练下一轮,直至损失值小于预设阈值,即认为此时的crf层输出的实体标签序列是最优解,进而得到目标关键词识别模型。
95.基于上述得到的目标关键词识别模型,将待识别的商品全名称输入目标关键词识别模型,预测待识别的商品全名称的实体标签序列。
96.图4c示意性示出了根据本公开实施例的标签识别过程的示意图。
97.如图4c所示,例如,待识别的商品全名称可以为“魅族16xsai 三摄超广角拍照手机4000mah大电池全网通4g智能双卡双待冰丝白 6gb 64gb”。此时,将该待识别的商品全名称输入上述得到的关键词识别模型中,可以输出待识别的商品全名称中的每一个字对应的实体标签序列。
98.为了便于区分,可以将同一实体类型的关键词在同一列显示。例如,图4c中,第一列实体标签序列按照商品品牌显示,也即{b-brand, i-brand},其中,b为品牌类标签的开始词,i为品牌类标签的后继词。同理,第二至五列依次按照型号、网络类型、颜色和内存显示。并且,在每一列中,按照开始词和后继词的先后顺序逐行显示每一个字的标签序列。
99.由图4c可见,本公开的实施例得到的目标关键词识别模型,其识别准确率较高。
100.根据本公开的实施例,拼接规则是预先创建的拼接规则。也即,拼接规则可以是系统人员事先进行相关配置,并在系统中保存。
101.通过本公开的实施例,基于系统预先创建的自 定义拼接规则,以显示商品短名称,可以随时修改更换,提高实时性和便利性。
102.根据本公开的实施例,抽取预设的不同实体类型中的至少两种实体类型,将至少两种实体类型按照预设顺序排列,形成拼接规则。
103.例如,设置拼接规则为,依次按照商品品牌、型号、内存、颜色和网络类型将上述关键词拼接生成最终的商品短名称,以适应不同电子价签的实际显示尺寸需要。由此,对于上述如图4c所示的标签序列,按照该拼接规则拼接生成的最终的商品短名称即为:“魅族16xs 6gb 64gb冰丝白4g”。
104.上述拼接完成的商品短名称中的空格,仅仅是为了区分不同实体类型。为了优化显示效果,用户可以根据实际需要在拼接规则中附加空格或其他符号(例如可以为顿号、逗号、下划线或加号),具体本发明不做限制。
105.本公开的实施例利用bilstm-crf模型提取特征,创建目标关键词识别模型,bilstm可以更好地理解上下文,crf对输入的每字做顶层的标注,对bilstm结果进行纠偏,进一步提高提取不同维度的名称的准确性。进而,基于模型进行商品名称的关键词识别,并结合指定的拼接规则生成商品短名称。
106.通过本公开的实施例,依据现有商品名称通过目标关键词识别模型,智能识别相关领域核心字段,并依据拼接规则生成商品短名称。本公开的实施例将bilstm crf命名实体识别技术应用于超市、便利店、药房等需要电子价签显示的应用场景中,避免人工更换的繁琐,实现了收银台与电子货架之间的商品名称和价格一致性,实现电子货架自动化管理,提高用户的便利性。
107.基于同一发明构思,本公开实施例还提供了一种电子价签系统,下面结合图5a对本公开实施例的电子价签系统进行介绍。
108.图5a示意性示出了根据本公开的实施例的电子价签系统的框图。
109.如图5a所示,电子价签系统500可以包括名称获取模块510、标签识别模块520和拼接显示模块530,其中:
110.名称获取模块510,例如执行参考上文图2描述的操作s210,用于获取电子货架上的待识别的商品全名称;
111.标签识别模块520,例如执行参考上文图2描述的操作s220,用于将待识别的商品全名称输入目标关键词识别模型,预测待识别的商品全名称的实体标签序列;以及
112.拼接显示模块530,例如执行参考上文图2描述的操作s230,用于利用拼接规则拼接实体标签序列对应的关键词,生成商品短名称,商品短名称显示于电子货架中。
113.通过本公开的实施例,可以将实体命名识别应用于超市、便利店、药房等需要价值
属性和商品属性显示的电子货架中,避免人工更换的繁琐,实现了收银台与电子货架之间的商品名称和价格一致性,实现电子货架自动化管理,提高用户的便利性。
114.图5b示意性示出了根据本公开实施例的标签识别模块的框图。
115.如图5b所示,标签识别模块520可以包括名称搜集单元5201、实体标注单元5202和模型训练单元5203,其中:
116.名称搜集单元5201,例如执行参考上文图3描述的操作s310,用于搜集电子货架中的商品全名称;
117.实体标注单元5202,例如执行参考上文图3描述的操作s320,用于对搜集的商品全名称逐字进行实体标注,作为待训练样本;
118.模型训练单元5203,例如执行参考上文图3描述的操作s330,用于利用待训练样本对关键词识别模型进行训练,得到目标关键词识别模型。
119.通过本公开的实施例,可以用大量的真实数据训练该关键词识别模型,在一定程度上解决了标注数据少的情况下使用深度神经网络做实体识别的问题,能有效的对输入文本信息进行准确识别。
120.根据本公开的实施例,实体标注单元还用于按照预设的不同实体类型,采用bio标注模式对商品全名称逐字进行实体标注。
121.根据本公开的实施例,关键词识别模型为bilstm-crf模型,依次包括:look-up层、双向lstm层和crf层,双向lstm层用于自动提取句子特征,crf层用于标注类别标签序列。
122.根据本公开的实施例,模型训练单元还用于构建损失函数,将预测的实体标签序列和经过实体标注的商品全名称输入至损失函数中,计算损失值以确定迭代训练次数,直至损失值小于预设阈值,得到目标关键词识别模型。
123.根据本公开的实施例,拼接规则是预先创建的拼接规则。
124.根据本公开的实施例的模块、子模块、单元、子单元中的任意多个、或其中任意多个的至少部分功能可以在一个模块中实现。根据本公开实施例的模块、子模块、单元、子单元中的任意一个或多个可以被拆分成多个模块来实现。根据本公开实施例的模块、子模块、单元、子单元中的任意一个或多个可以至少被部分地实现为硬件电路,例如现场可编程门阵列(fpga)、可编程逻辑阵列(pla)、片上系统、基板上的系统、封装上的系统、专用集成电路(asic),或可以通过对电路进行集成或封装的任何其他的合理方式的硬件或固件来实现,或以软件、硬件以及固件三种实现方式中任意一种或以其中任意几种的适当组合来实现。或者,根据本公开实施例的模块、子模块、单元、子单元中的一个或多个可以至少被部分地实现为计算机程序模块,当该计算机程序模块被运行时,可以执行相应的功能。
125.例如,名称获取模块510、标签识别模块520、拼接显示模块530、名称搜集单元5201、实体标注单元5202和模型训练单元5203中的任意多个可以合并在一个模块/单元/子单元中实现,或者其中的任意一个模块/单元/子单元可以被拆分成多个模块/单元/子单元。或者,这些模块/单元/子单元中的一个或多个模块/单元/子单元的至少部分功能可以与其他模块/单元/子单元的至少部分功能相结合,并在一个模块/单元/子单元中实现。根据本公开的实施例,名称获取模块510、标签识别模块 520、拼接显示模块530、名称搜集单元5201、实体标注单元5202和模型训练单元5203中的至少一个可以至少被部分地实现为硬件电路,例如现场可编程门阵列(fpga)、可编程逻辑阵列(pla)、片上系统、基板上的系统、
封装上的系统、专用集成电路(asic),或可以通过对电路进行集成或封装的任何其他的合理方式等硬件或固件来实现,或以软件、硬件以及固件三种实现方式中任意一种或以其中任意几种的适当组合来实现。或者,名称获取模块510、标签识别模块520、拼接显示模块530、名称搜集单元5201、实体标注单元5202和模型训练单元 5203中的至少一个可以至少被部分地实现为计算机程序模块,当该计算机程序模块被运行时,可以执行相应的功能。
126.需要说明的是,本公开的实施例中电子价签系统部分与本公开的实施例中商品短名称生成方法部分是相对应的,电子价签系统部分的描述具体参考商品短名称生成方法部分,在此不再赘述。
127.图6示意性示出了根据本公开实施例的适于实现上文描述的商品短名称生成方法的计算机系统的框图。图6示出的计算机系统仅仅是一个示例,不应对本公开实施例的功能和使用范围带来任何限制。
128.如图6所示,根据本公开实施例的计算机系统600包括处理器601,其可以根据存储在只读存储器(rom)602中的程序或者从存储部分608 加载到随机访问存储器(ram)603中的程序而执行各种适当的动作和处理。处理器601例如可以包括通用微处理器(例如cpu)、指令集处理器和/或相关芯片组和/或专用微处理器(例如,专用集成电路(asic)),等等。处理器601还可以包括用于缓存用途的板载存储器。处理器601 可以包括用于执行根据本公开实施例的方法流程的不同动作的单一处理单元或者是多个处理单元。
129.在ram 603中,存储有系统600操作所需的各种程序和数据。处理器601、rom 602以及ram 603通过总线604彼此相连。处理器601 通过执行rom 602和/或ram 603中的程序来执行根据本公开实施例的方法流程的各种操作。需要注意,所述程序也可以存储在除rom 602 和ram 603以外的一个或多个存储器中。处理器601也可以通过执行存储在所述一个或多个存储器中的程序来执行根据本公开实施例的方法流程的各种操作。
130.根据本公开的实施例,系统600还可以包括输入/输出(i/o)接口 605,输入/输出(i/o)接口605也连接至总线604。系统600还可以包括连接至i/o接口605的以下部件中的一项或多项:包括键盘、鼠标等的输入部分606;包括诸如阴极射线管(crt)、液晶显示器(lcd)等以及扬声器等的输出部分607;包括硬盘等的存储部分608;以及包括诸如lan卡、调制解调器等的网络接口卡的通信部分609。通信部分 609经由诸如因特网的网络执行通信处理。驱动器610也根据需要连接至i/o接口605。可拆卸介质611,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器610上,以便于从其上读出的计算机程序根据需要被安装入存储部分608。
131.根据本公开的实施例,根据本公开实施例的方法流程可以被实现为计算机软件程序。例如,本公开的实施例包括一种计算机程序产品,其包括承载在计算机可读存储介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信部分609从网络上被下载和安装,和/或从可拆卸介质 611被安装。在该计算机程序被处理器601执行时,执行本公开实施例的系统中限定的上述功能。根据本公开的实施例,上文描述的系统、设备、装置、模块、单元等可以通过计算机程序模块来实现。
132.本公开还提供了一种计算机可读存储介质,该计算机可读存储介质可以是上述实施例中描述的设备/装置/系统中所包含的;也可以是单独存在,而未装配入该设备/装置/
系统中。上述计算机可读存储介质承载有一个或者多个程序,当上述一个或者多个程序被执行时,实现根据本公开实施例的方法。
133.根据本公开的实施例,计算机可读存储介质可以是非易失性的计算机可读存储介质。例如可以包括但不限于:便携式计算机磁盘、硬盘、随机访问存储器(ram)、只读存储器(rom)、可擦式可编程只读存储器(eprom或闪存)、便携式紧凑磁盘只读存储器(cd-rom)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本公开中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。
134.例如,根据本公开的实施例,计算机可读存储介质可以包括上文描述的rom 602和/或ram 603和/或rom 602和ram 603以外的一个或多个存储器。
135.附图中的流程图和框图,图示了按照本公开各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,上述模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图或流程图中的每个方框、以及框图或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
136.本领域技术人员可以理解,本公开的各个实施例和/或权利要求中记载的特征可以进行多种组合和/或结合,即使这样的组合或结合没有明确记载于本公开中。特别地,在不脱离本公开精神和教导的情况下,本公开的各个实施例和/或权利要求中记载的特征可以进行多种组合和/或结合。所有这些组合和/或结合均落入本公开的范围。
137.以上对本公开的实施例进行了描述。但是,这些实施例仅仅是为了说明的目的,而并非为了限制本公开的范围。尽管在以上分别描述了各实施例,但是这并不意味着各个实施例中的措施不能有利地结合使用。本公开的范围由所附权利要求及其等同物限定。不脱离本公开的范围,本领域技术人员可以做出多种替代和修改,这些替代和修改都应落在本公开的范围之内。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献