一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

实体词的识别方法、装置、电子设备、介质及程序产品与流程

2022-12-20 00:55:04 来源:中国专利 TAG:


1.本公开涉及计算机应用技术领域,尤其涉及一种实体词的识别方法、装置、电子设备、介质及程序产品。


背景技术:

2.命名实体识别是自然语言处理中的一个重要任务,是指识别出文本中的人名、地名、机构名、时间等实体词。实体词有三种存在形式:平铺实体词、嵌套实体词、不连续实体词。
3.相关实体词识别技术为了识别嵌套实体词和不连续实体词,在对文本中每个字符进行分类后,还需要判断文本中每个字符与其它所有字符的关系,具有很高的复杂度高。例如,需要判断后一个字符所属的实体词是否是前一个字符所属的实体词的下一个实体词,以及判断两个字符是否是一个实体词的开始和结束。因此,如何在较低的计算复杂度的情况下,识别出各种形式的实体词,是一个急需解决的技术问题。


技术实现要素:

4.为克服相关技术中存在的问题,本公开提供一种实体词的识别方法、装置、电子设备、介质及程序产品。本公开的技术方案如下:
5.根据本公开实施例的第一方面,提供一种实体词的识别方法,包括:
6.将待识别文本输入标签确定模型,得到所述待识别文本中每个字符的标签,所述标签包括标记和编码,所述标记表征所述字符在实体词中的位置,具有相同编码的字符属于同一实体词;
7.根据所述字符的标签对所述字符进行组合,得到目标实体词。
8.可选地,所述根据所述字符的标签对所述字符进行组合,得到目标实体词,包括:
9.将所述待识别文本中具有相同编码的各个字符,确定为同一实体词的各个字符;
10.按照所述同一实体词的各个字符的所述标记表征的位置,将所述各个字符组合为所述同一实体词。
11.可选地,所述标记包括表征所述字符在所述实体词的中间位置的中间标记;
12.在所述同一实体词的各个字符中具有所述中间标记的中间位字符大于一个的情况下,还包括:
13.获取多个所述中间位字符在所述待识别文本中的先后顺序;
14.将多个所述中间位字符在所述待识别文本中的先后顺序,确定为多个所述中间位字符在所述同一实体词中的先后顺序;
15.根据多个所述中间位字符在所述同一实体词中的先后顺序,得到多个所述中间位字符在所述同一实体词中的位置。
16.可选地,所述标记包括非实体标记,所述非实体标记表征所述字符不处于任一实体词的任意位置。
17.可选地,所述标签确定模型是基于文本样本进行训练得到的模型,所述文本样本包含实体词样本,所述文本样本包含的各字符样本都携带所述标记和所述编码,所述实体词样本包括嵌套实体词样本和不连续实体词样本。
18.可选地,所述标签确定模型是按照以下步骤训练得到的:
19.获取所述文本样本;
20.将所述文本样本输入基模型,得到所述每个字符样本的预测标记和预测编码;
21.根据所述每个字符样本携带的所述标记和所述预测标记之间的差异,以及所述每个字符样本携带的所述编码和所述预测编码之间的差异,确定交叉熵损失函数值;
22.根据所述交叉熵损失函数值,对所述基模型进行训练,直至满足预设训练结束条件,得到所述标签确定模型。
23.根据本公开实施例的第二方面,提供一种实体词的识别装置,包括:
24.标签获取模块,被配置为将待识别文本输入标签确定模型,得到所述待识别文本中每个字符的标签,所述标签包括标记和编码,所述标记表征所述字符在实体词中的位置,具有相同编码的字符属于同一实体词;
25.实体词获取模块,被配置为根据所述字符的标签对所述字符进行组合,得到目标实体词。
26.根据本公开实施例的第三方面,提供一种电子设备,包括:处理器;用于存储所述处理器可执行指令的存储器;其中,所述处理器被配置为执行所述指令,以实现如第一方面所述的实体词的识别方法。
27.根据本公开实施例的第四方面,提供一种计算机可读存储介质,当所述计算机可读存储介质中的指令由电子设备的处理器执行时,使得所述电子设备能够执行如第一方面所述的实体词的识别方法。
28.根据本公开实施例的第五方面,提供一种计算机程序产品,包括计算机程序,所述计算机程序被处理器执行时实现如第一方面所述的实体词的识别方法。
29.本公开的实施例提供的技术方案可以包括以下有益效果:
30.本公开中,标签确定模型生成的待识别文本中每个字符的标签包括标记和编码,标记可以表征字符在实体词中的位置,具有相同编码的字符为属于同一实体词的字符;因此可以直接根据字符的标签对字符进行组合,得到各种形式的目标实体词。如此,无需判断每个字符与其它所有字符的关系,字符自身的标签足以表征每个字符是否为同一实体词的字符,以及表征字符在实体词中的位置,因此,计算复杂度较低。
31.应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。
附图说明
32.此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本发明的实施例,并与说明书一起用于解释本发明的原理。
33.图1是根据一示例性实施例示出的一种实体词的识别方法的流程图;
34.图2是根据一示例性实施例示出的多个字符的标签的示意图;
35.图3是根据一示例性实施例示出的一种实体词的识别装置的框图;
36.图4是根据一示例性实施例示出的一种用于实体词的识别装置的框图;
37.图5是根据一示例性实施例示出的一种用于实体词的识别装置的框图。
具体实施方式
38.为了使本领域普通人员更好地理解本公开的技术方案,下面将结合附图,对本公开实施例中的技术方案进行清楚、完整地描述。
39.需要说明的是,本公开的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本公开的实施例能够以除了在这里图示或描述的那些以外的顺序实施。以下示例性实施例中所描述的实施方式并不代表与本公开相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本公开的一些方面相一致的装置和方法的例子。
40.平铺实体词是指相邻字符组成的实体词,且一个平铺实体词中只包括一个实体词。嵌套实体词是指相邻字符组成的实体词,且嵌套实体词中包括不止一个实体词。例如,嵌套实体词“草莓牛奶”,其中“草莓”可以单独为一个实体词,“牛奶”也可以单独为一个实体词,然而在实际应用中,“草莓牛奶”是作为一个不可拆分的嵌套实体词,若将其拆分为“草莓”和“牛奶”分别进行处理,则可能导致不准确的结果。不连续实体词只是不相邻的字符组成的实体词,例如,文本“肌肉疲劳和酸疼”中包含的“肌肉酸疼”就是一个不连续实体词。
41.相关技术中的实体词识别方法主要有3种:序列标注、span-based(基于跨度)、word-word relation classification(词-词关系分类)。这三种方法的编码器基本是一样的,不同之处在于解码方式。如果句子长度为n,那么序列标注的方法的解码的计算复杂度是n,但是序列标注的方法无法识别嵌套实体词和不连续实体词;如果句子长度为n,那么span-based的方法的解码的计算复杂度是2n,但是span-based的方法无法识别不连续实体词;word-word relation classification的方法可以识别嵌套实体词和不连续实体词,但是需要判断文本中每个字符与其它所有字符的关系,具有较高的计算复杂度,如果句子长度为n,那么word-word relation classification的方法的解码的计算复杂度是n的二次方。本公开在不增加解码复杂度的情况下,提出了一种新的标注形式(标记 编码),以识别出各种形式的实体词。
42.图1是根据一示例性实施例示出的一种实体词的识别方法的流程图,如图1所示,该实体词的识别方法可以用于计算机、手机、平板电脑、穿戴设备等电子设备中,包括以下步骤。
43.在步骤s11中,将待识别文本输入标签确定模型,得到所述待识别文本中每个字符的标签,所述标签包括标记和编码,所述标记表征所述字符在实体词中的位置,具有相同编码的字符属于同一实体词;
44.在步骤s12中,根据所述字符的标签对所述字符进行组合,得到目标实体词。
45.标签确定模型是经过训练,针对输入的待识别文本,可以提取待识别文本的语义表示向量,并输出待识别文本中每个字符的标签,其中,各字符之间是可以用空格进行切分的。例如,对于中文而言,一个字符是指一个汉字或者一个标点符号等;对于英文而言,一个
字符是指一个单词或者一个标点符号,一个单词内虽然含有多个字母,但其是不可切分的。
46.一个标签可以包括标记,也可以同时包括标记和编码。具有相同编码的字符为同一实体词的字符,一个字符可能同时包括多个编码,包括多个编码的字符可能同时属于多个实体词。多个字符携带的编码中具有相同的编码,则该多个字符属于同一实体词。例如,a字符同时携带编码1和编码2,b字符携带编码1,c字符携带编码2,则a字符和b字符为同一实体词(编码1对应的实体词)的字符,同时a字符和c字符也为同一实体词(编码2对应的实体词)的字符。
47.标记表征字符在实体词中的位置,标记可以包括开始标记、中间标记、结尾标记和非实体标记。其中,一个字符携带开始标记表征该字符处于该字符组成的实体词的开始位置,一个字符携带中间标记表征该字符处于该字符组成的实体词的中间位置,一个字符携带结尾标记表征该字符处于该字符组成的实体词的结尾位置,一个字符携带非实体标记表征该字符不处于属于任一实体词的任意位置,即该字符不属于任一实体词。本公开中的实施例以“b”为开始标记,以“i”为中间标记,以“e”为结尾标记,以“o”为非实体标记,以数字为编码。可选地,各种标记和编码还可以具有其他形式,本公开对此不做限制。
48.因为携带非实体标记的字符不属于任一实体词,因为携带非实体标记的字符的标签可以不包括编码,或者可以理解为该字符携带的编码为空。如此,在生成实体词时,可以直接将携带非实体标记的字符进行排除,从而只需要对携带其他标记的字符进行处理,减少计算量。
49.因为一个字符可能同时属于多个实体词,例如“肌肉疲劳和酸疼”中,“肌肉”两个字既属于嵌套实体词“肌肉疲劳”,又属于不连续实体词“肌肉酸疼”,因此一个字符可以包括多个标签,一个标签表征该字符与一个实体词有关的信息。
50.例如,一个字符既包括标签b1,又包括标签e2,则该字符既为编码1对应的实体词中的第一个字符,又为编码2对应的实体词中的最后一个字符。
51.在得到每个字符的标签后,即可根据每个字符的标签中标记表征的该字符在实体词中的位置,将相同编码的字符进行组合,得到目标实体词。目标实体词可以为平铺实体词、嵌套实体词或不连续实体词。
52.例如,5个字符的标签分别为:b1b2、i1、e1、i2、e2,则可以将携带b1、i1、e1的字符组合为一个实体词,将携带b2、i2、e2的字符组合为另一个实体词。
53.如此,只需根据字符自身的标签即可得到实体词,而无需判断每个字符与其它所有字符的关系,因此若待识别文本的长度为n,则将字符组合为实体词的计算复杂度为n,计算复杂度较低。
54.此外,即使属于同一实体词的字符是不连续的,在根据字符的标签生成实体词时,都可以直接通过编码将不连续的实体词组合在一起,因此可以识别出待识别文本中的不连续实体词。
55.因为标签确定模型可以生成准确的标签,因此不会为嵌套实体词中包含的多个实体词生成不同的编码,而是为嵌套实体词整体生成同一编码,从而避免了将嵌套实体词识别为多个实体词的情况。
56.采用本公开的技术方案,标签确定模型生成的待识别文本中每个字符的标签包括标记和编码,标记可以表征字符在实体词中的位置,编码可以表征属于同一实体词的字符;
因此可以直接根据字符的标签对字符进行组合,得到各种形式的目标实体词。如此,无需判断每个字符与其它所有字符的关系,字符自身的标签足以表征每个字符是否为同一实体词的字符,以及表征字符在实体词中的位置,因此,计算复杂度较低。
57.可选地,在上述技术方案的基础上,根据字符的标签对字符进行组合,得到实体词,可以包括:将所述待识别文本中编码相同的各个字符,确定为同一实体词的各个字符;按照所述同一实体词的各个字符的所述标记表征的位置,将所述各个字符组合为所述同一实体词。
58.因为编码相同表征属于同一实体词,所以可以首先将编码相同的各个字符归为一类,确定为同一实体词的各个字符。然后根据同一实体词的各个字符的标记表征的该字符在该同一实体词中的位置,将该各个字符进行组合,得到该同一实体词。
59.例如,5个字符的标签分别为:i1、b1b2、e2、e1、i2,对于这5个字符,可以先根据编码确定5个字符属于两个实体词,第一个实体词包括第1、2、4个字符,第二个实体词包括第2、3、5个字符。根据第1、2、4个字符各自的标记,可以确定第一个实体词中包括的字符的顺序应该是第2个字符为该实体词的开始位,第1个字符为该实体词的中间位,第4个字符为该实体词的结尾位;根据第2、3、5个字符各自的标记,可以确定第二个实体词中包括的字符的顺序应该是第2个字符为该实体词的开始位,第5个字符为该实体词的中间位,第3个字符为该实体词的结尾位。
60.可选地,也可以先确定每个字符在各自的实体词中的位置,然后确定属于相同实体词的多个字符。
61.采用本公开的技术方案,即使实体词是平铺实体词、不连续实体词还是嵌套实体词,都可以通过字符的标签准确生成实体词,并且无需判断每个字符和其它所有字符的关系。
62.对于一个实体词而言,只会存在一个开始位和一个结尾位,因此可以直接确定携带开始标记和结尾标记的字符在实体词中的位置。然而一个实体词可能具有多个中间位字符(处于实体词的非开始位和非结尾位的字符),例如实体词“阔筋膜张肌”具有3个中间位字符。假设实体词“阔筋膜张肌”对应的编码为1,则字符“筋”、“膜”、“张”的标签都为i1。
63.实体词是从待识别文本中提取出来的实体词,因此实体词中各个字符的先后顺序是和各个字符在待识别文本中的先后顺序相同的。
64.因此,为了准确确定标签相同的中间位字符在实体词中的位置,可以获取多个中间位字符在待识别文本中的先后顺序。将同一实体词的多个中间位字符在待识别文本中的先后顺序,确定为同一实体词的多个中间位字符在该同一实体词中的先后顺序,从而得到同一实体词的多个中间位字符在该同一实体词中的位置。在得到同一实体词的多个中间位字符在该同一实体词中的位置后,再结合该实体词的开始位字符和结尾位字符,即可组合得到该同一实体词。
65.如此,解决了同一实体词中的多个中间位字符的位置不确定的问题,从而可以准确生成实体词。
66.可选地,在上述技术方案的基础上,标签确定模型是基于文本样本进行有监督训练得到的模型,所述文本样本包含实体词样本,所述文本样本包含的各字符样本都携带所述标记和所述编码,所述实体词样本包括嵌套实体词样本和不连续实体词样本。
67.字符样本的标记表征所述字符样本在所述实体词样本中的位置,字符样本的所述编码相同表征该字符样本属于同一实体词样本。嵌套实体词样本包括的各个字符样本的编码相同,不连续实体词样本的各个字符样本的编码相同。
68.文本样本可以是开源的中英文标注数据集,如ace2004(一种开源数据集)和ace2005(一种开源数据集)的数据,或者其它数据集,然后将每句话按空格进行切分得到多个字符样本。根据每个字符样本所属的文本样本中的实体词样本,以及每个字符样本在所述的实体词样本中的位置,为每个字符样本标注标记和编码。
69.如此,可以保证训练得到的标签确定模型在面对嵌套实体词、不连续实体词的时候,可以将嵌套实体词的各个字符的编码识别为同一编码,将不连续实体词的各个字符的编码识别为同一编码。
70.可选地,标签确定模型可以是按照以下步骤训练得到的:获取所述文本样本;将所述文本样本输入基模型,得到所述每个字符样本的预测标记和预测编码;根据所述每个字符样本携带的所述标记和所述预测标记之间的差异,以及所述每个字符样本携带的所述编码和所述预测编码之间的差异,确定交叉熵损失函数值;根据所述交叉熵损失函数值,对所述基模型进行训练,直至满足预设训练结束条件,得到标签确定模型。预设训练结束条件可以为模型收敛或训练次数达到固定值。
71.基模型是未训练的标签确定模型,通过对基模型进行训练,可以调整基模型的模型参数,使基模型逐渐提升预测的字符的标签的准确度,最终得到能够准确确定字符的标签的标签确定模型。标签确定模型/基模型可以包括语义表示模块和分类器,其中语义表示模块可以为bert(bidirectional encoder representations from transformers,一种语言表示模型)模型或其它nlp模型(natural language processing,自然语言处理模型),分类器可以为softmax(归一化指数函数)分类器。
72.将文本样本输入基模型,基模型的语义表示模块可以提取文本样本的语义表示向量,以及每个字符样本的语义表示向量。分类器根据语义表示模块确定的语义表示向量,可以输出每个字符样本的预测标记和预测编码。
73.根据每个字符样本携带的标记和预测标记之间的差异,以及每个字符样本携带的编码和预测编码之间的差异,可以建立交叉熵损失函数值。基模型的学习率为1e-5。
74.如此,只需对基模型进行简单的有监督训练,即可得到标签确定模型,从而利用标签确定模型准确输出待识别文本中每个字符的标签,进而生成各种形式的实体词。
75.图2是根据一示例性实施例示出的多个字符的标签的示意图,其中,多个字符为待识别文本“肌肉疲劳和酸疼。”的字符,该待识别文本包括嵌套实体词“肌肉疲劳”和不连续实体词“肌肉酸疼”。因为“肌肉”两个字同时属于这两个实体词,所以“肌”既包括标签“b1”又包括标签“b2”,“肉”既包括标签“i1”又包括标签“i2”。将b1、i1、e1组合成实体词可以得到“肌肉疲劳”,将b2、i2、e2组合成实体词可以得到“肌肉酸疼”,非实体标记o的字符不够成实体词。
76.准确得到待识别文本的实体词,可以具有多种用途,例如在搜索待识别文本时,可以只搜索待识别文本中的实体词,例如在进行信息推送时,可以将具有相同实体词的信息放入同一信息流中进行推送。
77.应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不
能限制本公开。
78.图3是根据一示例性实施例示出的一种实体词的识别装置的框图,参照图3,该装置包括标签获取模块31和实体词获取模块32,其中:
79.该标签获取模块31,被配置为将待识别文本输入标签确定模型,得到所述待识别文本中每个字符的标签,所述标签包括标记和编码,所述标记表征所述字符在实体词中的位置,具有相同编码的字符属于同一实体词;
80.该实体词获取模块32,被配置为根据所述字符的标签对所述字符进行组合,得到目标实体词。
81.可选地,所述标签获取模块31包括:
82.同一实体词确定单元,被配置为将所述待识别文本中具有相同编码的各个字符,确定为同一实体词的各个字符;
83.组合单元,被配置为按照所述同一实体词的各个字符的所述标记表征的位置,将所述各个字符组合为所述同一实体词。
84.可选地,所述标记包括表征所述字符在所述实体词的中间位置的中间标记;在所述同一实体词的各个字符中具有所述中间标记的中间位字符大于一个的情况下,还包括:
85.顺序获取模块,被配置为获取多个所述中间位字符在所述待识别文本中的先后顺序;
86.顺序确定模块,被配置为将多个所述中间位字符在所述待识别文本中的先后顺序,确定为多个所述中间位字符在所述同一实体词中的先后顺序;
87.位置确定模块,被配置为根据多个所述中间位字符在所述同一实体词中的先后顺序,得到多个所述中间位字符在所述同一实体词中的位置。
88.可选地,所述标记包括非实体标记,所述非实体标记表征所述字符不处于任一实体词的任意位置。
89.可选地,所述标签确定模型是基于文本样本进行训练得到的模型,所述文本样本包含实体词样本,所述文本样本包含的各字符样本都携带所述标记和所述编码,所述实体词样本包括嵌套实体词样本和不连续实体词样本。
90.可选地,所述标签确定模型是按照以下步骤训练得到的:
91.获取所述文本样本;
92.将所述文本样本输入基模型,得到所述每个字符样本的预测标记和预测编码;
93.根据所述每个字符样本携带的所述标记和所述预测标记之间的差异,以及所述每个字符样本携带的所述编码和所述预测编码之间的差异,确定交叉熵损失函数值;
94.根据所述交叉熵损失函数值,对所述基模型进行训练,直至满足预设训练结束条件,得到所述标签确定模型。
95.关于上述实施例中的装置,其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述,此处将不做详细阐述说明。
96.图4是根据一示例性实施例示出的一种用于实体词的识别装置400的框图。例如,装置400可以是移动电话,计算机,数字广播终端,消息收发设备,游戏控制台,平板设备,医疗设备,健身设备,个人数字助理等。
97.参照图4,装置400可以包括以下一个或多个组件:处理组件402,存储器404,电力
组件406,多媒体组件408,音频组件410,输入/输出(i/o)的接口412,传感器组件414,以及通信组件416。
98.处理组件402通常控制装置400的整体操作,诸如与显示,电话呼叫,数据通信,相机操作和记录操作相关联的操作。处理组件402可以包括一个或多个处理器420来执行指令,以完成上述的实体词的识别方法的全部或部分步骤。此外,处理组件402可以包括一个或多个模块,便于处理组件402和其他组件之间的交互。例如,处理组件402可以包括多媒体模块,以方便多媒体组件408和处理组件402之间的交互。
99.存储器404被配置为存储各种类型的数据以支持在装置400的操作。这些数据的示例包括用于在装置400上操作的任何应用程序或方法的指令,联系人数据,电话簿数据,消息,图片,视频等。存储器404可以由任何类型的易失性或非易失性存储设备或者它们的组合实现,如静态随机存取存储器(sram),电可擦除可编程只读存储器(eeprom),可擦除可编程只读存储器(eprom),可编程只读存储器(prom),只读存储器(rom),磁存储器,快闪存储器,磁盘或光盘。
100.电源组件406为装置400的各种组件提供电力。电源组件406可以包括电源管理系统,一个或多个电源,及其他与为装置400生成、管理和分配电力相关联的组件。
101.多媒体组件408包括在所述装置400和用户之间的提供一个输出接口的屏幕。在一些实施例中,屏幕可以包括液晶显示器(lcd)和触摸面板(tp)。如果屏幕包括触摸面板,屏幕可以被实现为触摸屏,以接收来自用户的输入信号。触摸面板包括一个或多个触摸传感器以感测触摸、滑动和触摸面板上的手势。所述触摸传感器可以不仅感测触摸或滑动动作的边界,而且还检测与所述触摸或滑动操作相关的持续时间和压力。在一些实施例中,多媒体组件408包括一个前置摄像头和/或后置摄像头。当装置400处于操作模式,如拍摄模式或视频模式时,前置摄像头和/或后置摄像头可以接收外部的多媒体数据。每个前置摄像头和后置摄像头可以是一个固定的光学透镜系统或具有焦距和光学变焦能力。
102.音频组件410被配置为输出和/或输入音频信号。例如,音频组件410包括一个麦克风(mic),当装置400处于操作模式,如呼叫模式、记录模式和语音识别模式时,麦克风被配置为接收外部音频信号。所接收的音频信号可以被进一步存储在存储器404或经由通信组件416发送。在一些实施例中,音频组件410还包括一个扬声器,用于输出音频信号。
103.i/o接口412为处理组件402和外围接口模块之间提供接口,上述外围接口模块可以是键盘,点击轮,按钮等。这些按钮可包括但不限于:主页按钮、音量按钮、启动按钮和锁定按钮。
104.传感器组件414包括一个或多个传感器,用于为装置400提供各个方面的状态评估。例如,传感器组件414可以检测到装置400的打开/关闭状态,组件的相对定位,例如所述组件为装置400的显示器和小键盘,传感器组件414还可以检测装置400或装置400一个组件的位置改变,用户与装置400接触的存在或不存在,装置400方位或加速/减速和装置400的温度变化。传感器组件414可以包括接近传感器,被配置用来在没有任何的物理接触时检测附近物体的存在。传感器组件414还可以包括光传感器,如cmos或ccd图像传感器,用于在成像应用中使用。在一些实施例中,该传感器组件414还可以包括加速度传感器,陀螺仪传感器,磁传感器,压力传感器或温度传感器。
105.通信组件416被配置为便于装置400和其他设备之间有线或无线方式的通信。装置
400可以接入基于通信标准的无线网络,如wifi,运营商网络(如2g、3g、4g或5g),或它们的组合。在一个示例性实施例中,通信组件416经由广播信道接收来自外部广播管理系统的广播信号或广播相关信息。在一个示例性实施例中,所述通信组件416还包括近场通信(nfc)模块,以促进短程通信。例如,在nfc模块可基于射频识别(rfid)技术,红外数据协会(irda)技术,超宽带(uwb)技术,蓝牙(bt)技术和其他技术来实现。
106.在示例性实施例中,装置400可以被一个或多个应用专用集成电路(asic)、数字信号处理器(dsp)、数字信号处理设备(dspd)、可编程逻辑器件(pld)、现场可编程门阵列(fpga)、控制器、微控制器、微处理器或其他电子元件实现,用于执行上述实体词的识别方法。
107.在示例性实施例中,还提供了一种包括指令的非临时性计算机可读存储介质,例如包括指令的存储器404,上述指令可由装置400的处理器420执行以完成上述实体词的识别方法。例如,所述非临时性计算机可读存储介质可以是rom、随机存取存储器(ram)、cd-rom、磁带、软盘和光数据存储设备等。
108.图5是根据一示例性实施例示出的一种用于实体词的识别装置500的框图。例如,装置500可以被提供为一服务器。参照图5,装置500包括处理组件522,其进一步包括一个或多个处理器,以及由存储器532所代表的存储器资源,用于存储可由处理组件522的执行的指令,例如计算机程序产品。存储器532中存储的计算机程序产品可以包括一个或一个以上的每一个对应于一组指令的模块。此外,处理组件522被配置为执行指令,以执行上述实体词的识别方法。
109.装置500还可以包括一个电源组件526被配置为执行装置500的电源管理,一个有线或无线网络接口550被配置为将装置500连接到网络,和一个输入输出(i/o)接口558。装置500可以操作基于存储在存储器532的操作系统,例如windows servertm,mac os xtm,unixtm,linuxtm,freebsdtm或类似。
110.本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本发明的其它实施方案。本公开旨在涵盖本发明的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本发明的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本发明的真正范围和精神由下面的权利要求指出。
111.应当理解的是,本发明并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本发明的范围仅由所附的权利要求来限制。
再多了解一些

本文用于创业者技术爱好者查询,仅供学习研究,如用于商业用途,请联系技术所有人。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献