一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

基于多视图语义特征融合的中文命名实体识别方法及装置

2022-06-05 03:33:04 来源:中国专利 TAG:


1.本发明涉及自然语言处理领域,尤其是涉及基于多视图语义特征融合的中文命名实体识别方法及装置。


背景技术:

2.命名实体识别(named entity recognition,ner)是提取非结构化文本中的结构化信息,如人名、地名、组织机构名等。ner在许多自然语言处理的下游任务中发挥着基石作用,包括信息检索、问答系统、实体关系的提取、知识图谱的构建等。近年来,随着人工智能的快速发展,中文命名实体识别技术已经广泛应用于通用领域,如网络安全领域,社交媒体领域,医疗领域等。
3.目前,从特征提取的角度去提升中文ner性能的方法有很多,经典的方法有zhang yue等人提出了lattice-lstm模型,开创性地将词汇信息加入基于字符特征的中文ner模型。liu wei等人为了解决lattice-lstm模型不能并行化批量处理数据,在字符嵌入时,将词汇信息添加到一个单词的开始和结束字符中,以获取单词的词边界信息,同时减少分词错误对实体识别产生的影响。ma ruotian等人在嵌入层也提出了一种简单的方法,将词汇信息嵌入到字符中,该方法只需要对字符嵌入层进行细微调整就可以使字符嵌入词汇信息,以达到字词信息结合的效果。
4.以上这些方法的创新都是基于字符特征的基础上,由于这种提取特征的方法只关注于提取部分特征,缺乏从多个角度和多个维度挖掘文本自身信息,导致模型捕获语义特征不足。


技术实现要素:

5.本发明提供了一种基于多视图语义特征融合的中文命名实体识别方法及装置,解决相关技术中只关注于提取部分特征,缺乏从多个角度和多个维度挖掘文本自身信息,导致模型捕获语义特征不足的问题。
6.第一方面,本技术提供一种基于多视图语义特征融合的中文命名实体识别方法,利用多视图语义特征融合模型对待识别的文本数据进行处理,完成中文命名实体识别,包括:利用多视图语义特征融合模型对待识别的文本数据进行处理,完成中文命名实体识别,包括:
7.通过多视图语义特征融合嵌入模块,提取所述文本对应的多视图语义特征融合嵌入向量;将所述多视图语义特征融合嵌入向量通入网络编码模块,获取所述文本相邻字符之间的依赖关系,捕获所述文本上下文信息特征;将所述文本上下文信息特征通过多头自注意力机制模块,从不同维度的子空间中提取所述文本蕴含的上下文信息,获得多个维度的语义特征;将所述多个维度的语义特征通入条件随机场标签解码模块,预测所述文本每个字符的标签。
8.进一步的,构建所述多视图语义特征融合嵌入模块包括字符特征嵌入、词边界特
征嵌入、偏旁部首特征嵌入和拼音特征嵌入。
9.进一步的,所述通过多视图语义特征融合嵌入模块,提取文本对应的多视图语义特征融合嵌入向量包括:
10.将所述文本中的每个中文字符映射为所述中文字符对应的嵌入向量,将所述中文字符对应的嵌入向量通过特征融合方法进行融合,得到中文字符对应的多视图语义特征融合嵌入向量。
11.进一步的,所述中文字符对应的嵌入向量包括:字符特征向量、词边界特征向量、偏旁部首特征向量和拼音特征向量。
12.进一步的,所述字符特征嵌入包括:采用词向量模型word2vec训练中文语料库gigaword的字符形成相应的50维度的字符向量集合,将标注数据集中的字符向量替换成所述50维度字符向量,并形成最终的字符向量表示。
13.进一步的,所述词边界特征嵌入包括:
14.通过jieba分词,将所述文本的词边界信息依附于字符形成所述词边界特征,
[0015][0016]
其中,表示嵌入词边界特征的字符表示,表示分割的词边界标签。
[0017]
进一步的,所述偏旁部首特征嵌入包括:将所述文本中的偏旁部首信息依附于字符形成偏旁部首特征,
[0018][0019]
其中,表示嵌入偏旁部首特征的字符表示,表示一个汉字对应的偏旁部首。
[0020]
进一步的,所述拼音特征嵌入包括:将文本中的拼音信息依附于字符形成拼音特征,
[0021][0022]
其中,表示嵌入拼音特征的字符表示,表示一个汉字对应的读音。
[0023]
进一步的,所述网络编码模块包括单层的双向长短周期记忆网络,所述双向长短周期记忆网络隐状态的具体表示为:
[0024][0025][0026][0027]
其中,表示前向长短时记忆网络lstm在j位置的隐状态,表示反向长短时记忆网络lstm在j位置的隐状态,hj表示j位置双向长短周期记忆网络的隐状态。
[0028]
第二方面,本技术还提供一种基于多视图语义特征融合的中文命名实体识别装置,所述装置包括存储器和处理器,所述存储器用于存储计算机程序,所述计算机程序被所述处理器执行时,实现第一方面所述的基于多视图语义特征融合的中文命名实体识别方法。
[0029]
本发明通过提供一种基于多视图语义特征融合的中文命名实体识别方法及装置,解决了现有技术存在部分或全部问题,相较于现有技术,本发明从多个角度、多个维度充分挖掘文本自身蕴含的特征,以提升模型整体的识别性能。对于构建多视图语义特征融合嵌入模块,本发明从多角度整合字符的语义信息,以弥补语义特征获取不充分等问题,从而提升模型识别的性能。对于嵌入多头自注意力机制模块,本发明在多维度子空间中捕获整个句子的全局依赖关系,以更好地理解和挖掘文本自身蕴含的语义特征,并最终提升模型的识别性能。本发明提高了中文ner模型的整体性能,并有效地从多角度、多维度增强中文文本自身特征的捕获能力。
附图说明
[0030]
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0031]
附图1为本发明实施例提供的多视图语义特征融合模型用于中文命名实体识别的总体架构;
[0032]
附图2为本发明实施例提供的多视图语义特征融合嵌入模块示意图;
[0033]
附图3为本发明实施例提供的偏旁部首特征和拼音特征的关联性示意图;
[0034]
附图4为本发明实施例提供的msra ner数据集上的表现示意图;
[0035]
附图5为本发明实施例提供的people daily ner数据集上的表现示意图;
[0036]
附图6为本发明实施例提供的chinese resume ner数据集上的表现示意图;
[0037]
附图7为本发明实施例提供的weibo ner数据集上的表现示意图。
具体实施方式
[0038]
下面将结合附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
[0039]
经发明人研究发现,目前,从特征提取的角度去提升中文ner性能的方法都是基于字符特征的基础上,添加较为准确的词汇信息,从字符和词汇特征角度增强模型的语义理解,但是这些方法还是缺少对文本的多方位信息获取。汉语的最细粒度是字符,以上方法对字符的特征提取还是只停留在字义层面的理解,而忽略了字形、字音对字义理解的加强作用。同时,这些方法都没有从句子层面,深层次挖掘句子内部字符间的依存关系。
[0040]
针对以上缺陷,本发明实施例提出一种基于多视图语义特征融合的中文命名实体识别方法,其中,多视图语义特征融合模型整体结构如图1所示,包括:多视图语义特征融合嵌入模块、双向长短周期记忆网络编码模块、多头自注意力机制模块、条件随机场标签解码模块;利用所述的多视图语义特征融合模型对待识别的文本数据进行处理,完成中文命名实体识别,包括:通过多视图语义特征融合嵌入模块,提取所述文本对应的多视图语义特征融合嵌入向量;将所述多视图语义特征融合嵌入向量通入网络编码模块,获取所述文本相
邻字符之间的依赖关系,捕获所述文本上下文信息特征;将所述文本上下文信息特征通过多头自注意力机制模块,从不同维度的子空间中提取所述文本蕴含的上下文信息,获得多个维度的语义特征;将所述多个维度的语义特征通入条件随机场标签解码模块,预测所述文本每个字符的标签。
[0041]
在多视图语义特征融合嵌入模块中,将从多个角度整合字符特征,以更好地理解句子的语义信息;在双向长短周期记忆网络(bi-directional long short-term memory,bilstm)网络编码模块将接受的多视图语义特征融合向量进行上下文编码;在多头自注意力机制模块,通过在多维度子空间中捕获文本的上下文信息,以充分挖掘文本自身蕴含的语义信息;在条件随机场(conditional random field,crf)标签解码模块,预测每个字符的标签。
[0042]
多视图语义特征融合嵌入模块的构建对中文命名实体识别具有至关重要的作用。在汉语句子中的最细粒度就是汉字,每一个汉字并不只是意味着一个独立的字符,其所处句子的位置都影响着每句话的重要含义,因此每个汉字都需要为其所在的中文句子提供其多方位信息,以确保深度模型对语义特征的多角度理解。
[0043]
本技术构建多视图语义特征融合嵌入模块可以从多个角度整合句子的语义信息。如图2所示,该模块由字符特征、词边界特征、偏旁部首特征和拼音特征构成,分别对应字义信息、词边界信息、字形信息、字音信息四个部分。对于任意一个中文句子si,其长度为n,本发明按照每个中文字符划分为c1,c2,c3,...,cn。其中,每个中文字符cj被映射为一个包含四部分信息的嵌入向量ej,从多个角度去更好地表达句子的语义特征。i表示第几个中文句子,取值为(i=1,2,...,n);j表示一句话中的第几个中文字,取值(j=1,2,...,m)。中文字符对应的嵌入向量包括:字符特征向量、词边界特征向量、偏旁部首特征向量和拼音特征向量。
[0044]
构建所述多视图语义特征融合嵌入模块包括字符特征嵌入、词边界特征嵌入、偏旁部首特征嵌入和拼音特征嵌入,相应的,多视图语义特征融合模型可以从以上多个角度捕获句子的语义特征:
[0045]
字符特征嵌入,预训练模型已经广泛应用于中文命名实体识别领域,采用经典的词向量模型word2vec去训练中文语料库gigaword的字符形成相应的50维度的字符向量集合,再将标注数据集中的字符向量替换成通过预训练得到的50维度字符向量,并形成最终的字符向量表示,以提升深度学习模型的性能。词边界特征嵌入,只采用字符特征嵌入会忽略相邻字符之间的语义关系,为此peng and dredze等人提出了基于字符特征的中文ner模型使用字符的软特征以提升模型的识别性能。本发明在构建多尺度特征模块中嵌入词边界特征,如公式(1),表示分割的词边界标签,本发明通过jieba分词,将一句话中的词边界信息依附于字符形成词边界特征,用于获取相邻字符间的联系。嵌入词边界征的字符表示:
[0046][0047]
偏旁部首特征嵌入,从文字构造来看,中文与英文有较大的区别,英文是字母文字,而中文是象形文字。象形文字是由原始图画文字演变而来的,本质上是描摹实物形状的文字。偏旁部首是指一个汉字的上、下、左、右、内、外的任意一个部分,可以深层次理解汉字最基本的含义。如图3所示,单独看“海口”与“潍坊”这两个词中,虽然都有“氵”,但是都与水
没有直接联系,它们都是地名。“海口”中的“海”字标签是“b-loc”,提取到其偏旁部首为“氵”。潍坊中的“潍”字的偏旁部首为“氵”,其标签也是“b-loc”。这两个字,一个是“左右结构”,另一个是“左中右结构”,从字符的形态上、结构上都相差很多,但偏旁部首是相同的,这样就在某种程度构建了它们之间的隐性联系,便于模型对语义信息的理解。再例如,“猿猴”、“狸猫”、“豹”、“豺狼”等,这些字不仅都具有相同的“犭”,在字义上都蕴含动物的意思。同时它们的空间结构都是“左右”形态,具有相似的嵌入结构特征分量,从字义、字形、结构形态等角度都传递了相互之间隐含的关联信息。因此,仅仅使用字符向量表示汉字,会忽略象形文字的本质特点。现有的一些工作使用汉字图像作为字形嵌入,由于其空间复杂度较大,很难达到很好的效果。本发明在构建多视图语义特征融合嵌入模块中嵌入偏旁部首特征,如公式(2),表示一个汉字对应的偏旁部首,将一句话中的偏旁部首信息依附于字符形成偏旁部首特征,可以简单地从字符自身捕获字形特征,以增强语义理解。嵌入偏旁部首特征的字符表示:
[0048][0049]
汉语拼音特征嵌入,汉语拼音是汉字的拉丁化方案,是一种表达汉字发音的特殊组成方式。拼音共有26个字母和4种音调组成。每一个汉字都对应一种特殊表达方式,即汉字的读音。通常每个汉字的读音都是由声母、韵母和音调组成。如图4所示,单独看“张文”与“张雯”这两个都是人名。“文”的拼音是“w
é
n”,实体标签是“e-per”。“雯”字的拼音为“w
é
n”,其标签也是“e-per”。这两个字,从字符的字义上、形态上、结构上都相差很多。但其拼音是相同的,这样在某些程度上构建了两者间的隐含联系,便于模型对字音、字义深层次的理解。本发明在构建多视图语义特征融合嵌入模块中嵌入拼音特征,如公式(3),表示一个汉字对应的读音,将一句话中的拼音信息依附于字符形成拼音特征,可以简单地从字符自身捕获字音特征,以增强语义理解。嵌入拼音特征的字符表示:
[0050][0051]
由于每种特征的嵌入维度存在区别,本发明不能直接相加各种嵌入特征,因此本发明引入了两种融合方法。
[0052]
concat融合方法
[0053]
如公式(4)所示,直接拼接嵌入的四种特征向量,以获取新的多尺度特征向量,为bilstm编码做准备。其中,表示某个中文字符对应的特征向量,表示该字符对应的词边界特征向量,表示该字符对应的偏旁部首特征向量,表示该字符对应的拼音特征向量,表示该字符对应的多视图语义特征融合嵌入向量。
[0054][0055]
concat linear融合方法
[0056]
如公式(5)所示,直接拼接四种特征向量之后,再增加一个线性连接层,以进一步融合特征向量。
[0057][0058]
理论上说,concat linear(先进行concat融合再进行线性拼接)融合方法节省了
一定的计算空间,提升模型的识别速度。但该融合方法可能由于线性拼接,导致融合信息的丢失,从而对模型的识别产生负面影响,通过大量实验表明concat融合方法可以使模型性能达到最好。
[0059]
通过多视图语义特征融合嵌入模块后,将多视图语义特征融合特征向量通入网络编码层,以捕获相邻字符之间的依赖关系。常见的网络编码层有循环神经网络、卷积神经网络、transformer等。本发明选择的长短时记忆网络(long short-term memory,lstm),是递归神经网络(recurrent neural network,rnn)的变体之一。bilstm是由前向lstm与后向lstm组合而成。该网络通过引入记忆细胞和门结构,有选择性地保留某些重要的信息,以解决梯度消失和梯度爆炸等问题。但是单向的lstm只能从前向后单向地编码句子的语义信息,而忽略了句子中,后半部分信息对前半部分信息的影响。为了更全面地整合句子信息,本发明采用一个单层的bilstm,以捕获上下文信息,从而获取句子的长距离依赖。bilstm隐状态的具体表示如公式(6),(7),(8),其中和分别表示前向lstm和反向lstm在j位置的隐状态。通过concat连接符将两者连接可得到j位置bilstm的隐状态hj。
[0060][0061][0062][0063]
发明人发现自注意力机制在处理文本信息时,会给句子中的重要文字赋予较高的权重,而对于其他字符则分配较小权重。自注意力机制的本质是对有限信息进行分配选择,如公式(9)所示,使用点积进行相似度计算。
[0064][0065]
其中,q为查询矩阵,k为密钥矩阵,防止q和k的内积过于太大,以起到调节作用,v为值矩阵,attention(q,k,v)表示注意力机制的计算结果,t表示矩阵转置。
[0066]
本发明嵌入多头自注意力机制模块,使模型充分明晰句子中各字符间的依赖关系。多头自注意力机制的计算方式如公式(10),(11)。在参数不共享的前提下将q、k、v通过参数矩阵映射后再做放缩点积注意力,并将该过程重复h次。最后将每个注意力headj的结果进行拼接,得到multi-head(q,k,v)。在多个子空间捕获句子的上下文信息,以获得多个维度的语义特征。
[0067][0068][0069]
每个中文字符对应的标签是先通过bilstm进行编码,再通过多头自注意力机制模块的多维度子空间捕获文本自身蕴含的上下文信息,最后通向解码层做标签预测。softmax函数的输出是相互独立的,它只能保证每个时刻的输出概率最大,无法考虑字符标签的前后顺序。但是,命名实体识别的标签预测需要考虑连续字符标签之间的依赖关系。因此在命名实体识别模型中多选用可以全局归一化的条件随机场(crf),使一个句子的整体预测概
率达到最大。
[0070]
本发明的申请人通过实验对本发明的技术方案进行了进一步分析和验证。
[0071]
具体如下:
[0072]
为了验证本发明提出方法的有效性,本发明使用中文命名实体识别四大公开语料库,通过设置不同的限定条件对不同的模型进行实验,并对实验结果展开讨论。
[0073]
本发明采用经典的静态字向量预训练模型。由词向量模型word2vec去训练中文语料库gigaword的字符形成相应的字符向量集合。
[0074]
本发明选择基线模型bilstm-crf作为中文ner模型性能比较的基础,将三种中文ner模型进行性能对比。第一种是在嵌入层只嵌入字符特征和词边界特征的bilstm-crf模型;第二种是在嵌入层嵌入本发明构建的多视图语义特征融合嵌入模块的bilstm-crf模型;第三种是在嵌入层嵌入本发明构建的多视图语义特征融合嵌入模块,并在bilstm层和crf层之间嵌入构建的多头自注意力机制模块。为了控制变量本发明采用一致的融合方法
‑‑
concat,因为不同的融合方法会改变模型的网络结构。
[0075]
由表3和表4、图4、图5、图6、图7可知,本发明提出的方法在所有的4个数据集中均取得了最好的效果,f1值均为最高。其中,m1表示只嵌入字符特征 词边界特征(bilstm crf)模型;m2表示字符特征 词边界特征 偏旁部首特征 拼音特征(bilstm crf)模型,即嵌入多视图语义特征融合嵌入模块的中文ner模型;m3表示字符特征 词边界特征 偏旁部首特征 拼音特征(bilstm 多头子注意力机制 crf)模型,即用于中文命名实体识别的多视图语义特征融合模型。
[0076]
本发明选取四个公开数据集作为实验的语料库。msra ner、people daily ner、chinese resume ner、weibo ner。
[0077]
msra ner和people daily ner这两个数据集主要来源于新闻官方的报道,使用句式、语法相对正式,具有较强的官方性。chinese resume ner主要来源于高管人员的简历材料,主要包含人名、职位名和公司名,三种实体信息,具有较强的逻辑性。weibo ner来源于社交媒体,主要包含人名、地名、组织机构名、地缘政治实体,四种实体信息,其句式和用词均凸显了非正式表达,具有较大的随意性,该数据集相对较小,过拟合问题比较严重。同时实体标签数据占比数据集也是相当小,结果会有一些波动,可以多次实验调整模型参数。表1显示了数据集的各种信息。4个公开数据集的详细内容如表1所示。
[0078]
表1超参数设置
[0079][0080]
为了验证偏旁部首特征和拼音特征的整体性能,本发明根据词向量模型word2vec将预先训练好的gigaword字向量对中文字符向量进行处理,以提升深度学习模型的性能。本发明在4个公开数据集上对使用字符 词边界特征(bilstm crf)的模型、字符 词边界 拼
音 偏旁部首特征(bilstm crf)和字符 词边界 拼音 偏旁部首特征(bilstm 多头自注意力机制 crf)进行多组对比实验;为了做到控制变量,本发明保证其他变量及参数设置都是一致。
[0081]
在参数设置方面,如表2所示,为了使本技术实施例的模型获得最优的性能,所采用的是tensorflow1.13.1框架,并用cpu进行训练。具体模型参数如表3所示,character特征嵌入维度设为50,word_boundary特征维数设为20,radical特征嵌入维度设为50,pinyin特征嵌入维度设为50,droupout层中的droup_keep设为0.5,bilstm的层数设为1,batch size设为12,学习率为0.002,epochs设为60,multi_head设为8。此外,还在模型中使用了梯度截断技术防止梯度爆炸和使用dropout技术来防止过拟合。梯度截断技术中设定[-5,5]为梯度截断范围,最后,使用adam优化器更新梯度。
[0082]
表2超参数设置
[0083][0084]
表3显示了在不同的四个公开数据集中多视图语义特征融合模型的性能。从表中可知,在4个公开数据集中,本发明提出的方法均取得了最高的f1值,彰显了本发明方法的可行性。
[0085]
表3:performance of our method in msra and people daily datasets
[0086][0087]
表4:performance of our method in the resume and weibo datasets
[0088][0089]
如表3和图6所示,在msra ner数据集中,本发明提出的方法在60轮训练中,构建多视图语义特征融合嵌入模块将静态嵌入模型的f1值从82.26%提升到了84.81%,构建多头自注意力机制模块又将多视图语义特征融合嵌入模块的方法从84.81%提升到86.17%。如表3和图5所示,在people daily ner数据集中,本发明提出的方法在60轮训练中,构建多视图语义特征融合嵌入模块将静态嵌入模型的f1值从82.12%提升到了86.17%,构建多头自注意力机制模块又将多视图语义特征融合嵌入模块的方法从86.17%提升到87.43%。在msra ner和people daily ner数据集中,本发明提出的方法对模型的识别产生了明显的提升效果。这是因为这两个数据集中的句子主要来源于新闻的官方报道,句式结构、语法形式较为正式严谨,这说明本发明的方法更适用于较为正式的语言环境。
[0090]
如表4和图6所示,在chinese resume ner数据集中,本发明提出的方法在60轮训练中,用于中文命名实体识别的多视图语义特征融合模型的f1值达到95.43%,比起构建多
视图语义特征融合嵌入模块的中文ner方法提升了约0.74%,比起只嵌入字符特征和词边界特征的bilstm-crf模型提升了约1.2%,证明本发明提出的方法整体上对模型的识别产生了一定的提升效果。这是因为在chinese resume ner语料库中,大多数命名实体存在一定的固有模式,如公司名和组织名存在某些固定的后缀,更容易被识别。
[0091]
如表4和图7所示,在weibo ner数据集中,本发明提出的方法在60轮训练中,多视图语义特征融合模型从整体上相对于静态字符嵌入模型并没有较为明显的提升,三条曲线的波动性较大,这主要原因是weibo ner数据集的规模较小,实体标签较少,因此模型识别的偶然性较高。但是在彰显模型最好性能的f1值中,m1的f1值为53.10%,m2的f1值为55.05%,m3的f1值为55.94%,本发明的方法还是取得了最好的效果。
[0092]
从以上4个数据集的结果,本发明可以看出,多视图语义特征融合模型给中文命名实体识别方法带来了较为明显的改进。最为突出的在msra ner和people daily ner这两个较为正式的语料库中存在明显的优势,证明了在识别较为正式的中文文本中,从多角度、多维度捕获语义特征对中文命名实体识别产生更有意义的价值。
[0093]
基于以上的实验结果,用于中文命名实体识别的多视图语义特征融合模型只从分词或字符的部分特征去捕获句子特征,同时提升了cner模型的整体性能。本发明的方法适用于弥补对自身蕴含语义特征挖掘不充分问题。实验结果证明了本发明提出的方法是有意义的。在嵌入表示层构建多视图语义特征融合嵌入模块,嵌入偏旁部首特征和拼音特征,使模型从字形、字音、字义等多个角度相互融合,弥补单个特征捕获的信息缺失。从多方位去整合句子的语义信息,使模型提取特征更全面。同时,将bilstm与多头自注意力机模块相结合,在不同的多个子空间中捕获文本自身蕴含的上下文信息,以更好地理解和挖掘文本自身蕴含的语义特征。本发明提出的方法从字符层面的多个角度、句子层面的多个维度给cner模型带来更多的特征捕获方式和逻辑关联模式。
[0094]
本技术提出了一种新颖的多视图语义特征融合模型(msfm)用于中文命名实体识别,该模型构建多视图语义特征融合嵌入模块(mfem)和嵌入多头自注意力机制模块(msam)。mfem设计的目的是获取字符特征、偏旁部首特征和拼音特征等,从很大程度上增强了汉字的字义、字形、字音等信息,以解决语义信息获取不充分等问题。嵌入msam使模型在多个不同的子空间中深层次学习句子内部的依存关系,以捕获句子的内部结构特征。设计的mfem和嵌入的msam从字符的多个角度提取特征并有效地融合了多维度句子信息,以提高模型的识别性能。在多个数据集中的结果显示,msfm可以提升cner的整体性能。msfm具有从多角度和多维度高效识别复杂中文句子中实体的能力。在大数据挖掘领域具有很强的应用价值。
[0095]
本技术实施例还提供一种基于多视图语义特征融合的中文命名实体识别装置,所述装置包括存储器和处理器,所述存储器用于存储计算机程序,所述计算机程序被所述处理器执行时,实现本技术所述的基于多视图语义特征融合的中文命名实体识别方法。
[0096]
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献