一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

多意图语句的分割方法和装置、存储介质及电子装置与流程

2022-12-20 02:00:30 来源:中国专利 TAG:


1.本技术涉及智慧家庭技术领域,具体而言,涉及一种多意图语句的分割方法和装置、存储介质及电子装置。


背景技术:

2.人机交互技术在当今智能设备的发展领域占据重要的地位,智能便捷的人机交互方式不仅可以大大提高设备控制的效率,还可以提高用户的交互体验,目前,普遍的人机交互技术只支持单一意图识别,例如:“打开热水器至40℃,并将空调设置为浴后模式”这一类包含多个指令意图的语句将面对识别困难的情况。
3.针对上述包含多个指令意图的语句,通常为了保证单一意图识别的准确率,可以先对语句进行领域分类,确定语句指令对应的设备类型,例如上述语句对应“浴霸”和“空调”两种设备领域,之后,再对已确定的设备领域进行精确的意图匹配,例如:空调有开机、关机、温度、模式设置4个小意图,上述语句中空调设备对应的意图可以匹配至“模式设置”。对每一个设备领域重复上述匹配过程,以实现对包含多个指令意图的语句的意图进行分割,但是这种匹配方式,面对包含多个指令意图的语句都需要多级匹配,不仅计算量大,而且每一级的匹配速度直接影响语句意图的识别效率,容易出现识别效率低,响应不及时的问题出现。
4.针对相关技术中,对多意图语句进行分割的过程中,分割的效率较低等问题,尚未提出有效的解决方案。


技术实现要素:

5.本技术实施例提供了一种多意图语句的分割方法和装置、存储介质及电子装置,以至少解决相关技术中,对多意图语句进行分割的过程中,分割的效率较低等问题。
6.根据本技术实施例的一个实施例,提供了一种多意图语句的分割方法,包括:
7.提取携带了多个执行意图的待分割语句中所包括的文字具有的文字特征;
8.根据所述文字特征将所述待分割语句转换为特征图像,其中,所述特征图像用于通过图像像素表征所述文字特征;
9.对所述特征图像进行语义分割,以生成多个语义图像,其中,每个所述语义图像用于表征多个所述执行意图中的一个目标执行意图;
10.识别所述多个语义图像中每个语义图像对应的目标子语句,得到所述待分割语句所对应的多个所述目标子语句。
11.可选的,所述根据所述文字特征将所述待分割语句转换为特征图像,包括:
12.构建所述待分割语句对应的初始矩阵图,其中,所述初始矩阵图中的矩阵行依次对应所述待分割语句中的每个文字,所述初始矩阵图中的矩阵列依次对应所述待分割语句中的每个文字;
13.对于所述初始矩阵图上的每个像素位置,对所述像素位置所对应的行文字的第一
文字特征与所述像素位置所对应的列文字的第二文字特征进行目标运算,得到所述像素位置对应的目标像素值;
14.将所述目标像素值添加到所述初始矩阵图上的所述像素位置中,得到目标矩阵图作为所述特征图像。
15.可选的,所述对所述像素位置所对应的行文字的第一文字特征与所述像素位置所对应的列文字的第二文字特征进行目标运算,得到所述像素位置对应的目标像素值,包括:
16.对所述第一文字特征和所述第二文字特征执行多个运算类型中的n个运算类型,得到n个运算结果,其中,n为大于或者等于2的整数;
17.将所述n个运算结果构造成所述像素位置对应的n通道的像素值作为所述目标像素值。
18.可选的,所述对所述第一文字特征和所述第二文字特征执行多个运算类型中的n个运算类型,得到n个运算结果,包括:
19.对所述第一文字特征和所述第二文字特征进行相乘运算,得到第一运算结果;
20.对所述第一文字特征和所述第二文字特征进行相似度运算,得到第二运算结果;
21.对所述第一文字特征和所述第二文字特征进行全连接运算,得到第三运算结果,其中,所述n个运算结果包括所述第一运算结果,所述第二运算结果和所述第三运算结果。
22.可选的,所述将所述n个运算结果构造成所述像素位置对应的n通道的像素值作为所述目标像素值,包括:
23.获取目标拼接顺序和目标拼接格式;
24.将所述第一运算结果,所述第二运算结果和所述第三运算结果按照所述目标拼接顺序拼接成所述目标拼接格式,得到所述目标像素值。
25.可选的,所述对所述特征图像进行语义分割,以生成多个语义图像,包括:
26.将所述特征图像多次输入目标语义分割模型,得到所述目标语义分割模型输出的多个分割结果,其中,所述目标语义分割模型是使用标注了多个标准语义图像的特征图像样本对初始语义分割模型进行训练得到的,所述特征图像样本用于表征携带了多个意图的标准语句,多个标准语义图像中每个所述标准语义图像用于表征所述标准语句中的一个意图对应的目标语句;
27.将多个所述分割结果确定为多个所述语义图像。
28.可选的,所述将所述特征图像多次输入目标语义分割模型,得到所述目标语义分割模型输出的多个分割结果,包括:
29.每次将所述特征图像和参考图像输入所述目标语义分割模型,其中,在首次输入的情况下,所述参考图像为初始图像,在非首次输入的情况下,所述参考图像为上一次所述目标语义分割模型输出的所述分割结果;
30.获取所述目标语义分割模型输出的一个所述分割结果,直至得到多个所述分割结果。
31.可选的,所述提取携带了多个执行意图的待分割语句中所包括的文字具有的文字特征,包括:
32.将所述待分割语句中所包括的每个文字转换为字向量,得到多个字向量;
33.对多个所述字向量进行双向特征提取,得到每个所述字向量对应的前向特征和后
向特征;
34.将所述前向特征和所述后向特征进行拼接,得到每个文字对应的所述文字特征。
35.可选的,所述识别所述多个语义图像中每个语义图像对应的目标子语句,包括:
36.从每个所述语义图像中提取图像像素属于目标像素类型的目标图像像素对应的目标文字,其中,每个所述语义图像中的图像像素按照所表达的执行意图划分了像素类型;
37.将所述目标文字构建为每个所述语义图像对应的所述目标子语句。
38.根据本技术实施例的又一方面,还提供了一种计算机可读的存储介质,该计算机可读的存储介质中存储有计算机程序,其中,该计算机程序被设置为运行时执行上述多意图语句的分割方法。
39.根据本技术实施例的又一方面,还提供了一种电子装置,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其中,上述处理器通过计算机程序执行上述的多意图语句的分割方法。
40.在本技术实施例中,提取携带了多个执行意图的待分割语句中所包括的文字具有的文字特征;根据文字特征将待分割语句转换为特征图像,其中,特征图像用于通过图像像素表征文字特征;对特征图像进行语义分割,以生成多个语义图像,其中,每个语义图像用于表征多个执行意图中的一个目标执行意图;识别多个语义图像中每个语义图像对应的目标子语句,得到待分割语句所对应的多个目标子语句,即首先提取待分割语句所包括的文字具有的文字特征,使用文字特征将待分割语句转换为特征图像,由于特征图像中的图像像素可以表征文字特征,因此可以通过对特征图像进行语义分割,得到多个语义图像的方式,将待分割语句所包括的多个执行意图分割至对应的多个语义图像中,最后识别多个语义图像中每个语义图像对应的目标子语句,就可以得到待分割语句所对应的多个目标子语句。也就是说,待分割语句进行语义分割的过程中,无需进行多级匹配,而是将待分割语句转化为特征图像,直接对特征图像进行语义分割,从而实现将待分割语句分割,得到多个目标子语句,采用上述技术方案,解决了相关技术中,对多意图语句进行分割的过程中,分割的效率较低等问题,实现了对多意图语句进行分割的过程中,提高分割的效率的技术效果。
附图说明
41.此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本技术的实施例,并与说明书一起用于解释本技术的原理。
42.为了更清楚地说明本技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,对于本领域普通技术人员而言,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
43.图1是根据本技术实施例的一种多意图语句的分割方法的硬件环境示意图;
44.图2是根据本技术实施例的一种多意图语句的分割方法的流程图;
45.图3是根据本技术实施例的一种多意图语句的分割方法的示意图;
46.图4是根据本技术实施例的一种特征图像的生成的示意图;
47.图5是根据本技术实施例的一种语义分割的示意图;
48.图6是根据本技术实施例的一种语义图像的生成的示意图;
49.图7是根据本技术实施例的一种多意图语句的分割流程的示意图;
50.图8是根据本技术实施例的一种多意图语句的分割装置的结构框图。
具体实施方式
51.为了使本技术领域的人员更好地理解本技术方案,下面将结合本技术实施例中的附图,对本技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本技术一部分的实施例,而不是全部的实施例。基于本技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本技术保护的范围。
52.需要说明的是,本技术的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本技术的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
53.根据本技术实施例的一个方面,提供了一种多意图语句的分割方法。该多意图语句的分割方法广泛应用于智慧家庭(smart home)、智能家居、智能家用设备生态、智慧住宅(intelligence house)生态等全屋智能数字化控制应用场景。可选地,在本实施例中,图1是根据本技术实施例的一种多意图语句的分割方法的硬件环境示意图,上述多意图语句的分割方法可以应用于如图1所示的由终端设备102和服务器104所构成的硬件环境中。如图1所示,服务器104通过网络与终端设备102进行连接,可用于为终端或终端上安装的客户端提供服务(如应用服务等),可在服务器上或独立于服务器设置数据库,用于为服务器104提供数据存储服务,可在服务器上或独立于服务器配置云计算和/或边缘计算服务,用于为服务器104提供数据运算服务。
54.上述网络可以包括但不限于以下至少之一:有线网络,无线网络。上述有线网络可以包括但不限于以下至少之一:广域网,城域网,局域网,上述无线网络可以包括但不限于以下至少之一:wifi(wireless fidelity,无线保真),蓝牙。终端设备102可以并不限定于为pc、手机、平板电脑、智能空调、智能烟机、智能冰箱、智能烤箱、智能炉灶、智能洗衣机、智能热水器、智能洗涤设备、智能洗碗机、智能投影设备、智能电视、智能晾衣架、智能窗帘、智能影音、智能插座、智能音响、智能音箱、智能新风设备、智能厨卫设备、智能卫浴设备、智能扫地机器人、智能擦窗机器人、智能拖地机器人、智能空气净化设备、智能蒸箱、智能微波炉、智能厨宝、智能净化器、智能饮水机、智能门锁等。
55.在本实施例中提供了一种多意图语句的分割方法,应用于上述设备终端,图2是根据本技术实施例的一种多意图语句的分割方法的流程图,如图2所示,该流程包括如下步骤:
56.步骤s202,提取携带了多个执行意图的待分割语句中所包括的文字具有的文字特征;
57.步骤s204,根据所述文字特征将所述待分割语句转换为特征图像,其中,所述特征图像用于通过图像像素表征所述文字特征;
58.步骤s206,对所述特征图像进行语义分割,以生成多个语义图像,其中,每个所述语义图像用于表征多个所述执行意图中的一个目标执行意图;
59.步骤s208,识别所述多个语义图像中每个语义图像对应的目标子语句,得到所述待分割语句所对应的多个所述目标子语句。
60.通过上述步骤,首先提取待分割语句所包括的文字具有的文字特征,使用文字特征将待分割语句转换为特征图像,由于特征图像中的图像像素可以表征文字特征,因此可以借助对特征图像进行语义分割,得到多个语义图像的方式,将待分割语句所包括的多个执行意图分割至对应的多个语义图像中,最后识别多个语义图像中每个语义图像对应的目标子语句,就可以得到分割语句所对应的多个目标子语句。也就是说,待分割语句进行语义分割的过程中,无需进行多级匹配,而是将待分割语句转化为特征图像,直接对特征图像进行语义分割,从而实现将待分割语句分割,得到多个目标子语句。采用上述技术方案,解决了相关技术中,对多意图语句进行分割的过程中,分割的效率较低等问题,实现了对多意图语句进行分割的过程中,提高分割的效率的技术效果。
61.在上述步骤s202提供的技术方案中,待分割语句可以但不限于为任何包含多个意图的语句,在对智能设备进行控制的场景中,待分割语句可以但不限于是指包含多个执行意图的语音指令,例如,用户说出的指令“打开空调和洗碗机”,实际上包括两个执行意图,分别是“打开空调”和“打开洗碗机”。
62.可选地,在本实施例中,待分割语句可以但不限于是经过预处理之后的语句,预处理可以但不限于包括:全角转半角,大写数字转阿拉伯数字,大写字母转小写字母,表情符号去除,分词,停用词过滤等处理方式。其中,分词就是将连续的字序列按照一定的规范重新组合成词序列的过程。在英文的行文中,单词之间是以空格作为自然分界符的,本技术可以将每一个字都做一个序列的部分。
63.可选地,在本实施例中,待分割语句中所包括的文字可以但不限于是指待分割语句中的单个文字,或者一个词语,其中,每个词语表达一个含义,例如,以“打开空调和洗碗机”作为待分割语句为例,待分割语句中所包括的文字可以是“打”、“开”、“空”、“调”、“和”、“洗”、“碗”、“机”8个单独的文字;待分割语句中所包括的文字还可以是“打开”、“空调”、“和”、“洗碗机”4个词语。
64.在一个示例性实施例中,可以但不限于通过以下方式提取携带了多个执行意图的待分割语句中所包括的文字具有的文字特征:将所述待分割语句中所包括的每个文字转换为字向量,得到多个字向量;对多个所述字向量进行双向特征提取,得到每个所述字向量对应的前向特征和后向特征;将所述前向特征和所述后向特征进行拼接,得到每个文字对应的所述文字特征。
65.可选地,在本实施例中,图3是根据本技术实施例的一种多意图语句的分割方法的示意图,如图3所示,以“打开空调和洗碗机”作为待分割语句为例,可以但不限于通过以下方式将所述待分割语句中所包括的每个文字转换为字向量:对“打开空调和洗碗机”所包括的每一个文字进行特征提取,其中,特征提取分为embedding(嵌入层)和提取层,embedding可以使用albert模型提取出整个语句中每个字的字向量,即可以将“打开空调和洗碗机”所包括的每一个文字输入albert模型,得到多个字向量。
66.可选地,在本实施例中,如图3所示,在得到多个字向量之后,可以将多个字向量输
入双向lstm模型(bilstm,bi-directional long short-term memory,双向长短期记忆网络),进行双向特征提取,得到每个所述字向量对应的前向特征(fw_cell)和后向特征(bw_cell),其中,fw_cell和bw_cell可以进行拼接得到一个用于表征每个文字对应的文字特征的向量。
67.在上述步骤s204提供的技术方案中,可以借鉴图像处理领域中的语义分割技术,首先将待分割语句转换为特征图像,通过语义分割技术对特征图像中的图像像素进行处理,将同属于同一个类型的图像像素划分至同一个区域,从而实现将待分割语句所包括的多个执行意图分割至多个目标子语句中,例如,通过上述方式可以将“打开空调和洗碗机”转化成特征图像,后续对特征图像进行语义分割,既可以得到“打开空调和洗碗机”对应的目标子语句:“打开空调”和“打开洗碗机”。
68.在一个示例性实施例中,可以但不限于通过以下方式根据所述文字特征将所述待分割语句转换为特征图像:构建所述待分割语句对应的初始矩阵图,其中,所述初始矩阵图中的矩阵行依次对应所述待分割语句中的每个文字,所述初始矩阵图中的矩阵列依次对应所述待分割语句中的每个文字;对于所述初始矩阵图上的每个像素位置,对所述像素位置所对应的行文字的第一文字特征与所述像素位置所对应的列文字的第二文字特征进行目标运算,得到所述像素位置对应的目标像素值;将所述目标像素值添加到所述初始矩阵图上的所述像素位置中,得到目标矩阵图作为所述特征图像。
69.可选地,在本实施例中,以“打开空调和洗碗机”作为待分割语句,将待分割语句中的每个文字依次对应至矩阵图中,构建待分割语句对应的初始矩阵图,图4是根据本技术实施例的一种特征图像的生成的示意图,如图4所示,以“打开空调和洗碗机”作为待分割语句,初始矩阵图中的矩阵行依次对应“打开空调和洗碗机”中的每个文字,之后对初始矩阵图中的每一个像素位置执行目标运算,得到目标像素值,以像素位置1为例,像素位置1对应的行文字为“打”,行文字“打”对应的第一文字特征为f1,像素位置1对应的列文字为“开”,列文字“开”对应的第二文字特征为f2,对第一文字特征(f1)和第二文字特征(f2)进行目标运算,得到像素位置1的目标像素值为f21,将目标像素值(f21)添加到所述初始矩阵图上的像素位置1中,依次对每个像素位置执行上述过程,得到目标矩阵图作为所述特征图像。
70.在一个示例性实施例中,可以但不限于通过以下方式对所述像素位置所对应的行文字的第一文字特征与所述像素位置所对应的列文字的第二文字特征进行目标运算,得到所述像素位置对应的目标像素值:对所述第一文字特征和所述第二文字特征执行多个运算类型中的n个运算类型,得到n个运算结果,其中,n为大于或者等于2的整数;将所述n个运算结果构造成所述像素位置对应的n通道的像素值作为所述目标像素值。
71.可选地,在本实施例中,如图3所示,可以对第一文字特征和第二文字特征执行目标运算,可以但不限于采用“相乘”、“cos相似度”和“全连接”等等运算类型作为目标运算的运算方式,其中,每一种运算类型可以得到一个运算结果,此处可以得到3个运算结果,一个运算结果组成一个通道,在目标运算之后,可以得到3个通道图。
72.在一个示例性实施例中,可以但不限于通过以下方式对所述第一文字特征和所述第二文字特征执行多个运算类型中的n个运算类型,得到n个运算结果:对所述第一文字特征和所述第二文字特征进行相乘运算,得到第一运算结果;对所述第一文字特征和所述第二文字特征进行相似度运算,得到第二运算结果;对所述第一文字特征和所述第二文字特
征进行全连接运算,得到第三运算结果,其中,所述n个运算结果包括所述第一运算结果,所述第二运算结果和所述第三运算结果。
73.可选地,在本实施例中,相乘运算、相似度运算和全连接运算的运算顺序可以但不限于为任何顺序。
74.在一个示例性实施例中,可以但不限于通过以下方式将所述n个运算结果构造成所述像素位置对应的n通道的像素值作为所述目标像素值:获取目标拼接顺序和目标拼接格式;将所述第一运算结果,所述第二运算结果和所述第三运算结果按照所述目标拼接顺序拼接成所述目标拼接格式,得到所述目标像素值。
75.可选地,在本实施例中,通过获取目标拼接顺序和目标拼接格式可以统一第一运算结果,第二运算结果和第三运算结果之间的拼接方式,即第一运算结果,第二运算结果和第三运算结果使用同一套目标拼接顺序和目标拼接格式。
76.在上述步骤s206提供的技术方案中,图5是根据本技术实施例的一种语义分割的示意图,如图5所示,语义分割是图像处理和机器视觉的一个重要分支,语义分割要判断每个像素点的类别,进行精确分割。汽车、红绿灯和路牌所属像素被分割至不同的区域。
77.可选地,在本实施例中,将图像处理中的语义分割技术应用至多意图语句的执行意图识别中,由于待分割语句中的每一个文字对应一个像素位置,通过语义分割将特征图像进行语义分割,可以得到多个语义图像,图6是根据本技术实施例的一种语义图像的生成的示意图,如图6所示,特征图形中的每一个像素位置都对应一个目标像素值,在自然语言处理中,也存在语义分割任务,我们可以将一句话中的每一个字当成一个像素,目标像素值可以包括(1或者0),0可以代表不属于这句话,1可以代表属于这句话,因此可以通过对特征图像进行语义分割,得到多个语义图像(语义图像1和语义图像1),其中,语义图像1为用于表征执行意图“打开空调”;语义图像2为用于表征执行意图“打开洗碗机”。
78.在一个示例性实施例中,可以但不限于通过以下方式对所述特征图像进行语义分割,以生成多个语义图像:将所述特征图像多次输入目标语义分割模型,得到所述目标语义分割模型输出的多个分割结果,其中,所述目标语义分割模型是使用标注了多个标准语义图像的特征图像样本对初始语义分割模型进行训练得到的,所述特征图像样本用于表征携带了多个意图的标准语句,多个标准语义图像中每个所述标准语义图像用于表征所述标准语句中的一个意图对应的目标语句;将多个所述分割结果确定为多个所述语义图像。
79.可选地,在本实施例中,目标语义分割模型可以但不限于为unet模型,其中,在对语义分割模型进行训练之前,首先需要定义语料格式,主要分为:标准语句和目标语句,其中,标准语句可以为用户输入的语句,目标语句用于表征对应的标准语句的一个意图,例如“洗碗机设置快速洗后启动”对应的目标语句可以是“洗碗机设置快速洗”和“洗碗机启动”。
80.可选地,在本实施例中,语义分割模型训练过程中用于训练的语料可以包括以下类型:
81.单设备多意图类型、例如:标准语句:洗碗机设置快速洗后启动,对应的目标语句可以是“洗碗机设置快速洗”和“洗碗机启动”;
82.多设备单意图类型、例如:标准语句:打开空调和洗碗机,对应的目标语句可以是“打开洗碗机”和“打开空调”;
83.多设备多意图类型、例如:标准语句:打开热水器然后空调设置浴后模式,对应的
目标语句可以是“打开热水器”和“空调设置浴后模式”。
84.可选地,在本实施例中,在语义分割模型训练之前,标准语句可以首先进行数据预处理,主要包括全角转半角,大写数字转阿拉伯数字,大写字母转小写字母,表情符号去除,分词,停用词过滤等。其中,分词就是将连续的字序列按照一定的规范重新组合成词序列的过程。在英文的行文中,单词之间是以空格作为自然分界符的,本技术可以将每一个字都做一个序列的部分。
85.在一个示例性实施例中,可以但不限于通过以下方式将所述特征图像多次输入目标语义分割模型,得到所述目标语义分割模型输出的多个分割结果:每次将所述特征图像和参考图像输入所述目标语义分割模型,其中,在首次输入的情况下,所述参考图像为初始图像,在非首次输入的情况下,所述参考图像为上一次所述目标语义分割模型输出的所述分割结果;获取所述目标语义分割模型输出的一个所述分割结果,直至得到多个所述分割结果。
86.可选地,在本实施例中,如图3所示,待分割语句“打开空调和洗碗机”经过unet模型分割之后,得到结果1“打开空调”和结果2“打开洗碗机”有相关性,因此在分割结果2之前,需要将前一句的结果1作为一个通道,添加至3通道图中,作为unet模型的输入,得到unet模型输出的结果2,特别地,由于第一次没有前一句的结果,所以我们初始化一张全零的图,加入到3通道图中,变成一张4通道的图。
87.在上述步骤s208提供的技术方案中,每个语义图像对应一个目标子语句,目标子语句又用于表征对应待分割语句中的一个执行意图,因此,通过识别多个语义图像中每个语义图像对应的目标子语句,可以得到待分割语句对应的多个执行意图。
88.在一个示例性实施例中,可以但不限于通过以下方式识别所述多个语义图像中每个语义图像对应的目标子语句:从每个所述语义图像中提取图像像素属于目标像素类型的目标图像像素对应的目标文字,其中,每个所述语义图像中的图像像素按照所表达的执行意图划分了像素类型;将所述目标文字构建为每个所述语义图像对应的所述目标子语句。
89.在一个示例性实施例中,可以将包含在待分割语句中的多个执行意图分割出来,即,识别出待分割语句中指示的多个执行意图,之后可以将多个执行意图分别传输至对应的待控制设备中,分别控制不同设备执行对应的意图。例如,上述“打开空调和洗碗机”,在识别出对应的执行意图为“打开空调”和“打开洗碗机”之后,可以将“打开空调”输入至空调设备,并执行“开启空调”的操作,同时,可以将“打开洗碗机”输入至洗碗机设备,并执行“开启洗碗机”的操作。
90.可选地,在本实施例中,如图6所示,语义图像1中,属于目标类型的(数字1)目标图像像素对应的目标文字分别为:“打”、“开”、“洗”、“碗”、“机”,目标文字构建的目标子语句可以为“打开洗碗机”。
91.为了更好的理解上述多意图语句的分割的过程,以下再结合可选实施例对上述多意图语句的分割流程进行说明,但不用于限定本技术实施例的技术方案。
92.在本实施例中提供了一种多意图语句的分割方法,图7是根据本技术实施例的一种多意图语句的分割流程的示意图,如图7所示,主要包括如下步骤:
93.步骤s701:在生产环境,用户的发话,会先通过一个小型的二分类模型,用于判断用户发话是否是多意图,如果是多意图,则通过语义分割模型;若不是则直接进入识别模
块,其中,语义分割模型为经过筛选数据的语料训练优化之后得到的;
94.步骤s702:如果是多意图,进入语义分割模型后会被分割出多个目标子语句;
95.步骤s703:最后,每个目标子语句并行进入识别模块,最后汇总结果,其中,目标子语句可以分别进入识别模块a、识别模块b、识别模块c,或者,也可以进入同一个识别模块。
96.通过以上的实施方式借鉴图像处理技术中的语义分割,将用户的多意图发话,拆分成两个原子意图,例如打开空调和洗碗机,拆分成打开空调、打开洗碗机两个句子。再将拆分后的句子带入单意图识别系统识别。也就是说,将自然语言转换为一张图,来实现语言向图的转化,使用了图像处理和机器视觉的语义分割技术,将图像处理方法使用在自然语言处理方法上,实现了知识的迁移,创新。
97.通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到根据上述实施例的方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本技术的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如rom/ram、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,或者网络设备等)执行本技术各个实施例的方法。
98.图8是根据本技术实施例的一种多意图语句的分割装置的结构框图;如图8所示,包括:
99.提取模块802,用于提取携带了多个执行意图的待分割语句中所包括的文字具有的文字特征;
100.转换模块804,用于根据所述文字特征将所述待分割语句转换为特征图像,其中,所述特征图像用于通过图像像素表征所述文字特征;
101.分割模块806,用于对所述特征图像进行语义分割,以生成多个语义图像,其中,每个所述语义图像用于表征多个所述执行意图中的一个目标执行意图;
102.识别模块808,用于识别所述多个语义图像中每个语义图像对应的目标子语句,得到所述待分割语句所对应的多个所述目标子语句。
103.通过上述实施例,首先提取待分割语句所包括的文字具有的文字特征,使用文字特征将待分割语句转换为特征图像,由于特征图像中的图像像素可以表征文字特征,因此可以借助对特征图像进行语义分割,得到多个语义图像的方式,将待分割语句所包括的多个执行意图分割至对应的多个语义图像中,最后识别多个语义图像中每个语义图像对应的目标子语句,就可以得到分割语句所对应的多个目标子语句。也就是说,待分割语句进行语义分割的过程中,无需进行多级匹配,而是将待分割语句转化为特征图像,直接对特征图像进行语义分割,从而实现将待分割语句分割,得到多个目标子语句。采用上述技术方案,解决了相关技术中,对多意图语句进行分割的过程中,分割的效率较低等问题,实现了对多意图语句进行分割的过程中,提高分割的效率的技术效果。
104.在一个示例性实施例中,所述转换模块,包括:
105.第一构建单元,用于构建所述待分割语句对应的初始矩阵图,其中,所述初始矩阵图中的矩阵行依次对应所述待分割语句中的每个文字,所述初始矩阵图中的矩阵列依次对应所述待分割语句中的每个文字;
106.运算单元,用于对于所述初始矩阵图上的每个像素位置,对所述像素位置所对应
的行文字的第一文字特征与所述像素位置所对应的列文字的第二文字特征进行目标运算,得到所述像素位置对应的目标像素值;
107.添加单元,用于将所述目标像素值添加到所述初始矩阵图上的所述像素位置中,得到目标矩阵图作为所述特征图像。
108.在一个示例性实施例中,所述运算单元,还用于:
109.对所述第一文字特征和所述第二文字特征执行多个运算类型中的n个运算类型,得到n个运算结果,其中,n为大于或者等于2的整数;
110.将所述n个运算结果构造成所述像素位置对应的n通道的像素值作为所述目标像素值。
111.在一个示例性实施例中,所述运算单元,还用于:
112.对所述第一文字特征和所述第二文字特征进行相乘运算,得到第一运算结果;
113.对所述第一文字特征和所述第二文字特征进行相似度运算,得到第二运算结果;
114.对所述第一文字特征和所述第二文字特征进行全连接运算,得到第三运算结果,其中,所述n个运算结果包括所述第一运算结果,所述第二运算结果和所述第三运算结果。
115.在一个示例性实施例中,所述运算单元,还用于:
116.获取目标拼接顺序和目标拼接格式;
117.将所述第一运算结果,所述第二运算结果和所述第三运算结果按照所述目标拼接顺序拼接成所述目标拼接格式,得到所述目标像素值。
118.在一个示例性实施例中,所述分割模块,包括:
119.输入单元,用于将所述特征图像多次输入目标语义分割模型,得到所述目标语义分割模型输出的多个分割结果,其中,所述目标语义分割模型是使用标注了多个标准语义图像的特征图像样本对初始语义分割模型进行训练得到的,所述特征图像样本用于表征携带了多个意图的标准语句,多个标准语义图像中每个所述标准语义图像用于表征所述标准语句中的一个意图对应的目标语句;
120.确定单元,用于将多个所述分割结果确定为多个所述语义图像。
121.在一个示例性实施例中,所述输入单元,还用于:
122.每次将所述特征图像和参考图像输入所述目标语义分割模型,其中,在首次输入的情况下,所述参考图像为初始图像,在非首次输入的情况下,所述参考图像为上一次所述目标语义分割模型输出的所述分割结果;
123.获取所述目标语义分割模型输出的一个所述分割结果,直至得到多个所述分割结果。
124.在一个示例性实施例中,所述提取模块,包括:
125.转换单元,用于将所述待分割语句中所包括的每个文字转换为字向量,得到多个字向量;
126.第一提取单元,用于对多个所述字向量进行双向特征提取,得到每个所述字向量对应的前向特征和后向特征;
127.拼接单元,用于将所述前向特征和所述后向特征进行拼接,得到每个文字对应的所述文字特征。
128.在一个示例性实施例中,所述识别模块,包括:
129.第二提取单元,用于从每个所述语义图像中提取图像像素属于目标像素类型的目标图像像素对应的目标文字,其中,每个所述语义图像中的图像像素按照所表达的执行意图划分了像素类型;
130.第二构建单元,用于将所述目标文字构建为每个所述语义图像对应的所述目标子语句。
131.可选地,在本实施例中,上述存储介质可以被设置为存储用于执行以下步骤的程序代码:
132.s1,提取携带了多个执行意图的待分割语句中所包括的文字具有的文字特征;
133.s2,根据所述文字特征将所述待分割语句转换为特征图像,其中,所述特征图像用于通过图像像素表征所述文字特征;
134.s3,对所述特征图像进行语义分割,以生成多个语义图像,其中,每个所述语义图像用于表征多个所述执行意图中的一个目标执行意图;
135.s4,识别所述多个语义图像中每个语义图像对应的目标子语句,得到所述待分割语句所对应的多个所述目标子语句。
136.本技术的实施例还提供了一种电子装置,包括存储器和处理器,该存储器中存储有计算机程序,该处理器被设置为运行计算机程序以执行上述任一项方法实施例中的步骤。
137.可选地,上述电子装置还可以包括传输设备以及输入输出设备,其中,该传输设备和上述处理器连接,该输入输出设备和上述处理器连接。
138.可选地,在本实施例中,上述处理器可以被设置为通过计算机程序执行以下步骤:
139.s1,提取携带了多个执行意图的待分割语句中所包括的文字具有的文字特征;
140.s2,根据所述文字特征将所述待分割语句转换为特征图像,其中,所述特征图像用于通过图像像素表征所述文字特征;
141.s3,对所述特征图像进行语义分割,以生成多个语义图像,其中,每个所述语义图像用于表征多个所述执行意图中的一个目标执行意图;
142.s4,识别所述多个语义图像中每个语义图像对应的目标子语句,得到所述待分割语句所对应的多个所述目标子语句。
143.可选地,在本实施例中,上述存储介质可以包括但不限于:u盘、只读存储器(read-only memory,简称为rom)、随机存取存储器(random access memory,简称为ram)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。
144.可选地,本实施例中的具体示例可以参考上述实施例及可选实施方式中所描述的示例,本实施例在此不再赘述。
145.显然,本领域的技术人员应该明白,上述的本技术的各模块或各步骤可以用通用的计算装置来实现,它们可以集中在单个的计算装置上,或者分布在多个计算装置所组成的网络上,可选地,它们可以用计算装置可执行的程序代码来实现,从而,可以将它们存储在存储装置中由计算装置来执行,并且在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤,或者将它们分别制作成各个集成电路模块,或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。这样,本技术不限制于任何特定的硬件和软件结合。
146.以上所述仅是本技术的优选实施方式,应当指出,对于本技术领域的普通技术人
员来说,在不脱离本技术原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本技术的保护范围。
再多了解一些

本文用于创业者技术爱好者查询,仅供学习研究,如用于商业用途,请联系技术所有人。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献