一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

意图识别方法、装置、计算机设备及存储介质与流程

2022-05-26 22:38:08 来源:中国专利 TAG:


1.本技术涉及人工智能技术领域,尤其涉及一种意图识别方法、装置、计算机设备及存储介质。


背景技术:

2.随着计算机技术的发展,越来越多地采用计算机进行智能决策,意图识别是智能决策重要的组成部分。意图识别通常将目标对象的对象信息输入神经网络,由神经网络预测目标对象的意图。例如,在公共卫生领域,可以获取某个用户的发表的博客,然后对该用户是否存在自杀等消极意图进行预测,并根据意图识别结果对用户进行指导。
3.然而,当前的意图识别往往是获取单模态的对象信息;并且,由于描述目标对象的向量特征维度很高,高度稀疏的向量中对意图识别有用的特征容易被模型忽略,导致意图识别的准确性较低。


技术实现要素:

4.本技术实施例的目的在于提出一种意图识别方法、装置、计算机设备及存储介质,以解决意图识别准确率较低的问题。
5.为了解决上述技术问题,本技术实施例提供一种意图识别方法,采用了如下所述的技术方案:
6.获取目标对象的对象信息;
7.对于所述对象信息中的各类对象子信息,将所述对象子信息转化为初始表征向量;
8.对所述各初始表征向量进行拼接,得到第一表征向量;
9.将所述第一表征向量输入经过对比学习训练的表示模型,得到第二表征向量;
10.将所述第二表征向量输入意图识别模型,得到意图识别结果。
11.为了解决上述技术问题,本技术实施例还提供一种意图识别装置,采用了如下所述的技术方案:
12.信息获取模块,用于获取目标对象的对象信息;
13.信息转化模块,用于对于所述对象信息中的各类对象子信息,将所述对象子信息转化为初始表征向量;
14.向量拼接模块,用于对所述各初始表征向量进行拼接,得到第一表征向量;
15.向量输入模块,用于将所述第一表征向量输入经过对比学习训练的表示模型,得到第二表征向量;
16.意图识别模块,用于将所述第二表征向量输入意图识别模型,得到意图识别结果。
17.为了解决上述技术问题,本技术实施例还提供一种计算机设备,采用了如下所述的技术方案:
18.获取目标对象的对象信息;
19.对于所述对象信息中的各类对象子信息,将所述对象子信息转化为初始表征向量;
20.对所述各初始表征向量进行拼接,得到第一表征向量;
21.将所述第一表征向量输入经过对比学习训练的表示模型,得到第二表征向量;
22.将所述第二表征向量输入意图识别模型,得到意图识别结果。
23.为了解决上述技术问题,本技术实施例还提供一种计算机可读存储介质,采用了如下所述的技术方案:
24.获取目标对象的对象信息;
25.对于所述对象信息中的各类对象子信息,将所述对象子信息转化为初始表征向量;
26.对所述各初始表征向量进行拼接,得到第一表征向量;
27.将所述第一表征向量输入经过对比学习训练的表示模型,得到第二表征向量;
28.将所述第二表征向量输入意图识别模型,得到意图识别结果。
29.与现有技术相比,本技术实施例主要有以下有益效果:获取目标对象的对象信息,对象信息可以包含多种类型的对象子信息;将各类对象子信息转化为初始表征向量,然后对各初始表征向量进行拼接,得到第一表征向量,从而实现多模态、多类型的对象子信息的表达;然后将第一表征向量输入表示模型,表示模型预先经过对比学习训练,可以将不同对象信息所对应的表征向量进行充分区分,得到第二表征向量;然后将第二表征向量输入意图识别模型,得到目标对象的意图识别结果;本技术融合了多模态的对象信息,通过预先经过对比学习训练的表示模型得到对象信息更优的向量表达,从而提高了意图识别的准确性。
附图说明
30.为了更清楚地说明本技术中的方案,下面将对本技术实施例描述中所需要使用的附图作一个简单介绍,显而易见地,下面描述中的附图是本技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
31.图1是本技术可以应用于其中的示例性系统架构图;
32.图2是根据本技术的意图识别方法的一个实施例的流程图;
33.图3是根据本技术的意图识别装置的一个实施例的结构示意图;
34.图4是根据本技术的计算机设备的一个实施例的结构示意图。
具体实施方式
35.除非另有定义,本文所使用的所有的技术和科学术语与属于本技术的技术领域的技术人员通常理解的含义相同;本文中在申请的说明书中所使用的术语只是为了描述具体的实施例的目的,不是旨在于限制本技术;本技术的说明书和权利要求书及上述附图说明中的术语“包括”和“具有”以及它们的任何变形,意图在于覆盖不排他的包含。本技术的说明书和权利要求书或上述附图中的术语“第一”、“第二”等是用于区别不同对象,而不是用于描述特定顺序。
36.在本文中提及“实施例”意味着,结合实施例描述的特定特征、结构或特性可以包
含在本技术的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例,也不是与其它实施例互斥的独立的或备选的实施例。本领域技术人员显式地和隐式地理解的是,本文所描述的实施例可以与其它实施例相结合。
37.为了使本技术领域的人员更好地理解本技术方案,下面将结合附图,对本技术实施例中的技术方案进行清楚、完整地描述。
38.如图1所示,系统架构100可以包括终端设备101、102、103,网络104和服务器105。网络104用以在终端设备101、102、103和服务器105之间提供通信链路的介质。网络104可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。
39.用户可以使用终端设备101、102、103通过网络104与服务器105交互,以接收或发送消息等。终端设备101、102、103上可以安装有各种通讯客户端应用,例如网页浏览器应用、购物类应用、搜索类应用、即时通信工具、邮箱客户端、社交平台软件等。
40.终端设备101、102、103可以是具有显示屏并且支持网页浏览的各种电子设备,包括但不限于智能手机、平板电脑、电子书阅读器、mp3播放器(moving picture expertsgroup audio layer iii,动态影像专家压缩标准音频层面3)、mp4(moving pictureexperts group audio layer iv,动态影像专家压缩标准音频层面4)播放器、膝上型便携计算机和台式计算机等等。
41.服务器105可以是提供各种服务的服务器,例如对终端设备101、102、103上显示的页面提供支持的后台服务器。
42.需要说明的是,本技术实施例所提供的意图识别方法一般由服务器执行,相应地,意图识别装置一般设置于服务器中。
43.应该理解,图1中的终端设备、网络和服务器的数目仅仅是示意性的。根据实现需要,可以具有任意数目的终端设备、网络和服务器。
44.继续参考图2,示出了根据本技术的意图识别方法的一个实施例的流程图。所述的意图识别方法,包括以下步骤:
45.步骤s201,获取目标对象的对象信息。
46.在本实施例中,意图识别方法运行于其上的电子设备(例如图1所示的服务器)可以通过有线连接方式或者无线连接方式与终端进行通信。需要指出的是,上述无线连接方式可以包括但不限于3g/4g/5g连接、wifi连接、蓝牙连接、wimax连接、zigbee连接、uwb(ultra wideband)连接、以及其他现在已知或将来开发的无线连接方式。
47.具体地,首先获取目标对象的对象信息。目标对象可以是要进行意图识别的对象。对象信息可以是目标对象的相关信息。例如,当目标对象为人时,对象信息可以包括人的年龄、性别、籍贯、职业、收入等个人信息,还包括意图识别的应用场景有关的其他信息。例如,在自杀意图预测的场景中,对象信息还可以包括人的病例数据以及社交网络信息。病例数据可以包括目标对象的疾病症状、医生的诊断信息和治疗信息;社交网络信息包括目标对象的网络浏览信息(例如浏览的博客、新闻、图片、视频等)、社交信息(与哪些对象有社交关系等)和意图载体(例如目标对象发表的博客等)。
48.需要强调的是,为进一步保证上述对象信息的私密和安全性,上述对象信息还可以存储于一区块链的节点中。
49.本技术所指区块链是分布式数据存储、点对点传输、共识机制、加密算法等计算机
技术的新型应用模式。区块链(blockchain),本质上是一个去中心化的数据库,是一串使用密码学方法相关联产生的数据块,每一个数据块中包含了一批次网络交易的信息,用于验证其信息的有效性(防伪)和生成下一个区块。区块链可以包括区块链底层平台、平台产品服务层以及应用服务层等。
50.步骤s202,对于对象信息中的各类对象子信息,将对象子信息转化为初始表征向量。
51.具体地,对象信息可以是多模态信息的集合,包含多种类型的对象子信息,例如上文提到的个人信息、病例数据和社交网络信息都是不同维度的对象子信息。需要将对象子信息分别转化为初始表征向量,从而实现对象信息的量化。
52.步骤s203,对各初始表征向量进行拼接,得到第一表征向量。
53.具体地,将各初始表征向量进行拼接,得到第一表征向量。在拼接时,可以按照预设的顺序,将各类对象子信息所对应的初始表征向量进行拼接。
54.步骤s204,将第一表征向量输入经过对比学习训练的表示模型,得到第二表征向量。
55.具体地,将第一表征向量输入表示模型。表示模型预先经过无监督的对比学习训练,可以从第一表征向量中提取关键信息,并对第一表征向量进行降维处理,从而得到第二表征向量。对比学习使得表示模型将来自不同对象信息的第一表征向量进行充分区分,输出第二表征向量。第二表征向量相较于第一表征向量,可以以更低的维度,更好地表示对象信息。在一个实施例中,表示模型可以基于transformer网络搭建。
56.步骤s205,将第二表征向量输入意图识别模型,得到意图识别结果。
57.其中,意图识别模型可以是用于意图识别的模型。
58.具体地,将第二表征向量输入意图识别模型。意图识别模型预先经过训练,可以根据第二表征向量输出意图识别结果。意图识别模型可以基于全连接神经网络搭建。
59.意图识别模型需要预先经过训练,意图识别模型的训练可以是有监督训练,在训练中需要带有标签的第二训练向量,其中,第二训练向量由训练完毕的表示模型生成。将第二训练向量输入初始意图识别模型,得到意图预测结果;根据意图预测结果和标签计算模型损失;根据模型损失调整模型参数并继续训练,直至模型损失小于预设的损失阈值,则停止训练,得到意图识别模型。
60.例如,在自杀意图的意图识别与预测中,用数字0或1表示目标对象是否存在自杀意图。将第二训练向量输入初始意图识别模型得到意图预测结果,根据意图预测结果和标签计算模型损失,此时模型损失可以是二元交叉熵损失(binary cross entropy loss)。以减小二元交叉熵损失为目标调整初始意图识别模型的模型参数,并继续训练,直至二元交叉熵损失小于预设的损失阈值,得到意图识别模型。
61.本实施例中,获取目标对象的对象信息,对象信息可以包含多种类型的对象子信息;将各类对象子信息转化为初始表征向量,然后对各初始表征向量进行拼接,得到第一表征向量,从而实现多模态、多类型的对象子信息的表达;然后将第一表征向量输入表示模型,表示模型预先经过对比学习训练,可以将不同对象信息所对应的表征向量进行充分区分,得到第二表征向量;然后将第二表征向量输入意图识别模型,得到目标对象的意图识别结果;本技术融合了多模态的对象信息,通过预先经过对比学习训练的表示模型得到对象
信息更优的向量表达,从而提高了意图识别的准确性。
62.进一步的,上述步骤s202可以包括:对于对象信息中的各类对象子信息,获取对象子信息的信息类型;确定信息类型所对应的信息转化方式;按照信息转化方式将对象子信息转化为初始表征向量。
63.具体地,对于对象信息中的各类对象子信息,获取对象子信息的信息类型,不同信息类型的对象子信息在映射为向量时具有不同的信息转化方式。根据信息类型所对应的信息转化方式将对象子信息映射为向量,从而得到初始表征向量。
64.在一个实施例中,对象子信息的信息类型包括种类(category)、连续数值类型(numerical)、文本(text)和社交图四种。其中:
65.种类category:对象子信息是离散的值,例如性别包括男性和女性,采用字典进行编码表示;
66.连续数值类型numerical:对象子信息是连续的数值类型,例如收入,需要先对对象子信息进行标准化(normalization),使用标准化后得到的数据进行表示;
67.文本text:对象子信息是文本类型数据,对文本进行切分得到多个分词,每个分词具有token id(需要预先建立语料库,语料库中存储各种可能的分词,给每一个分词添加一个标号,得到每个分词的token id),通过token id实现文本的表示;
68.graph:对象子信息为社交图的数据,可以通过node2vec获得目标对象(此时目标对象是社交网络中的一个节点)的在社交网络中的表示。其中,node2vec的思想是在网络中进行随机游走,对随机游走采样得到(节点,上下文)的组合,然后用处理词向量的方法对这样的组合建模得到网络节点的表示。
69.本实施例中,根据对象子信息的信息类型,采用相应的信息转化方式将对象子信息映射为初始表征向量,确保了得到的初始表征向量的准确性。
70.进一步的,上述步骤s203可以包括:将各初始表征向量输入标准处理网络,得到标准化处理的初始表征向量;将各标准化处理的初始表征向量进行拼接,得到第一表征向量。
71.其中,标准处理网络可以是对初始表征向量进行标准化处理的网络。在一个实施例中,标准处理网络可以基于全连接网络构建。
72.具体地,各初始表征向量的空间分布是不同的,为此,可以将各初始表征向量输入标准处理网络,由标准处理网络对初始表征向量进行标准化处理。标准化处理后,各初始表征向量被映射到同一个空间分布中。将标准化处理后的初始表征向量进行拼接,得到第一表征向量。在一个实施例中,可以将各初始表征向量输入layer normalization层进行标准化处理。
73.本实施例中,通过标准处理网络将初始表征向量进行标准化处理,从而将各初始表征向量映射到同一个空间中,确保了可以对各初始表征向量的正常处理。
74.进一步的,上述步骤s204可以包括:将第一表征向量输入经过对比学习训练的表示模型,以通过表示模型对第一表征向量中的各初始表征向量分别进行降维处理,得到各降维初始向量;通过表示模型对各降维初始向量进行融合处理,得到第二表征向量。
75.具体地,各初始表征向量可以是one-hot向量,维度较高,且维度差异较大。表示模型可以是transformer网络,可以先通过表示模型对组成第一表征向量的各初始表征向量进行降维处理,将one-hot形式的初始表征向量转化为embedding表示,embedding表示具有
特定的维度,相较于one-hot向量更为稠密,维度更高。
76.然后通过表示模型对embedding表示进行融合处理,得到第二表征向量,第二表征向量可以从整体对各embedding进行表示。第二表征向量与各embedding表示的维度可以相同,也可以不同。
77.本实施例中,通过表示模型进行降维处理以及向量融合,使得得到的第二表征向量能够在更低的维度更准确地表示对象信息。
78.进一步的,上述步骤s204之前,还可以包括:获取训练对象信息集,训练对象信息集包括多个训练对象的训练对象信息;对于训练对象集中每个训练对象的训练对象信息,将训练对象信息转化为第一训练向量;将第一训练向量输入初始表示模型,得到训练对象的第二训练向量和第二训练向量的相似向量;对于训练对象,将相似向量设置为第二训练向量的正样本,并将训练对象信息集中其他训练对象的第二训练向量以及其他训练对象的第二训练向量所对应的相似向量设置为第二训练向量的负样本;根据第二训练向量、正样本和负样本对初始表示模型进行对比学习训练,得到表示模型。
79.具体地,需要先通过对比学习得到表示模型。服务器获取训练对象信息集,训练对象信息集中包括多个训练对象的训练对象信息。对于每个训练对象的训练对象信息,将训练对象信息转化为第一训练向量。
80.将第一训练向量输入初始表示模型,初始表示模型可以尚未完成训练的表示模型。初始表示模型对第一训练向量进行处理,可以输出两组向量,两组向量都可以作为训练对象信息的向量表示,可以将其中的一组作为第二训练向量,将另一组作为第二训练向量的相似向量。
81.对于该训练对象,将得到的相似向量设置为第二训练向量的正样本,将训练对象信息集中,其他训练对象的第二训练向量,以及其他训练对象的第二训练向量的相似向量设置为负样本。
82.假设初始训练对象信息集中有训练对象o1、o2、o3,其第一训练向量分别为r1、r2、r3,第一训练向量r1、r2、r3所对应的第二训练向量为h1、h2、h3,第二训练向量h1、h2、h3的相似向量依次为s1、s2、s3。
83.对于训练对象o1,其第二训练向量为h1,将第二训练向量h1的相似向量s1设置为正样本,将训练对象数据集中其他训练对象的第二训练向量h2、h3,以及第二训练向量h2、h3的相似向量s2、s3设置为负样本。
84.采用无监督的对比学习(contrastive learning)对初始表示模型进行训练。在对比学习中,并不一定要求模型关注到样本的每一个细节,只要模型学到的特征能够使当前的样本和其他样本区别开即可。因此,在模型训练中,调整初始表示模型,使得模型输出的第二训练向量和正样本尽可能不断接近,并尽可能不断拉大第二训练向量和负样本之间的差异。模型训练结束后,可以得到表示模型。
85.本实施例中,采用无监督的对比学习,仅将第二训练向量的相似向量作为正样本,其余向量均作为负样本,使初始表示模型在训练中可以将不同的样本进行充分区分,确保了得到的表示模型输出的第二表示向量的准确性。
86.进一步的,上述将第一训练向量输入初始表示模型,得到训练对象的第二训练向量和第二训练向量的相似向量的步骤可以包括:将第一训练向量输入初始表示模型,得到
训练对象的第二训练向量;调整初始表示模型中的断开层;将第一训练向量输入调整后的初始表示模型,并将调整后的初始表示模型输出的向量作为第二训练向量的相似向量。
87.具体地,将第一训练向量输入初始表示模型进行处理,得到训练对象的第二训练向量。表示模型中具有断开层(dropout),断开层可以设置不同的断开掩膜(dropout mask),断开掩膜可以丢弃一些信息,从而降低模型的过拟合,增加模型的学习能力。
88.在得到第二训练向量后,重新设置断开层中的断开掩膜,然后将第一训练向量重新输入,将第二次输出的向量作为第二训练向量的相似向量。
89.本实施例中,通过对断开层的调整,可以得到第一训练向量的不同表示。
90.进一步的,上述根据第二训练向量、正样本和负样本对初始表示模型进行对比学习训练,得到表示模型的步骤可以包括:分别计算第二训练向量与正样本以及负样本之间的相似度;根据得到的相似度计算模型损失;根据模型损失调整初始表示模型的模型参数并继续训练,直至模型损失收敛,得到表示模型。
91.具体地,在对比学习中,模型的损失函数如下:
[0092][0093]
其中,sim()表示余弦相似度;n是一个batch中的向量数量;hi为当前训练对象的第二训练向量,si为hi的正样本,vk是一个batch中的向量,包括当前训练对象的第二训练向量hi、第二训练向量hi的正样本以及负样本;τ为温度参数,可以是[0,1]之间的一个数;li是模型损失。
[0094]
计算当前的第二训练向量与正样本的相似度,然后计算当前的第二训练向量与各负样本的相似度,具体可以是通过余弦相似性函数计算相似度,然后根据公式(1)计算模型损失。
[0095]
在得到模型损失后,根据模型损失调整初始表示模型的模型参数,具体可以是以最大化模型损失为目标,通过adam等优化算法调整初始表示模型的模型参数;并在参数调整后第一训练向量重新输入模型,以对模型进行迭代训练,直至模型损失不再变化,达到收敛,从而得到最后的表示模型。
[0096]
本实施例中,为了最大化第二训练向量和各负样本的差异,基于向量之间的相似度计算模型损失,并根据模型损失调整模型参数,保证了生成的表示模型的准确性。
[0097]
本技术实施例可以基于人工智能技术对相关的数据进行获取和处理。其中,人工智能(artificial intelligence,ai)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。
[0098]
人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、操作/交互系统、机电一体化等技术。人工智能软件技术主要包括计算机视觉技术、机器人技术、生物识别技术、语音处理技术、自然语言处理技术以及机器学习/深度学习等几大方向。
[0099]
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,该计算机程序可存储于一计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,前述的存储介质可为
磁碟、光盘、只读存储记忆体(read-only memory,rom)等非易失性存储介质,或随机存储记忆体(random access memory,ram)等。
[0100]
应该理解的是,虽然附图的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,其可以以其他的顺序执行。而且,附图的流程图中的至少一部分步骤可以包括多个子步骤或者多个阶段,这些子步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,其执行顺序也不必然是依次进行,而是可以与其他步骤或者其他步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。
[0101]
进一步参考图3,作为对上述图2所示方法的实现,本技术提供了一种意图识别装置的一个实施例,该装置实施例与图2所示的方法实施例相对应,该装置具体可以应用于各种电子设备中。
[0102]
如图3所示,本实施例所述的意图识别装置300包括:信息获取模块301、信息转化模块302、向量拼接模块303、向量输入模块304以及意图识别模块305,其中:
[0103]
信息获取模块301,用于获取目标对象的对象信息。
[0104]
信息转化模块302,用于对于对象信息中的各类对象子信息,将对象子信息转化为初始表征向量。
[0105]
向量拼接模块303,用于对各初始表征向量进行拼接,得到第一表征向量。
[0106]
向量输入模块304,用于将第一表征向量输入经过对比学习训练的表示模型,得到第二表征向量。
[0107]
意图识别模块305,用于将第二表征向量输入意图识别模型,得到意图识别结果。
[0108]
本实施例中,获取目标对象的对象信息,对象信息可以包含多种类型的对象子信息;将各类对象子信息转化为初始表征向量,然后对各初始表征向量进行拼接,得到第一表征向量,从而实现多模态、多类型的对象子信息的表达;然后将第一表征向量输入表示模型,表示模型预先经过对比学习训练,可以将不同对象信息所对应的表征向量进行充分区分,得到第二表征向量;然后将第二表征向量输入意图识别模型,得到目标对象的意图识别结果;本技术融合了多模态的对象信息,通过预先经过对比学习训练的表示模型得到对象信息更优的向量表达,从而提高了意图识别的准确性。
[0109]
在本实施例的一些可选的实现方式中,信息转化模块302可以包括:类型获取子模块、方式确定子模块以及信息转化子模块,其中:
[0110]
类型获取子模块,用于对于对象信息中的各类对象子信息,获取对象子信息的信息类型。
[0111]
方式确定子模块,用于确定信息类型所对应的信息转化方式。
[0112]
信息转化子模块,用于按照信息转化方式将对象子信息转化为初始表征向量。
[0113]
本实施例中,根据对象子信息的信息类型,采用相应的信息转化方式将对象子信息映射为初始表征向量,确保了得到的初始表征向量的准确性。
[0114]
在本实施例的一些可选的实现方式中,向量拼接模块303可以包括:标准处理子模块以及向量拼接子模块,其中:
[0115]
标准处理子模块,用于将各初始表征向量输入标准处理网络,得到标准化处理的初始表征向量。
[0116]
向量拼接子模块,用于将各标准化处理的初始表征向量进行拼接,得到第一表征向量。
[0117]
本实施例中,通过标准处理网络将初始表征向量进行标准化处理,从而将各初始表征向量映射到同一个空间中,确保了可以对各初始表征向量的正常处理。
[0118]
在本实施例的一些可选的实现方式中,向量输入模块304可以包括:降维处理子模块以及向量融合子模块,其中:
[0119]
降维处理子模块,用于将第一表征向量输入经过对比学习训练的表示模型,以通过表示模型对第一表征向量中的各初始表征向量分别进行降维处理,得到各降维初始向量。
[0120]
向量融合子模块,用于通过表示模型对各降维初始向量进行融合处理,得到第二表征向量。
[0121]
本实施例中,通过表示模型进行降维处理以及向量融合,使得得到的第二表征向量能够在更低的维度更准确地表示对象信息。
[0122]
在本实施例的一些可选的实现方式中,意图识别装置300还可以包括:信息集获取模块、训练转化模块、训练输入模块、向量设置模块以及对比学习模块,其中:
[0123]
信息集获取模块,用于获取训练对象信息集,训练对象信息集包括多个训练对象的训练对象信息。
[0124]
训练转化模块,用于对于训练对象集中每个训练对象的训练对象信息,将训练对象信息转化为第一训练向量。
[0125]
训练输入模块,用于将第一训练向量输入初始表示模型,得到训练对象的第二训练向量和第二训练向量的相似向量。
[0126]
向量设置模块,用于对于训练对象,将相似向量设置为第二训练向量的正样本,并将训练对象信息集中其他训练对象的第二训练向量以及其他训练对象的第二训练向量所对应的相似向量设置为第二训练向量的负样本。
[0127]
对比学习模块,用于根据第二训练向量、正样本和负样本对初始表示模型进行对比学习训练,得到表示模型。
[0128]
本实施例中,采用无监督的对比学习,仅将第二训练向量的相似向量作为正样本,其余向量均作为负样本,使初始表示模型在训练中可以将不同的样本进行充分区分,确保了得到的表示模型输出的第二表示向量的准确性。
[0129]
在本实施例的一些可选的实现方式中,训练输入模块可以包括:训练输入子模块、调整子模块以及向量输入子模块,其中:
[0130]
训练输入子模块,用于将第一训练向量输入初始表示模型,得到训练对象的第二训练向量。
[0131]
调整子模块,用于调整初始表示模型中的断开层。
[0132]
向量输入子模块,用于将第一训练向量输入调整后的初始表示模型,并将调整后的初始表示模型输出的向量作为第二训练向量的相似向量。
[0133]
本实施例中,通过对断开层的调整,可以得到第一训练向量的不同表示。
[0134]
在本实施例的一些可选的实现方式中,对比学习模块可以包括:相似度计算子模块、损失计算子模块以及模型调整子模块,其中:
[0135]
相似度计算子模块,用于分别计算第二训练向量与正样本以及负样本之间的相似度。
[0136]
损失计算子模块,用于根据得到的相似度计算模型损失。
[0137]
模型调整子模块,用于根据模型损失调整初始表示模型的模型参数并继续训练,直至模型损失收敛,得到表示模型。
[0138]
本实施例中,为了最大化第二训练向量和各负样本的差异,基于向量之间的相似度计算模型损失,并根据模型损失调整模型参数,保证了生成的表示模型的准确性。
[0139]
为解决上述技术问题,本技术实施例还提供计算机设备。具体请参阅图4,图4为本实施例计算机设备基本结构框图。
[0140]
所述计算机设备4包括通过系统总线相互通信连接存储器41、处理器42、网络接口43。需要指出的是,图中仅示出了具有组件41-43的计算机设备4,但是应理解的是,并不要求实施所有示出的组件,可以替代的实施更多或者更少的组件。其中,本技术领域技术人员可以理解,这里的计算机设备是一种能够按照事先设定或存储的指令,自动进行数值计算和/或信息处理的设备,其硬件包括但不限于微处理器、专用集成电路(application specific integrated circuit,asic)、可编程门阵列(field-programmable gate array,fpga)、数字处理器(digital signal processor,dsp)、嵌入式设备等。
[0141]
所述计算机设备可以是桌上型计算机、笔记本、掌上电脑及云端服务器等计算设备。所述计算机设备可以与用户通过键盘、鼠标、遥控器、触摸板或声控设备等方式进行人机交互。
[0142]
所述存储器41至少包括一种类型的可读存储介质,所述可读存储介质包括闪存、硬盘、多媒体卡、卡型存储器(例如,sd或dx存储器等)、随机访问存储器(ram)、静态随机访问存储器(sram)、只读存储器(rom)、电可擦除可编程只读存储器(eeprom)、可编程只读存储器(prom)、磁性存储器、磁盘、光盘等。在一些实施例中,所述存储器41可以是所述计算机设备4的内部存储单元,例如该计算机设备4的硬盘或内存。在另一些实施例中,所述存储器41也可以是所述计算机设备4的外部存储设备,例如该计算机设备4上配备的插接式硬盘,智能存储卡(smart media card,smc),安全数字(secure digital,sd)卡,闪存卡(flash card)等。当然,所述存储器41还可以既包括所述计算机设备4的内部存储单元也包括其外部存储设备。本实施例中,所述存储器41通常用于存储安装于所述计算机设备4的操作系统和各类应用软件,例如意图识别方法的计算机可读指令等。此外,所述存储器41还可以用于暂时地存储已经输出或者将要输出的各类数据。
[0143]
所述处理器42在一些实施例中可以是中央处理器(central processing unit,cpu)、控制器、微控制器、微处理器、或其他数据处理芯片。该处理器42通常用于控制所述计算机设备4的总体操作。本实施例中,所述处理器42用于运行所述存储器41中存储的计算机可读指令或者处理数据,例如运行所述意图识别方法的计算机可读指令。
[0144]
所述网络接口43可包括无线网络接口或有线网络接口,该网络接口43通常用于在所述计算机设备4与其他电子设备之间建立通信连接。
[0145]
本实施例中提供的计算机设备可以执行上述意图识别方法。此处意图识别方法可以是上述各个实施例的意图识别方法。
[0146]
本实施例中,获取目标对象的对象信息,对象信息可以包含多种类型的对象子信
息;将各类对象子信息转化为初始表征向量,然后对各初始表征向量进行拼接,得到第一表征向量,从而实现多模态、多类型的对象子信息的表达;然后将第一表征向量输入表示模型,表示模型预先经过对比学习训练,可以将不同对象信息所对应的表征向量进行充分区分,得到第二表征向量;然后将第二表征向量输入意图识别模型,得到目标对象的意图识别结果;本技术融合了多模态的对象信息,通过预先经过对比学习训练的表示模型得到对象信息更优的向量表达,从而提高了意图识别的准确性。
[0147]
本技术还提供了另一种实施方式,即提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机可读指令,所述计算机可读指令可被至少一个处理器执行,以使所述至少一个处理器执行如上述的意图识别方法的步骤。
[0148]
本实施例中,获取目标对象的对象信息,对象信息可以包含多种类型的对象子信息;将各类对象子信息转化为初始表征向量,然后对各初始表征向量进行拼接,得到第一表征向量,从而实现多模态、多类型的对象子信息的表达;然后将第一表征向量输入表示模型,表示模型预先经过对比学习训练,可以将不同对象信息所对应的表征向量进行充分区分,得到第二表征向量;然后将第二表征向量输入意图识别模型,得到目标对象的意图识别结果;本技术融合了多模态的对象信息,通过预先经过对比学习训练的表示模型得到对象信息更优的向量表达,从而提高了意图识别的准确性。
[0149]
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本技术的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如rom/ram、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,空调器,或者网络设备等)执行本技术各个实施例所述的方法。
[0150]
显然,以上所描述的实施例仅仅是本技术一部分实施例,而不是全部的实施例,附图中给出了本技术的较佳实施例,但并不限制本技术的专利范围。本技术可以以许多不同的形式来实现,相反地,提供这些实施例的目的是使对本技术的公开内容的理解更加透彻全面。尽管参照前述实施例对本技术进行了详细的说明,对于本领域的技术人员来而言,其依然可以对前述各具体实施方式所记载的技术方案进行修改,或者对其中部分技术特征进行等效替换。凡是利用本技术说明书及附图内容所做的等效结构,直接或间接运用在其他相关的技术领域,均同理在本技术专利保护范围之内。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献