指令流的生成方法、装置及电子设备与流程

2023-02-19 05:38:51 来源：中国专利 TAG：

1.本技术属于数据处理技术领域，尤其涉及一种指令流的生成方法、指令流的生成装置、电子设备及计算机可读存储介质。

背景技术：

2.随着自然语言分析技术的发展，对智能设备的控制也变的多元化，例如可以通过有语音控制的方式控制设备指令执行不同的操作，或者在和ai助手文字聊天的过程中，通过文字来触发某些操作。在控制智能设备的过程中，往往只能生成较为简单的操作指令，而对于复杂的操作，则存在所生成的操作指令不完整的问题。

技术实现要素：

3.本技术提供了一种指令流的生成方法、指令流的生成装置、电子设备及计算机可读存储介质，可以生成完整的复杂指令，提高智能设备控制的自动化。
4.第一方面，本技术提供了一种指令流的生成方法，包括：
5.获取待处理的文本数据；
6.对上述文本数据进行编码，得到上述文本数据的特征向量；
7.对上述特征向量进行循环解码，生成上述特征向量对应的指令流，其中，上述循环解码包括至少一次解码操作，每一次解码操作得到上述文本数据中至少一个关键语义对应的指令码，上述指令流由上述指令码组成。
8.第二方面，本技术提供了一种指令流的生成装置，包括：
9.第一获取模块，用于获取待处理的文本数据；
10.编码模块，用于对上述文本数据进行编码，得到上述文本数据的特征向量；
11.解码模块，用于对上述特征向量进行循环解码，生成上述特征向量对应的指令流，其中，上述循环解码包括至少一次解码操作，每一次解码操作得到上述文本数据中至少一个关键语义对应的指令码，上述指令流由上述指令码组成。
12.第三方面，本技术提供了一种电子设备，上述电子设备包括存储器、处理器以及存储在上述存储器中并可在上述处理器上运行的计算机程序，上述处理器执行上述计算机程序时实现如上述第一方面的方法的步骤。
13.第四方面，本技术提供了一种计算机可读存储介质，上述计算机可读存储介质存储有计算机程序，上述计算机程序被处理器执行时实现如上述第一方面的方法的步骤。
14.第五方面，本技术提供了一种计算机程序产品，上述计算机程序产品包括计算机程序，上述计算机程序被一个或多个处理器执行时实现如上述第一方面的方法的步骤。
15.本技术与现有技术相比存在的有益效果是：本技术通过对待处理的文本数据进行编码，得到文本数据对应的特征向量，之后通过对特征向量进行循环解码，从而生成指令流。通过每一次解码操作，能够得到文本数据中至少一个关键语义对应的指令码，当完成循环解码后，即可得到由指令码组成的指令流。该方法生成的控制指令能够完成复杂的控制
操作，进而提高智能设备控制的自动化。
附图说明
16.为了更清楚地说明本技术实施例中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本技术的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。
17.图1是本技术实施例提供的指令流的生成方法的流程示意图；
18.图2是本技术实施例提供的指令流的生成装置的结构示意图；
19.图3是本技术实施例提供的电子设备的结构示意图。
具体实施方式
20.以下描述中，为了说明而不是为了限定，提出了诸如特定系统结构、技术之类的具体细节，以便透彻理解本技术实施例。然而，本领域的技术人员应当清楚，在没有这些具体细节的其它实施例中也可以实现本技术。在其它情况中，省略对众所周知的系统、装置、电路以及方法的详细说明，以免不必要的细节妨碍本技术的描述。
21.本技术实施例提供的指令流的生成方法可以应用于手机、平板电脑、车载设备、增强现实(augmented reality，ar)/虚拟现实(virtual reality，vr)设备、笔记本电脑、超级移动个人计算机(ultra-mobile personal computer，umpc)、上网本、个人数字助理(personal digital assistant，pda)等电子设备上，本技术实施例对电子设备的具体类型不作任何限制。
22.为了说明本技术所提出的技术方案，下面通过具体实施例来进行说明。
23.图1示出了本技术提供的指令流的生成方法的示意性流程图，作为示例而非限定，该方法可以应用于上述任意一种电子设备中。
24.步骤101、获取待处理的文本数据。
25.在进行指令流的生成之前，需要获取对应的文本数据，即待处理的文本数据。文本数据可以是聊天界面中，用户所发送的文字聊天内容；或者在接收用户的语音数据后，对该语音数据进行处理所得到的文字内容。
26.在一些实施例中，为了提升用户的体验感，在获取待处理的文本数据之前，可以通过以下步骤得到文本数据：
27.a1、获取待识别语音。
28.a2、对待识别语音进行预处理。
29.a3、对预处理后的待识别语音进行语音识别，得到文本数据。
30.在通过语音数据获得文本数据的过程中，可以先获取待识别语音，待识别语音可以是实时采集的语音数据，也可以是在聊天界面中，用户通过终端设备发送的语音数据。在获取到待识别语音之后，为了提高语音识别的准确性和识别效率，可以对待识别语音进行预处理，例如执行预加重、分帧、加窗以及端点检测等操作。在待识别语音完成预处理后，即可将待识别语音进行语音识别，得到待识别语音对应的文本数据，也即得到后续生成指令流中的待处理的文本数据。
31.步骤102、对文本数据进行编码，得到文本数据的特征向量。
32.在获得文本数据之后，为了提高后续指令流生成的效率，可以对文本数据进行编码，从而得到文本数据对应的特征向量。该过程即为将文本数据转换成一个连续的表达的过程。可选地，在对文本数据编码的过程中，可以利用transformer模型中的编码器完成。
33.步骤103、对特征向量进行循环解码，生成特征向量对应的指令流。
34.在得到特征向量之后，可以对该特征向量进行循环解码，从而生成特征向量对应的指令流。其中，循环解码操作包括至少一次解码操作，并且每执行一次解码操作，可以得到数据文本中至少一个关键语义对应的指令码，完成循环解码后，可以得到由指令码组成的指令流。可选地，在对特征向量循环解码的过程中，可以利用transformer模型中的解码器完成。
35.本技术实施例通过对待处理的文本数据进行编码，得到文本数据对应的特征向量，之后通过对特征向量进行循环解码，从而生成指令流。通过每一次解码操作，可以得到文本数据中至少一个关键语义对应的指令码，当完成循环解码后，即可得到由指令码组成的指令流，该方法生成的控制指令能够完成更复杂的控制操作，从而提高智能设备控制的自动化。
36.在一些实施例中，为了提高指令流生成的效率和准确性，在步骤102之前，上述生成方法还包括：
37.b1、检测文本数据中是否包含数字字符。
38.b2、若文本数据中包含数字字符，则将数字字符替换成预设的数字槽位。
39.在对特征向量解码的过程中，文本数据中可能会包含数字，当文本数据中的数字无规律的出现时，极有可能会导致解码出错。即可能出现对特征向量进行解码的模型无法学习到对应的规律的问题，进而导致循环解码得到的指令流出错。为了解决该问题，可以简化数字的表达，即对文本数据中的数字字符进行脱敏处理。具体地，可以利用预设的数字槽位来替换文本数据中的数字字符，数字槽位的值即为所替换的数字字符。为了便于理解，举例说明：假设文本数据为“红球选1 2 3 4 5 6 7”，利用数字槽位对文本数据中的数字进行替换后，可以得到“红球选[0][1][2][3][4][5][6]”，对应的，每个数字槽位的值分别为“[0]＝1，[1]＝2，[2]＝3，[3]＝4，[4]＝5，[5]＝6，[6]＝7”。应当注意的是，在该例子中，预设的数字槽位是从0开始顺序编号，对于数字槽位的编号也可以采用其他编号方式，在此不作限定。
[0040]
在一些实施例中，为了避免在文本数据中的内容为闲聊内容的情况下多次执行无效的循环解码操作，在上述步骤102之前，上述生成方法还包括：
[0041]
将文本数据输入已训练的分类模型中进行意图分类，得到意图分类结果。
[0042]
不论是通过聊天界面获得的文字内容，还是通过识别用户的语音数据得到的文字内容，大部分的文本数据中可能没有包含生成指令流的关键语义。也就是说，获得的文本数据中，并未包含控制意图。在这种情况下，即使对文本数据进行编码解码，也无法获得指令流。因此，为了提高解码效率，避免不必要的解码操作，可以在对文本数据编码之前，将文本数据输入已训练的分类模型中，进行意图分类，得到对应的意图分类结果。这里所说的通过已训练的分类模型进行分类是一种多任务分类过程，即分类结果是多样的。为了便于理解，举例说明，对于彩票购买这一应用场景，对应的意图分类结果可以包括无意图、选票及选球
等。
[0043]
可选地，意图分类可以设置在数字槽位替换之前，这是由于如果将数字槽位替换设置在意图分类之前，数字槽位的替换可能对于分类引入不必要的噪声，造成部分语义缺失。为了便于理解，举例说明，假设数据文本为“我和你一样”，下进行数字槽位替换，得到“我和你[0]样，[0]＝1”，将得到的文本输入分类模型中进行意图分类的过程中，[0]即为噪音，[0]的存在让整句话的语义无法正确表述。因此直接将文本先输入分类模型中进行意图分类，之后在进行文本中的数字字符进行数字槽位的替换，能够使得整个流程高效简单，充分利用了意图分类和指令解码各自的优点。
[0044]
在一些实施例中，为了提高意图分类结果的准确性，可以通过以下步骤实现分类模型的训练：
[0045]
c1、获取训练样本，所述训练样本标注有真实意图。
[0046]
c2、将训练样本输入待训练的分类模型中，得到训练分类结果。
[0047]
c3、基于训练分类结果和真实意图对分类模型的模型参数进行优化，得到已训练的分类模型。
[0048]
对于分类模型的训练，可以对线上日志进行采集，然后经过人工标注，从而形成对应的训练样本，其中，人工标注是指根据文本内容对文本进行真实意图的标注。在得到训练样本后，即可将训练样本输入分类模型进行分类，得到训练分类结果，最后根据训练分类结果和真实意图对分类模型的模型参数进行优化，从而得到已训练的分类模型。训练完成后，还可以从采集到的文本数据中选择一些坏例或者困难样本进行日常迭代，从而不断完善分类模型，使得分类结果更准确。
[0049]
相应地，在得到意图分类结果后，上述步骤103可具体表现为：
[0050]
基于意图分类结果对特征向量进行循环解码，生成特征向量对应的指令流。
[0051]
在得到意图分类结果之后，为了提高解码效率，可以结合意图分类结果对特征向量进行循环解码，以生成特征向量对应的指令流。
[0052]
在一些实施例中，为了提高解码效率，意图分类结果具体以如下方式影响到指令流的生成：
[0053]
d1、检测意图分类结果中是否包含预设意图。
[0054]
d2、若意图分类结果中包含预设意图，则对特征向量进行循环解码，生成特征向量对应的指令流。
[0055]
d3、若指令分类结果中不包含目标指令，则根据文本数据发送对应的回复信息。
[0056]
在进行编码之前，先基于预设意图对意图分类结果进行检测，当检测到意图分类结果中包含预设意图时，则说明文本数据中包含控制意图，也即可以对文本数据进行编码解码操作，得到指令流。因此，在检测到该结果之后，可以开始进行编码以及循环解码操作。
[0057]
如果指令分类结果中不包含目标指令，则说明文本数据中不包含控制意图，也即该文本数据对应的特征向量，无需进行后续的编码以及循环解码操作。此时，可以根据该文本内容进一步匹配回复信息，并将匹配得到的回复通过文字或者语音的形式进行回复，以提升用户的体验感。
[0058]
在一些实施例中，为了进一步提高指令流生成的准确性，上述步骤103具体包括：
[0059]
f1、基于特征向量依次对文本数据中的关键语义进行解码操作，得到每次解码操
作对应的指令码；
[0060]
f2、基于每次解码操作对应的指令码组成初始指令流；
[0061]
f3、删除初始指令流中的无关指令码，生成特征向量对应的指令流，无关指令码是与预设意图无关的指令码。
[0062]
文本数据中包含至少一个关键语义，不同的关键语义可以对应不同的指令码，从而形成指令码集合。以彩票购买场景为例，指令码集合参见下表1：
[0063]
表1
[0064][0065][0066]
结合预设的指令码集合，并基于特征向量依次对文本数据中的关键语义执行解码操作，每一次解码操作可以得到一个关键语义对应的指令码；当对文本数据中的所有关键语义完成解码操作后，可以得到和文本数据中关键语义对应的指令码；基于每次解码操作对应的指令码，即可生成初始指令流。为了进一步提高指令流生成的准确性，在获得初始指令流之后，可以删除初始指令流中的无关指令码，进而得到特征向量对应的指令流，这里说的无关指令码指的是与预设意图无关的指令码，例如解码开始的标记或者解码结束的标记则为与预设意图无关的指令码，可以删除以提高指令流生成的准确性。
[0067]
应理解，上述实施例中各步骤的序号的大小并不意味着执行顺序的先后，各过程的执行顺序应以其功能和内在逻辑确定，而不应对本技术实施例的实施过程构成任何限定。
[0068]
为便于理解，下面以实际应用场景来说明本技术提出的指令流的生成方法。假设获取到的文本数据1为“不买2张，买5张”以及文本数据2为“刮刮乐多少钱一张”。先对文本数据进行意图分类，得到意图为选票意图。接下来可以对本文本数据进行编码解码操作。由于文本数据1涉及了数字，可以先对文本数据1进行数字槽位替换，即获得“不买[0]，买[1]；[0]＝2，[1]＝5”；之后将“不买[0]，买[1]”通过模型进行编码解码，具体为：
[0069]
文本数据：不买2张，买5张。
[0070]
模型编码后进行意图分类：选票意图。
[0071]
文本数据数字槽位替换：不买[0]张，买[1]张。
[0072]
循环编码解码生成指令流：[selpn][1]。
[0073]
具体地，循环解码的过程如下：
[0074]
第1步：
[0075]
编码部分输入：不买[0]张，买[1]张
[0076]
解码部分输入：[sos]
[0077]
最后解码输出：[selpn]
[0078]
(注：[sos]为解码起始标记)
[0079]
第2步：
[0080]
编码部分输入：不买[0]张，买[1]张
[0081]
解码部分输入：[sos][selpn]
[0082]
最后解码输出：[1]
[0083]
第3步：
[0084]
编码部分输入：不买[0]张，买[1]张
[0085]
解码部分输入：[sos][selpn][1]
[0086]
最后解码输出：[eos]
[0087]
当看到解码结束标记：[eos]，则停止解码，最终得到：[sos][selpn][1][eos]，取有效部分：[selpn][1]。
[0088]
通过对文本数据的编码和解码，可以获得文本数据对应的指令流，从而提高指令生成的完整性，进一步提高智能设备的自动化控制。
[0089]
而对于文本数据2，通过编码后进行意图分类可以知道，该文本数据中不包含预设意图，那么可以根据该文本数据的特征向量匹配吻合的答案“刮刮乐2元一张”，从而解答用户的问题，提升用户的体验感。
[0090]
对应于上文实施例所述的指令流的生成方法，图2示出了本技术实施例提供的指令流的生成装置2的结构框图，为了便于说明，仅示出了与本技术实施例相关的部分。
[0091]
参照图2，该生成装置2包括：
[0092]
第一获取模块201，用于获取待处理的文本数据；
[0093]
编码模块202，用于对文本数据进行编码，得到文本数据的特征向量；
[0094]
解码模块203，用于对特征向量进行循环解码，生成特征向量对应的指令流，其中，循环解码包括至少一次解码操作，每一次解码操作得到文本数据中至少一个关键语义对应的指令码，指令流由指令码组成。
[0095]
可选地，上述生成装置2还可以包括：
[0096]
检测模块，用于检测文本数据中是否包含数字字符；
[0097]
槽位替换模块，用于若文本数据中包含数字字符，则将数字字符替换成预设的数字槽位，其中，数字槽位的值为所替换的数字字符。
[0098]
可选地，上述生成装置2还可以包括：
[0099]
分类模块，用于将文本数据输入已训练的分类模型中进行意图分类，得到意图分类结果；
[0100]
相应的，上述解码模块203具体用于基于意图分类结果对特征向量进行循环解码，生成特征向量对应的指令流。
[0101]
可选地，上述解码模块203可以包括：
[0102]
检测单元，用于检测意图分类结果中是否包含预设意图；
[0103]
指令流解码单元，用于若意图分类结果中包含预设意图，则对特征向量进行循环解码，生成特征向量对应的指令流。
[0104]
可选地，上述解码模块203还可以包括，
[0105]
信息回复单元，用于在检测意图分类结果中是否包含预设意图之后，若指令分类结果中不包含目标指令，则根据文本数据发送对应的回复信息。
[0106]
可选地，上述解码模块203可以包括：
[0107]
解码单元，用于基于所述特征向量依次对文本数据中的关键语义进行解码操作，得到每次解码操作对应的指令码；
[0108]
组合单元，用于基于每次解码操作对应的指令码组成初始指令流；
[0109]
生成单元，用于删除初始指令流中的无关指令码，生成特征向量对应的指令流，无关指令码是与预设意图无关的指令码。
[0110]
可选地，上述生成装置2还可以包括：
[0111]
第二获取模块，用于在获取待处理的文本数据之前，获取待识别语音；
[0112]
预处理模块，用于对待识别语音进行预处理；
[0113]
语音识别模块，用于对预处理后的待识别语音进行语音识别，得到文本数据。
[0114]
需要说明的是，上述装置/单元之间的信息交互和执行过程等内容，由于与本技术方法实施例基于同一构思，其具体功能及带来的技术效果，具体可参见方法实施例部分，此处不再赘述。
[0115]
图3为本技术一实施例提供的电子设备的结构示意图。如图3所示，该实施例的电子设备3包括：至少一个处理器30(图3中仅示出一个)处理器、存储器31以及存储在存储器31中并可在至少一个处理器30上运行的计算机程序32，处理器30执行计算机程序32时实现上述任意指令流的生成方法实施例中的步骤，例如图1所示出的步骤101-103。
[0116]
所称处理器30可以是中央处理单元(central processing unit，cpu)，该处理器30还可以是其他通用处理器、数字信号处理器(digital signal processor，dsp)、专用集成电路(application specific integrated circuit，asic)、现成可编程门阵列(field-programmable gate array，fpga)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
[0117]
存储器31在一些实施例中可以是电子设备3的内部存储单元，例如电子设备3的硬盘或内存。存储器31在另一些实施例中也可以是电子设备3的外部存储设备，例如电子设备3上配备的插接式硬盘，智能存储卡(smart media card，smc)，安全数字(secure digital，sd)卡，闪存卡(flash card)等。
[0118]
进一步地，存储器31还可以既包括终端设备3的内部存储单元也包括外部存储设备。存储器31用于存储操作装置、应用程序、引导装载程序(bootloader)、数据以及其他程序等，例如计算机程序的程序代码等。存储器31还可以用于暂时地存储已经输出或者将要输出的数据。
[0119]
所属领域的技术人员可以清楚地了解到，为了描述的方便和简洁，仅以上述各功能单元、模块的划分进行举例说明，实际应用中，可以根据需要而将上述功能分配由不同的功能单元、模块完成，即将所述装置的内部结构划分成不同的功能单元或模块，以完成以上描述的全部或者部分功能。实施例中的各功能单元、模块可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中，上述集成的
单元既可以采用硬件的形式实现，也可以采用软件功能单元的形式实现。另外，各功能单元、模块的具体名称也只是为了便于相互区分，并不用于限制本技术的保护范围。上述系统中单元、模块的具体工作过程，可以参考前述方法实施例中的对应过程，在此不再赘述。
[0120]
本技术实施例还提供了一种计算机可读存储介质，所述计算机可读存储介质存储有计算机程序，所述计算机程序被处理器执行时实现可实现上述各个方法实施例中的步骤。
[0121]
本技术实施例提供了一种计算机程序产品，当计算机程序产品在移动终端上运行时，使得移动终端执行时实现可实现上述各个方法实施例中的步骤。
[0122]
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本技术实现上述实施例方法中的全部或部分流程，可以通过计算机程序来指令相关的硬件来完成，所述的计算机程序可存储于一计算机可读存储介质中，该计算机程序在被处理器执行时，可实现上述各个方法实施例的步骤。其中，所述计算机程序包括计算机程序代码，所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质至少可以包括：能够将计算机程序代码携带到拍照装置/电子设备的任何实体或装置、记录介质、计算机存储器、只读存储器(rom，read-only memory)、随机存取存储器(ram，random access memory)、电载波信号、电信信号以及软件分发介质。例如u盘、移动硬盘、磁碟或者光盘等。在某些司法管辖区，根据立法和专利实践，计算机可读介质不可以是电载波信号和电信信号。
[0123]
在上述实施例中，对各个实施例的描述都各有侧重，某个实施例中没有详述或记载的部分，可以参见其它实施例的相关描述。
[0124]
本领域普通技术人员可以意识到，结合本文中所公开的实施例描述的各示例的单元及算法步骤，能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行，取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能，但是这种实现不应认为超出本技术的范围。
[0125]
在本技术所提供的实施例中，应该理解到，所揭露的装置/网络设备和方法，可以通过其它的方式实现。例如，以上所描述的装置/网络设备实施例仅仅是示意性的，例如，所述模块或单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，例如多个单元或组件可以结合或者可以集成到另一个系统，或一些特征可以忽略，或不执行。另一点，所显示或讨论的相互之间的耦合或直接耦合或通讯连接可以是通过一些接口，装置或单元的间接耦合或通讯连接，可以是电性，机械或其它的形式。
[0126]
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
[0127]
以上所述实施例仅用以说明本技术的技术方案，而非对其限制；尽管参照前述实施例对本技术进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换；而这些修改
或者替换，并不使相应技术方案的本质脱离本技术各实施例技术方案的精神和范围，均应包含在本技术的保护范围之内。

再多了解一些

1/2 1 2 下一页尾页

本文用于创业者技术爱好者查询，仅供学习研究，如用于商业用途，请联系技术所有人。

上一篇：返回列表
下一篇：一种降噪方法、设备及存储介质与流程

指令流的生成方法、装置及电子设备与流程

相关文献

最热文献