农林渔牧食品/饮料服装/饰品纺织/造纸医疗/保健机械/机床家具/门窗喷涂/染料道路/铁路

摄影/光学乐器/声学照明/工业冶金/铸造安全/消防建筑/工具控制/调节计算,推算其他产品

一种信息交互方法、装置及电子设备与流程

2021-06-22 17:08:00 来源：中国专利 TAG：电子设备交互装置计算机方法

本发明涉及计算机技术领域，更具体地，涉及一种信息交互方法、装置及电子设备。

背景技术：

智能设备的应用极大地方便了用户的生活，例如但由于老人等用户由于记忆力等因素并不能很好地适应智能设备中较为复杂地交互操作，造成了这类用户的不便，例如网约车领域，由于老人用户可能具有记忆力下降等情况，这给老人用户造成了叫车困扰，且有些老人用户不适应智能手机中的app的复杂交互操作，更增加了老人用户的出行难度。

技术实现要素：

有鉴于此，本发明实施例提供一种信息交互方法、装置及电子设备，以使得用户可以通过唤醒词实现一键式创建任务，简化了任务创建的操作复杂度，提高了用户体验感。

第一方面，本发明实施例提供一种信息交互方法，所述方法包括：

接收音频信息；

根据预先训练的至少一个唤醒词模型确定所述音频信息对应的唤醒词；

根据所述唤醒词对应的行程信息创建任务；

向目标用户终端发送任务创建结果。

第二方面，本发明实施例提供一种信息交互装置，所述装置包括：

接收单元，被配置为接收音频信息；

唤醒词确定单元，被配置为根据预先训练的至少一个唤醒词模型确定所述音频信息对应的唤醒词；

任务创建单元，被配置为根据所述唤醒词对应的行程信息创建任务；

发送单元，被配置为向目标用户终端发送任务创建结果。

第三方面，本发明实施例提供一种电子设备，包括存储器和处理器，所述存储器用于存储一条或多条计算机程序指令，其中，所述一条或多条计算机程序指令被所述处理器执行以实现如本发明实施例第一方面所述的方法。

第四方面，本发明实施例提供一种计算机可读存储介质，所述计算机可读存储介质内存储有计算机程序，所述计算机程序被处理器执行时实现如本发明实施例第一方面所述的方法。

第五方面，本发明实施例提供一种计算机程序产品，当所述计算机程序产品在计算机上运行时，使得所述计算机执行如本发明实施例第一方面所述的方法。

本发明实施例通过接收音频信息，并根据预先训练的至少一个唤醒词模型确定该音频信息对应的唤醒词，根据该唤醒词对应的行程信息创建任务，向目标用户终端发送任务创建结果。由此，用户可以通过唤醒词实现一键式创建任务，简化了任务创建的操作复杂度，提高了用户体验感。

附图说明

通过以下参照附图对本发明实施例的描述，本发明的上述以及其它目的、特征和优点将更为清楚，在附图中：

图1是本发明实施例的信息交互方法的流程图；

图2是本发明实施例的一种唤醒词设置方法的流程图；

图3是本发明实施例的一种唤醒词设置方法的示意图；

图4是本发明实施例的另一种唤醒词设置方法的流程图；

图5是本发明实施例的一种唤醒词设置方法的示意图；

图6是本发明实施例的一种信息交互过程的示意图；

图7是本发明实施例的信息交互装置的示意图；

图8是本发明实施例的电子设备的示意图。

具体实施方式

以下基于实施例对本发明进行描述，但是本发明并不仅仅限于这些实施例。在下文对本发明的细节描述中，详尽描述了一些特定的细节部分。对本领域技术人员来说没有这些细节部分的描述也可以完全理解本发明。为了避免混淆本发明的实质，公知的方法、过程、流程、元件和电路并没有详细叙述。

此外，本领域普通技术人员应当理解，在此提供的附图都是为了说明的目的，并且附图不一定是按比例绘制的。

除非上下文明确要求，否则在说明书的“包括”、“包含”等类似词语应当解释为包含的含义而不是排他或穷举的含义；也就是说，是“包括但不限于”的含义。

在本发明的描述中，需要理解的是，术语“第一”、“第二”等仅用于描述目的，而不能理解为指示或暗示相对重要性。此外，在本发明的描述中，除非另有说明，“多个”的含义是两个或两个以上。

在以下实施例中，主要以通过网约车应用领域中的任务创建进行具体描述，应理解，本实施例并不对应用领域进行限制，其他应用领域，例如快递等物流领域均可采用本实施例的交互方法进行任务创建。

应理解，在本实施例的任一实施方式中，在获得用户授权后，获取的相关用户信息，例如账户信息、或位置信息等，以便于为用户创建相关任务等。

图1是本发明实施例的信息交互方法的流程图。如图1所示，本发明实施例的信息交互方法包括以下步骤：

步骤s110，接收音频信息。在一种可选的实现方式中，目标用户通过目标用户终端中的应用程序或者目标用户终端中的应用程序中嵌入的小程序上传音频信息。可选的，在应用程序的相关页面中具有任务创建控件，通过触发该任务创建控件以上传音频信息。

步骤s120，根据预先训练的至少一个唤醒词模型确定音频信息对应的唤醒词。

在一种可选的实现方式中，各唤醒词分别具有对应的唤醒词模型，唤醒词模型基于音频数据训练获得，其中音频数据包含对应的唤醒词样本。可选的，假设唤醒词为“回家”，获取音频数据，音频数据中包含多条包括“回家”的唤醒词样本和多条不包含“回家”的语音样本。可选的，可以采集同一用户或者不同用户说出的包括“回家”的音频数据。可选的，多条不具有唤醒词“回家”的音频数据内容可以相同也可以不相同。

其中，将多条包括“回家”的唤醒词样本确定为正样本数据，将多条不包含“回家”的语音样本确定为负样本数据。可选的，对正样本数据进行文本标注。可选的，对正样本数据和负样本数据进行预处理，例如分频处理等，对预处理后的正样本数据和负样本数据进行fbank特征提取，获取正样本数据的fbank特征(例如fbank30维特征)和负样本数据的fbank特征，将正样本数据的fbank特征(例如fbank30维特征)和负样本数据的fbank特征输入至初始模型中进行训练，以获取唤醒词“回家”对应的唤醒词模型。

在一种可选的实现方式中，本实施例中的唤醒词模型是一种基于crnn(convolutionalrecurrentneuralnetwork，卷积循环神经网络)的网络模型。crnn是一种cnn(卷积层) rnn(循环层) ctc(损失)的网络结构，用于端到端地对不定长的数据序列进行识别。其中，采用cnn对音频数据进行特征提取，采用rnn对特征序列进行预测，也即对序列中的各特征向量进行学习，并输出预测标签分布，并采用ctc损失把从rnn层获取的一系列标签分布转换成最终的标签序列。由此，本实施例可以利用rnn和ctc学习到音频数据的上下文关系，从而可以提高数据识别的准确性，提高模型鲁棒性。

在一种可选的实现方式中，目标用户可以设置多个唤醒词，以绑定多个不同的行程信息。可选的，在目标用户设置的多个唤醒词中，可以仅包括服务端提供的固定唤醒词，也可以仅包括用户自定义的自定义唤醒词，还可以同时包括服务端提供的固定唤醒词和自定义唤醒词。也就是说，目标用户可以选择服务端提供的固定唤醒词来设置启用基于该固定唤醒词的一键创建任务，同时可以自定义唤醒词，通过上传该自定义唤醒词的音频数据以训练获得该自定义唤醒词对应的唤醒词模型，从而可以设置启用基于该自定义唤醒词的一键创建任务。可选的，固定唤醒词的设置方法和自定义唤醒词的设置方法分别如图2和图3所示。

图2是本发明实施例的一种唤醒词设置方法的流程图。在一种可选的实现方式中，通过上述方式预先训练至少一个固定唤醒词的唤醒词模型以供目标用户选择。如图2所示，本发明实施例的唤醒词设置方法包括以下步骤：

步骤s210，控制在目标用户终端页面显示固定唤醒词。可选的，控制在目标用户终端中的应用程序或者目标用户终端中的应用程序中嵌入的小程序的页面上显示预先训练好唤醒词模型的固定唤醒词，以供用户选择。

步骤s220，接收目标用户输入的唤醒词音频信息。可选的，目标用户可以通过目标用户终端中的应用程序或者目标用户终端中的应用程序中嵌入的小程序中的语音输入框输入其选择的固定唤醒词对应的唤醒词音频信息，也即包括唤醒词的音频信息。

步骤s230，确定唤醒词音频信息对应的唤醒词模型。在一种可选的实现方式中，对唤醒词音频信息进行语音识别，确定对应的文本信息，对文本信息进行语义识别，以确定匹配的唤醒词模型。可选的，采用asr(automaticspeechrecognition，自动语音识别)模型对唤醒词音频信息进行语音识别，确定对应的文本信息。可选的，采用nlu(naturallanguageunderstanding，自然语音理解技术)模型对唤醒词音频信息对应的文本信息进行语义识别，根据语义识别结果进行模糊匹配以确定唤醒词音频信息对应的唤醒词模型。

步骤s240，将目标用户选择的固定唤醒词与目标用户输入的行程信息进行绑定。在一种可选的实现方式中，将用户选择的固定唤醒词对应的唤醒词模型发送至目标用户终端以供目标用户终端在线或离线使用，并控制目标用户终端页面显示形成行程信息输入框，获取目标用户在行程信息输入框输入的行程信息，将目标用户选择的固定唤醒词与其输入的行程信息进行绑定。其中，行程信息可以包括行程路线。以网约车应用场景为例，行程信息还可以包括网约车类型等信息，例如出租车、快车、拼车等。预设信息可以为“回家”，对应的行程路线可以为“a大厦—b小区东门”，网约车类型可以为出租车。

图3是本发明实施例的一种唤醒词设置方法的示意图。可选的，以网约车应用场景为例，如图3所示，在目标用户终端的网约车应用程序页面31中设置唤醒词。其中，控制在目标用户终端的页面31中显示固定唤醒词“上班”、“回家”、“上学”。在一种可选的实现方式中，目标用户可以通过页面31中的语音输入框311输入的唤醒词音频信息，对唤醒词音频信息进行语音识别，确定对应的文本信息，对文本信息进行语义识别，以确定匹配的唤醒词模型。可选的，假设用户选择的固定唤醒词为“上班”，在目标用户终端下载更新完固定唤醒词“上班”的唤醒词模型后，目标用户终端页面切换至页面32。其中，页面32中可以包括行程信息输入框321。可选的，目标用户可以通过语音输入框322输入各行程信息，在目标用户终端或服务平台对目标用户输入的行程信息音频进行语音识别，将识别后的文本信息分别填充至行程信息输入框321中。可选的，目标用户可以对行程信息输入框321中的信息进行手动修改，以确保行程信息的准确性。在其他可选的实现方式中，目标用户可以直接在行程信息输入框321中填充对应的行程信息。在唤醒词及行程信息确认无误后，目标用户可以通过触发确认键“ok”以使得唤醒词与对应的行程信息进行绑定。如图3所示，唤醒词“上班”与行程信息“采用出租车从a小区东门到b大厦”进行绑定。

在另一种可选的实现方式中，显示固定唤醒词“上班”、“回家”、“上学”的显示框可以作为选择控件，也即可以通过触发固定唤醒词“上班”、“回家”、“上学”的显示框以确定所选择的固定唤醒词，将用户选择的固定唤醒词对应的唤醒词模型发送至目标用户终端以供目标用户终端在线或离线使用，并控制目标用户终端页面显示形成行程信息输入框，获取目标用户在行程信息输入框输入的行程信息，将目标用户选择的固定唤醒词与其输入的行程信息进行绑定。

图4是本发明实施例的另一种唤醒词设置方法的流程图。在一种可选的实现方式中，用户可以自定义唤醒词。如图4所示，本发明实施例的唤醒词设置方法包括以下步骤：

步骤s310，接收目标用户输入的多条具有自定义唤醒词的唤醒词音频数据。可选的，响应于目标用户触发自定义唤醒词控件，引导目标用户输入多条唤醒词音频数据。

步骤s320，获取多条不具有自定义唤醒词的非唤醒词音频数据。可选的，可以从音频数据库中获取多条非唤醒词音频数据，也可以引导用户输入多条非唤醒词音频数据，本实施例并不对此进行限制。

步骤s330，根据多条所述唤醒词音频数据和所述非唤醒词音频数据训练获取所述自定义唤醒词对应的唤醒词模型。可选的，根据多条唤醒词音频数据确定正样本，根据多条非唤醒词音频数据确定负样本，根据正样本和负样本训练获取该自定义唤醒词对应的唤醒词模型。进一步可选的，将至少部分唤醒词音频数据确定为正样本测试集，将至少部分非唤醒词音频数据确定为负样本测试集，根据正样本测试集和负样本测试集测试训练后的唤醒词模型，确定训练后的唤醒词模型的性能参数，响应于性能参数满足预定条件，获取训练完成的唤醒词模型。可选的，性能参数满足预定条件可以为唤醒词模型的识别准确性大于预定阈值。

可选的，在本实施例中，唤醒词模型为基于crnn的网络模型，其基于正样本和负样本进行训练的方式如上所述，在此不再赘述。

在获取音频数据时，若让目标用户输入的音频数据过多，会造成目标用户的负担，但若过少，则训练获得的唤醒词模型的识别准确性会降低。因此，在本实施例的一种实现方式中，对多条唤醒词音频数据进行加噪处理、和/或变速等处理，以增加唤醒词音频数据，根据增加后的唤醒词音频数据确定正样本。由此，可以在不增加用户负担的情况下获得了较多的正样本，提高了训练后的唤醒词模型的识别准确性和鲁棒性。

步骤s340，将个性化唤醒词与目标用户输入的行程信息进行绑定。在一种可选的实现方式中，将用户自定义的唤醒词对应的唤醒词模型发送至目标用户终端以供目标用户终端在线或离线使用，并控制目标用户终端页面显示形成行程信息输入框，获取目标用户在行程信息输入框输入的行程信息，将目标用户自定义的唤醒词与其输入的行程信息进行绑定。其中，行程信息可以包括行程路线。以网约车应用场景为例，行程信息还可以包括网约车类型等信息，例如出租车、快车、拼车等。预设信息可以为“回家”，对应的行程路线可以为“a大厦—b小区东门”，网约车类型可以为出租车。

图5是本发明实施例的一种唤醒词设置方法的示意图。可选的，以网约车应用场景为例，如图5所示，在目标用户终端的网约车应用程序页面51中设置唤醒词。其中，控制在目标用户终端的页面51中显示固定唤醒词“上班”、“回家”、“上学”以及自定义唤醒词控件511。在本实施例中，响应于自定义唤醒词控件511被触发，或者识别到目标用户通过语音输入框512输入的音频信息为“自定义设置唤醒词”等类似语句，目标用户终端页面切换至页面52。在页面52中，控制目标用户终端引导引导目标用户输入多条唤醒词音频数据。可选的，控制在页面52中显示提示气泡522，气泡522中包括提示信息，例如“请长按说出至少30条唤醒词语句”，以引导目标用户通过长按语音输入控件521输入多条包括自定义唤醒词的语句。在其他可选的实现方式中，还可以跳转至页面52时，控制目标终端通过语音播报提示目标用户输入多条唤醒词音频数据，例如语音播报“请您说出至少30条唤醒词语句”等。

在一种可选的实现方式中，当唤醒词音频数据收集完成后，还可以在页面52引导目标用户通过长按语音输入控件521输入多条不包括自定义唤醒词的语句，以获取非唤醒词音频数据。在其他可选的实现方式中，还可以通过音频数据库获取非唤醒词音频数据，本实施例并不对获取非唤醒词音频数据的方式进行限制。

在唤醒词音频数据和非唤醒词音频数据收集完毕后，根据唤醒词音频数据和非唤醒词音频数据训练获取自定义唤醒词对应的唤醒词模型，将训练完成的自定义唤醒词对应的唤醒词模型发送至目标用户终端以供目标用户终端在线或离线使用。

在目标用户终端下载自定义唤醒词对应的唤醒词模型后，目标用户终端页面切换至页面53。页面53中可以包括行程信息输入框531。可选的，目标用户可以通过语音输入框532输入各行程信息，在目标用户终端或服务平台对目标用户输入的行程信息音频进行语音识别，将识别后的文本信息分别填充至行程信息输入框531中。可选的，目标用户可以对行程信息输入框531中的信息进行手动修改，以确保行程信息的准确性。在其他可选的实现方式中，目标用户可以直接在行程信息输入框531中填充对应的行程信息。在唤醒词及行程信息确认无误后，目标用户可以通过触发确认键“ok”以使得唤醒词与对应的行程信息进行绑定。如图5所示，自定义唤醒词“火车站”与行程信息“采用出租车从a小区东门到c火车站”进行绑定。

在一种可选的实现方式中，若目标用户说出唤醒词预定时间或者多次说出唤醒词后，任务仍然未创建成功，则可能是由于对应的唤醒词模型的识别准确率较低。在本实施例中，可以对唤醒词模型进行再训练，以进一步提高唤醒词模型的准确性。其中，唤醒词模型的再训练过程与步骤s310-s330类似，在此不再赘述。

由此，本实施例通过提供多个固定的唤醒词以供用户进行选择并绑定对应的行程路线，从而可以减少交互流程，为用户设置唤醒词提供便利。本实施例还可以通过提供自定义唤醒词使得用户可以设置个性化的唤醒词，由此，可以实现用户个性化行程路线的设置，进一步提高了用户体验感。

步骤s130，根据目标用户当前输入的音频信息对应的唤醒词对应的行程信息创建任务。如上所述，各唤醒词绑定有对应的行程信息，因此，可以根据目标用户当前输入的音频信息对应的唤醒词获取行程信息，并根据行程信息创建对应的任务。其中，行程信息可以包括行程路线。以网约车应用场景为例，行程信息还可以包括网约车类型等信息，例如出租车、快车、拼车等。假设目标用户说出的唤醒词为“上班”，“上班”对应的行程路线为“a小区东门—b大厦”，车辆类型为出租车，则根据“上班”对应的行程路线为“a小区东门—b大厦”以及目标用户设置的车辆类型创建网约车任务，也即生成网约车订单，以供网约车司机通过司机终端接单，从而无需复杂的交互过程便能够实现网约车订单创建，为老人用户等群体提供了遍历，进而提高了用户体验感。

步骤s140，向目标用户终端发送任务创建结果。可选的，可以通过目标用户终端中的应用程序或者用户终端中的其他应用程序中嵌入的服务平台小程序提示用户任务创建结果以及任务的当前状态。例如，控制目标用户终端播报或显示“您的从a小区东门到b大厦的网约车订单以创建，正在等待司机接单”。

本发明实施例通过接收音频信息，并根据预先训练的至少一个唤醒词模型确定该音频信息对应的唤醒词，根据该唤醒词对应的行程信息创建任务，向目标用户终端发送任务创建结果。由此，用户可以通过唤醒词实现一键式创建任务，简化了任务创建的操作复杂度，提高了用户体验感。

图6是本发明实施例的一种信息交互过程的示意图。以网约车应用场景为例，如图6所示，在目标用户终端的网约车app页面61中包括唤醒词一键打车控件611，目标用户可以通过触发唤醒词一键打车控件611输入音频信息，目标用户终端响应于接收到音频信息，根据预先训练的至少一个唤醒词模型确定该音频信息对应的唤醒词，根据该唤醒词对应的行程信息创建任务，向目标用户终端发送任务创建结果。如图6所示，使得目标用户终端在任务创建成功的同时播报提示信息，例如播报“您的从a小区东门到b大厦的网约车订单以创建，正在等待司机接单”的提示信息，同时在用户终端界面61中可以通过悬浮窗612的形式展示任务当前状态的详情。例如，任务当前状态为：等待司机接单，起点为：a小区东门，终点为：b大厦。

本发明实施例通过接收音频信息，并根据预先训练的至少一个唤醒词模型确定该音频信息对应的唤醒词，根据该唤醒词对应的行程信息创建任务，向目标用户终端发送任务创建结果。由此，用户可以通过唤醒词实现一键式创建任务，简化了任务创建的操作复杂度，提高了用户体验感。

应理解，图3、图5和图6中的中的目标用户终端的页面仅仅是为了便于理解，其并不对本实施例的信息交互方法对应的实际应用页面进行限制。

图7是本发明实施例的信息交互装置的示意图。本发明实施例的信息交互装置7包括接收单元71、唤醒词确定单元72、任务创建单元73和发送单元74。

接收单元71被配置为接收音频信息。唤醒词确定单元72被配置为根据预先训练的至少一个唤醒词模型确定所述音频信息对应的唤醒词。任务创建单元73被配置为根据所述唤醒词对应的行程信息创建任务。发送单元74被配置为向目标用户终端发送任务创建结果。

在一种可选的实现方式中，各所述唤醒词分别具有对应的唤醒词模型，所述唤醒词模型基于具音频数据训练获得，其中音频数据包含唤醒词样本。

在一种可选的实现方式中，所述唤醒词包括固定唤醒词。信息交互装置还包括第一设置单元。所述第一设置单元包括第一显示子单元、第一接收子单元、模型确定子单元和第一绑定子单元。

第一显示子单元被配置为控制在所述目标用户终端页面显示固定唤醒词。第一接收子单元被配置为接收目标用户输入的唤醒词音频信息，所述唤醒词音频信息中具有所述目标用户选择的固定唤醒词。模型确定子单元，被配置为确定所述唤醒词音频信息对应的唤醒词模型。第一绑定子单元，被配置为将所述目标用户选择的固定唤醒词与所述目标用户输入的行程信息进行绑定。

在一种可选的实现方式中，所述模型确定子单元包括语音识别模块和语义识别模块。语音识别模块被配置为对所述唤醒词音频信息进行语音识别，确定对应的文本信息。语义识别模块被配置为对所述文本信息进行语义识别，以确定匹配的唤醒词模型。

在一种可选的实现方式中，所述唤醒词包括自定义唤醒词。信息交互装置7还包括第二设置单元。所述第二设置单元包括第二接收子单元、数据获取子单元、训练子单元和第二绑定子单元。

第二接收子单元被配置为接收目标用户输入的多条具有自定义唤醒词的唤醒词音频数据。数据获取子单元，被配置为获取多条不具有自定义唤醒词的非唤醒词音频数据。训练子单元，被配置为根据多条所述唤醒词音频数据和所述非唤醒词音频数据训练获取所述自定义唤醒词对应的唤醒词模型。第二绑定子单元，被配置为将所述个性化唤醒词与所述目标用户输入的行程信息进行绑定。

在一种可选的实现方式中，所述训练子单元包括样本确定模块和训练模块。样本确定模块，被配置为根据多条所述唤醒词音频数据确定正样本，根据多条所述非唤醒词音频数据确定负样本。训练模块，被配置为根据所述正样本和负样本训练获取所述自定义唤醒词对应的唤醒词模型。

在一种可选的实现方式中，所述训练子单元还包括测试集确定模块、测试模块和模型获取模块。测试集确定模块，被配置为将至少部分所述唤醒词音频数据确定为正样本测试集，将至少部分所述非唤醒词音频数据确定为负样本测试集。测试模块，被配置为根据所述正样本测试集和所述负样本测试集测试训练后的唤醒词模型，确定训练后的唤醒词模型的性能参数。模型获取模块，被配置为响应于所述性能参数满足预定条件，获取训练完成的唤醒词模型。

在一种可选的实现方式中，所述样本确定模块包括数据扩充子模块和正样本确定子模块。数据扩充子模块被配置为对多条所述唤醒词音频数据进行加噪处理、和/或变速处理，以增加唤醒词音频数据。正样本确定子模块被配置为根据增加后的唤醒词音频数据确定正样本。

图8是本发明实施例的电子设备的示意图。如图8所示，电子设备8为通用数据处理装置，其包括通用的计算机硬件结构，其至少包括处理器81和存储器82。处理器81和存储器82通过总线83连接。存储器82适于存储处理器81可执行的指令或程序。处理器81可以是独立的微处理器，也可以是一个或者多个微处理器集合。由此，处理器81通过执行存储器82所存储的指令，从而执行如上所述的本发明实施例的方法流程实现对于数据的处理和对于其它装置的控制。总线83将上述多个组件连接在一起，同时将上述组件连接到显示控制器84和显示装置以及输入/输出(i/o)装置85。输入/输出(i/o)装置85可以是鼠标、键盘、调制解调器、网络接口、触控输入装置、体感输入装置、打印机以及本领域公知的其他装置。典型地，输入/输出装置85通过输入/输出(i/o)控制器86与系统相连。

本领域的技术人员应明白，本申请的实施例可提供为方法、装置(设备)或计算机程序产品。因此，本申请可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且，本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可读存储介质(包括但不限于磁盘存储器、cd-rom、光学存储器等)上实施的计算机程序产品。

本申请是参照根据本申请实施例的方法、装置(设备)和计算机程序产品的流程图来描述的。应理解可由计算机程序指令实现流程图中的每一流程。

这些计算机程序指令可以存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中，使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品，该指令装置实现流程图一个流程或多个流程中指定的功能。

也可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器，使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程中指定的功能的装置。

本发明的另一实施例涉及一种计算机程序产品，当该计算机程序产品在计算机上运行时，使得计算机执行上述部分或全部的方法实施例。

本发明的另一实施例涉及一种非易失性存储介质，用于存储计算机可读程序，所述计算机可读程序用于供计算机执行上述部分或全部的方法实施例。

即，本领域技术人员可以理解，实现上述实施例方法中的全部或部分步骤是可以通过程序来指定相关的硬件来完成，该程序存储在一个存储介质中，包括若干指令用以使得一个设备(可以是单片机，芯片等)或处理器(processor)执行本申请各实施例所述方法的全部或部分步骤。而前述的存储介质包括：u盘、移动硬盘、只读存储器(rom，read-onlymemory)、随机存取存储器(ram，randomaccessmemory)、磁碟或者光盘等各种可以存储程序代码的介质。

本发明实施例公开了ts1、一种信息交互方法，所述方法包括：

接收音频信息；

根据预先训练的至少一个唤醒词模型确定所述音频信息对应的唤醒词；

根据所述唤醒词对应的行程信息创建任务；

向目标用户终端发送任务创建结果。

ts2、根据ts1所述的方法，各所述唤醒词分别具有对应的唤醒词模型，所述唤醒词模型基于音频数据训练获得，其中音频数据包含唤醒词样本。

ts3、根据ts1或ts2所述的方法，所述唤醒词包括固定唤醒词；

所述固定唤醒词通过以下步骤设置：

控制在所述目标用户终端页面显示固定唤醒词；

接收目标用户输入的唤醒词音频信息，所述唤醒词音频信息中具有所述目标用户选择的固定唤醒词；

确定所述唤醒词音频信息对应的唤醒词模型；

将所述目标用户选择的固定唤醒词与所述目标用户输入的行程信息进行绑定。

ts4、根据ts3所述的方法，确定所述唤醒词音频信息对应的唤醒词模型包括：

对所述唤醒词音频信息进行语音识别，确定对应的文本信息；

对所述文本信息进行语义识别，以确定匹配的唤醒词模型。

ts5、根据ts1-ts4中任一项所述的方法，所述唤醒词包括自定义唤醒词；

所述自定义唤醒词的设置步骤包括：

接收目标用户输入的多条具有自定义唤醒词的唤醒词音频数据；

获取多条不具有自定义唤醒词的非唤醒词音频数据；

根据多条所述唤醒词音频数据和所述非唤醒词音频数据训练获取所述自定义唤醒词对应的唤醒词模型；

将所述个性化唤醒词与所述目标用户输入的行程信息进行绑定。

ts6、根据ts5所述的方法，根据多条所述唤醒词音频数据和所述非唤醒词音频数据训练获取所述自定义唤醒词对应的唤醒词模型包括：

根据多条所述唤醒词音频数据确定正样本，根据多条所述非唤醒词音频数据确定负样本；

根据所述正样本和负样本训练获取所述自定义唤醒词对应的唤醒词模型。

ts7、根据ts5或ts6所述的方法，根据多条所述唤醒词音频数据和所述非唤醒词音频数据训练获取所述自定义唤醒词对应的唤醒词模型还包括：

将至少部分所述唤醒词音频数据确定为正样本测试集，将至少部分所述非唤醒词音频数据确定为负样本测试集；

根据所述正样本测试集和所述负样本测试集测试训练后的唤醒词模型，确定训练后的唤醒词模型的性能参数；

响应于所述性能参数满足预定条件，获取训练完成的唤醒词模型。

ts8、根据ts6所述的方法，根据多条所述唤醒词音频数据确定正样本包括：

对多条所述唤醒词音频数据进行加噪处理、和/或变速处理，以增加唤醒词音频数据；

根据增加后的唤醒词音频数据确定正样本。

本发明实施例公开了ts9、一种信息交互装置，所述装置包括：

接收单元，被配置为接收音频信息；

唤醒词确定单元，被配置为根据预先训练的至少一个唤醒词模型确定所述音频信息对应的唤醒词；

任务创建单元，被配置为根据所述唤醒词对应的行程信息创建任务；

发送单元，被配置为向目标用户终端发送任务创建结果。

ts10、根据ts9所述的装置，各所述唤醒词分别具有对应的唤醒词模型，所述唤醒词模型基于音频数据训练获得，其中音频数据包含唤醒词样本。

ts11、根据ts9或ts10所述的装置，所述唤醒词包括固定唤醒词，所述装置还包括第一设置单元；

所述第一设置单元包括：

第一显示子单元，被配置为控制在所述目标用户终端页面显示固定唤醒词；

第一接收子单元，被配置为接收目标用户输入的唤醒词音频信息，所述唤醒词音频信息中具有所述目标用户选择的固定唤醒词；

模型确定子单元，被配置为确定所述唤醒词音频信息对应的唤醒词模型；

第一绑定子单元，被配置为将所述目标用户选择的固定唤醒词与所述目标用户输入的行程信息进行绑定。

ts12、根据ts11所述的装置，所述模型确定子单元包括：

语音识别模块，被配置为对所述唤醒词音频信息进行语音识别，确定对应的文本信息；

语义识别模块，被配置为对所述文本信息进行语义识别，以确定匹配的唤醒词模型。

ts13、根据ts9-ts12中任一项所述的装置，所述唤醒词包括自定义唤醒词，所述装置还包括第二设置单元；

所述第二设置单元包括：

第二接收子单元，被配置为接收目标用户输入的多条具有自定义唤醒词的唤醒词音频数据；

数据获取子单元，被配置为获取多条不具有自定义唤醒词的非唤醒词音频数据；

训练子单元，被配置为根据多条所述唤醒词音频数据和所述非唤醒词音频数据训练获取所述自定义唤醒词对应的唤醒词模型；

第二绑定子单元，被配置为将所述个性化唤醒词与所述目标用户输入的行程信息进行绑定。

ts14、根据ts13所述的装置，所述训练子单元包括：

样本确定模块，被配置为根据多条所述唤醒词音频数据确定正样本，根据多条所述非唤醒词音频数据确定负样本；

训练模块，被配置为根据所述正样本和负样本训练获取所述自定义唤醒词对应的唤醒词模型。

ts15、根据ts13或ts14所述的装置，所述训练子单元还包括：

测试集确定模块，被配置为将至少部分所述唤醒词音频数据确定为正样本测试集，将至少部分所述非唤醒词音频数据确定为负样本测试集；

测试模块，被配置为根据所述正样本测试集和所述负样本测试集测试训练后的唤醒词模型，确定训练后的唤醒词模型的性能参数；

模型获取模块，被配置为响应于所述性能参数满足预定条件，获取训练完成的唤醒词模型。

ts16、根据ts14所述的装置，所述样本确定模块包括：

数据扩充子模块，被配置为对多条所述唤醒词音频数据进行加噪处理、和/或变速处理，以增加唤醒词音频数据；

正样本确定子模块，被配置为根据增加后的唤醒词音频数据确定正样本。

本发明实施例公开了ts17、一种电子设备，包括存储器和处理器，所述存储器用于存储一条或多条计算机程序指令，其中，所述一条或多条计算机程序指令被所述处理器执行以实现如ts1-ts8中任一项所述的方法。

本发明实施例公开了ts18、一种计算机可读存储介质，所述计算机可读存储介质内存储有计算机程序，所述计算机程序被处理器执行时实现如ts1-ts8任一项所述的方法。

本发明实施例公开了ts19、一种计算机程序产品，当所述计算机程序产品在计算机上运行时，使得所述计算机执行如ts1-ts8中任一项所述的方法。

以上所述仅为本发明的优选实施例，并不用于限制本发明，对于本领域技术人员而言，本发明可以有各种改动和变化。凡在本发明的精神和原理之内所作的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。

再多了解一些

1/2 1 2 下一页尾页

本文用于企业家、创业者技术爱好者查询，结果仅供参考。

一种信息交互方法、装置及电子设备与流程

相关文章

最热文献