一种多轮语音交互方法、终端及服务器与流程

2021-10-08 22:16:00 来源：中国专利 TAG：终端人工智能交互语音服务器

1.本技术涉及人工智能技术领域，尤其涉及一种多轮语音交互方法、终端及服务器。

背景技术：

2.目前智能对话可以分为单轮对话及多轮对话，对于单轮对话，通常表现为一问一答的形式，用户提出问题或发出请求，系统识别用户意图，做出回答或执行特定操作。对于多轮对话，通常表现为有问有答的形式。通常多轮对话只针对一个应用场景，若在面临不同的应用场景时，会导致交互的准确率下降。

技术实现要素：

3.本技术实施例提供一种多轮语音交互方法、终端及服务器，用以提高多场景下多轮交互的准确率。
4.第一方面，本技术实施例提供一种智能终端，所述终端包括：处理器、存储器、播放单元和收音单元；
5.所述收音单元用于获取用户输入的语音信息；
6.所述处理器用于识别用户的语音信息；对所述语音信息进行解析，确定所述语音信息的特征信息；根据所述语音信息的特征信息确定所述语音信息匹配的多轮对话场景；根据所述多轮对话场景对应的交互信息模板，确定所述语音信息的回复信息；其中，所述交互信息模板中包含所述多轮对话场景的每一轮的语音信息和所述语音信息对应的语义信息；
7.所述播放单元用于播报所述回复信息；
8.所述存储器用于存储所述多轮对话场景对应的交互信息模板。
9.上述终端，通过获取语音信息的特征信息来确定该语音的应用场景，并根据该应用场景对应的交互信息模板，确定回复信息。这样，在确定回复信息之前先确定该语音信息的应用场景，可以更加准确的确定的回复信息，从而提高交互的准确性。
10.在某些实施例中，所述语音信息是首轮输入的语音信息，所述处理器具体被配置为：将与所述语音信息的类型信息相同类型的多轮对话场景作为所述语音信息匹配的多轮对话场景；或，
11.所述语音信息不是首轮输入的语音信息，所述处理器具体被配置为：获取从上一轮对话过程加入到数据库的语音信息的场景标识，并根据所述场景标识确定所述语音信息对应的多轮对话场景。
12.上述终端，根据不同轮数使用不同的确定的方法，若不是首轮输入的语音信息，则可以通过上一轮语音信息的场景标识，确定对话场景。这样，可以节省计算资源，提高运行速度。
13.在某些实施例中，所述处理器具体被配置为：
14.将所述语音信息、与所述语音信息匹配的多轮对话场景的场景标识以及所述语音
信息的输入时间存储到所述数据库中；
15.若确定下一轮输入的语音信息的输入时间与当前语音信息的输入时间的时间差大于预设时间差，则确定下一轮输入的语音信息是首轮输入的语音信息。
16.上述终端，通过两次输入的语音信息的输入时间之间的时间差来确定是否使用场景标识。这样，可以更加准确的确认输入的信息是否为首轮输入的，从而提高的交互的准确性。
17.在某些实施例中，所述处理器具体被配置为：
18.若所述多轮对话场景对应的交互信息模板中存在所述语音信息对应的回复信息，则将所述回复信息作为所述语音信息的回复信息；或，
19.若所述多轮对话场景对应的交互信息模板中不存在所述语音信息对应的回复信息，则从所述多轮对话场景对应的交互信息模板中获取所述语音信息的语义信息，并通过所述多轮对话场景的处理模块对所述语义信息进行处理，得到所述语音信息的回复信息。
20.上述终端，通过预设的回复信息以及语义信息来确定最终的回复信息。这样，根据不同的语音信息，采用不同的方式确定回复信息可以使交互更加准确。
21.第二方面，本技术实施例提供一种服务器，所述服务器包括：处理器和存储器；
22.所述处理器用于识别用户的语音信息；对所述语音信息进行解析，确定所述语音信息的特征信息；根据所述语音信息的特征信息确定所述语音信息匹配的多轮对话场景；根据所述多轮对话场景对应的交互信息模板，确定所述语音信息的回复信息；其中，所述交互信息模板中包含所述多轮对话场景的每一轮的语音信息和所述语音信息对应的语义信息；将所述回复信息发送给智能终端，以使所述智能终端播报所述回复信息；
23.所述存储器用于存储所述多轮对话场景对应的交互信息模板。
24.上述服务器，通过获取语音信息的特征信息来确定该语音的应用场景，并根据该应用场景对应的交互信息模板，确定回复信息。这样，在确定回复信息之前先确定该语音信息的应用场景，可以更加准确的确定的回复信息，从而提高交互的准确性。
25.第三方面，本技术实施例提供一种多轮语音交互方法，应用于智能终端，所述方法包括：
26.识别用户的语音信息；
27.对所述语音信息进行解析，确定所述语音信息的特征信息；
28.根据所述语音信息的特征信息确定所述语音信息匹配的多轮对话场景；
29.根据所述多轮对话场景对应的交互信息模板，确定所述语音信息的回复信息；其中，所述交互信息模板中包含所述多轮对话场景的每一轮的语音信息和所述语音信息对应的语义信息；
30.将所述回复信息进行播报。
31.在某些实施例中，所述语音信息是首轮输入的语音信息，所述特征信息为类型信息，所述根据所述语音信息的类型信息确定所述语音信息匹配的多轮对话场景，包括：
32.将与所述语音信息的类型信息相同类型的多轮对话场景作为所述语音信息匹配的多轮对话场景；或，
33.所述语音信息不是首轮输入的语音信息，所述特征信息为场景标识，所述根据所述语音信息的类型信息确定所述语音信息匹配的多轮对话场景，包括：
34.获取从上一轮对话过程加入到数据库的语音信息的场景标识，并根据所述场景标识确定所述语音信息对应的多轮对话场景。
35.在某些实施例中，所述根据确定的所述多轮对话场景对应的交互信息模板，确定所述语音信息的回复信息之后，所述方法还包括：
36.将所述语音信息、与所述语音信息匹配的多轮对话场景的场景标识以及所述语音信息的输入时间存储到所述数据库中；
37.若确定下一轮输入的语音信息的输入时间与当前语音信息的输入时间的时间差大于预设时间差，则确定下一轮输入的语音信息是首轮输入的语音信息。
38.在某些实施例中，所述根据所述多轮对话场景对应的交互信息模板，确定所述语音信息的回复信息，包括：
39.若所述多轮对话场景对应的交互信息模板中存在所述语音信息对应的回复信息，则将所述回复信息作为所述语音信息的回复信息；或，
40.若所述多轮对话场景对应的交互信息模板中不存在所述语音信息对应的回复信息，则从所述多轮对话场景对应的交互信息模板中获取所述语音信息的语义信息，并通过所述多轮对话场景的处理模块对所述语义信息进行处理，得到所述语音信息的回复信息。
41.第四方面，本技术实施例提供一种多轮语音交互方法，应用于服务器，所述方法包括：
42.识别用户的语音信息；
43.对所述语音信息进行解析，确定所述语音信息的特征信息；
44.根据所述语音信息的特征信息确定所述语音信息匹配的多轮对话场景；
45.根据所述多轮对话场景对应的交互信息模板，确定所述语音信息的回复信息；其中，所述交互信息模板中包含所述多轮对话场景的每一轮的语音信息和所述语音信息对应的语义信息；
46.将所述回复信息发送给智能终端，以使所述智能终端播报所述回复信息。
47.第五方面，本技术还提供一种计算机存储介质，其上存储有计算机程序，该程序被处理单元执行时实现第二方面所述多轮语音交互方法的步骤。
48.另外，第二方面至第三方面中任一种实现方式所带来的技术效果可参见第一方面中不同实现方式所带来的技术效果，此处不再赘述。
49.应当理解的是，以上的一般描述和后文的细节描述仅是示例性和解释性的，并不能限制本技术。
附图说明
50.此处所说明的附图用来提供对本技术的进一步理解，构成本技术的一部分，本技术的示意性实施例及其说明用于解释本技术，并不构成对本技术的不当限定。在附图中：
51.图1是本技术实施例提供的第一种交互信息应用场景的示意图；
52.图2是本技术实施例提供的一种终端的结构示意图；
53.图3为本技术实施例提供的一种基于智能终端的多轮语音交互方法的流程示意图；
54.图4是本技术实施例提供的第二种交互信息应用场景的示意图；
55.图5为本技术实施例提供的一种基于服务器的多轮语音交互方法的流程示意图；
56.图6为本技术实施例提供的一种完整的多轮交互方法的流程示意图；
57.图7为本技术实施例提供的老人健康管理场景下的多轮交互方法的流程示意图；
58.图8为本技术实施例提供的全屋找人场景下的多轮交互方法的流程示意图；
59.图9为本技术实施例提供的智能终端控制场景下的多轮交互方法的流程示意图。
具体实施方式
60.为了使本技术的目的、技术方案和优点更加清楚，下面将结合附图对本技术作进一步地详细描述，显然，所描述的实施例仅仅是本技术一部份实施例，而不是全部的实施例。基于本技术中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例，都属于本技术保护的范围。
61.本技术实施例中术语“和/或”，描述关联对象的关联关系，表示可以存在三种关系，例如，a和/或b，可以表示：单独存在a，同时存在a和b，单独存在b这三种情况。字符“/”一般表示前后关联对象是一种“或”的关系。
62.本技术的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象，而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换，以便这里描述的本技术的实施例能够以除了在这里图示或描述的那些以外的顺序实施。
63.本技术实施例提供一种智能终端，所述终端包括：处理器、存储器、播放单元和收音单元；
64.其中，处理器和存储器可集成为同一元件，该元件中既可以充当处理器使用，又可以存储器使用。
65.所述收音单元用于获取用户输入的语音信息；
66.所述处理器用于识别用户的语音信息；对所述语音信息进行解析，确定所述语音信息的特征信息；根据所述语音信息的特征信息确定所述语音信息匹配的多轮对话场景；根据所述多轮对话场景对应的交互信息模板，确定所述语音信息的回复信息；其中，所述交互信息模板中包含所述多轮对话场景的每一轮的语音信息和所述语音信息对应的语义信息；
67.所述播放单元用于播报所述回复信息；
68.所述存储器用于存储所述多轮对话场景对应的交互信息模板。
69.具体来说，用户在与本技术实施例提供的智能终端进行交互时，结合图1所示，用户向智能终端发送语音信息，智能终端根据收音单元获取用户输入的语音信息，并根据语音信息确定对应的对话场景，并根据对话场景确定回复信息，最终将确定的回复信息播报给用户。
70.本技术实施例提供一种多轮语音交互方法、终端及服务器，通过获取语音信息的特征信息来确定该语音的应用场景，并根据该应用场景对应的交互信息模板，确定回复信息。这样，在确定回复信息之前先确定该语音信息的应用场景，可以更加准确的确定的回复信息，从而提高交互的准确性。
71.在某些实施例中，智能终端除了上述介绍的元件，还可以包括以下元件，结合图2
所示。
72.应该理解的是，图2所示终端200仅是一个范例，并且终端200可以具有比图1中所示的更多的或者更少的部件，可以组合两个或多个的部件，或者可以具有不同的部件配置。图中所示出的各种部件可以在包括一个或多个信号处理和/或专用集成电路在内的硬件、软件、或硬件和软件的组合中实现。
73.如图2所示，终端200包括：存储器210、显示单元220、摄像头230、无线保真(wireless fidelity，wi-fi)模块240、处理器250、音频电路260以及电源270等部件。
74.处理器250是终端200的控制中心，利用各种接口和线路连接整个终端的各个部分，通过运行或执行存储在存储器210内的软件程序，以及调用存储在存储器210内的数据，执行终端200的各种功能和处理数据。在一些实施例中，处理器250可包括一个或多个处理单元；处理器250还可以集成应用处理器和基带处理器，其中，应用处理器主要处理操作系统、用户界面和应用程序等，基带处理器主要处理无线通信。本技术中处理器250可以运行操作系统、应用程序、用户界面显示及触控响应，以及本技术实施例所述的服装推荐方法。
75.存储器210可用于存储软件程序及数据。处理器250通过运行存储在存储器210的软件程序或数据，从而执行终端200的各种功能以及数据处理。存储器210可以包括高速随机存取存储器，还可以包括非易失性存储器，例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。存储器210存储有使得终端200能运行的操作系统。本技术中存储器210可以存储操作系统及各种应用程序，还可以存储执行本技术实施例所述方法的代码。
76.其中，显示单元220可用于接收输入的数字或字符信息，产生与终端200的用户设置以及功能控制有关的信号输入，具体地，显示单元220可以包括设置在终端200正面的触摸屏221，可收集用户在其上或附近的触摸操作，例如点击按钮，拖动滚动框等。
77.显示单元220还可用于显示由用户输入的信息或提供给用户的信息以及终端200的各种菜单的图形用户界面(graphical user interface，gui)。具体地，显示单元220可以包括设置在终端200正面的显示屏222。其中，显示屏222可以采用液晶显示器、发光二极管等形式来配置。显示单元220可以用于显示本技术中所述的各种图形用户界面。其中，当终端集成在终端上时，可以将终端中的门的外壳采用显示单元中的显示屏222代替。
78.其中，触摸屏221可以覆盖在显示屏222之上，也可以将触摸屏221与显示屏222集成而实现终端200的输入和输出功能，集成后可以简称触摸显示屏。本技术中显示单元220可以显示应用程序以及对应的操作步骤。
79.以下通过介绍实施例的方式，介绍终端200配置图2中包含的元件的详细情况。
80.在某些实施例中，所述语音信息是首轮输入的语音信息，所述处理器具体被配置为：将与所述语音信息的类型信息相同类型的多轮对话场景作为所述语音信息匹配的多轮对话场景；或，
81.所述语音信息不是首轮输入的语音信息，所述处理器具体被配置为：获取从上一轮对话过程加入到数据库的语音信息的场景标识，并根据所述场景标识确定所述语音信息对应的多轮对话场景。
82.在某些实施例中，所述处理器具体被配置为：
83.将所述语音信息、与所述语音信息匹配的多轮对话场景的场景标识以及所述场景标识的使用期限存储到所述数据库中；
84.若确定加入到数据库的场景标识超过使用期限，则确定下一轮输入的语音信息是首轮输入的语音信息。
85.在某些实施例中，所述处理器具体被配置为：
86.若所述多轮对话场景对应的交互信息模板中存在所述语音信息对应的回复信息，则将所述回复信息作为所述语音信息的回复信息；或，
87.若所述多轮对话场景对应的交互信息模板中不存在所述语音信息对应的回复信息，则从所述多轮对话场景对应的交互信息模板中获取所述语音信息的语义信息，并通过所述多轮对话场景的处理模块对所述语义信息进行处理，得到所述语音信息的回复信息。
88.在该实施例中，处理器250还与摄像头230相连，其中，摄像头230可用于捕获静态图像或视频。物体通过镜头生成光学图像投射到感光元件。感光元件可以是电荷耦合器件(charge coupled device，ccd)或互补金属氧化物半导体(complementary metal-oxide-semiconductor，cmos)光电晶体管。感光元件把光信号转换成电信号，之后将电信号传递给处理器250转换成数字图像信号。
89.在该实施例中，处理器250和音频电路260相连。音频电路260、扬声器261、麦克风262可提供用户与终端200之间的音频接口。音频电路260可将接收到的音频数据转换后的电信号，传输到扬声器261，由扬声器261转换为声音信号输出。终端200还可配置音量按钮，用于调节声音信号的音量。另一方面，麦克风262将收集的声音信号转换为电信号，由音频电路260接收后转换为音频数据，将音频数据输出至存储器210以便进一步处理。本技术中麦克风262可以获取用户的语音。
90.具体实现时，处理器250确定回复信息，并通过扬声器261将回复信息播报。
91.在该实施例中，处理器250与wi-fi模块240相连，其中，wi-fi属于短距离无线传输技术，终端200可以通过wi-fi模块240帮助用户收发电子邮件、浏览网页和访问流媒体等，它为用户提供了无线的宽带互联网访问。
92.基于上述介绍的所有实施例中，终端200还包括给各个元件供电的电源270(比如电池)。电源可以通过电源管理系统与处理器250逻辑相连，从而通过电源管理系统实现管理充电、放电以及功耗等功能。终端200还可配置有电源按钮，用于终端的开机和关机，以及锁屏等功能。
93.以下通过一种应用于智能终端的多轮语音交互方法进行详细介绍。如图3所示，该方法具体包括以下步骤：
94.s301：识别用户的语音信息。
95.s302：对所述语音信息进行解析，确定所述语音信息的特征信息。
96.s303：根据所述语音信息的特征信息确定所述语音信息匹配的多轮对话场景。
97.在本技术实施例中，由于为多轮对话场景，因此每一轮根据语音信息的特征信息获取多轮对话场景的方式也有所不同。其中，主要将多轮对话场景分为首轮对话和非首轮对话。
98.若接收到的语音信息是首轮输入的语音信息，所述特征信息为类型信息，则将与所述语音信息的类型信息相同类型的多轮对话场景作为所述语音信息匹配的多轮对话场景。
99.若接收到的语音信息不是首轮输入的语音信息，所述特征信息为场景标识，则获
取从上一轮对话过程加入到数据库的语音信息的场景标识，并根据所述场景标识确定所述语音信息对应的多轮对话场景。
100.在本技术实施例中，语音信息的特征信息分为类型信息和场景标识。其中，对语音信息进行解析，可以得到语音信息的关键词等信息，并通过关键词确定语音信息的类型信息。这样，根据不同轮数使用不同的确定的方法，若不是首轮输入的语音信息，则可以通过上一轮语音信息的场景标识，确定对话场景。这样，可以节省计算资源，提高运行速度。
101.其中，判断接收到的语音信息是否为首轮输入是根据上一轮对话过程加入到数据库的语音信息的场景标识确定的。
102.在本技术实施例中，交互设备与用户进行完一次交互后，会将这一轮的交互信息存储到数据库中，具体可实施为：
103.将所述语音信息、与所述语音信息匹配的多轮对话场景的场景标识以及所述语音信息的输入时间存储到所述数据库中；
104.若确定下一轮输入的语音信息的输入时间与当前语音信息的输入时间的时间差大于预设时间差，则确定下一轮输入的语音信息是首轮输入的语音信息。
105.在本技术实施例中，存储到数据库中的信息可以以表格的形式进行存储，具体的，如表1所示，其中数据库中存储的信息。
106.表1数据库中存储的信息
107.语音信息场景标识使用期限语音1标识1时间1语音2标识2时间2语音3标识3时间3
108.其中，每一行作为一轮交互的信息进行存储。
109.在本技术实施例中，根据场景标识的使用期限确定语音信息是否为首轮信息。例如：若确定上一轮的语音信息为语音3，则根据语音3对应的时间3与当前时间(时间2)进行比较，若时间2与时间3之间的时间差大于预设时间差，则确定当前的语音信息为首轮语音信息；若时间差不大于预设时间差，则确定当前的语音信息不为首轮语音信息。
110.通过场景标识的使用期限来确定是否使用场景标识。这样，可以更加准确的确认输入的信息是否为首轮输入的，从而提高的交互的准确性。
111.s304：根据所述多轮对话场景对应的交互信息模板，确定所述语音信息的回复信息；其中，所述交互信息模板中包含所述多轮对话场景的每一轮的语音信息和所述语音信息对应的语义信息。
112.s305：将所述回复信息进行播报。
113.其中，交互信息模板中包含语音信息、语义信息以及回复信息。如表2所示，其为交互信息模板。
114.表2交互信息模板
115.语音信息语义信息回复信息语音1语义1回复1语音2语义2 语音3语义3回复3
116.当然，除上述三种信息之外，还可以将场景信息、关键词以及类型等信息均存储到交互信息模板中，对此，本技术不做限定。
117.在本技术实施例中，根据交互信息模板确定输入语音对应的回复。例如：语音1存在对应的回复1，因此可以根据语音1确定回复1；而语音2并不存在对应的回复信息，因此根据语义2进行处理，得到语音2的回复。需要说明的是，若回复信息的优先级高于语义信息；即若在交互信息模板中一个语音及存在语义信息，也存在回复信息，此时，直接根据回复信息确定回复。具体可实施为：
118.若所述多轮对话场景对应的交互信息模板中存在所述语音信息对应的回复信息，则将所述回复信息作为所述语音信息的回复信息；或，
119.若所述多轮对话场景对应的交互信息模板中不存在所述语音信息对应的回复信息，则从所述多轮对话场景对应的交互信息模板中获取所述语音信息的语义信息，并通过所述多轮对话场景的处理模块对所述语义信息进行处理，得到所述语音信息的回复信息。
120.这样，通过预设的回复信息以及语义信息来确定最终的回复信息。这样，根据不同的语音信息，采用不同的方式确定回复信息可以使交互更加准确。
121.在本技术实施例中，除了提供一种智能终端，还提供了一种服务器，所述服务器包括：处理器和存储器；
122.所述处理器用于识别用户的语音信息；对所述语音信息进行解析，确定所述语音信息的特征信息；根据所述语音信息的特征信息确定所述语音信息匹配的多轮对话场景；根据所述多轮对话场景对应的交互信息模板，确定所述语音信息的回复信息；其中，所述交互信息模板中包含所述多轮对话场景的每一轮的语音信息和所述语音信息对应的语义信息；将所述回复信息发送给智能终端，以使所述智能终端播报所述回复信息；
123.所述存储器用于存储所述多轮对话场景对应的交互信息模板。
124.具体来说，用户在与本技术实施例提供的智能终端进行交互时，如图4所示，用户向智能终端发送语音信息，智能终端根据收音单元获取用户输入的语音信息，并将语音信息发送给服务器，而服务器根据语音信息确定对应的对话场景，并根据对话场景确定回复信息，最终将确定的回复信息发送给智能终端，使智能终端将回复信息播报给用户。这样，由服务器对语音信息进行处理，可以更加快速的确定对应的回复信息。
125.以下通过一种应用于服务器的多轮语音交互方法进行详细介绍。如图5所示，该方法具体包括以下步骤：
126.s501：识别用户的语音信息。
127.s502：对所述语音信息进行解析，确定所述语音信息的特征信息。
128.s503：根据所述语音信息的特征信息确定所述语音信息匹配的多轮对话场景。
129.s504：根据所述多轮对话场景对应的交互信息模板，确定所述语音信息的回复信息；其中，所述交互信息模板中包含所述多轮对话场景的每一轮的语音信息和所述语音信息对应的语义信息。
130.s505：将所述回复信息发送给智能终端，以使所述智能终端播报所述回复信息。
131.其中，图5中的各个步骤的具体实现方式可以参照前文论述的内容，此处不再赘述。
132.通过获取语音信息的特征信息来确定该语音的应用场景，并根据该应用场景对应
的交互信息模板，确定回复信息。这样，在确定回复信息之前先确定该语音信息的应用场景，可以更加准确的确定的回复信息，从而提高交互的准确性。且由服务器对语音信息进行处理，可以更加快速的确定对应的回复信息。
133.基于同一发明构思，本技术实施例还提供一种完整的多轮交互方法，如图6所示。其中，根据用户的输入，判断场景标识时是否超过期限，如果超过期限说明是用户多轮交互中的首轮输入，否则是用户多轮交互中的非首轮输入。若语音信息为首轮输入，则根据语音信息的类型信息确定多轮对话场景；若语音信息不为首轮输入，则根据场景标识确定多轮对话场景；如果匹配失败，直接返回错误信息给用户，提醒用户输入正确的查询信息；如果匹配成功，则确定交互信息模块板存在对应的回复信息，若存在，确定对应的回复信息，若不存在，则确定对应的语义信息，并根据语义信息确定回复信息。将交互信息存储到数据库中，并将回复信息进行播报。
134.需要说明的是，本技术提供的多轮语音交互方法可应用于各种多轮对话场景，尤其应用于家庭场景。其中，家庭场景下主要包含以下功能涉及到多轮交互：老人健康管理，全屋找人，智能终端控制等，下面通过具体实施例分别介绍每个功能对应的业务逻辑及多轮交互实现过程。
135.第一、老人健康管理
136.首先构建老人健康管理交互场景的交互信息模板，如表3所示，其为老人健康管理交互场景的交互信息模板：
137.表3老人健康管理交互场景的交互信息模板
[0138][0139][0140]
其中，表3中存储了该多轮对话场景中的所有可能语音信息。
[0141]
在本技术实施例中，老人健康管理场景下的具体的多轮交互实现场景可以为：
[0142]
用户：用药管理。
[0143]
交互设备：请说出您的药物名称。
[0144]
用户：降血压药。
[0145]
交互设备；请说出药物的含量。
[0146]
用户：150片。
[0147]
交互设备：请说出您每天的耗量。
[0148]
用户：3片。
[0149]
而实现上述过程是基于以下方法进行实现的，如图7所示，确定用户首轮的输入“用药管理”，其中，“用药管理”为本技术中的语音信息；因为在数据库中并未找到上述应用标识或者上一轮应用场景已经过期，则用户输入的信息为首轮信息；通过对“用药管理”进行解析，确定这句话的类型信息，从而确定多轮交互场景为老人健康管理场景；在本技术实施例中，“用药管理”的类型信息为健康管理类型，从而根据健康管理类型确定对应的多轮对话场景。根据确定的老人健康管理场景，找到对应的交互信息模板，如表3所示，基于交互信息模板中存在用药管理对应的回复信息，则将对应的回复信息“请说出您的药物名称”进行播报，并将交互信息存储到数据库中，其中，具体将语音信息“用药管理”，场景标识“老人健康管理”以及用户输入“用药管理”的时间存储到数据库中。
[0150]
用户根据智能终端的提示进行第二轮的输入“降血压药”，由于在数据库中找到了上一轮的应用标识且上一轮输入的时间与本轮输入的时间之差未超过预设时间差，则确定当前轮对话为第二轮交互，从而根据获取的场景标识确定次轮的多轮对话场景，根据存储的上一轮交互信息中的场景标识“老人健康管理”确定多轮对话场景为老人健康管理场景。基于交互信息模板中存在降血压药对应的回复信息，则将对应的回复信息“请说出药物的含量”进行播报，并将第二轮的交互信息存储到数据库中。下一轮的处理情况跟第二轮类似。因为用户和交互设备之间的多轮问答式交互是为了完成一次用药存储记录，所以先把上一轮的数据找到并把这一轮的数据进行更新，直到所有的数据都得，完成老人健康管理的一次记录的输入。
[0151]
第二、全屋找人
[0152]
构建全屋找人交互场景的交互信息模板，如表4所示，其为全屋找人交互场景的交互信息模板：
[0153]
表4全屋找人交互场景的交互信息模板
[0154][0155]
在本技术实施例中，全屋找人场景下的具体的多轮交互实现场景可以为：
[0156]
用户：爸爸在哪里。
[0157]
交互设备：爸爸不在家。
[0158]
用户：那妈妈呢。
[0159]
交互设备；妈妈在客厅。
进行解析，确定这句话的类型信息，从而确定多轮交互场景为智能终端控制场景；在本技术实施例中，“打开空调”的类型信息为智能终端控制类型，从而根据智能终端控制类型确定对应的多轮对话场景。根据确定的智能终端控制交互场景，找到对应的交互信息模板，如表5所示，基于交互信息模板中存在打开空调对应的回复信息，则将对应的回复信息“请问打开哪里的空调”进行播报，并将交互信息存储到数据库中，其中，具体将语音信息“打开空调”，场景标识“智能终端控制”以及用户输入“打开空调”的时间存储到数据库中。用户根据智能终端的提示进行第二轮的输入“客厅”，由于在数据库中找到了上一轮的应用标识且上一轮输入的时间与本轮输入的时间之差未超过预设时间差，则确定当前轮对话为第二轮交互，从而根据获取的场景标识确定次轮的多轮对话场景，因为用户这一轮的回答“客厅”没有匹配结果，故交互信息模板匹配失败。本轮需要查询问法数据库，得到本轮的意图再调用相应的函数实现相应的功能。
[0172]
在示例性实施例中，还提供了一种包括指令的存储介质，例如包括指令的存储器，上述指令可由终端的处理器执行以完成上述方法。可选地，存储介质可以是非临时性计算机可读存储介质，例如，所述非临时性计算机可读存储介质可以是rom、随机存取存储器(ram)、cd-rom、磁带、软盘和光数据存储设备等。
[0173]
本技术实施例还提供一种计算机程序产品，当所述计算机程序产品在终端上运行时，使得所述终端执行实现本技术实施例上述任意一项多轮语音交互方法。
[0174]
本领域技术人员在考虑说明书及实践这里发明的发明后，将容易想到本技术的其它实施方案。本技术旨在涵盖本技术的任何变型、用途或者适应性变化，这些变型、用途或者适应性变化遵循本技术的一般性原理并包括本技术未发明的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的，本技术的真正范围和精神由下面的权利要求指出。
[0175]
应当理解的是，本技术并不局限于上面已经描述并在附图中示出的精确结构，并且可以在不脱离其范围进行各种修改和改变。本技术的范围仅由所附的权利要求来限制。

再多了解一些

1/2 1 2 下一页尾页

本文用于企业家、创业者技术爱好者查询，结果仅供参考。

上一篇：返回列表
下一篇：语音唤醒方法、装置、存储介质及电子设备与流程

一种多轮语音交互方法、终端及服务器与流程

相关文章

最热文献