人机对话管理的方法、系统、设备及存储介质与流程

2022-02-20 19:42:24 来源：中国专利 TAG：

1.本发明涉及计算机技术领域，尤其涉及一种人机对话管理的方法、系统、设备及存储介质。

背景技术：

2.人机对话是计算机的一种工作方式，即计算机操作员或用户与计算机之间，通过控制台或终端显示屏幕，以对话方式进行工作。操作员可用命令或命令过程告诉计算机执行某一任务。现在人机对话已经广泛的应用于各个技术领域以及人们的生活中，其服务了社会，但其技术内容相当复杂。
3.如图1所示，左边最底部，是最基础的大数据、机器学习和语言学(linguistics)；往上看，是知识图谱(knowledge graph)，其中包含了实体图谱、注意力图谱和意图图谱。再往上，左侧是语言理解(language understanding)，右侧是语言生成(language generation)——语言理解，包含了query理解、文本理解、情感分析(sentiment analysis)等，还有词法(lexical)、句法(syntax)和语义(semantic)等不同层次的分析。语言生成，包含了写作、阅读理解等等。最上方，是系统层面，包含了问答系统、机器翻译和对话系统。最右侧，是各种应用场景，包含搜索、feeds流、o2o、广告等等。
4.面对这样的场景，如何更好的针对用户的语音指令进行vad的拾音，则是本发明要解决的问题。在n lp(natural language processing，自然语言处理)中，意图代表用户想要达到的目的，是在语言表达中所体现出的“用户想干什么”，解决的是人与人，人与机器之间的通讯问题。意图是由什么组成的呢？在android intent(安卓网络)中由action(活动)，data(数据)和一些属性组成，在nlu指自然语言理解，n lp(natural language processing，自然语言处理)中，意图可以由槽位来表达，槽位就是意图的参数信息。槽位是指从句子中抽取出的特定概念。比如对一个对话式智能设备说“今天天气怎么样”，意图是什么呢？意图就是“查询天气”。那这个意图是由哪些槽位表达呢？“今天”、“北京”。vad(voice activity detection，语音活动检测)技术的主要任务是从带有噪声的语音中准确的定位出语音的开始和结束点，因为语音中含有很长的静音，也就是把静音和实际语音分离开来，因为是语音数据的原始处理，所以vad是语音信号处理过程的关键技术之一。语音识别系统在识别或者声学模型训练阶段所遇到的第一个技术就是端点检测，把静音和噪声作为干扰信号从原始数据中去除，并且端点检测对于语音识别系统的性能至关重要。
5.然而，人在说话时经常会遇到卡壳的情况。同样的，在给语音指令终端设备时这种情况也经常存在，如语音指令“我要听.....周杰伦的音乐”(重点的
……
表示卡壳的情况)。而目前大多数的语音方案商如batm(百度，阿里，腾讯，小米四大公司)、思必驰、科大讯飞等对于vad的处理主要是在语音指令中间会给一个0.5s到1s的等待过程，如在中间的这个阶段没有检测到有语音音频时，自动终止本地麦克风阵列的拾音。然而这种固定的0.5s到1s不能够适配大多数的情况或者足够多的复杂人群，如小孩和老人这类反应比较慢，或者本身认知水平较差的人群。
6.综上可知，现有技术在实际使用上显然存在不便与缺陷，所以有必要加以改进。

技术实现要素：

7.针对上述的缺陷，本发明的目的在于提供一种人机对话管理的方法、系统、设备及存储介质，以使人机对话管理适配不同的用户群体，提升人机对话管理的效果。
8.为了实现本发明的一个发明目的，本发明提供了一种人机对话管理的方法，所述方法包括：
9.间隔预设的第一时间接收语音指令中的至少一段语句；
10.根据预设的判断规则判断所述至少一段语句具有意图的概率，并在所述具有意图的概率达到预设值时，获取至少一个预读取意图；
11.调整所述第一时间为第二时间，并间隔所述第二时间接收所述语音指令的其他语句，填充所述预读取意图，获取至少一个完整的意图。
12.根据所述的方法，所述间隔预设的第一时间接收语音指令的至少一段语句包括：
13.间隔预设的第一时间接收语音指令中的至少一段语音；
14.将所述至少一段语音识别为对应的至少一段语句的文本。
15.根据所述的方法，所述根据预设的判断规则判断所述至少一段语句具有意图的概率，并在所述具有意图的概率达到预设值时，获取至少一个预读取意图包括：
16.根据预存的大数据信息和/或句法规则信息和/或语法规则信息，识别所述至少一段语句的文本的具有意图的概率；
17.在所述具有意图的概率达到预设值时，根据所述预存的大数据信息和/或句法规则信息和/或语法规则信息，获取至少一个预读取意图。
18.根据所述的方法，调整所述第一时间为第二时间，并间隔所述第二时间接收所述语音指令的其他语句，填充所述预读取意图，获取至少一个完整的意图包括：
19.将所述第一时间增大为第二时间，并间隔所述第二时间接收所述语音指令的其他语句的语音；
20.将所述其他语句的语音识别为对应的其他语句的文本；
21.根据所述其他语句的文本，获取一个或者多个槽位；
22.将所述槽位填充到所述预读取意图中，获取至少一个完整的意图。
23.根据所述的方法，在所述填充所述预读取意图，获取至少一个完整的意图之后还包括：
24.调整所述第二时间为第一时间，间隔所述第一时间接收语音指令中的至少一段语句。
25.根据所述的方法，所述预设的第一时间为在人机对话中，语音端点检测的间隔时间；
26.所述预存的大数据信息和/或句法规则信息和/或语法规则信息为预先存储在云端服务器的信息。
27.为了实现本发明的另一个发明目的，本发明还提供了一种人机对话管理的系统，所述系统包括：
28.语音接收模块，用于间隔预设的第一时间接收语音指令中的至少一段语句；
一词在此系包含任何直接及间接的电性连接手段。间接的电性连接手段包括通过其它装置进行连接。
44.参见图2，在本发明的一个实施例中，提供一种人机对话管理的方法，所述方法包括：
45.步骤s201中，间隔预设的第一时间接收语音指令中的至少一段语句；由于用户可能在发出语音指令时，例如一句完成的话，会存在多段语句，多段语句间存在时间间隔，因此在该步骤中，间隔预设的第一时间接收语音指令中的至少一段语句，一段或者多段语句可能表达了用户的意图。
46.步骤s202中，根据预设的判断规则判断所述至少一段语句具有意图的概率，并在所述具有意图的概率达到预设值时，获取至少一个预读取意图；在接收到所述一段或者多段语句后，则根据预设的判断规则判断所述至少一段语句具有意图的概率，在具有意图的概率达到预设值，可以判断其是一个预读取意图，即接收到一段语句已经可以获得用户的初步意图，但还不是完整的意图，需要根据后续的一段或者多段语句进行补充。
47.步骤s203中，调整所述第一时间为第二时间，并间隔所述第二时间接收所述语音指令的其他语句，填充所述预读取意图，获取至少一个完整的意图。在该步骤中，为了获取意图，以及适应不同的用户群体的语音表达情况，调整所述第一时间为第二时间，该第二时间是为了获得更多完善意图的语句，以填充所述预读取意图，以最终获取至少一个完整的意图。当然也可能包括多个意图，由此实现了针对不同的用户群体进行语音指令的适时拾音，对用户的语音指令更优更智能的理解，使拾音更为灵活、人性化。
48.在本发明的一个实施例中，所述间隔预设的第一时间接收语音指令的至少一段语句包括：
49.间隔预设的第一时间接收语音指令中的至少一段语音；在接收用户的语音指令时，是间隔预设的第一时间进行语音指令的接收的，可以接收一段或者多段语音；
50.将所述至少一段语音识别为对应的至少一段语句的文本。在获得一段或者多段语音后，将其识别为对应的文本信息，以实现人机交互。这里可以采用asr(automatic speech recognition，自动语音识别技术)技术。
51.在该实施例中，所述根据预设的判断规则判断所述至少一段语句具有意图的概率，并在所述具有意图的概率达到预设值时，获取至少一个预读取意图包括：
52.根据预存的大数据信息和/或句法规则信息和/或语法规则信息，识别所述至少一段语句的文本的具有意图的概率；
53.在所述具有意图的概率达到预设值时，根据所述预存的大数据信息和/或句法规则信息和/或语法规则信息，获取至少一个预读取意图。
54.在该实施例中，根据一些已经收集的大数据信息进行判断，如“我想找喜茶”、“地址”，由大数据得知喜茶是很受欢迎的饮料店，而说出这两段语句的用户想获知用户想要去找喜茶店的地址的意图的概率很高，根据大数据的信息判断达到了80％，而预设具有意图的预设值为60％则判断其是具有一个预读取意图的，这需要根据后续的信息进行补充。此外，还可以根据一些句法规则信息或者是语法规则信息进行判断，例如，用户说出了：“我想买”，根据语法规则判断，其缺少宾语，但是其已经表达其意图是想买东西，即具有预读取意图，根据预设的判断标准，这样的语法表达具有意图的概率达到了90％，也超过了预设值
60％，因此也是一个获取至少一个预读取意图。至于最后的完整的意图，需要更多信息的补充，这些信息可以是其想买的具体商品(也可以称为一个槽位)，以及该商品的购买地址的查询，这就涉及到第一个意图是买某个商品，而第二个意图是查询该商品的购买地址，这在一个语音指令中可以体现。而句法规则也可以算是语法的一部分，它根据被研究语言的固定用法论述表语、修饰语和其他词的关系。句子的结构方式；表示其在句子中相互关系的词形式的排列。根据已经收集的语句进行分析，可以获得那些句法规则信息和语法规则信息，具有意图的概率是多少，由此根据所述预设值的设置，由此获得一个或者多个预读取意图。
55.在本发明的一个实施例中，调整所述第一时间为第二时间，并间隔所述第二时间接收所述语音指令的其他语句，填充所述预读取意图，获取至少一个完整的意图包括：
56.将所述第一时间增大为第二时间，并间隔所述第二时间接收所述语音指令的其他语句的语音；
57.由此适应一些老人或者是儿童的群体的语音收集，当然也可以是将所述第一时间减小为第二时间，即第二时间小于第一时间，如在步骤s201中收集语音时，发现用户的语速比较快，如预设次数以上收集该用户的语音指令中的多个语句的时间间隔都远小于预设的第一时间，则可以适时的减小拾音的时间。
58.将所述其他语句的语音识别为对应的其他语句的文本；
59.在接收到所述其他语句的语音后，对这些语音进行识别，将其识别为对应的文本。
60.根据所述其他语句的文本，获取一个或者多个槽位；
61.在后续的接收到的语句中可以获得一个多个槽位的信息。例如，上一实施例中，例如用户说出了“我想买”，其预读取意图即用户：购物商品；然后在后续的所述其他语句的文本中，获得了“牛奶”、“澳洲的”的文本，即其两个槽位的信息为“牛奶”、“澳洲的”。
62.将所述槽位填充到所述预读取意图中，获取至少一个完整的意图。将上述的两个槽位的信息“牛奶”、“澳洲的”填充到所述预读取意图中，则最后完整的意图就是：“我想买澳洲的牛奶”。获得用户的意图后可以进行其他人机交互内容，例如可以帮助用户在互联网上购买澳洲牛奶等。
63.优选的，所述预设的第一时间为在人机对话中，语音端点检测(vad)的间隔时间；所述预存的大数据信息和/或句法规则信息和/或语法规则信息为预先存储在云端服务器的信息。
64.在本发明的一个实施例中，在所述填充所述预读取意图，获取至少一个完整的意图之后还包括：
65.调整所述第二时间为第一时间，间隔所述第一时间接收语音指令中的至少一段语句。在完成了所述获取至少一个完整的意图之后，可以将所述第二时间为第一时间，恢复原有的接收语音指令的语句的时间间隔。实现上可是恢复语音端点检测(vad)的间隔时间。
66.为了实现本发明的另一发明目的，参见图3，本发明还提供了一种人机对话管理的系统100，用于实现上述多个实施例的方法，所述系统100包括：
67.语音接收模块10，用于间隔预设的第一时间接收语音指令中的至少一段语句；
68.意图预读取模块20，用于根据预设的判断规则判断所述至少一段语句具有意图的概率，并在所述具有意图的概率达到预设值时，获取至少一个预读取意图；
69.意图获取模块30，用于调整所述第一时间为第二时间，并间隔所述第二时间接收
所述语音指令的其他语句，填充所述预读取意图，获取至少一个完整的意图。
70.在该实施例中，语音接收模块10间隔预设的第一时间接收语音指令中的一段或者多段语句，这些一段或者多段语句构成了用户发出的语音指令。由于用户说话的习惯，包括语速或者思考频率的不同，其发出的语音指令的多段语句之间存在时间间隔，在接收语音指令之前，通常会设置一个接收各个语段的间隔时间，即如所述第一时间。本发明的一个实施方式中，所述第一时间即为vad的断点时间。意图预读取模块20根据预设的判断规则，对所述至少一段语句具有意图的概率进行判断，如判断接收都一段或者两段话后，该次语音指令具有真实的用户的意图的概率是多少，如达到了70％，大于预设值，则先获取至少一个预读取意图。当然，也可能是用户一段语句已经表达了真实完整的意图，则可以直接获得用户的意图。但为了适应更多的群体，如老人和小孩，或者是一些表达比较慢的用户，为了更好的实现人机对话的管理，在系统100中设置意图获取模块30则调整所述第一时间为第二时间，间隔所述第二时间继续接收语音指令的其他语句，以获取更多的信息，填充所述预读取意图，最后获取至少一个完整的意图。
71.参见图4，在本发明的一个实施例中，所述语音接收模块10包括：
72.语音接收子模块11，用于间隔预设的第一时间接收语音指令中的至少一段语音；
73.第一语音识别子模块12，用于将所述至少一段语音识别为对应的至少一段语句的文本。所述第一语音识别子模块12为设置于所述云端服务器具有语音识别技术的模块；
74.在该实施例中，语音接收子模块11间隔预设的第一时间，如0.7秒，接收语音指令中的至少一段语音；第一语音识别子模块12将所述至少一段语音识别为对应的至少一段语句的文本。在本发明的一个实施方式中，采用包括asr和nlp(neuro-linguistic programming，自然语言理解处理)的技术所述第一语音识别子模块12为设置于所述云端服务器具有语音识别技术(asr)的模块。
75.参见图4，在本发明的一个实施例中，所述意图预读取模块20包括：
76.意图概率识别子模块21，用于根据预存的大数据信息和/或句法规则信息和/或语法规则信息，识别所述至少一段语句的文本的具有意图的概率；
77.意图预读取子模块22，用于在所述具有意图的概率达到预设值时，根据所述预存的大数据信息和/或句法规则信息和/或语法规则信息，获取至少一个预读取意图。
78.在该实施例中，所述预设的第一时间为在人机对话中，语音端点检测的间隔时间；所述预存的大数据信息和/或句法规则信息和/或语法规则信息为预先存储在云端服务器的信息。意图概率识别子模块21根据预存的大数据信息和/或句法规则信息和/或语法规则信息，识别所述至少一段语句的文本的具有意图的概率；若该一段或者多段语句具有意图的概率比较大，达到了预设值，如50％，则意图预读取子模块22可以预读取意图。通过调整所述预设值，还可以调整人机对话的灵敏度，以适应不同的用户群体。比如一些智力有障碍的用户，他们可能更需要一些人机对话管理的帮助，但是由于其表达更低于普通群体，因此在意图表达的语音指令可能则会包括更多的语句，降低所述预设值，以及接收语音指令的间隔时间，都能更好的适应着部分群体。而在本发明的一个实施方式中，所述意图概率识别子模块21为设置于所述云端服务器具有自然语言处理技术的模块。
79.参见图4，在本发明的一个实施例中，所述意图获取模块30包括：
80.间隔时间调整子模块31，用于将所述第一时间增大为第二时间，并间隔所述第二
时间接收所述语音指令的其他语句的语音；
81.第二语音识别子模块32，用于将所述其他语句的语音识别为对应的其他语句的文本；
82.槽位获取子模块33，用于根据所述其他语句的文本，获取一个或者多个槽位；
83.意图获取子模块34，用于将所述槽位填充到所述预读取意图中，获取至少一个完整的意图。
84.在该实施例中，间隔时间调整子模块31将所述第一时间增大为第二时间，如从0.7秒增大到1.5秒，并每间隔1.5秒接收所述语音指令的其他语句的语音；第二语音识别子模块32则将其他语句的语音识别为对应的其他语句的文本；所述第二语音识别子模块32为设置于所述云端服务器具有语音识别技术的模块；槽位获取子模块33根据所述其他语句的文本，获取一个或者多个槽位；意图获取子模块34则将槽位获取子模块33获得的所述槽位填充到所述预读取意图中，最终获取至少一个完整的意图。
85.此外，参见图4，所述系统100还包括：
86.语音接收恢复模块40，用于调整所述第二时间为第一时间，间隔所述第一时间接收语音指令中的至少一段语句。在完成了所述获取至少一个完整的意图之后，语音接收恢复模块将所述第二时间为第一时间，恢复原有的接收语音指令的语句的时间间隔继续接收语音指令。
87.在本发明的一个实施例中，设置于云端的语音接收子模块11、第一语音识别子模块12以及第二语音识别子模块32为asr技术的具体实现模块，在识别指令时可以实时将收到的语音指令文本同步发送到意图概率识别子模块21，意图概率识别子模块21是nlp技术的具体实现模块，nlp引擎进行所述语音指令文本识别和处理。当asr将语音指令发送到nlp引擎，则nlp引擎通过大数据或句法语法的判断其意图为播放音乐或者有声音频等，认为这大概率是一个意图，但是这个意图(对应上述实施例中的预读取意图)需要填充槽位后才是一个完整的有效的意图，则此时将vad的断点时间延长，在上述多个实施例中为所述第一时间延长至第二时间，继续接受用户的意图，如asr实时更新给nlp引擎的语音指令，则在意图槽位添加对应的槽位，当意图已完整且为有效意图，则vad恢复到正常的是没有接收到语音音频的断点。而在实际的意图中，需要考虑到的情况是，也是一个意图有多个槽位的情况，也可能存在意图转变的情况，可以根据用户可能补充的语音指令导致的意图转变的概率来进行延长。
88.具体的，假设一个人机对话管理系统100的asr对于语音指令的vad断点是没有接收到语音音频的0.7秒。以语音指令“我要听.....周杰伦的音乐”为例，云端的asr在识别指令时可以实时将收到的语音指令文本同步发送到nlp引擎进行识别和处理。当asr将“我要听”发送到nlp引擎，则nlp引擎通过大数据或句法语法的判断其意图为播放音乐或者有声音频等。则认为这大概率是一个意图，但是这个意图需要填充槽位后才是一个完整的有效的意图，则此时将vad的断点时间延长，如原本的是没有接收到音频的0.7秒，则变成1.5秒，继续接受用户的意图，如asr实时更新给nlp引擎的语音指令为“我要听周杰伦的歌”，则在意图槽位添加对应的歌手名称，则认为用户的意图为播放音乐，此时意图已完整且为有效意图，则vad恢复到正常的是没有接收到语音音频的0.7秒的断点。
89.而在实际的意图中，需要考虑到的情况也是一个意图有多个槽位的情况，也可能
存在意图转变的情况。一个意图多个槽位的情况：播放某某的特定歌曲，对应语音指令“我想听周杰伦的
……
双截棍”则虽然“我想听周杰伦的”已经是一个完整的意图，但是需要考虑到实际的语法情况的分析，如“我想听周杰伦的”存在“的”，则同样的大概率可能是一个需要填充槽位的意图，则此时面对这种情况，则将vad的断点时间延长，如原本的是没有接收到音频的0.7秒，则变成1.5秒，继续接受用户的意图。由此适应了不同群里用户的发出语音指令的情况。
90.此外，意图转换的情况：查询天气到外出天气提示对应语音指令“今天天气怎样
……
适合到外面玩吗”，则此时这种情况同时也需要结合用户过往的跟机器的一些对话历史作为参考，即已经记录的大数据信息或者一些语法规则作参考，在dm(dialog management，对话管理)控制着人机对话的过程，对话管理时则应该尤为注意该断点，对应的断点不一定非得是1.5秒，也可以根据用户可能补充的语音指令导致的意图转变的概率来进行延长。综上所述，对用户的语音指令更优更智能的理解，在此基础上能够更好的用户的语音指令进行vad的断点，使拾音更为灵活、人性化。
91.此外，为了实现本发明的另一发明目的，本发明还提供了一种终端，包括上述任意一项所述的系统100。该终端可以包括在人机对话中的设置于用户端的语音音箱、对话终端等，以及设置在云端服务器。
92.为了实现本发明的另一发明目的，本发明还提供了一种存储用于执行上述任意一种方法的计算机程序。
93.为了实现本发明的另一发明目的，本发明还提供了一种计算机设备400，包括存储介质200、处理器300以及存储在所述存储介质上并可在所述处理器300上运行的计算机程序，所述处理器300执行所述计算机程序时实现上述任一项所述的方法。
94.参见图5和图6，在本发明的一个实施例中，还提供了用于存储一种用于执行上述实施例中任意一种方法的计算机程序的存储介质200。以及一种计算机设备400，包括存储介质200、处理器300以及存储在所述存储介质200上并可在所述处理器300上运行的计算机程序，所述处理器300执行所述计算机程序时实现上述任一个实施例中的所述的方法。
95.本发明提供一种存储介质200，用于存储如图2所述任意一种方法的计算机程序。例如计算机程序指令，当其被计算机执行时，通过该计算机的操作，可以调用或提供根据本技术的方法和/或技术方案。而调用本技术的方法的程序指令，可能被存储在固定的或可移动的存储介质中，和/或通过广播或其他信号承载媒体中的数据流而被传输和/或被存储在根据程序指令运行的计算机设备的存储介质中。在此，根据本技术的一个实施例包括一个如图6所示的计算机设备400，所述计算机设备400优选包括用于存储计算机程序的存储介质200和用于执行计算机程序的处理器300，其中，当该计算机程序被该处理器300执行时，触发该计算机设备400执行基于前述多个实施例中的方法和/或技术方案。
96.需要注意的是，本技术可在软件和/或软件与硬件的组合体中被实施，例如，可采用专用集成电路(asic)、通用目的计算机或任何其他类似硬件设备来实现。在一个实施例中，本技术的软件程序可以通过处理器执行以实现上文步骤或功能。同样地，本技术的软件程序(包括相关的数据结构)可以被存储到计算机可读记录介质中，例如，ram存储器，磁或光驱动器或软磁盘及类似设备。另外，本技术的一些步骤或功能可采用硬件来实现，例如，作为与处理器配合从而执行各个步骤或功能的电路。
97.根据本发明的方法可以作为计算机实现方法在计算机上实现、或者在专用硬件中实现、或以两者的组合的方式实现。用于根据本发明的方法的可执行代码或其部分可以存储在计算机程序产品上。计算机程序产品的示例包括存储器设备、光学存储设备、集成电路、服务器、在线软件等。优选地，计算机程序产品包括存储在计算机可读介质上以便当所述程序产品在计算机上执行时执行根据本发明的方法的非临时程序代码部件。
98.在优选实施例中，计算机程序包括适合于当计算机程序在计算机上运行时执行根据本发明的方法的所有步骤的计算机程序代码部件。优选地，在计算机可读介质上体现计算机程序。
99.综上所述，本发明通过间隔预设的第一时间接收语音指令中的至少一段语句，然后根据预设的判断规则判断所述至少一段语句具有意图的概率，并在所述具有意图的概率达到预设值时，获取至少一个预读取意图，以及调整间隔接收语音指令的预设的第一时间，在接收所述语音指令的其他语句后，填充所述预读取意图，获取至少一个完整的意图。由此适应了不同的群体发出语音指令的不同情况，使人机对话管理适配了不同的用户群体，提升人机对话管理的效果及效率。
100.本发明公开了a1、一种人机对话管理的方法，所述方法包括：
101.间隔预设的第一时间接收语音指令中的至少一段语句；
102.根据预设的判断规则判断所述至少一段语句具有意图的概率，并在所述具有意图的概率达到预设值时，获取至少一个预读取意图；
103.调整所述第一时间为第二时间，并间隔所述第二时间接收所述语音指令的其他语句，填充所述预读取意图，获取至少一个完整的意图。
104.a2、根据所述的方法，所述间隔预设的第一时间接收语音指令的至少一段语句包括：
105.间隔预设的第一时间接收语音指令中的至少一段语音；
106.将所述至少一段语音识别为对应的至少一段语句的文本。
107.a3、根据a2所述的方法，所述根据预设的判断规则判断所述至少一段语句具有意图的概率，并在所述具有意图的概率达到预设值时，获取至少一个预读取意图包括：
108.根据预存的大数据信息和/或句法规则信息和/或语法规则信息，识别所述至少一段语句的文本的具有意图的概率；
109.在所述具有意图的概率达到预设值时，根据所述预存的大数据信息和/或句法规则信息和/或语法规则信息，获取至少一个预读取意图。
110.a4、根据a3所述的方法，调整所述第一时间为第二时间，并间隔所述第二时间接收所述语音指令的其他语句，填充所述预读取意图，获取至少一个完整的意图包括：
111.将所述第一时间增大为第二时间，并间隔所述第二时间接收所述语音指令的其他语句的语音；
112.将所述其他语句的语音识别为对应的其他语句的文本；
113.根据所述其他语句的文本，获取一个或者多个槽位；
114.将所述槽位填充到所述预读取意图中，获取至少一个完整的意图。
115.a5、根据a1所述的方法，在所述填充所述预读取意图，获取至少一个完整的意图之后还包括：
116.调整所述第二时间为第一时间，间隔所述第一时间接收语音指令中的至少一段语句。
117.a6、根据a1所述的方法，所述预设的第一时间为在人机对话中，语音端点检测的间隔时间；
118.所述预存的大数据信息和/或句法规则信息和/或语法规则信息为预先存储在云端服务器的信息。
119.本发明还公开了b7、一种人机对话管理的系统，所述系统包括：
120.语音接收模块，用于间隔预设的第一时间接收语音指令中的至少一段语句；
121.意图预读取模块，用于根据预设的判断规则判断所述至少一段语句具有意图的概率，并在所述具有意图的概率达到预设值时，获取至少一个预读取意图；
122.意图获取模块，用于调整所述第一时间为第二时间，并间隔所述第二时间接收所述语音指令的其他语句，填充所述预读取意图，获取至少一个完整的意图。
123.b8、根据b7所述的系统，所述语音接收模块包括：
124.语音接收子模块，用于间隔预设的第一时间接收语音指令中的至少一段语音；
125.第一语音识别子模块，用于将所述至少一段语音识别为对应的至少一段语句的文本。
126.b9、根据b8所述的系统，所述意图预读取模块包括：
127.意图概率识别子模块，用于根据预存的大数据信息和/或句法规则信息和/或语法规则信息，识别所述至少一段语句的文本的具有意图的概率；
128.意图预读取子模块，用于在所述具有意图的概率达到预设值时，根据所述预存的大数据信息和/或句法规则信息和/或语法规则信息，获取至少一个预读取意图。
129.b10、根据b9所述的系统，所述意图获取模块包括：
130.间隔时间调整子模块，用于将所述第一时间增大为第二时间，并间隔所述第二时间接收所述语音指令的其他语句的语音；
131.第二语音识别子模块，用于将所述其他语句的语音识别为对应的其他语句的文本；
132.槽位获取子模块，用于根据所述其他语句的文本，获取一个或者多个槽位；
133.意图获取子模块，用于将所述槽位填充到所述预读取意图中，获取至少一个完整的意图。
134.b11、根据b7所述的系统，其特征在于，所述系统还包括：
135.语音接收恢复模块，用于调整所述第二时间为第一时间，间隔所述第一时间接收语音指令中的至少一段语句。
136.b12、根据b7所述的系统，所述预设的第一时间为在人机对话中，语音端点检测的间隔时间；
137.所述预存的大数据信息和/或句法规则信息和/或语法规则信息为预先存储在云端服务器的信息。
138.b13、根据b10所述的系统，所述第一语音识别子模块和第二语音识别子模块为设置于所述云端服务器具有语音识别技术的模块；
139.所述识别子模块为设置于所述云端服务器具有自然语言处理技术的模块。
140.本发明还公开了c14、一种终端，包括b7～b13中任意一项所述的系统。
141.本发明还公开了d15、一种存储介质，用于存储一种用于执行a1～a6中任意一种方法的计算机程序。
142.本发明还公开了e16、一种计算机设备，包括存储介质、处理器以及存储在所述存储介质上并可在所述处理器上运行的计算机程序，所述处理器执行所述计算机程序时实现a1～a6一项所述的方法。

再多了解一些

1/2 1 2 下一页尾页

本文用于企业家、创业者技术爱好者查询，结果仅供参考。

人机对话管理的方法、系统、设备及存储介质与流程

相关文献

最热文献