一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

输入数据解析方法、装置、电子设备和存储介质与流程

2023-02-01 21:37:37 来源:中国专利 TAG:


1.本公开涉及数据处理领域,具体为语音技术、物联网和自动驾驶领域,具体涉及一种输入数据解析方法、装置、电子设备和存储介质。


背景技术:

2.随着智能设备的普及,人机交互的方式朝着越来越便捷的方向发展,语音交互和手势交互等较之打字、鼠标或触屏控制是更为便利的一种方式,让机器理解人类语言,并做出响应,以使得机器更好地为人类服务。
3.具体的,语音交互设备可以将所接收到的语音上传到云端,借助云端强大的处理能力进行语音识别和自然语言理解。


技术实现要素:

4.本公开提供了一种输入数据解析方法、装置、电子设备和存储介质。
5.根据本公开的一方面,提供了一种输入数据解析方法,包括:
6.将用户提供的输入数据发送至服务器中,以使得所述服务器对所述输入数据进行在线解析;
7.对所述输入数据进行离线解析,得到离线解析结果,并对所述离线解析结果进行可信检测;
8.在离线解析结果可信且未接收到在线解析结果的情况下,获取可信的离线解析结果,并将所述可信的离线解析结果确定为所述输入数据的解析结果;
9.在离线解析结果不可信或优先接收到在线解析结果的情况下,获取所述在线解析结果,并将所述在线解析结果确定为所述输入数据的解析结果。
10.根据本公开的一方面,提供了一种输入数据解析装置,包括:
11.输入数据获取模块,用于将用户提供的输入数据发送至服务器中,以使得所述服务器对所述输入数据进行在线解析;
12.离线解析可信检测模块,用于对所述输入数据进行离线解析,得到离线解析结果,并对所述离线解析结果进行可信检测;
13.可信结果获取模块,用于离线结果获取模块,用于在离线解析结果可信且未接收到在线解析结果的情况下,获取可信的离线解析结果,并将所述可信的离线解析结果确定为所述输入数据的解析结果;
14.在线结果获取模块,用于在离线解析结果不可信或优先接收到在线解析结果的情况下,获取所述在线解析结果,并将所述在线解析结果确定为所述输入数据的解析结果。
15.根据本公开的另一方面,提供了一种电子设备,包括:
16.至少一个处理器;以及
17.与所述至少一个处理器通信连接的存储器;其中,
18.所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一
个处理器执行,以使所述至少一个处理器能够执行本公开任一实施例所述的输入数据解析方法。
19.根据本公开的另一方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,其中,所述计算机指令用于使所述计算机执行本公开任一实施例所述的输入数据解析方法。
20.根据本公开的另一方面,提供了一种计算机程序对象,包括计算机程序,所述计算机程序在被处理器执行时实现本公开任一实施例所述的输入数据解析方法。
21.本公开实施例可以提高输入数据解析的准确性。
22.应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。
附图说明
23.附图用于更好地理解本方案,不构成对本公开的限定。其中:
24.图1是根据本公开实施例公开的一种输入数据解析方法的流程图;
25.图2是根据本公开实施例公开的另一种输入数据解析方法的流程图;
26.图3是根据本公开实施例公开的另一种输入数据解析方法的流程图;
27.图4是根据本公开实施例公开的另一种输入数据解析方法的场景图;
28.图5是根据本公开实施例公开的一种输入数据解析装置的结构图;
29.图6是用来实现本公开实施例的输入数据解析方法的电子设备的框图。
具体实施方式
30.以下结合附图对本公开的示范性实施例做出说明,其中包括本公开实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本公开的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
31.图1是根据本公开实施例公开的一种输入数据解析方法的流程图,本实施例可以适用于对输入数据进行解析的情况。本实施例方法可以由输入数据解析装置来执行,该装置可采用软件和/或硬件的方式实现,并具体配置于具有一定数据运算能力的电子设备中,该电子设备可以是客户端设备,客户端设备例如手机、平板电脑、车载终端、台式电脑和物联网设备等。
32.s101,将用户提供的输入数据发送至服务器中,以使得所述服务器对所述输入数据进行在线解析。
33.输入数据用于识别解析得到指令,以指示相应的模块或设备执行,实现人机交互。用户提供的输入数据,可以是用户通过文本、语音、图像和视频等方式提供的数据。可以直接将输入数据(即源数据)发送至服务器。或者可以对输入数据进行处理,将处理后的输入数据发送至服务器。服务器用于对输入数据进行在线解析,以确定用户的意图。服务器置于网络中,与当前的电子设备进行网络通信,相应的,服务器对输入数据进行解析是一种在线解析过程。服务器反馈的解析结果为在线解析结果。
34.s102,对所述输入数据进行离线解析,得到离线解析结果,并对所述离线解析结果
进行可信检测。
35.对输入数据进行离线解析,实际是利用本地资源对输入数据进行解析,即不利用网络资源对输入数据进行解析。离线解析结果是在本地运行解析过程,得到的解析结果,也即是指在难以获取网络资源的环境中运行的解析过程,其中,难以获取网络资源的环境可以是指无网络或者弱网络的环境。离线解析结果可以包括动作和动作对象,例如,离线解析结果为操作 对象。示例性的,输入语句为语音“打开车窗”,离线解析结果为打开操作和操作对象为车窗。可信检测用于检测离线解析结果是否可信。示例性的,可以采用置信度、准确性、能否生成指令和生成的指令是否可用等至少一项参数检测离线解析结果是否可信。
36.s103,在离线解析结果可信且未接收到在线解析结果的情况下,获取可信的离线解析结果,并将所述可信的离线解析结果确定所述输入数据的解析结果。
37.s104,在离线解析结果不可信或优先接收到在线解析结果的情况下,获取所述在线解析结果,并将所述在线解析结果确定为所述输入数据的解析结果。
38.实际上,在线解析结果和可信的离线解析结果可以理解为准确的解析结果。在线解析结果和可信的离线解析结果中,将优先获取的解析结果,即将时间顺序上,最先获取的解析结果,确定为输入数据的解析结果。如果离线解析结果不可信,则等待接收在线解析结果,并将接收到的在线解析结果确定为输入数据的解析结果。
39.可选的,所述输入数据解析方法还包括:在离线解析结果可信的情况下,获取可信的离线解析结果;拦截所述服务器发送的在线解析结果;在所述离线解析结果不可信的情况下,等待接收所述服务器反馈的在线解析结果;接收到所述服务器反馈的在线解析结果。
40.获取到可信的离线解析结果,如果此时还未接收到在线解析结果,则拦截在线解析结果,不对在线解析结果进行任何处理,可以直接丢弃在线解析结果,释放等待处理在线解析结果的资源。在离线解析,以及离线解析结果的可信检测的过程中,一旦获取到在线解析结果,就停止离线解析的过程,释放离线解析使用的资源。
41.如果确定离线解析结果不可信,则等待接收在线解析结果。如果等待超时,则向用户进行反馈响应超时。避免处理不可信的离线解析结果,从而导致错误执行操作。若在自动驾驶领域,处理不可信的离线解析结果甚至会造成安全事故。
42.通过对可信的离线解析结果进行处理,拦截在线解析结果,并在离线解析结果不可信的情况下,等待接收在线解析结果,可以提高采用的解析结果可信,提高解析准确性,并且可以基于解析结果,正确执行,提高交互准确性,并且将优先获取的解析结果作为后续处理的输入,可以提高人机交互响应速度。
43.可选的,根据输入数据的解析结果生成指令,并将指令发送至对应的模块中,以使该模块执行该指令,实现相应功能。
44.在现有技术中,例如,在语音识别过程中,特别是弱网状态下,指令长时间不返回或者提示网络报错之类,会影响用户对智能设备的使用。同时因离线解析准确性不高的问题,导致直接使用离线解析结果进行指令解析时,容易出现指令解析错误的问题。
45.根据本公开的技术方案,通过同时进行在线解析和离线解析,并采用时间最前且最可信的解析结果,确定为用户输入数据的解析结果,兼顾解析效率和准确性,实现实时准确响应用户请求。
46.图2是根据本公开实施例公开的另一种输入数据解析方法的流程图,基于上述技
术方案进一步优化与扩展,并可以与上述各个可选实施方式进行结合。所述对所述离线解析结果进行可信检测,包括:对所述离线解析结果的准确性和可用性进行检测。
47.s201,将用户提供的输入数据发送至服务器中,以使得所述服务器对所述输入数据进行在线解析。
48.获取用户语音数据,将用户语音数据发送至服务器进行在线语音识别,得到语音识别结果。在无网或者弱网情况下,当前的电子设备对用户语音数据进行离线语音识别,得到语音识别结果。
49.可选的,所述对所述输入数据进行离线解析,得到离线解析结果,包括:对所述输入数据进行语音识别;对语音识别结果进行语义解析,得到离线解析结果。
50.输入数据为用户语音数据。应用于语音交互场景中。用户语音数据为用户语音形成的音频数据。用户与当前的电子设备进行语音交互,当前的电子设备经过用户授权,录制用户语音,得到用户语音数据,并确定为用户提供的输入数据。可以采用自动语音识别技术(automatic speech recognition)实现语音识别,具体是将语音信号转换为文本指令。其中,当前的电子设备对用户语音数据进行语音识别,具体的,语音识别过程是离线运行的过程。
51.通过获取用户语音数据,并文本识别得到语音识别结果,可以针对语音交互的场景,提高语音交互控制的准确性和实时性。
52.可选的,输入数据解析方法还包括:对语音识别结果进行分词,得到至少一个备选词语;获取所述备选词语的读音信息;在预存的期望词语中,查询与所述备选词语的读音信息匹配的期望词语;将所述期望词语替换所述备选词语,并对所述语音识别结果进行修正。
53.离线语音识别的语音识别结果往往不是很准确,可以采用一些方式对语音识别结果进行修正。备选词语用于作为修正单元,检测是否存在错误,以进行修正。读音信息可以是指备选词语的读音。预存的期望词语是指期望得到的词语,具体是指期望得到应用于与控制领域内控制对象或者控制操作等关联的词语。可以根据当前的电子设备的功能模块的功能,以及控制功能,确定期望的词语。示例性的,当用户发出“zheyanglian”实际是表示控制对象是“遮阳帘”,但离线识别结果有可能识别为“这样年”,此时期望词语为“遮阳帘”。此外,用户可能会带有方言口音,导致离线识别结果与实际的用户想要表达的语音内容相差较大。期望词语可以适配用户想要表达的控制功能相关的且标准化的内容,即对用户语音识别结果进行规范和标准化,进而适配控制功能,准确识别语音得到语音识别结果。
54.备选词语的与读音信息匹配的期望词语,备选词语的读音与期望词语的读音相同或相近。期望词语用于替换备选词语,并修正语音识别结果。示例性的,读音相同或相近,可以是指检测备选词语的读音和期望词语的读音中,存在的相同的音节的数量占备选词语的总音节的数量的比值大于等于预设阈值。其中,音节可以是字的读音。词语通常为至少一个字。
55.可以获取已知的常用的测试语音问题(query)集合构成,测试集合可以是单个汉字、词组或句式等构成。但是因不同的用户的口音及实际发音情况不一样,实际离线语音误识别“遮阳帘”可能识别为“这样帘”、“这阳帘”、“遮样年
”……
出现这种情况时,示例性的,可以将该识别的备选词语“这样年”纠错为期望词语“遮阳帘”,得到更为准确的离线解析结果,以便能够基于离线解析结果解析出正确的指令。
56.可以通过模糊的音节匹配的策略来实现词汇的纠错。具体的,查询与备选词语的读音信息匹配的期望词语,可以包括:将读音信息中至少两个音节,与备选词语的读音信息中至少两个音节相同的期望词语,确定为与备选词语的读音信息匹配的期望词语。示例性的,备选词语“遮样年”的读音信息为“zheyangnian”,期望词语“遮阳帘”的读音信息为“zheyanglian”,存在“zhe”和“yang”这两个音节相同,从而确定期望词语“遮阳帘”与备选词语“遮样年”匹配。此外,还可以进一步设定将读音信息中至少两个连续音节,与备选词语的读音信息中至少两个连续音节相同的期望词语,确定为与备选词语的读音信息匹配的期望词语。此外,备选词语的语言还可以适用于英文、法文或日文等,对此不具体限定。
57.通过对语音识别结果进行修正,可以提高语音识别准确性,进而根据准确的语音识别结果进行在离线解析,可以提高解析结果的准确性。
58.s202,对所述输入数据进行离线解析,得到离线解析结果,并对所述离线解析结果的准确性和可用性进行检测。
59.准确性用于检测离线解析结果是否解析准确,可用性用于检测离线解析结果是否可用于后续操作。示例性的,准确性可以通过离线解析结果的解析置信度、用于解析输入数据的额外数据是否存在以及是否丰富和输入数据的处理准确性等至少一项进行检测。可用性可以通过离线解析结果是否可执行,是否可生成指令,以及生成的指令是否可执行等至少一项进行检测。
60.s203,在离线解析结果可信且未接收到在线解析结果的情况下,获取可信的离线解析结果,并将所述可信的离线解析结果确定为所述输入数据的解析结果。
61.s204,在离线解析结果不可信或优先接收到在线解析结果的情况下,获取所述在线解析结果,并将所述在线解析结果确定为所述输入数据的解析结果。
62.可选的,所述对所述离线解析结果的准确性进行检测,包括下述至少一项:获取所述输入数据对应的语句识别自信分,并检测所述语句识别自信分是否大于等于预设自信分阈值;和检测是否可获取多轮对话的信息。
63.语句识别自信分用于检测语句识别准确率,通常自信分越高,语句识别准确率越高。其中,输入数据为文本识别结果。解析结果为文本识别结果的语义解析结果。示例性的,输入数据为语音识别结果,语句识别自信分为语音识别自信分;输入数据为图像识别结果,语句识别自信分为图像识别自信分。自信分阈值用于检测输入数据的语句识别是否准确。仅针对语句识别自信分,语句识别自信分大于等于自信分阈值的情况下,确定输入数据的语句识别准确;在语句识别自信分小于自信分阈值的情况下,确定输入数据的语句识别不准确。示例性的,可以采用预先训练的机器学习模型检测语句识别自信分。
64.多轮对话是指针对同一意图进行多轮问答以明确用户的意图。可获取多轮对话的信息,表明输入数据为多轮对话中某一轮对话的对话数据,从而输入数据可以结合多轮对话的信息,优化用户的意图,表明可以更加清楚明确该输入数据的意图,更容易得到准确的解析结果。此外,在多轮对话场景中,还可以基于上下文状态,对输入数据进行解析,以修正或者优化离线解析结果,提高离线解析结果的准确性。也即,多轮对话的场景可以增加输入数据的丰富性,增加更具有意图代表性的内容,从而,提高离线解析结果的准确性。通常,在语音交互场景中,会存储有对话的信息,具体可以包括对话标识信息、是否是多轮对话和对话是否结束等信息。并且,在多轮对话的场景中,还会存储有多轮对话的前后对话内容、对
话类型和意图等信息。示例性的,可以检测在获取输入数据的同时,检测是否可获取多轮对话的信息,表明输入数据是否处于多轮对话的某一轮对话中。可以在输入数据所在的当前对话为多轮对话,且多轮对话未结束的情况下,确定可获取多轮对话的信息;在输入数据所在的当前对话不是多轮对话,或者多轮对话已结束的情况下,确定不可获取多轮对话的信息。在可获取多轮对话的信息的情况下,确定输入数据的语句识别准确;在不可获取多轮对话的情况下,确定输入数据的语句识别不准确。示例性的,可以基于第一轮对话中用户提供的输入数据,确定第一轮对话的意图,并对输入数据和/或意图进行检测,检测是否为多轮对话,如果是则标注对话为多轮对话,并记录多轮对话未结束状态。可以预设多轮对话的意图,例如,多轮对话的意图为导航意图,示例性的,输入数据的意图为导航到a地,可以确定可获取多轮对话的信息,同时还可以沿用该多轮对话的上下文信息和意图等,用户短时间内提供的第二次输入数据,确定第二次输入数据实际为多轮对话中的第二轮对话,可以根据多轮对话的上下文信息和意图,即第一轮对话和所确定的意图,对第二次输入数据进行意图检测。又如,预设多轮对话的内容,例如,多轮对话的内容为预设描述状态的内容,例如,第一轮用户提供的输入数据为“天气很热”,可以确定第一轮输入数据为多轮对话,并且后续电子设备可以反馈“是否要打开窗户”的问句,即第二轮对话,相应用户第三轮提供的输入数据可以为“是”或者“否”,此时第三轮输入数据与前两轮对话为同一个多轮对话的对话内容。此外还有其他情况,具体根据需要进行设定。
65.在语句识别自信分大于等于自信分阈值,且可获取多轮对话的信息的情况下,确定输入数据的语句识别准确;在语句识别自信分小于自信分阈值或不可获取多轮对话的信息的情况下,确定输入数据的语句识别不准确。此外,还有其他情况可以确定准确性,例如,检测离线解析结果的准确性,对此不具体限定。
66.通过检测语句识别自信分和多轮对话,确定离线解析结果的准确性,可以简化检测准确性过程,以及通过多个角度检测准确性,提高准确性检测精度。
67.可选的,所述对所述离线解析结果的可用性进行检测,包括下述至少一项:获取所述离线解析结果的预测意图,检测所述离线解析结果对应的预测意图是否为离线支持意图;和检测所述离线解析结果是否解析得到可信指令。
68.离线支持意图是指在离线场景中可以实现相应功能的意图。可以理解的是,一些意图对应的功能的实现需要网络交互获取资源,例如,导航意图,需要从网络中获取地图资源数据,在离线场景中,无法获取这部分资源,从而无法实现导航意图对应的功能。此外,一些意图的处理过程需要在线执行,离线场景的当前电子设备不具有执行意图对应的操作的能力,例如,意图对应的操作为对用户的权限信息进行验证的操作,该操作由服务器执行。在离线场景中,无法执行该操作,从而无法执行该意图对应的操作。具体的,离线支持意图,可以是指不依赖在线资源或服务的意图。可选的,可以收集当前的电子设备的功能模块在离线场景中具备的功能,并对应确定离线支持的意图,添加到白名单中,其中,白名单存储有离线支持意图。
69.可信指令是指可以执行的指令。是否解析得到可信指令,具体包括检测是否可以生成指令,以及检测生成的指令是否可信。可信指令是指相应的功能模块可以执行该指令,并得到正确的执行结果,具体的,相应的功能模块可以获取到有效的资源正确执行该可信指令,例如,不依赖在线资源,同时仅凭离线资源可以正确处理该可信指令。
70.可选的,可以根据当前的电子设备的功能模块在离线场景中具备的功能,确定各功能模块可以执行的指令的范围,从而确定可信指令的范围。检测根据离线解析结果是否可以生成属于可信指令范围内的指令,以检测离线解析结果是否解析得到可信指令。又如,可以基于可信指令的范围,对应配置离线解析结果包括的指定字段的范围,在离线解析结果存在该范围内的任一字段的情况下,确定离线解析结果解析得到可信指令;在离线解析结果不存在该范围内的全部字段的的情况下,确定离线解析结果不能解析得到可信指令。此外,还有其他情况可以确定可用性,对此不具体限定。
71.通过检测离线支持意图和可信指令,确定离线解析结果的可用性,可以细化检测可用性过程,以及通过多个角度检测可用性,提高可用性检测精度。
72.可选的,所述检测所述离线解析结果是否解析得到可信指令,包括:检测所述离线解析结果是否解析得到至少一个功能类型匹配的指令,并确定指令可解析检测结果;获取解析得到的指令的资源依赖类型,并确定资源有效检测结果;根据所述指令可解析检测结果和所述资源有效检测结果,检测所述离线解析结果是否解析得到可信指令。
73.功能类型是指解析得到的指令对应的功能的类型,可以根据输入数据实现的功能或离线解析结果对应的意图等确定。示例性的,在物联网场景中,控制的电子设备为音箱,可实现的功能包括播放歌曲,功能类型可以包括切换歌曲或调整音量等类型。相应功能类型匹配的指令包括歌曲切换指令或音量调整指令。
74.指令可解析检测结果用于确定离线解析结果是否可以解析得到指令。指令可解析检测结果包括可解析结果和不可解析结果。示例性的,可以根据功能类型配置多个解析方式,采用多个解析方式,检测是否可以对离线解析结果进行解析。解析得到的指令可以包括功能类型匹配的指令、通用指令或空等。在任意一个解析方式可解析情况下,可以解析得到功能类型匹配的指令,以及指令可解析检测结果为可解析结果;在各解析方式均可解析情况下,可以解析得到的通用指令,以及指令可解析检测结果为不可解析结果,或者在各解析方式均可解析情况下,无法得到指令,即解析得到的指令为空,以及指令可解析检测结果为不可解析结果。示例性的,解析过程可以是将离线解析结果中指定字符替换为功能模块可识别的目标字符,功能类型配置解析方式,可以是配置功能类型对应的替换规则。
75.资源依赖类型用于确定在指令执行过程中所需的资源的类型。资源依赖类型包括在线资源依赖类型或离线资源依赖类型等。又如,资源依赖类型包括有效资源依赖类型或无效(不可信)资源依赖类型等。资源有效检测结果用于检测是否可以获取有效的在指令执行过程中所需的资源,从而用于检测解析得到的指令是否可执行。资源有效检测结果包括有效资源或无效资源。可以根据资源依赖类型确定资源有效检测结果。具体的,可以预设资源依赖类型与资源有效检测结果之间的对应关系。在一个具体的例子中,资源依赖类型为在线资源依赖类型,确定资源有效检测结果为无效资源;资源依赖类型为离线资源依赖类型,确定资源有效检测结果为有效资源。
76.指令可解析检测结果和资源有效检测结果用于共同配合检测离线解析结果是否解析得到可信指令。根据指令可解析检测结果和资源有效检测结果,确定可以解析得到功能类型匹配的指令,并且该指令可正确执行,相应确定离线解析结果解析得到可信指令;根据指令可解析检测结果和资源有效检测结果,确定不能解析得到功能类型匹配的指令,或者是解析得到的功能类型匹配的指令无法正确执行,相应确定离线解析结果无法解析得到
可信指令。具体的,在指令可解析检测结果为可解析结果,且资源有效检测结果为有效资源的情况下,确定离线解析结果解析得到可信指令;在指令可解析检测结果为不可解析结果,或资源有效检测结果为无效资源的情况下,确定离线解析结果不能解析得到可信指令。
77.可以配置指令生成模块,指令生成模块对离线解析结果进行处理,根据功能模块的信息,生成适配功能模块的指令,以及对指令进行可信检测。通过指令生成模块,检测所述离线解析结果是否解析得到至少一个功能类型匹配的指令,并确定指令可解析检测结果;获取解析得到的指令的资源依赖类型,并确定资源有效检测结果。根据指令可解析检测结果和资源有效检测结果检测离线解析结果是否解析得到可信指令。
78.通过离线解析结果是否可以解析得到指令,以及解析得到的指令是否依赖有效资源,检测离线解析结果是否可以解析得到可信指令,实现对离线解析结果的可用性进行检测,从解析角度和可执行的角度检测可用性,丰富可用性的检测维度,以及增加检测范围,提高可用性检测精度。
79.可选的,对所述离线解析结果进行可信检测可以包括:获取所述输入数据对应的语句识别自信分,并检测所述语句识别自信分是否大于等于预设自信分阈值;检测是否可获取多轮对话的信息;获取所述离线解析结果的预测意图,检测所述离线解析结果对应的预测意图是否为离线支持意图;和检测所述离线解析结果是否解析得到可信指令。在语句识别自信分大于等于预设自信分阈值,可获取多轮对话的信息,且离线解析结果可解析得到可信指令的情况下,确定离线解析结果可信;或者在语句识别自信分大于等于预设自信分阈值,预测意图为离线支持意图,且离线解析结果可解析得到可信指令的情况下,确定离线解析结果可信。剩余情况的离线解析结果不可信。
80.根据本公开的技术方案,通过从离线解析结果的准确性和可用性检测,以确定离线解析结果是否可信,增加可信的检测维度,以及增加检测范围,提高可信检测准确性,以获取可信的离线解析结果,从而提高输入数据对应的解析结果的准确性。
81.图3是根据本公开实施例公开的另一种输入数据解析方法的流程图,基于上述技术方案进一步优化与扩展,并可以与上述各个可选实施方式进行结合。输入数据解析方法优化为还包括:获取当前多轮对话的上下文信息和对话类型;根据所述上下文信息确定关联意图;根据所述输入数据的解析结果,确定目标指令;获取所述输入数据的解析结果对应的预测意图;根据所述关联意图、所述预测意图和所述对话类型,确定目标功能模块,并将所述目标指令发送至所述目标功能模块,以使所述目标功能模块执行所述目标指令。
82.s301,将用户提供的输入数据发送至服务器中,以使得所述服务器对所述输入数据进行在线解析。
83.s302,对所述输入数据进行离线解析,得到离线解析结果,并对所述离线解析结果进行可信检测。
84.s303,在离线解析结果可信且未接收到在线解析结果的情况下,获取可信的离线解析结果,并将所述可信的离线解析结果确定为所述输入数据的解析结果。
85.s304,在离线解析结果不可信或优先接收到在线解析结果的情况下,获取所述在线解析结果,并将所述在线解析结果确定为所述输入数据的解析结果。
86.s305,获取当前多轮对话的上下文信息和对话类型。
87.在检测到可获取多轮对话的信息的情况下,即表明当前对话为多轮对话,此时可
以获取当前多轮对话的信息,具体可以包括上下信息和对话类型。当前多轮对话,是指用户提供的输入数据所在的当前对话所属的多轮对话。上下文信息是指与当前多轮对话关联的内容。示例性的,上下文信息可以包括持续时间、是否是多轮对话、多轮对话是否结束、标识信息和前面对话确定的意图等。对话类型用于确定当前多轮对话中用户的回复内容的范围。示例性的,对话类型可以包括:限制用户对话内容类型和非限制用户对话内容类型。
88.如果输入数据为首轮对话的用户输入的数据,则可以将输入数据关联的内容,确定为当前多轮对话的上下文信息,并确定对话类型,并存储上下文信息和对话类型。如果输入数据为第二轮对话的用户输入的数据,则可以直接获取预存的上下文信息和对话类型。此外,还可以根据第二轮对话的输入数据更新上下文信息和对话类型,以用于后续轮次的对话;或者仅沿用且不更新首轮对话的上下文信息和对话类型,其中,是否更新和更新的方式,可以根据需要进行设定,对此不具体限定。以此类推,针对后续轮次对话的输入数据,可以获取前几轮对话记录的上下文信息和对话类型。可以根据上下文信息确定对话类型,如果上下文信息对应的意图为限制用户对话内容的意图,例如,导航或拨打电话等意图,确定对话类型为限制用户对话内容类型;如果上下文信息对应的意图为非限制的意图,例如,打开天窗,确定对话类型为非限制用户对话内容类型。
89.s306,根据所述上下文信息确定关联意图。
90.关联意图可以是指当前多轮对话中前几轮对话确定的用户的意图。上下文信息可以包括意图,从上下文信息中提取意图,确定为关联意图。或者上下文信息包括前几轮的对话的内容,根据前几轮的对话内容,解析关联意图。s305-s306可以与s302同时执行。
91.s307,根据所述输入数据的解析结果,确定目标指令。
92.目标指令为输入数据的解析结果解析得到的指令。目标指令用于分发给功能模块进行执行。功能模块接收目标指令执行,实现用户意图对应的功能。在优先获取在线解析结果时,对在线解析结果进行解析,得到目标指令,或者直接在获取线解析结果的同时,获取服务器下发的指令,确定为目标指令。在优先获取可信的离线解析结果时,将该可信的离线解析结果解析得到的指令,确定为目标指令。在前述实施例中,需要将离线解析结果解析得到指令,并进行可信检测,相应,在可以解析得到可信指令且未等到在线解析结果的情况下,将解析得到的可信指令,确定为目标指令。在s303之后,执行s307。
93.s308,获取所述输入数据的解析结果对应的预测意图。
94.预测意图可以是指输入数据确定的意图。在多轮对话的场景中,关联意图为当前多轮对话中,前几轮对话确定的意图。预测意图为当前多轮对话中,当前轮次对话确定的意图。
95.s308可与s302同时执行。s307还可以与s304-s306的执行顺序进行调换。在输入数据的解析结果为在线解析结果的情况下,接收在线解析结果的同时,还会接收在线解析结果对应的意图,确定为输入数据的解析结果对应的预测意图。
96.s309,根据所述关联意图、所述预测意图和所述对话类型,确定目标功能模块,并将所述目标指令发送至所述目标功能模块,以使所述目标功能模块执行所述目标指令。
97.关联意图、预测意图和对话类型用于共同确定目标功能模块。目标功能模块用于执行目标指令。输入数据解析方法可以应用于物联网应用场景,目标功能模块可以配置于物联网设备中。物联网设备可以可连接网络的设备,并通过网络接收指令并执行,物联网设
备可以分为固定设备或移动设备,如固定设备为智能家居设备,移动设备为车载设备等。具体的,在物联网应用场景中,目标功能模块包括物联网设备的模块,可以包括桌子升降模块、音箱、柜门滑动模块或车窗控制的模块等。示例性的,目标功能模块为媒体控制模块,用于控制播放媒体,例如控制音频播放或视频播放等。又如,目标功能模块为电话模块,用于建立电话通信连接。又如,目标功能模块为导航模块,用于提供导航功能。又如,目标功能模块为硬件控制模块,例如,用于控制车窗、车门和空调等。此外,还有其他情况,对此不具体限定。
98.实际上,关联意图可能与预测意图不同。在多轮对话中,用户表达的意图通常一致,并且通过多次对话是描述一个完整意图。如果关联意图与预测意图不同,则需要判断用户是否更改意图,如果没有更改意图,则根据关联意图和预测意图,共同确定一个目标意图,确定目标意图对应的目标功能模块,如果更改意图,则基于预测意图,确定预测意图对应的目标功能模块。对话类型用于选择根据某几个意图确定目标意图对应的目标功能模块。例如,根据对话类型,选择预测意图对应的目标功能模块、选择关联意图对应的目标功能模块、或者选择关联意图和预测意图共同确定目标意图对应的目标功能模块,其中不同对话类型对应选择的意图不同。又如,根据对话类型和目标意图,选择预测意图对应的目标功能模块、选择关联意图对应的目标功能模块、或者选择关联意图和预测意图共同确定目标意图对应的目标功能模块。其中不同对话类型和目标意图的组合对应选择的意图不同。
99.示例性的,关联意图是调整蓝牙,预测意图是调整音量。对话类型为限制用户对话内容类型,此时对应选择根据关联意图和预测意图共同确定目标意图,即目标意图为调整蓝牙音量。若无关联意图,仅根据预测意图,无法确定是调整系统音量还是调整蓝牙音量。将调整音量的目标指令发送至蓝牙模块。又如,关联意图是打开车窗,预测意图是今天天气较热。对话类型为非限制用户对话内容类型,此时对应选择根据预测意图确定目标意图,即目标意图为询问天气。将温度检测的目标指令发送至温控模块,或者是将天气获取的指令发送至无线模块。此外还有其他示例,不具体限定,此处不应理解为对本技术方案的限制。
100.实际上,在当前多轮对话中,第一轮对话可以是基于在线解析结果生成目标指令,发送至目标功能模块,第二轮对话可以基于可信的离线解析结果生成目标指令,发送至目标功能模块;或者第一轮对话可以是基于可信的离线解析结果生成目标指令,发送至目标功能模块,第二轮对话可以基于在线解析结果生成目标指令,发送至目标功能模块。此时,不同轮次的对话中采用不同的解析结果,生成目标指令发送至目标功能模块,为了避免先后基于不同的解析结果生成指令,导致先后识别的意图有误,导致误召回的问题,基于上下文状态,确定指令发送的正确的目标功能模块,以实现正确的功能,可以提高离在线指令无缝衔接,使得在离在线解析结果切换时,可以准确确定执行目标指令的目标功能模块,提高指令执行准确性。
101.此外,在离线解析结果时,还可以根据上下文信息对输入数据进行离线解析,得到离线解析结果,提高离线解析准确性。也即输入数据解析方法还包括:在可获取多轮对话的信息的情况下,获取当前多轮对话的上下文信息。根据当前多轮对话的上下文信息对输入数据进行离线解析,以及对离线解析结果进行可信检测。相应的,也可以将上下文信息和输入数据分析发送至服务器,以使服务器根据上下文信息对输入数据进行在线解析。
102.可选的,所述根据所述关联意图、所述预测意图和所述对话类型,确定目标功能模
块,包括:在所述对话类型为限制用户对话内容类型的情况下,将所述关联意图对应的功能模块确定为目标功能模块;在所述对话类型为非限制用户对话内容类型,且所述输入数据的解析结果为在线解析结果的情况下,将所述在线解析结果的预测意图对应的功能模块确定为目标功能模块;或在所述对话类型为非限制用户对话内容类型,且所述输入数据的解析结果为离线解析结果的情况下,将所述关联意图对应的功能模块确定为目标功能模块。
103.限制用户对话内容类型是指用户的对话内容在预设范围内。非限制用户对话内容类型是指用户的对话内容无限制。示例性的,多轮对话中,当前的电子设备提供的问题是导航至:1、a地,2、b地和3、c地。用户的对话内容只能在这三个选项里面选择。用户的对话内容可以是某地,或者某个选项,这个回复方式不限制,但对话内容只能局限于提供的内容范围内。又如,多轮对话中,当前的电子设备未提供问题,或者提供的问题是调整什么呢?用户的对话内容为今天天气真热。此时用户的对话内容没有限制,可以任意回复。对话类型为限制用户对话内容类型,表明用户只能在预设范围内选择对话内容,而预设范围是基于关联意图确定的对话内容的范围,不同关联意图,对应的预设范围不同。此时,用户的意图以关联意图为主,从而,将关联意图对应的功能模块确定为目标功能模块。对话类型为非限制用户对话内容类型,表明用户可以无限制对话内容。此时用户的意图以预测意图为主,但由于可信的离线解析结果未必准确,因此,针对可信的离线解析结果,将关联意图对应的功能模块确定为目标功能模块。而在线解析结果较为准确,针对在线解析结果,将预测意图对应的功能模块确定为目标功能模块。
104.此外,如果预测意图无法确定目标功能模块,此时可以根据关联意图和预测意图共同确定目标功能模块。示例性的,关联意图是调整蓝牙,预测意图是调整音量。对话类型为限制用户对话内容类型,此时选择调整蓝牙对应的蓝牙模块,确定为目标功能模块。又如,关联意图是打开车窗,预测意图是拨打电话。对话类型为非限制用户对话内容类型。输入数据的解析结果为在线解析结果,此时选择拨打电话对应的电话模块,确定为目标功能模块。输入数据的解析结果为可信的在线解析结果,此时选择打开车窗对应的车窗控制模块,确定为目标功能模块。
105.通过预测意图、多轮对话的上下文的关联意图和对话类型,以及解析结果的离在线类型,确定目标功能模块,可以细分不同场景,确定最准确的意图,并确定对应功能模块为执行目标指令的目标功能模块,提高目标功能模块确定的准确性,提高指令执行准确性,适配不同功能模块,增加应用场景。
106.此外,如果用户提供的对话内容不在预设范围内,则向用户提供在预设范围内进行回复的提示信息。可选的,输入数据解析方法还包括:在对话类型为限制用户对话内容类型,且关联意图与预测意图不同的情况下,向用户提供输入数据的澄清信息;获取用户提供的新的输入数据;针对新的输入数据,确定新的输入数据的解析结果。澄清信息用于提示用户预设范围内进行回复的。
107.可选的,所述目标功能模块包括车载设备的模块。
108.车载设备为车辆上配置的设备,可连接网络并通过网络接收指令并执行。输入数据解析方法可以应用于车辆辅助驾驶应用场景,以及自动驾驶应用场景。当前的电子设备可以配置有目标功能模块,或者,目标功能模块与当前的电子模块所属的电子设备为相互独立的电子设备,并且,该两个电子设备可以通过网络通信。实际上,针对移动场景通常使
用手机流量等移动网络接入互联网。如果进隧道或地库等封闭式场景中,可能会出现弱网或者无网的情况,导致网络连接不稳定,导致云端服务不可靠。在云端服务不可靠时,选择可信的离线解析结果作为生成指令的依据,可以提高车辆控制的准确性和可靠性,提高车辆安全,并且可以无需长时间等待云端提供的在线解析结果,提高解析速度。
109.通过将目标功能模块配置为车载设备的模块,丰富应用场景,并且可以提高解析结果的获取速度,并兼顾解析准确性,可以提高车辆控制的准确性和可靠性,提高车辆安全。
110.根据本公开的技术方案,通过在多轮对话中,根据多轮对话的上下文信息确定关联意图,获取输入数据的解析结果对应的预测意图,根据关联意图和预测意图以及对话类型,确定目标功能模块,并将目标指令发送至目标功能模块,以执行,可以准确确定执行目标指令的目标功能模块,以正确执行目标指令,同时可实现离在线解析结果的指令切换,提高离在线解析结果切换时的解析准确性和执行准确性。
111.图4是根据本公开实施例公开的另一种输入数据解析方法的场景图。输入数据解析方法可以包括:
112.s401,语音客户端录音。
113.启动语音客户端,经过用户授权启动系统录音功能,并录制用户的语音,得到用户语音数据,并确定为用户提供的输入数据。
114.s402,将用户提供的输入数据发送至服务器中,以使得所述服务器对所述输入数据进行在线语音识别。
115.s403,服务器对输入数据的语音识别结果进行在线语义解析。
116.在线解析包括在线语音识别和在线语义解析。
117.通过网络传输,将用户提供的输入数据提供给在线语音识别引擎(即服务器),并获取到在线语音引擎返回的在线识别asr(automatic speech recognition,自动语音识别技术)结果。获取到的在线识别asr结果后,云端语音识别服务器会将识别的文本中转至在线的语义处理服务器,获取语义解析结果nlu(natural language understanding,自然语言理解),在本发明中将在线返回的nlu结果定义为r1。
118.s404,对输入数据进行离线语音识别。
119.将输入数据提供给集成至客户端的离线语音识别引擎,识别引擎会返回的离线语音识别asr结果。对语音识别结果进行分词,得到至少一个备选词语;获取所述备选词语的读音信息;在预存的期望词语中,查询与所述备选词语的读音信息匹配的期望词语;将所述期望词语替换所述备选词语,并对所述语音识别结果进行修正。返回的语音识别的asr结果因采用的是离线识别,识别的结果往往并不是非常的准确,需要进行修正,具体方法:获取识别的结果的拼音,如果识别出来的文字的音节有两个以上的音节与目标词汇的音节拼音匹配,则将识别结果替换为目标词汇。
120.s405,对得到的语音识别结果进行离线语义解析,得到离线解析结果。
121.纠正后的语音识别结果提供给本地的语义解析引擎进行语义解析,获取到离线语义解析nlu结果。同时进行在线解析和离线解析。在s402的同时执行s403。实际上,在线识别和解析得到的在线解析结果更可靠,在线解析的准确率是远高于离线解析的准确率,理论上应该使用在线解析结果,但是在线解析结果因网络波动的问题,导致返回在线解析结果
较慢,甚至因网络超时不能返回在线解析结果会导致在线解析结果无法进一步解析得到指令,并执行。
122.s406,获取输入数据对应的语句识别自信分,并检测语句识别自信分是否大于等于预设自信分阈值。
123.在对离线语音识别结果进行修正时,计算修正前的语音识别结果的语句识别自信分。根据离线识别的文字与预期定义的识别的文字及音节的匹配度计算得到语句识别自信分。具体的,获取修正前和修正后的语音识别结果的相同的字(word)的数量,与修正前的语音识别结果包括的字的数量的比值,确定为语句识别自信分。其中,如果语句识别自信分是否大于等于预设自信分阈值,则执行s406和s407,否则离线解析结果不可信,等待接收在线解析结果。
124.s407,检测是否可获取多轮对话的信息;或者获取离线解析结果的预测意图,检测离线解析结果对应的预测意图是否为离线支持意图。
125.指令行为由域domain及意图intent构成。域可以是指功能分类得到内容,在域中进一步细分意图。实际上,输入数据用于执行某些功能,可以按照功能对用户的目的进行区分,区分的大类为域,大类进一步细分小类为意图。域可以理解为一个功能的领域。离线支持的这些意图可能会因为资源、或者需要网络交互的意图比如导航相关的信息等,有可能导致离线不可用,可以预先针对这些意图进行区分。将可确定的离线可支持的意图加入白名单内。白名单中存储有域以及域下的意图。域可以采用垂类进行表示,例如,导航垂类、音乐垂类、车控垂类、系统控制垂类和电话垂类等。预测意图所属的域命中白名单,或者是预测意图命中白名单,确定预测意图为离线支持意图。如果可获取多轮对话的信息或预测意图为离线支持意图,则执行s408,否则离线解析结果不可信,等待接收在线解析结果。
126.s408,检测所述离线解析结果是否解析得到可信指令。
127.将离线解析结果发送至指令生成模块,得到指令生成模块反馈的指令和可信检测结果。通过指令生成模块检测所述离线解析结果是否解析得到至少一个功能类型匹配的指令,并确定指令可解析检测结果;获取解析得到的指令的资源依赖类型,并确定资源有效检测结果。根据指令可解析检测结果和资源有效检测结果检测离线解析结果是否解析得到可信指令。
128.指令生成模块可以分为多个功能指令生成单元,例如,导航垂类的指令生成单元、音乐垂类的指令生成单元、车控垂类的指令生成单元、系统控制垂类的指令生成单元和电话垂类的指令生成单元。当前垂类的指令生成单元能够处理该离线解析结果并生成指令,同时且该指令能获取到有效的资源,确定该生成的指令是可信的指令。如果该指令依赖在线资源及离线无法处理的指令,则确定该生成的指令是不可信的指令。如果全部的指令生成单元都无法处理该离线解析结果并生成指令,会生成一个通用的指令,并且,确定该指令是不可信的指令,例如通用的指令为不支持该指令的语音播报的tts(text to speech,语音合成技术)指令。其中,当前垂类的指令生成单元所生成的指令用于发送至当前垂类对应的功能模块执行。示例性的,导航垂类的指令生成单元生成的指令用于导航模块执行。
129.s409,在离线解析结果可信且未接收到在线解析结果的情况下,获取可信的离线解析结果,并获取可信的离线解析结果的离线指令。
130.在语句识别自信分大于等于预设自信分阈值,输入数据可获取多轮对话的信息,
且离线解析结果可解析得到可信指令的情况下,确定离线解析结果可信;或者在语句识别自信分大于等于预设自信分阈值,预测意图为离线支持意图,且离线解析结果可解析得到可信指令的情况下,确定离线解析结果可信。剩余情况的离线解析结果不可信。
131.s410,在离线解析结果不可信或者离线解析过程中,等待接收在线解析结果。
132.在不可信的离线解析结果的情况下,等待接收在线解析结果。
133.s411,在离线解析结果不可信或优先接收到在线解析结果的情况下,获取在线解析结果,并获取在线解析结果的在线指令。
134.将可信的离线解析结果的可信指令,确定为目标指令;获取在线解析结果的在线指令,并生成目标指令。获取当前多轮对话的上下文信息和对话类型;根据所述上下文信息确定关联意图;根据所述输入数据的解析结果,确定目标指令;获取所述输入数据的解析结果对应的预测意图;根据所述关联意图、所述预测意图和所述对话类型,确定目标功能模块,并将所述目标指令发送至所述目标功能模块,以使所述目标功能模块执行所述目标指令。用户输入“我要打电话”进入多轮交互,会有tts语音播报提示请问“你要打给谁”,并启动语音识别进入聆听状态,录制用户的语音,得到输入数据,此时输入数据是多轮对话中用户输入的语音数据,从而可获取多轮对话的信息。此时如果用户输入“今天的天气”,正常的执行行为应该是去拨打联系人为“今天的天气”的电话,但此时因为没有记录上下文的状态,导致“今天的天气”执行了在线指令,播报了今天的天气与预期不符。因此,在每一轮对话开始时,会记录这一轮的对话的会话信息(session),即前述上下文信息,对话的session保存着当前处理的垂类(用于区分当前处理的垂类,解决同一轮对话被其他垂类召回的问题)、是否是多轮对话、是否结束的session(用于告知当前会话结束)及session会话id(每一轮对话的唯一可识别id信息)等信息。
135.当离线与在线指令切换时,无论当前是离线解析还是在线解析,都会从保存的会话session里面读取信息,之后,分发给正确的垂类的功能模块并执行。例如,用户输入“我要打电话”,因为记录上下文信息,就不会发送给天气查询垂类的功能模块执行“今天的天气”的查询指令,而是会发送给电话垂类线的功能模块执行“今天的天气”联系人的电话查询和电话拨打指令,判断通讯录里面是否有该联系人,然后给出正确的执行行为。
136.s412,执行指令。
137.将所述目标指令发送至所述目标功能模块,以使所述目标功能模块执行所述目标指令。具体是分发给指定的目标功能模块进行执行。
138.根据本公开的技术方案,解决弱网环境下指令响应慢的问题,同时也能解决里离在线指令的无缝衔接的问题,可以方便快速的解决离在线切换时,指令因为上下文的衔接,导致误召回的问题(被识别为其他的意图),极大的提高用户的响应速度,提高用户体验。
139.根据本公开的实施例,图5是本公开实施例中的输入数据解析装置的结构图,本公开实施例适用于对输入数据进行解析的情况。该装置采用软件和/或硬件实现,并具体配置于具备一定数据运算能力的电子设备中。
140.如图5所示的一种输入数据解析装置500,包括:输入数据获取模块501、离线解析可信检测模块502、离线结果获取模块503和在线结果获取模块504;其中,
141.输入数据获取模块501,用于将用户提供的输入数据发送至服务器中,以使得所述服务器对所述输入数据进行在线解析;
142.离线解析可信检测模块502,用于对所述输入数据进行离线解析,得到离线解析结果,并对所述离线解析结果进行可信检测;
143.离线结果获取模块503,用于在离线解析结果可信且未接收到在线解析结果的情况下,获取可信的离线解析结果,并将所述可信的离线解析结果确定所述输入数据的解析结果;
144.在线结果获取模块504,用于在离线解析结果不可信或优先接收到在线解析结果的情况下,获取所述在线解析结果,并将所述在线解析结果确定为所述输入数据的解析结果。
145.根据本公开的技术方案,通过同时进行在线解析和离线解析,并采用时间最前且最可信的解析结果,确定为用户输入数据的解析结果,兼顾解析效率和准确性,实现实时准确响应用户请求。
146.进一步的,离线解析可信检测模块502,包括:准确可用检测单元,用于对所述离线解析结果的准确性和可用性进行检测。
147.进一步的,所述准确可用检测单元,包括下述至少一项:识别准确率检测子单元,用于获取所述输入数据对应的语句识别自信分,并检测所述语句识别自信分是否大于等于预设自信分阈值;和多轮对话检测子单元,用于检测是否可获取多轮对话的信息。
148.进一步的,所述准确可用检测单元,包括下述至少一项:意图检测子单元,用于获取所述离线解析结果的预测意图,检测所述离线解析结果对应的预测意图是否为离线支持意图;和可信指令检测子单元,用于检测所述离线解析结果是否解析得到可信指令。
149.进一步的,所述可信指令检测子单元,具体用于:检测所述离线解析结果是否解析得到至少一个功能类型匹配的指令,并确定指令可解析检测结果;获取解析得到的指令的资源依赖类型,并确定资源有效检测结果;根据所述指令可解析检测结果和所述资源有效检测结果,检测所述离线解析结果是否解析得到可信指令。
150.进一步的,所述离线解析可信检测模块502,包括:语音识别模块,用于对所述输入数据进行语音识别;离线解析模块,用于对语音识别结果进行语义解析,得到离线解析结果。
151.进一步的,所述输入数据解析装置,还包括:识别结果分词模块,用于对语音识别结果进行分词,得到至少一个备选词语;读音信息确定模块,用于获取所述备选词语的读音信息;期望词语查询模块,用于在预存的期望词语中,查询与所述备选词语的读音信息匹配的期望词语;识别结果修正模块,用于将所述期望词语替换所述备选词语,并对所述语音识别结果进行修正。
152.进一步的,所述输入数据解析装置,还包括:会话信息获取模块,用于获取当前多轮对话的上下文信息和对话类型;意图确定模块,用于根据所述上下文信息确定关联意图;目标指令确定模块,用于根据所述输入数据的解析结果,确定目标指令;预测意图确定模块,用于获取所述输入数据的解析结果对应的预测意图;功能模块确定模块,用于根据所述关联意图、所述预测意图和所述对话类型,确定目标功能模块,并将所述目标指令发送至所述目标功能模块,以使所述目标功能模块执行所述目标指令。
153.进一步的,功能模块确定模块,包括:第一功能确定单元,用于在所述对话类型为限制用户对话内容类型的情况下,将所述关联意图对应的功能模块确定为目标功能模块;
第二功能确定单元,用于在所述对话类型为非限制用户对话内容类型,且所述输入数据的解析结果为在线解析结果的情况下,将所述在线解析结果的预测意图对应的功能模块确定为目标功能模块;或第三功能确定单元,用于在所述对话类型为非限制用户对话内容类型,且所述输入数据的解析结果为离线解析结果的情况下,将所述关联意图对应的功能模块确定为目标功能模块。
154.进一步的,输入数据解析装置还包括:在线结果拦截模块,用于在离线解析结果可信且未接收到在线解析结果的情况下,拦截所述服务器发送的在线解析结果;在线结果等待模块,用于在所述离线解析结果不可信的情况下,等待接收所述服务器反馈的在线解析结果。
155.进一步的,所述目标功能模块包括车载设备的模块。
156.上述输入数据解析装置可执行本公开任意实施例所提供的输入数据解析方法,具备执行输入数据解析方法相应的功能模块和有益效果。
157.本公开的技术方案中,所涉及的用户个人信息的收集、存储、使用、加工、传输、提供和公开等处理,均符合相关法律法规的规定,且不违背公序良俗。
158.根据本公开的实施例,本公开还提供了一种电子设备、一种可读存储介质和一种计算机程序对象。
159.图6示出了可以用来实施本公开的实施例的示例电子设备600的示意性区域图。电子设备旨在表示各种形式的数字计算机,诸如,膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置,诸如,个人数字处理、蜂窝电话、智能电话、可穿戴设备和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例,并且不意在限制本文中描述的和/或者要求的本公开的实现。
160.如图6所示,设备600包括计算单元601,其可以根据存储在只读存储器(rom)602中的计算机程序或者从存储单元608加载到随机访问存储器(ram)603中的计算机程序,来执行各种适当的动作和处理。在ram 603中,还可存储设备600操作所需的各种程序和数据。计算单元601、rom 602以及ram 603通过总线604彼此相连。输入/输出(i/o)接口605也连接至总线604。
161.设备600中的多个部件连接至i/o接口605,包括:输入单元606,例如键盘、鼠标等;输出单元607,例如各种类型的显示器、扬声器等;存储单元608,例如磁盘、光盘等;以及通信单元609,例如网卡、调制解调器、无线通信收发机等。通信单元609允许设备600通过诸如因特网的计算机网络和/或各种电信网络与其他设备交换信息/数据。
162.计算单元601可以是各种具有处理和计算能力的通用和/或专用处理组件。计算单元601的一些示例包括但不限于中央处理单元(cpu)、图形处理单元(gpu)、各种专用的人工智能(ai)计算芯片、各种运行机器学习模型算法的计算单元、数字信号处理器(dsp)、以及任何适当的处理器、控制器、微控制器等。计算单元601执行上文所描述的各个方法和处理,例如输入数据解析方法。例如,在一些实施例中,输入数据解析方法可被实现为计算机软件程序,其被有形地包含于机器可读介质,例如存储单元608。在一些实施例中,计算机程序的部分或者全部可以经由rom602和/或通信单元609而被载入和/或安装到设备600上。当计算机程序加载到ram 603并由计算单元601执行时,可以执行上文描述的输入数据解析方法的
一个或多个步骤。备选地,在其他实施例中,计算单元601可以通过其他任何适当的方式(例如,借助于固件)而被配置为执行输入数据解析方法。
163.本文中以上描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、现场可编程门阵列(fpga)、专用集成电路(asic)、专用标准对象(assp)、芯片上系统的系统(soc)、复杂可编程逻辑设备(cpld)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括:实施在一个或者多个计算机程序中,该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释,该可编程处理器可以是专用或者通用可编程处理器,可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令,并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。
164.用于实施本公开的方法的程序代码可以采用一个或多个编程语言的任何组合来编写。这些程序代码可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器或控制器,使得程序代码当由处理器或控制器执行时使流程图和/或区域图中所规定的功能/操作被实施。程序代码可以完全在机器上执行、部分地在机器上执行,作为独立软件包部分地在机器上执行且部分地在远程机器上执行或完全在远程机器或服务器上执行。
165.在本公开的上下文中,机器可读介质可以是有形的介质,其可以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的程序。机器可读介质可以是机器可读信号介质或机器可读储存介质。机器可读介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备,或者上述内容的任何合适组合。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(ram)、只读存储器(rom)、可擦除可编程只读存储器(eprom或快闪存储器)、光纤、便捷式紧凑盘只读存储器(cd-rom)、光学储存设备、磁储存设备、或上述内容的任何合适组合。
166.为了提供与用户的交互,可以在计算机上实施此处描述的系统和技术,该计算机具有:用于向用户显示信息的显示装置(例如,crt(阴极射线管)或者lcd(液晶显示器)监视器);以及键盘和指向装置(例如,鼠标或者轨迹球),用户可以通过该键盘和该指向装置来将输入提供给计算机。其它种类的装置还可以用于提供与用户的交互;例如,提供给用户的反馈可以是任何形式的传感反馈(例如,视觉反馈、听觉反馈、或者触觉反馈);并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。
167.可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如,作为数据服务器)、或者包括中间件部件的计算系统(例如,应用服务器)、或者包括前端部件的计算系统(例如,具有图形用户界面或者网络浏览器的用户计算机,用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如,通信网络)来将系统的部件相互连接。通信网络的示例包括:局域网(lan)、广域网(wan)和互联网。
168.计算机系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。服务器可以是云服务器,也可以为分布式系统的
服务器,或者是结合了区块链的服务器。
169.应该理解,可以使用上面所示的各种形式的流程,重新排序、增加或删除步骤。例如,本发公开中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行,只要能够实现本公开公开的技术方案所期望的结果,本文在此不进行限制。
170.上述具体实施方式,并不构成对本公开保护范围的限制。本领域技术人员应该明白的是,根据设计要求和其他因素,可以进行各种修改、组合、子组合和替代。任何在本公开的精神和原则之内所作的修改、等同替换和改进等,均应包含在本公开保护范围之内。
再多了解一些

本文用于创业者技术爱好者查询,仅供学习研究,如用于商业用途,请联系技术所有人。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献