一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

应用程序的语音控制方法、装置、设备和存储介质与流程

2021-06-04 15:17:00 来源:中国专利 TAG:应用程序 语音 装置 语音识别 控制


1.本发明涉及语音识别技术领域,具体涉及一种应用程序的语音控制方法、装置、设备和存储介质。


背景技术:

2.电脑等终端中通常安装有多个应用程序,安装的应用程序可以为终端用户带来便捷的服务。随着终端的不断更新换代,终端上可运行的应用程序数量也随之增多,通过应用程序终端用户可以办公、聊天等,应用程序已经成为终端用户日常生活中不可或缺的部分。
3.当前人们为了更便捷地控制各类应用程序执行相应的操作,经常会使用语音控制的技术。通常情况下,语音识别系统提供语音识别能力,以功能模块库的形式,集成到应用程序中,应用程序通过集成语音识别功能模块,接收语音识别结果,对相应的结果进行处理,以达到响应语音控制的目的。其中,传统系统集成的方式是语音识别系统提供语音识别的软体开发工具包(software development kit,sdk),负责将语音转换成文字,应用程序在自己的系统内部集成sdk。然后通过调用sdk提供应用程序编程接口(应用程序lication programming interface,api),获取语音识别内容,再将语音转写的文字翻译成相应的指令。
4.但是,由于应用程序与sdk属于紧耦合,所以一旦sdk版本发生变化,api接口发生变化,或者sdk的版本做升级,就需要应用程序重新同步进行更新,版本发布,当需要进行维护时,就需要应用程序进行调用方式调整,维护过程繁琐,难度较高。


技术实现要素:

5.本发明提供一种应用程序的语音控制方法、装置、设备和存储介质,能够解决现有技术中因应用程序与sdk耦合度较高,导致应用程序维护过程繁琐,难度较高的技术问题。
6.本发明解决上述技术问题的技术方案如下:
7.一种应用程序的语音控制方法,包括:
8.响应于接收的语音信息为语音指令,根据预设的语音指令与快捷按键的映射关系,确定与所述语音指令相对应的快捷按键;
9.将所述快捷按键通过预设的数据传输接口发送给与所述快捷按键对应的应用程序,以控制所述应用程序执行所述快捷按键对应的操作。
10.进一步地,上述所述的应用程序的语音控制方法中,响应于接收的语音信息为语音指令,根据预设的语音指令与快捷按键的映射关系,确定与所述语音指令相对应的快捷按键之前,还包括:
11.将n组语音指令与快捷按键的映射关系显示在当前显示界面的快捷指令提示区域;
12.其中,n为自然数。
13.进一步地,上述所述的应用程序的语音控制方法中,将n组语音指令与快捷按键的
映射关系显示在当前显示界面的快捷指令提示区域,包括:
14.统计每组语音指令与快捷按键的映射关系的调用频率;
15.根据每组语音指令与快捷按键的映射关系的调用频率,确定每组语音指令与快捷按键的优先显示等级;
16.按照等级由高到低的顺序,依次显示每组语音指令与快捷按键的映射关系。
17.进一步地,上述所述的应用程序的语音控制方法中,根据每组语音指令与快捷按键的映射关系的调用频率,确定每组语音指令与快捷按键的优先显示等级,包括:
18.将调用频率小于预设频率的语音指令与快捷按键的映射关系按照调用频率由高到低的顺序等级逐渐降低的原则设置优先显示等级;
19.将调用频率大于预设频率的语音指令与快捷按键的映射关系按照调用频率由低到高的顺序等级逐渐降低的原则设置优先显示等级;
20.其中,调用频率小于预设频率的语音指令与快捷按键的映射关系中最低的优先显示等级高于调用频率小于预设频率的语音指令与快捷按键的映射关系中最高的优先显示等级。
21.进一步地,上述所述的应用程序的语音控制方法中,将n组语音指令与快捷按键的映射关系显示在当前显示界面的快捷指令提示区域之前,还包括:
22.检测当前显示界面的至少一个空白区域;
23.将至少一个所述空白区域进行标记;
24.响应于至少一个所述空白区域中的目标空白区域的选取指令,将所述目标空白区域作为所述快捷指令提示区域。
25.进一步地,上述所述的应用程序的语音控制方法中,响应于至少一个所述空白区域中的目标空白区域的选取指令,将所述目标空白区域作为所述快捷指令提示区域之后,还包括:
26.清除每个所述空白区域的标记。
27.进一步地,上述所述的应用程序的语音控制方法中,所述语音指令与快捷按键的映射关系根据所述应用程序的原有快捷按键对应的文本设定,和/或,所述语音指令与快捷按键的映射关系由用户自定义设定。
28.本发明还提供一种应用程序的语音控制装置,包括:
29.确定模块,用于响应于接收的语音信息为语音指令,根据预设的语音指令与快捷按键的映射关系,确定与所述语音指令相对应的快捷按键;
30.控制模块,用于将所述快捷按键通过预设的数据传输接口发送给与所述快捷按键对应的应用程序,以控制所述应用程序执行所述快捷按键对应的操作。
31.本发明还提供一种应用程序的语音控制设备,包括:处理器和存储器;
32.所述处理器用于执行所述存储器中存储的语音识别文本的展示方法的程序,以实现上述任一项所述的应用程序的语音控制方法。
33.本发明还提供一种存储介质,所述存储介质存储有一个或者多个程序,所述一个或者多个程序可被执行时实现上述任一项所述的应用程序的语音控制方法。
34.本发明的有益效果是:
35.响应于接收的语音信息为语音指令,根据预设的语音指令与快捷按键的映射关
系,确定与语音指令相对应的快捷按键;将快捷按键通过预设的数据传输接口发送给与快捷按键对应的应用程序,以控制应用程序执行快捷按键对应的操作,实现了语音识别功能模块和应用程序在松耦合下利用语音控制应用程序,避免sdk版本发生变化,api接口发生变化,或者sdk的版本做升级时,对应用程序进行调用方式调整。采用本发明的技术方案,能够简化应用程序维护过程,降低应用程序维护难度。
附图说明
36.图1为本发明实施例提供的一种应用程序的语音控制方法的流程图;
37.图2为本发明实施例提供的另一种应用程序的语音控制方法的流程图;
38.图3为本发明实施例的应用程序的语音控制装置的结构示意图;
39.图4为本发明实施例提供的应用程序的语音控制设备的结构示意图。
具体实施方式
40.以下结合附图对本发明的原理和特征进行描述,所举实例只用于解释本发明,并非用于限定本发明的范围。
41.图1为本发明实施例提供的一种应用程序的语音控制方法的流程图,如图1所示,本实施例的应用程序的语音控制方法具体可以包括如下步骤:
42.100、响应于接收的语音信息为语音指令,根据预设的语音指令与快捷按键的映射关系,确定与语音指令相对应的快捷按键;
43.在一个具体实现过程中,很多应用程序在开发时会设置一些常用的快捷按键,例如word、excel、绘图软件等办公用的应用程序,这些应用程序已经设置有相应的快捷按键,可以将这些快捷按键对应的文本作为语音指令,预先通过预设的数据传输接口进行注册,如,可以通过电脑中的windows os接口进行注册,从而生成语音指令与快捷按键的映射关系。
44.本实施例中,还可以由用户自定义设定语音指令与快捷按键的映射关系。例如,用户可以根据自己实际需求设置自己方便操控的快捷按键作为自己常用的指令,并将该快捷按键与语音指令对应后进行注册。
45.本实施例中,在采集到用户的语音信息后,进行语音识别,若得到的识别结果为语音指令,可以进行响应,并根据预设的语音指令与快捷按键的映射关系,确定与语音指令相对应的快捷按键,以将识别的语音指令转转成对应的快捷按键。例如,在识别结果中,提取上述语音指令内容

保存、打印、撤销、恢复,并标记为语音指令后,确定对应的快捷按键依次为:ctrl s、ctrl p、ctrl u、ctrl r。
46.101、将快捷按键通过预设的数据传输接口发送给与快捷按键对应的应用程序,以控制应用程序执行快捷按键对应的操作。
47.在将得到的语音指令转换为快捷按键后,可以将对应的快捷按键通过预设的数据传输接口发送给与快捷按键对应的应用程序,以控制应用程序执行快捷按键对应的操作,相当于在终端对快捷按键进行操控后,应用程序即可执行响应的操作,这样,则实现了语音识别功能模块和应用程序之间独立设置,降低了二者的耦合度,即使sdk版本发生变化,api接口发生变化,或者sdk的版本做升级,也可以不再对应用程序重新同步进行更新,版本发
布,当需要进行维护时,也就不再需要对应用程序进行调用方式调整。
48.本实施例的应用程序的语音控制方法,响应于接收的语音信息为语音指令,根据预设的语音指令与快捷按键的映射关系,确定与语音指令相对应的快捷按键;将快捷按键通过预设的数据传输接口发送给与快捷按键对应的应用程序,以控制应用程序执行快捷按键对应的操作,实现了语音识别功能模块和应用程序在松耦合下利用语音控制应用程序,避免sdk版本发生变化,api接口发生变化,或者sdk的版本做升级时,对应用程序进行调用方式调整。采用本发明的技术方案,能够简化应用程序维护过程,降低应用程序维护难度。
49.图2为本发明实施例提供的另一种应用程序的语音控制方法的流程图,如图2所示,本实施例的应用程序的语音控制方法具体可以包括如下步骤:
50.200、检测当前显示界面的至少一个空白区域;
51.本实施例中,可以自动检测当前显示界面的至少一个空白区域,例如,可以利用截取当前显示界面对应的图片,并利用图像识别技术检测出不包含文字、图片等内容的区域作为空白区域,从而得到至少一个空白区域。
52.201、将至少一个空白区域进行标记;
53.在得到至少一个空白区域后,可以利用带有颜色的线框将至少一个空白区域圈住,以便对至少一个空白区域进行标记。
54.202、响应于至少一个空白区域中的目标空白区域的选取指令,将目标空白区域作为快捷指令提示区域;
55.用户可以根据自己的需求,从当前显示界面的至少一个空白区域中选取目标空白区域,这样,终端可以响应用户的选取指令,并将目标空白区域作为快捷指令提示区域,并清除每个空白区域的标记。
56.需要说明的是,在当前显示界面中随着用户使用应用程序的过程,空白区域可能会随着发生变化,例如,用户可能需要用到目标空白区域,如在目标空白区域进行打字,此时,需要用户再重新选择目标空白区域。
57.203、将n组语音指令与快捷按键的映射关系显示在当前显示界面的快捷指令提示区域;
58.在一些实施例中,可能某个应用程序的快捷按键较多,用户无法记住很多快捷按键对应的语音指令,因此,用户可以自定义n的数目,这样即可将n组语音指令与快捷按键的映射关系显示在当前显示界面的快捷指令提示区域。其中,n为自然数。例如,可以将n组语音指令与快捷按键的映射关系以图片的形式插入当前显示界面的快捷指令提示区域。用户即可在当前显示界面查看到不同快捷按键对应的语音指令,从而可以不再记忆语音指令与快捷按键的映射关系,提高了用户使用语音控制应用程序的便捷性。
59.需要说明的是,如果n的数目较大,快捷指令提示区域无法将n组语音指令与快捷按键的映射关系全部显示时,可以只显示部分,并可以滚动显示n组语音指令与快捷按键的映射关系。
60.在一个具体实现过程中,该步骤可以按照如下方式实现:
61.a、统计每组语音指令与快捷按键的映射关系的调用频率;
62.在用户使用过程中,可以统计每组语音指令与快捷按键的映射关系的调用频率。
63.b、根据每组语音指令与快捷按键的映射关系的调用频率,确定每组语音指令与快
捷按键的优先显示等级;
64.具体地,可以将调用频率小于预设频率的语音指令与快捷按键的映射关系按照调用频率由高到低的顺序等级逐渐降低的原则设置优先显示等级;将调用频率大于预设频率的语音指令与快捷按键的映射关系按照调用频率由低到高的顺序等级逐渐降低的原则设置优先显示等级;其中,调用频率小于预设频率的语音指令与快捷按键的映射关系中最低的优先显示等级高于调用频率小于预设频率的语音指令与快捷按键的映射关系中最高的优先显示等级。
65.例如,ctrl s的调用频率为10次、ctrl p的调用频率为8次、ctrl u的调用频率为5次、ctrl r的调用频率为4次。4个快捷按键的等级排序为:ctrl u、ctrl r、ctrl p、ctrl s。这样,对于用户常用的快捷按键而言,用户可能已经熟记,计时不显示,也不会影响用户的使用,因此,可以将其等级降低,不再优先显示,而调用频率较低的快捷按键用户可能不能熟记,此时将其等级升高,优先显示调用频率较低的快捷按键。
66.c、按照等级由高到低的顺序,依次显示每组语音指令与快捷按键的映射关系。
67.204、响应于接收的语音信息为语音指令,根据预设的语音指令与快捷按键的映射关系,确定与语音指令相对应的快捷按键;
68.205、将快捷按键通过预设的数据传输接口发送给与快捷按键对应的应用程序,以控制应用程序执行快捷按键对应的操作。
69.本实施例的应用程序的语音控制方法,通过在当前显示界面的快捷指令提示区域显示语音指令与快捷按键的映射关系,无需用户对语音指令与快捷按键的映射关系进行记忆,而是直接快捷指令提示区域查看后,即可输入相应的语音指令,实现控制应用程序执行快捷按键对应的操作,提高了用户使用语音控制应用程序的便捷性。
70.需要说明的是,本发明实施例的方法可以由单个设备执行,例如一台计算机或服务器等。本实施例的方法也可以应用于分布式场景下,由多台设备相互配合来完成。在这种分布式场景的情况下,这多台设备中的一台设备可以只执行本发明实施例的方法中的某一个或多个步骤,这多台设备相互之间会进行交互以完成的方法。
71.图3为本发明实施例的应用程序的语音控制装置的结构示意图,如图3所示,本实施例的应用程序的语音控制装置可以包括确定模块30和控制模块31。
72.确定模块30,用于响应于接收的语音信息为语音指令,根据预设的语音指令与快捷按键的映射关系,确定与所述语音指令相对应的快捷按键;
73.本实施例中,所述语音指令与快捷按键的映射关系根据所述应用程序的原有快捷按键对应的文本设定,和/或,所述语音指令与快捷按键的映射关系由用户自定义设定。
74.控制模块31,用于将所述快捷按键通过预设的数据传输接口发送给与所述快捷按键对应的应用程序,以控制所述应用程序执行所述快捷按键对应的操作。
75.本实施例的应用程序的语音控制装置,响应于接收的语音信息为语音指令,根据预设的语音指令与快捷按键的映射关系,确定与语音指令相对应的快捷按键;将快捷按键通过预设的数据传输接口发送给与快捷按键对应的应用程序,以控制应用程序执行快捷按键对应的操作,实现了语音识别功能模块和应用程序在松耦合下利用语音控制应用程序,避免sdk版本发生变化,api接口发生变化,或者sdk的版本做升级时,对应用程序进行调用方式调整。采用本发明的技术方案,能够简化应用程序维护过程,降低应用程序维护难度。
76.在一个具体实现过程中,控制模块31,还用于检测当前显示界面的至少一个空白区域;将至少一个所述空白区域进行标记;响应于至少一个所述空白区域中的目标空白区域的选取指令,将所述目标空白区域作为所述快捷指令提示区域,并清除每个所述空白区域的标记。
77.本实施例中,在确定快捷指令提示区域后,可以将n组语音指令与快捷按键的映射关系显示在当前显示界面的快捷指令提示区域;其中,n为自然数。
78.具体地,可以统计每组语音指令与快捷按键的映射关系的调用频率;根据每组语音指令与快捷按键的映射关系的调用频率,确定每组语音指令与快捷按键的优先显示等级;例如,将调用频率小于预设频率的语音指令与快捷按键的映射关系按照调用频率由高到低的顺序等级逐渐降低的原则设置优先显示等级;将调用频率大于预设频率的语音指令与快捷按键的映射关系按照调用频率由低到高的顺序等级逐渐降低的原则设置优先显示等级;其中,调用频率小于预设频率的语音指令与快捷按键的映射关系中最低的优先显示等级高于调用频率小于预设频率的语音指令与快捷按键的映射关系中最高的优先显示等级。
79.本实施例中,在确定每组语音指令与快捷按键的优先显示等级后,可以按照等级由高到低的顺序,依次显示每组语音指令与快捷按键的映射关系。
80.上述实施例的装置用于实现前述实施例中相应的方法,其具体实现方案可以参见前述实施例记载的方法及方法实施例中的相关说明,并且具有相应的方法实施例的有益效果,在此不再赘述。
81.图4为本发明实施例提供的应用程序的语音控制设备的结构示意图,如图4所示,本实施例的通行设备可以包括:处理器1010和存储器1020。本领域技术人员可知的,该设备还可以包括输入/输出接口1030、通信接口1040和总线1050。其中处理器1010、存储器1020、输入/输出接口1030和通信接口1040通过总线1050实现彼此之间在设备内部的通信连接。
82.处理器1010可以采用通用的cpu(central processing unit,中央处理器)、微处理器、应用专用集成电路(应用程序lication specific integrated circuit,asic)、或者一个或多个集成电路等方式实现,用于执行相关程序,以实现本说明书实施例所提供的技术方案。
83.存储器1020可以采用rom(read only memory,只读存储器)、ram(random access memory,随机存取存储器)、静态存储设备,动态存储设备等形式实现。存储器1020可以存储操作系统和其他应用程序,在通过软件或者固件来实现本说明书实施例所提供的技术方案时,相关的程序代码保存在存储器1020中,并由处理器1010来调用执行。
84.输入/输出接口1030用于连接输入/输出模块,以实现信息输入及输出。输入输出/模块可以作为组件配置在设备中(图中未示出),也可以外接于设备以提供相应功能。其中输入设备可以包括键盘、鼠标、触摸屏、麦克风、各类传感器等,输出设备可以包括显示器、扬声器、振动器、指示灯等。
85.通信接口1040用于连接通信模块(图中未示出),以实现本设备与其他设备的通信交互。其中通信模块可以通过有线方式(例如usb、网线等)实现通信,也可以通过无线方式(例如移动网络、wifi、蓝牙等)实现通信。
86.总线1050包括一通路,在设备的各个组件(例如处理器1010、存储器1020、输入/输
出接口1030和通信接口1040)之间传输信息。
87.需要说明的是,尽管上述设备仅示出了处理器1010、存储器1020、输入/输出接口1030、通信接口1040以及总线1050,但是在具体实施过程中,该设备还可以包括实现正常运行所必需的其他组件。此外,本领域的技术人员可以理解的是,上述设备中也可以仅包含实现本说明书实施例方案所必需的组件,而不必包含图中所示的全部组件。
88.本发明还提供一种存储介质,其存储有一个或者多个程序,所述一个或者多个程序可被执行时实现上述实施例的应用程序的语音控制方法。
89.本实施例的计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(pram)、静态随机存取存储器(sram)、动态随机存取存储器(dram)、其他类型的随机存取存储器(ram)、只读存储器(rom)、电可擦除可编程只读存储器(eeprom)、快闪记忆体或其他内存技术、只读光盘只读存储器(cd

rom)、数字多功能光盘(dvd)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。
90.所属领域的普通技术人员应当理解:以上任何实施例的讨论仅为示例性的,并非旨在暗示本公开的范围(包括权利要求)被限于这些例子;在本发明的思路下,以上实施例或者不同实施例中的技术特征之间也可以进行组合,步骤可以以任意顺序实现,并存在如上所述的本发明的不同方面的许多其它变化,为了简明它们没有在细节中提供。
91.另外,为简化说明和讨论,并且为了不会使本发明难以理解,在所提供的附图中可以示出或可以不示出与集成电路(ic)芯片和其它部件的公知的电源/接地连接。此外,可以以框图的形式示出装置,以便避免使本发明难以理解,并且这也考虑了以下事实,即关于这些框图装置的实施方式的细节是高度取决于将要实施本发明的平台的(即,这些细节应当完全处于本领域技术人员的理解范围内)。在阐述了具体细节(例如,电路)以描述本发明的示例性实施例的情况下,对本领域技术人员来说显而易见的是,可以在没有这些具体细节的情况下或者这些具体细节有变化的情况下实施本发明。因此,这些描述应被认为是说明性的而不是限制性的。
92.尽管已经结合了本发明的具体实施例对本发明进行了描述,但是根据前面的描述,这些实施例的很多替换、修改和变型对本领域普通技术人员来说将是显而易见的。例如,其它存储器架构(例如,动态ram(dram))可以使用所讨论的实施例。
93.以上,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到各种等效的修改或替换,这些修改或替换都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以权利要求的保护范围为准。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文章

  • 日榜
  • 周榜
  • 月榜