一种助听器的语音控制方法、装置、设备及介质与流程

2022-07-02 04:50:35 来源：中国专利 TAG：

1.本发明涉及语音识别技术领域，特别涉及一种助听器的语音控制方法、装置、设备及介质。

背景技术：

2.目前，助听器已经成为众多听力损失患者改善听力，提高言语交流能力的重要工具，助听器是一个小型扩音器，把原本听不到的声音加以扩大，再利用听障者的残余听力，使声音能送到大脑听觉中枢，而感觉到声音，为听障者带来很大便利，由于助听器发展方向是小型化、多功能、多场景使用等，导致操作越来越复杂。这种发展趋势，进一步加剧使用者对于传统助听器按键操控方式的不适应。可以设想，一个老年的听损患者在使用助听器时，在佩戴时要完成助听器音量大小调整、多媒体功能(如听音乐、通话、看电视)等控制是多么的困难。一方面是由于助听器非常小巧，导致准确寻找“指控”操作开关困难；另一方面，一旦对于开关实施控制时，也会导致在助听器中听到“巨大”的声响而对听者耳朵产生冲击伤害，这是由于操作的摩擦声进入助听器麦克风后，经过助听器放大后的缘故
3.由上可见，在助听器的语音控制过程中，如何增加语音指令识别的准确性，降低助听器语音控制的功耗，提高了用户对助听器的需求是本领域有待解决的问题。

技术实现要素：

4.有鉴于此，本发明的目的在于提供一种助听器的语音控制方法、装置、设备及介质，能够有效增加语音指令识别的准确性，降低助听器语音控制的功耗，提高了用户对助听器的需求。其具体方案如下：
5.第一方面，本技术公开了一种助听器的语音控制方法，包括：
6.获取预先设置的目标用户的语音模板和唤醒词模板，并将所述语音模板和唤醒词模板保存至助听器的语音存储；所述语音模板包括各语音学习指令的特征值以及与所述特征值相应的执行功能；所述唤醒词模板包括唤醒词指令的特征值；
7.获取所述目标用户的语音指令，并对所述目标用户的语音指令进行特征提取，以得到特征提取后的语音指令；
8.判断所述语音存储中是否存在与所述特征提取后的语音指令相匹配的唤醒词模板，若所述语音存储中存在与所述特征提取后的语音指令相匹配的唤醒词模板，则判断所述语音存储中是否存在与所述特征提取后的语音指令相匹配的目标语音模板；
9.若所述语音存储中存在与所述特征提取后的语音指令相匹配的目标语音模板，则基于所述语音存储中的所述目标语音模板确定出目标特征值以及与所述目标特征值相应的目标执行功能，以便基于所述目标执行功能对所述助听器进行相应的控制。
10.可选的，所述获取预先设置的目标用户的语音模板和唤醒词模板之前，还包括：
11.基于语音指令学习设备获取目标用户的语音学习指令和唤醒词指令，并对所述语音学习指令和唤醒词指令进行特征值提取，以得到所述各语音学习指令的特征值和所述唤
醒词指令的特征值；
12.将所述语音学习指令的特征值以及与所述语音学习指令的特征值相应的执行功能保存至预设所述语音指令学习设备中的语音模板，并将及所述唤醒词指令的特征值保存至所述语音指令学习设备中的唤醒词模板。
13.可选的，所述获取预先设置的目标用户的语音模板和唤醒词模板，并将所述语音模板和唤醒词模板保存至助听器的语音存储，包括：
14.基于蓝牙通讯技术获取所述语音指令学习设备中的各语音模板和唤醒词模板；
15.将所述各语音模板和所述唤醒词模板保存至助听器的嵌入式处理器中的flash存储。
16.可选的，所述对所述目标用户的语音指令进行特征提取之前，还包括：
17.基于预设阈值确定方法确定出预设阈值；
18.利用所述目标用户的语音指令确定出声音电平值，并判断所述声音电平值是否大于所述预设阈值，若所述声音电平值不大于所述预设阈值，则对所述目标用户的语音指令进行删除操作。
19.可选的，所述对所述目标用户的语音指令进行特征提取，以得到特征提取后的语音指令，包括：
20.若所述声音电平值大于所述预设阈值，则基于语音端点检测算法对所述目标用户的语音指令进行特征提取，以得到特征提取后的语音指令。
21.可选的，所述基于所述语音存储中的所述目标语音模板确定出目标特征值以及与所述目标特征值相应的目标执行功能，包括：
22.基于动态时间归整算法从所述语音存储中所有的所述语音模板中确定出目标语音模板；
23.基于所述目标语音模板确定出目标特征值以及与所述目标特征值相应的目标执行功能。
24.可选的，所述基于所述目标执行功能对所述助听器进行相应的控制，包括：
25.基于与所述目标特征值相应的所述目标执行功能确定出目标执行代码；
26.通过所述目标执行代码对所述助听器进行相应的控制。
27.第二方面，本技术公开了一种助听器的语音控制装置，包括：
28.语音模板存储模块，用于获取预先设置的目标用户的语音模板和唤醒词模板，并将所述语音模板和唤醒词模板保存至助听器的语音存储；所述语音模板包括各语音学习指令的特征值以及与所述特征值相应的执行功能；所述唤醒词模板包括唤醒词指令的特征值；
29.语音指令提取模块，用于获取所述目标用户的语音指令，并对所述目标用户的语音指令进行特征提取，以得到特征提取后的语音指令；
30.语音指令判断模块，用于判断所述语音存储中是否存在与所述特征提取后的语音指令相匹配的唤醒词模板，若所述语音存储中存在与所述特征提取后的语音指令相匹配的唤醒词模板，则判断所述语音存储中是否存在与所述特征提取后的语音指令相匹配的目标语音模板；
31.语音指令执行模块，用于若所述语音存储中存在与所述特征提取后的语音指令相
匹配的目标语音模板，则基于所述语音存储中的所述目标语音模板确定出目标特征值以及与所述目标特征值相应的目标执行功能，以便基于所述目标执行功能对所述助听器进行相应的控制。
32.第三方面，本技术公开了一种电子设备，包括：
33.存储器，用于保存计算机程序；
34.处理器，用于执行所述计算机程序，以实现前述的助听器的语音控制方法。
35.第四方面，本技术公开了一种计算机存储介质，用于保存计算机程序；其中，所述计算机程序被处理器执行时实现前述公开的助听器的语音控制方法的步骤。
36.可见，本技术提供了一种助听器的语音控制方法，包括获取预先设置的目标用户的语音模板和唤醒词模板，并将所述语音模板和唤醒词模板保存至助听器的语音存储；所述语音模板包括各语音学习指令的特征值以及与所述特征值相应的执行功能；所述唤醒词模板包括唤醒词指令的特征值；获取所述目标用户的语音指令，并对所述目标用户的语音指令进行特征提取，以得到特征提取后的语音指令；判断所述语音存储中是否存在与所述特征提取后的语音指令相匹配的唤醒词模板，若所述语音存储中存在与所述特征提取后的语音指令相匹配的唤醒词模板，则判断所述语音存储中是否存在与所述特征提取后的语音指令相匹配的目标语音模板；若所述语音存储中存在与所述特征提取后的语音指令相匹配的目标语音模板，则基于所述语音存储中的所述目标语音模板确定出目标特征值以及与所述目标特征值相应的目标执行功能，以便基于所述目标执行功能对所述助听器进行相应的控制。本技术通过对所述目标用户的语音指令进行特征提取，然后与语音模板进行匹配能够有效增加语音指令识别的准确性，在提取和匹配的过程中，降低助听器语音控制的功耗，并且通过语音指令对助听器进行控制，能够提高用户对助听器的需求。
附图说明
37.为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据提供的附图获得其他的附图。
38.图1为本技术公开的一种助听器的语音控制方法流程图；
39.图2为本技术公开的一种助听器的语音控制方法流程图；
40.图3为本技术公开的一种助听器的语音控制方法的具体流程图；
41.图4为本技术公开的一种助听器的语音控制装置结构示意图；
42.图5为本技术提供的一种电子设备结构图。
具体实施方式
43.下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。
44.在当前背景下，助听器已经成为众多听力损失患者改善听力，提高言语交流能力
的重要工具，助听器是一个小型扩音器，把原本听不到的声音加以扩大，再利用听障者的残余听力，使声音能送到大脑听觉中枢，而感觉到声音，为听障者带来很大便利，由于助听器发展方向是小型化、多功能、多场景使用等，导致操作越来越复杂。这种发展趋势，进一步加剧使用者对于传统助听器按键操控方式的不适应。由上可见，在助听器的语音控制过程中，如何增加语音指令识别的准确性，降低助听器语音控制的功耗，提高了用户对助听器的需求是本领域有待解决的问题。
45.参见图1所示，本发明实施例公开了一种助听器的语音控制方法，具体可以包括：
46.步骤s11：获取预先设置的目标用户的语音模板和唤醒词模板，并将所述语音模板和唤醒词模板保存至助听器的语音存储；所述语音模板包括各语音学习指令的特征值以及与所述特征值相应的执行功能；所述唤醒词模板包括唤醒词指令的特征值。
47.本实施例中，在获取预先设置的目标用户的语音模板和唤醒词模板之前，还包括基于语音指令学习设备获取目标用户的语音学习指令和唤醒词指令，并对所述语音学习指令和唤醒词指令进行特征值提取，以得到所述各语音学习指令的特征值和所述唤醒词指令的特征值；将所述语音学习指令的特征值以及与所述语音学习指令的特征值相应的执行功能保存至预设所述语音指令学习设备中的语音模板，并将及所述唤醒词指令的特征值保存至所述语音指令学习设备中的唤醒词模板，然后基于蓝牙通讯技术获取所述语音指令学习设备中的各语音模板和唤醒词模板；将所述各语音模板和所述唤醒词模板保存至助听器的嵌入式处理器中的flash存储。
48.步骤s12：获取所述目标用户的语音指令，并对所述目标用户的语音指令进行特征提取，以得到特征提取后的语音指令。
49.步骤s13：判断所述语音存储中是否存在与所述特征提取后的语音指令相匹配的唤醒词模板，若所述语音存储中存在与所述特征提取后的语音指令相匹配的唤醒词模板，则判断所述语音存储中是否存在与所述特征提取后的语音指令相匹配的目标语音模板。
50.步骤s14：若所述语音存储中存在与所述特征提取后的语音指令相匹配的目标语音模板，则基于所述语音存储中的所述目标语音模板确定出目标特征值以及与所述目标特征值相应的目标执行功能，以便基于所述目标执行功能对所述助听器进行相应的控制。
51.本实施例中，获取预先设置的目标用户的语音模板和唤醒词模板，并将所述语音模板和唤醒词模板保存至助听器的语音存储；所述语音模板包括各语音学习指令的特征值以及与所述特征值相应的执行功能；所述唤醒词模板包括唤醒词指令的特征值；获取所述目标用户的语音指令，并对所述目标用户的语音指令进行特征提取，以得到特征提取后的语音指令；判断所述语音存储中是否存在与所述特征提取后的语音指令相匹配的唤醒词模板，若所述语音存储中存在与所述特征提取后的语音指令相匹配的唤醒词模板，则判断所述语音存储中是否存在与所述特征提取后的语音指令相匹配的目标语音模板；若所述语音存储中存在与所述特征提取后的语音指令相匹配的目标语音模板，则基于所述语音存储中的所述目标语音模板确定出目标特征值以及与所述目标特征值相应的目标执行功能，以便基于所述目标执行功能对所述助听器进行相应的控制。本技术通过对所述目标用户的语音指令进行特征提取，然后与语音模板进行匹配能够有效增加语音指令识别的准确性，在提取和匹配的过程中，降低助听器语音控制的功耗，并且通过语音指令对助听器进行控制，能够提高用户对助听器的需求。
52.参见图2所示，本发明实施例公开了一种助听器的语音控制方法，具体可以包括：
53.步骤s21：获取预先设置的目标用户的语音模板和唤醒词模板，并将所述语音模板和唤醒词模板保存至助听器的语音存储；所述语音模板包括各语音学习指令的特征值以及与所述特征值相应的执行功能；所述唤醒词模板包括唤醒词指令的特征值。
54.步骤s22：获取所述目标用户的语音指令，并对所述目标用户的语音指令进行特征提取，以得到特征提取后的语音指令。
55.本实施例中，在获取所述目标用户的语音指令之后，基于预设阈值确定方法确定出预设阈值，然后利用所述目标用户的语音指令确定出声音电平值，并判断所述声音电平值是否大于所述预设阈值，若所述声音电平值不大于所述预设阈值，则对所述目标用户的语音指令进行删除操作，若所述声音电平值大于所述预设阈值，则基于语音端点检测算法对所述目标用户的语音指令进行特征提取，以得到特征提取后的语音指令。
56.本实施例中，所述语音端点检测算法(vad，voice activity detection)是一种基于短时能量(ste，short time energy)的短时过零率(zcc，zero cross counter)的能量特征提取方法，通过利用vad算法能够去除多余数据，提取有用特征，从而降低运算量，增加语音指令识别的准确性。
57.步骤s23：判断所述语音存储中是否存在与所述特征提取后的语音指令相匹配的唤醒词模板，若所述语音存储中存在与所述特征提取后的语音指令相匹配的唤醒词模板，则判断所述语音存储中是否存在与所述特征提取后的语音指令相匹配的目标语音模板。
58.步骤s24：若所述语音存储中存在与所述特征提取后的语音指令相匹配的目标语音模板，则基于动态时间归整算法从所述语音存储中所有的所述语音模板中确定出目标语音模板，然后基于所述目标语音模板确定出目标特征值以及与所述目标特征值相应的目标执行功能，利用与所述目标特征值相应的所述目标执行功能确定出目标执行代码，通过所述目标执行代码对所述助听器进行相应的控制。
59.本实施例中，获取预先设置的目标用户的语音模板和唤醒词模板，并将所述语音模板和唤醒词模板保存至助听器的语音存储；所述语音模板包括各语音学习指令的特征值以及与所述特征值相应的执行功能；所述唤醒词模板包括唤醒词指令的特征值；获取所述目标用户的语音指令，并对所述目标用户的语音指令进行特征提取，以得到特征提取后的语音指令；判断所述语音存储中是否存在与所述特征提取后的语音指令相匹配的唤醒词模板，若所述语音存储中存在与所述特征提取后的语音指令相匹配的唤醒词模板，则判断所述语音存储中是否存在与所述特征提取后的语音指令相匹配的目标语音模板；若所述语音存储中存在与所述特征提取后的语音指令相匹配的目标语音模板，则基于动态时间归整算法(dtw，dynamic time warping)从所述语音存储中所有的所述语音模板中确定出目标语音模板，然后基于所述目标语音模板确定出目标特征值以及与所述目标特征值相应的目标执行功能，利用与所述目标特征值相应的所述目标执行功能确定出目标执行代码，通过所述目标执行代码对所述助听器进行相应的控制。本技术通过对所述目标用户的语音指令进行特征提取，然后与语音模板进行匹配能够有效增加语音指令识别的准确性，在提取和匹配的过程中，降低助听器语音控制的功耗，并且通过语音指令对助听器进行控制，能够提高用户对助听器的需求。
60.例如，如图3所示，利用app客户端获取目标用户的语音学习指令和唤醒词指令，一
般每个语音指令学习三遍之后，对所述语音学习指令和唤醒词指令进行特征值提取，以得到所述各语音学习指令的特征值和所述唤醒词指令的特征值，然后将所述语音学习指令的特征值以及与所述语音学习指令的特征值相应的执行功能保存至预设所述语音指令学习设备中的语音模板，并将及所述唤醒词指令的特征值保存至所述语音指令学习设备中的唤醒词模板，然后基于蓝牙通讯技术获取所述语音指令学习设备中的各语音模板和唤醒词模板，将所述各语音模板和所述唤醒词模板保存至助听器的嵌入式处理器中的flash存储，通过助听器的mic(麦克风，microphone)语音接收目标用户的语音指令，然后利用vad算法对目标用户的语音指令进行特征提取，将提取后的语音指令利用dtw算法与唤醒词模板进行匹配，若匹配成功，则与语音模板进行匹配，若匹配成功，则从语音模板中找到对应的目标执行功能，以便基于所述目标执行功能对所述助听器进行相应的控制。
61.参见图4所示，本发明实施例公开了一种助听器的语音控制装置，具体可以包括：
62.语音模板存储模块11，用于获取预先设置的目标用户的语音模板和唤醒词模板，并将所述语音模板和唤醒词模板保存至助听器的语音存储；所述语音模板包括各语音学习指令的特征值以及与所述特征值相应的执行功能；所述唤醒词模板包括唤醒词指令的特征值；
63.语音指令提取模块12，用于获取所述目标用户的语音指令，并对所述目标用户的语音指令进行特征提取，以得到特征提取后的语音指令；
64.语音指令判断模块13，用于判断所述语音存储中是否存在与所述特征提取后的语音指令相匹配的唤醒词模板，若所述语音存储中存在与所述特征提取后的语音指令相匹配的唤醒词模板，则判断所述语音存储中是否存在与所述特征提取后的语音指令相匹配的目标语音模板；
65.语音指令执行模块14，用于若所述语音存储中存在与所述特征提取后的语音指令相匹配的目标语音模板，则基于所述语音存储中的所述目标语音模板确定出目标特征值以及与所述目标特征值相应的目标执行功能，以便基于所述目标执行功能对所述助听器进行相应的控制。
66.本实施例中，获取预先设置的目标用户的语音模板和唤醒词模板，并将所述语音模板和唤醒词模板保存至助听器的语音存储；所述语音模板包括各语音学习指令的特征值以及与所述特征值相应的执行功能；所述唤醒词模板包括唤醒词指令的特征值；获取所述目标用户的语音指令，并对所述目标用户的语音指令进行特征提取，以得到特征提取后的语音指令；判断所述语音存储中是否存在与所述特征提取后的语音指令相匹配的唤醒词模板，若所述语音存储中存在与所述特征提取后的语音指令相匹配的唤醒词模板，则判断所述语音存储中是否存在与所述特征提取后的语音指令相匹配的目标语音模板；若所述语音存储中存在与所述特征提取后的语音指令相匹配的目标语音模板，则基于所述语音存储中的所述目标语音模板确定出目标特征值以及与所述目标特征值相应的目标执行功能，以便基于所述目标执行功能对所述助听器进行相应的控制。本技术通过对所述目标用户的语音指令进行特征提取，然后与语音模板进行匹配能够有效增加语音指令识别的准确性，在提取和匹配的过程中，降低助听器语音控制的功耗，并且通过语音指令对助听器进行控制，能够提高用户对助听器的需求。
67.在一些具体实施例中，所述语音模板存储模块11，具体可以包括：
68.指令获取模块，用于基于语音指令学习设备获取目标用户的语音学习指令和唤醒词指令，并对所述语音学习指令和唤醒词指令进行特征值提取，以得到所述各语音学习指令的特征值和所述唤醒词指令的特征值；
69.模板获取模块，用于将所述语音学习指令的特征值以及与所述语音学习指令的特征值相应的执行功能保存至预设所述语音指令学习设备中的语音模板，并将及所述唤醒词指令的特征值保存至所述语音指令学习设备中的唤醒词模板。
70.在一些具体实施例中，所述语音模板存储模块11，具体可以包括：
71.蓝牙技术获取模块，用于基于蓝牙通讯技术获取所述语音指令学习设备中的各语音模板和唤醒词模板；
72.存储模块，用于将所述各语音模板和所述唤醒词模板保存至助听器的嵌入式处理器中的flash存储。
73.在一些具体实施例中，所述语音指令提取模块12，具体可以包括：
74.阈值确定模块，用于基于预设阈值确定方法确定出预设阈值；
75.判断模块，用于利用所述目标用户的语音指令确定出声音电平值，并判断所述声音电平值是否大于所述预设阈值，若所述声音电平值不大于所述预设阈值，则对所述目标用户的语音指令进行删除操作。
76.在一些具体实施例中，所述语音指令提取模块12，具体可以包括：
77.提取模块，用于若所述声音电平值大于所述预设阈值，则基于语音端点检测算法对所述目标用户的语音指令进行特征提取，以得到特征提取后的语音指令。
78.在一些具体实施例中，所述语音指令判断模块13，具体可以包括：
79.目标语音模板确定模块，用于基于动态时间归整算法从所述语音存储中所有的所述语音模板中确定出目标语音模板；
80.目标执行功能确定模块，用于基于所述目标语音模板确定出目标特征值以及与所述目标特征值相应的目标执行功能。
81.在一些具体实施例中，所述语音指令判断模块13，具体可以包括：
82.代码确定模块，基于与所述目标特征值相应的所述目标执行功能确定出目标执行代码；
83.控制模块，用于通过所述目标执行代码对所述助听器进行相应的控制。
84.图5为本技术实施例提供的一种电子设备的结构示意图。该电子设备20，具体可以包括：至少一个处理器21、至少一个存储器22、电源23、通信接口24、输入输出接口25和通信总线26。其中，所述存储器22用于存储计算机程序，所述计算机程序由所述处理器21加载并执行，以实现前述任一实施例公开的由电子设备执行的助听器的语音控制方法中的相关步骤。
85.本实施例中，电源23用于为电子设备20上的各硬件设备提供工作电压；通信接口24能够为电子设备20创建与外界设备之间的数据传输通道，其所遵循的通信协议是能够适用于本技术技术方案的任意通信协议，在此不对其进行具体限定；输入输出接口25，用于获取外界输入数据或向外界输出数据，其具体的接口类型可以根据具体应用需要进行选取，在此不进行具体限定。
86.另外，存储器22作为资源存储的载体，可以是只读存储器、随机存储器、磁盘或者
光盘等，其上所存储的资源包括操作系统221、计算机程序222及数据223等，存储方式可以是短暂存储或者永久存储。
87.其中，操作系统221用于管理与控制电子设备20上的各硬件设备以及计算机程序222，以实现处理器21对存储器22中数据223的运算与处理，其可以是windows、unix、linux等。计算机程序222除了包括能够用于完成前述任一实施例公开的由电子设备20执行的助听器的语音控制方法的计算机程序之外，还可以进一步包括能够用于完成其他特定工作的计算机程序。数据223除了可以包括助听器的语音控制设备接收到的由外部设备传输进来的数据，也可以包括由自身输入输出接口25采集到的数据等。
88.结合本文中所公开的实施例描述的方法或算法的步骤可以直接用硬件、处理器执行的软件模块，或者二者的结合来实施。软件模块可以置于随机存储器(ram)、内存、只读存储器(rom)、电可编程rom、电可擦除可编程rom、寄存器、硬盘、可移动磁盘、cd-rom、或技术领域内所公知的任意其它形式的存储介质中。
89.进一步的，本技术实施例还公开了一种计算机可读存储介质，所述存储介质中存储有计算机程序，所述计算机程序被处理器加载并执行时，实现前述任一实施例公开的助听器的语音控制方法步骤。
90.最后，还需要说明的是，在本文中，诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来，而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下，由语句“包括一个
……”
限定的要素，并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
91.以上对本发明所提供的一种助听器的语音控制方法、装置、设备及存储介质进行了详细介绍，本文中应用了具体个例对本发明的原理及实施方式进行了阐述，以上实施例的说明只是用于帮助理解本发明的方法及其核心思想；同时，对于本领域的一般技术人员，依据本发明的思想，在具体实施方式及应用范围上均会有改变之处，综上所述，本说明书内容不应理解为对本发明的限制。

再多了解一些

1/2 1 2 下一页尾页

本文用于企业家、创业者技术爱好者查询，结果仅供参考。

上一篇：返回列表
下一篇：RF-FSO连接方法及执行其的地面站系统与流程

一种助听器的语音控制方法、装置、设备及介质与流程

相关文献

最热文献