一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种设备唤醒方法、装置、电子设备及存储介质与流程

2022-02-20 20:59:11 来源:中国专利 TAG:


1.本技术涉及智能设备控制领域,尤其涉及一种设备唤醒方法、装置、电子设备及存储介质。


背景技术:

2.目前,随着智能语音技术的发展,可以进行语音交互的设备越来越多,用户可以通过特定话术来唤醒设备以进行聊天或控制。
3.但是在一些场景下可能会经常出现误唤醒,比如:电视广告中出现了设备对应的唤醒词,导致设备被唤醒。再比如,在用户与其他人聊天时,对话中出现了设备对应的唤醒词,导致设备被唤醒。这些情况都不属于用户真实要唤醒设备的场景,所以这些唤醒都属于误唤醒。
4.误唤醒在一定程度上会产生不好的用户体验,给用户造成不必要的困扰和麻烦。因而,如何减少设备的误唤醒成为目前亟待解决的技术问题。


技术实现要素:

5.为了减少设备的误唤醒,本技术提供了一种设备唤醒方法、装置、电子设备及存储介质。
6.第一方面,本技术提供了一种设备唤醒方法,包括:
7.获取音频数据;
8.将所述音频数据转换为文本数据;
9.若确定所述文本数据中包含预设的唤醒词,则确定所述唤醒词在所述文本数据中的特指度值,所述特指度值与用户对设备的唤醒意图强度正相关;
10.若确定所述特指度值属于预设区间,则唤醒所述设备。
11.作为一种可能的实现方式,所述方法还包括:
12.若确定所述文本数据不包含所述唤醒词,则丢弃所述音频数据。
13.作为一种可能的实现方式,所述确定所述唤醒词在所述文本数据中的特指度值,包括:
14.计算所述唤醒词的长度与所述文本数据的长度的第一比值;
15.确定所述文本数据中的意图数量,将所述唤醒词的意图数量与所述意图数量的比值确定为第二比值;
16.确定所述唤醒词在所述文本数据中的位置权重;
17.确定所述文本数据中特定词的数量;
18.将所述第一比值、所述第二比值、所述位置权重和所述特定词的数量的和值,确定为预设唤醒词在所述文本数据中的特指度值。
19.作为一种可能的实现方式,所述计算预设的唤醒词的长度与所述文本数据的长度的第一比值,包括:
20.确定所述唤醒词的字数;
21.确定所述文本数据的字数;
22.将所述唤醒词的字数与所述文本数据的字数的比值,作为第一比值。
23.作为一种可能的实现方式,所述确定所述文本数据中的意图数量,包括:
24.对所述文本数据进行分词处理,得到至少一个词;
25.针对每个词,确定预设的词与意图的映射关系表中是否存在所述词对应的意图;
26.若确定存在所述词对应的意图,则确定所述词为目标词;
27.对所述文本数据中的目标词进行去重处理;
28.确定去重处理后的所述文本数据中目标词的数量;
29.将所述数量作为所述文本数据的意图总量。
30.作为一种可能的实现方式,所述确定所述唤醒词在所述文本数据中的位置权重,包括:
31.确定所述唤醒词在所述文本数据中的位置;
32.若确定所述唤醒词位于所述文本数据的句首,则确定所述唤醒词在所述文本数据中的位置权重为预设的第一值;
33.若确定所述唤醒词不位于所述文本数据的句首,则确定所述唤醒词在所述文本数据中的位置权重为预设的第二值。
34.作为一种可能的实现方式,所述确定所述文本数据中特定词的数量,包括:
35.获取预设的特定词;
36.基于所述特定词对所述文本数据进行识别,确定其中包含的所述特定词的数量。
37.第二方面,本技术实施例还提供了一种设备唤醒装置,包括:
38.获取模块,用于获取音频数据;
39.转换模块,用于将所述音频数据转换为文本数据;
40.特指度确定模块,用于若确定所述文本数据包含预设的唤醒词,则确定所述唤醒词在所述文本数据中的特指度值,所述特指度值与用户对设备的唤醒意图强度正相关;
41.唤醒模块,用于若确定所述特指度值属于预设区间,则唤醒所述设备。
42.第三方面,本技术实施例还提供了一种电子设备,包括:处理器和存储器,所述处理器用于执行所述存储器中存储的设备唤醒程序,以实现第一方面所述的设备唤醒方法。
43.第四方面,本技术实施例还提供了一种存储介质,所述存储介质存储有一个或者多个程序,所述一个或者多个程序可被一个或者多个处理器执行,以实现第一方面所述的设备唤醒方法。
44.本技术实施例提供的上述技术方案与现有技术相比具有如下优点:
45.本技术实施例提供的一种设备唤醒方法,获取音频数据,将音频数据转换为文本数据,若确定文本数据中包含预设的唤醒词,则确定唤醒词在文本数据中的特指度值,特指度值与用户对设备的唤醒意图强度正相关,若确定特指度值属于预设区间,则唤醒设备。如此,只有当唤醒词的特征度值属于预设区间时才会唤醒设备,相比于现有的只要有唤醒词就唤醒,可以有效减少设备的误唤醒,进而提升用户体验。
46.应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本技术。
附图说明
47.此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本技术的实施例,并与说明书一起用于解释本技术的原理。
48.图1是根据一示例性实施例示出的一种设备唤醒方法的流程图。
49.图2是根据一示例性实施例示出的一种设备唤醒方法的流程图。
50.图3是根据一示例性实施例示出的一种设备唤醒装置的示意图。
51.图4是根据一示例性实施例示出的一种电子设备的图。
具体实施方式
52.这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本技术相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本技术的一些方面相一致的装置和方法的例子。
53.请参阅图1,图1是本技术的一个实施例提供的一种设备唤醒方法的流程示意图。
54.如图1所示,该方法可以包括如下步骤:
55.s11.获取音频数据。
56.本技术实施例提供的设备唤醒方法,可以应用于具有语音交互功能的设备,比如智能音响等。
57.在实际应用中,具有语音交互功能的设备通常安装有用于接收外部输入的音频数据的语音接收器。基于此,s11中获取的音频数据可以为语音接收器接收到的音频数据。
58.因为通常是在设备未处于唤醒状态时,需要对设备进行唤醒,在设备处于唤醒状态时,无需对设备进行唤醒,因此,作为一个实施例,在执行s11之前,还可以先判断当前设备是否处于唤醒状态,若确定设置未处于唤醒状态,则执行s11,若确定设备处于唤醒状态,则说明此时不需要执行设备唤醒操作,从而不执行s11,并结束设备唤醒流程。
59.s12.将音频数据转换为文本数据。
60.在本技术实施例中,在获取到音频数据之后,可以采用语音识别技术将音频数据转换为文本数据。
61.作为一个实施例,可以采用现有的语音识别软件将音频数据转换为文本数据。
62.s13.若确定文本数据中包含预设的唤醒词,则确定唤醒词在文本数据中的特指度值。
63.唤醒词为根据需求预先设置的用于唤醒设备的词,不同设备的唤醒词可能不同,一般设备的唤醒词会预先存储在设备中,在使用时可直接获取。
64.在本技术实施例中,在将音频数据转换为文本数据之后,可以获取存储的预设唤醒词,基于唤醒词对文本数据进行识别,以确定文本数据中是否包含唤醒词,在确定包含唤醒词的情况下,计算唤醒词在文本数据中的特指度值,而在文本数据中不包含唤醒词时,则确定无需唤醒设备,直接丢弃该音频数据过滤掉,并结束唤醒流程。
65.在本技术实施例中,特制度值是指唤醒词占整段文本数据的比例、以及经过语义理解后的分数。唤醒词在文本数据中的特指度值与用户对设备的唤醒意图强度正相关,即唤醒词在文本数据中的特指度值越大,表示用户唤醒设备的意图越强烈,唤醒词在文本数
据中的特指度值越小,表示用户唤醒设备的意图越弱。因此可以基于唤醒词在文本数据中的特征度值来确定用户唤醒设备的意图强度,以便确定是否唤醒设备。
66.至于如何计算唤醒词在文本数据中的特指度值,将在下文中进行说明,此处先不详述。
67.作为一个实施,在基于唤醒词识别文本数据时,可以将唤醒词与文本数据进行比对,若比对出文本数据中包含与唤醒词一致的词,则确定文本数据包含唤醒词,若比对出文本数据中没有与唤醒词一致的词,则确定文本数据中没有唤醒词。
68.s14.若确定特指度值属于预设区间,则唤醒设备。
69.在确定出唤醒词在文本数据中的特指度值之后,将特指度值与预设区间进行比对,确定特指度值是否属于预设区间,若确定特指度值属于预设区间,则确定用户对设备的唤醒意图明显,从而唤醒设备,若确定特指度值不属于预设区间,则确定用户对设备的唤醒意图不明显,则此时为了防止误唤醒,不唤醒设备。其中,预设区间为根据实际需求或经验设定的区间。例如预设区间为是[n, ∞),n的值可以根据实际需求或经验设置,则在确定特指度值小于n时,过滤掉对应的语音数据,不唤醒设备,并解说唤醒流程;在确定特指度值大于等于n时,唤醒设备。
[0070]
本技术实施例提供的一种设备唤醒方法,获取音频数据,将音频数据转换为文本数据,确定预设的唤醒词在文本数据中的特指度值,特指度值与用户对设备的唤醒意图强度正相关,若确定特指度值属于预设区间,则唤醒设备。如此,只有当唤醒词的特征度值属于预设区间时才会唤醒设备,相比于现有的只要有唤醒词就唤醒,可以有效减少设备的误唤醒,进而提升用户体验
[0071]
参见图2,为本技术另一实施例提供的一种设备唤醒方法,如图2所示,在图1所示的设备唤醒方法的基础上,确定唤醒词在文本数据中的特指度值,可以包括如下步骤:
[0072]
s21.计算唤醒词的长度与文本数据的长度的第一比值。
[0073]
在本技术实施例中,先确定文本数据中包含的唤醒词,然后再分别确定文本中包含的唤醒词的长度和文本数据的长度。
[0074]
作为一个实施例,可以采用下式计算第一比值:
[0075]
p1=m1/m2[0076]
其中,p1表示第一比值,m1表示文本数据中包含的唤醒词的长度,m2表示文本数据的长度。
[0077]
作为一个实施例,词的长度可以是词的字数,文本数据的长度可以是文本数据的字数,因此可以分别确定唤醒词的字数和文本数据的字数,将唤醒词的字数与文本数据的字数的比值作为第一比值。
[0078]
作为另一个实施例,因此唤醒词和文本数据中有时可能会包含英文、数字等字符,因此可以将词的字符数作为词的长度,将文本数据的字符数作为文本数据的长度,然后将唤醒词的字符数与文本数据的字符数的比值作为第一比值。
[0079]
s22.确定文本数据的意图总量,将唤醒词的意图数量与意图总量的比值确定为第二比值。
[0080]
作为一个实施例,可以预先构建词与意图的映射关系表,并将该映射关系表存储在设备中,其中,映射关系表可以基于用户的历史行为数据确定,其中行为数据可以包括用
[0095]
其中,s表示唤醒词在文本数据中的特指度值,p3表示位置权重,m4表示特定词的数量。
[0096]
至此完成对唤醒词在文本数据中的特指度值的计算。
[0097]
参见图3,为本技术实施例提供的一种设备唤醒装置的示意图,如图3所示,该装置可以包括:
[0098]
获取模块301,用于获取音频数据;
[0099]
转换模块302,用于将音频数据转换为文本数据;
[0100]
特指度确定模块303,用于若确定文本数据包含预设的唤醒词,则确定唤醒词在文本数据中的特指度值,特指度值与用户对设备的唤醒意图强度正相关;
[0101]
唤醒模块304,用于若确定特指度值属于预设区间,则唤醒所述设备。
[0102]
作为一种可能的实现方式,上述装置还可以包括(图3中未示出):
[0103]
丢弃模块,用于在确定文本数据中不包含唤醒词时,丢弃所述音频数据。
[0104]
作为一种可能的实现方式,特指度确定模块303包括:
[0105]
第一计算单元,用于计算唤醒词的长度与文本数据的长度的第一比值;
[0106]
第二计算单元,用于确定文本数据的意图总量,将唤醒词的意图数量与意图总量的比值确定为第二比值;
[0107]
第三计算单元,用于确定唤醒词在文本数据中的位置权重;
[0108]
第四计算单元,用于确定文本数据中特定词的数量;
[0109]
第五计算单元,用于根据第一比值、第二比值、位置权重和特定词的数量,确定唤醒词在文本数据中的特指度值。
[0110]
作为一种可能的实现方式,第一计算单元,具体用于:
[0111]
确定唤醒词的字数;
[0112]
确定文本数据的字数;
[0113]
将唤醒词的字数与文本数据的字数的比值,作为第一比值。
[0114]
作为一种可能的实现方式,第二计算单元确定所述文本数据的意图总量,包括:
[0115]
对文本数据进行分词处理,得到至少一个词;
[0116]
针对每个词,确定预设的词与意图的映射关系表中是否存在该词对应的意图;
[0117]
若确定存在词对应的意图,则确定词为目标词;
[0118]
对文本数据中的目标词进行去重处理;
[0119]
确定去重处理后的文本数据中目标词的数量;
[0120]
将目标词的数量作为文本数据的意图总量。
[0121]
作为一种可能的实现方式,第三计算单元,具体用于:
[0122]
确定唤醒词在文本数据中的位置;
[0123]
若确定唤醒词位于文本数据的句首,则确定唤醒词在文本数据中的位置权重为预设的第一值;
[0124]
若确定唤醒词不位于文本数据的句首,则确定唤醒词在文本数据中的位置权重为预设的第二值。
[0125]
作为一种可能的实现方式,第四计算单元,具体用于:
[0126]
获取预设的特定词;
[0127]
基于特定词对文本数据进行识别,确定其中包含的特定词的数量。
[0128]
参见图4,图4是本技术的另一实施例提供的一种电子设备的结构示意图。
[0129]
如图4所示,本实施例提供的电子设备包括:至少一个处理器401、存储器402、至少一个网络接口403和其他用户接口404。电子设备400中的各个组件通过总线系统405耦合在一起。可理解,总线系统405用于实现这些组件之间的连接通信。总线系统405除包括数据总线之外,还包括电源总线、控制总线和状态信号总线。但是为了清楚说明起见,在图4中将各种总线都标为总线系统405。
[0130]
其中,用户接口404可以包括显示器、键盘或者点击设备(例如,鼠标,轨迹球(trackball)、触感板或者触摸屏等。
[0131]
可以理解,本发明实施例中的存储器402可以是易失性存储器或非易失性存储器,或可包括易失性和非易失性存储器两者。其中,非易失性存储器可以是只读存储器(read-only memory,rom)、可编程只读存储器(programmable rom,prom)、可擦除可编程只读存储器(erasable prom,eprom)、电可擦除可编程只读存储器(electrically eprom,eeprom)或闪存。易失性存储器可以是随机存取存储器(random access memory,ram),其用作外部高速缓存。通过示例性但不是限制性说明,许多形式的ram可用,例如静态随机存取存储器(static ram,sram)、动态随机存取存储器(dynamic ram,dram)、同步动态随机存取存储器(synchronous dram,sdram)、双倍数据速率同步动态随机存取存储器(double data rate sdram,ddrsdram)、增强型同步动态随机存取存储器(enhanced sdram,esdram)、同步连接动态随机存取存储器(synch link dram,sldram)和直接内存总线随机存取存储器(direct rambus ram,drram)。本文描述的存储器402旨在包括但不限于这些和任意其它适合类型的存储器。
[0132]
在一些实施方式中,存储器402存储了如下的元素,可执行单元或者数据结构,或者他们的子集,或者他们的扩展集:操作系统4021和应用程序4022。
[0133]
其中,操作系统4021,包含各种系统程序,例如框架层、核心库层、驱动层等,用于实现各种基础业务以及处理基于硬件的任务。应用程序4022,包含各种应用程序,例如媒体播放器(media player)、浏览器(browser)等,用于实现各种应用业务。实现本发明实施例方法的程序可以包含在应用程序4022中。
[0134]
在本发明实施例中,通过调用存储器402存储的程序或指令,具体的,可以是应用程序4022中存储的程序或指令,处理器401用于执行各方法实施例所提供的方法步骤,例如包括:
[0135]
获取音频数据;
[0136]
将音频数据转换为文本数据;
[0137]
若确定文本数据中包含预设的唤醒词,则确定唤醒词在文本数据中的特指度值,特指度值与用户对设备的唤醒意图强度正相关;
[0138]
若确定特指度值属于预设区间,则唤醒设备。
[0139]
上述本发明实施例揭示的方法可以应用于处理器401中,或者由处理器401实现。处理器401可能是一种集成电路芯片,具有信号的处理能力。在实现过程中,上述方法的各步骤可以通过处理器401中的硬件的集成逻辑电路或者软件形式的指令完成。上述的处理器401可以是通用处理器、数字信号处理器(digital signal processor,dsp)、专用集成电
路(application specific integrated circuit,asic)、现成可编程门阵列(field programmable gate array,fpga)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。可以实现或者执行本发明实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合本发明实施例所公开的方法的步骤可以直接体现为硬件译码处理器执行完成,或者用译码处理器中的硬件及软件单元组合执行完成。软件单元可以位于随机存储器,闪存、只读存储器,可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器402,处理器401读取存储器402中的信息,结合其硬件完成上述方法的步骤。
[0140]
可以理解的是,本文描述的这些实施例可以用硬件、软件、固件、中间件、微码或其组合来实现。对于硬件实现,处理单元可以实现在一个或多个专用集成电路(application specific integrated circuits,asic)、数字信号处理器(digital signal processing,dsp)、数字信号处理设备(dspdevice,dspd)、可编程逻辑设备(programmable logic device,pld)、现场可编程门阵列(field-programmable gate array,fpga)、通用处理器、控制器、微控制器、微处理器、用于执行本技术功能的其它电子单元或其组合中。
[0141]
对于软件实现,可通过执行本文功能的单元来实现本文的技术。软件代码可存储在存储器中并通过处理器执行。存储器可以在处理器中或在处理器外部实现。
[0142]
本发明实施例还提供了一种存储介质(计算机可读存储介质)。这里的存储介质存储有一个或者多个程序。其中,存储介质可以包括易失性存储器,例如随机存取存储器;存储器也可以包括非易失性存储器,例如只读存储器、快闪存储器、硬盘或固态硬盘;存储器还可以包括上述种类的存储器的组合。
[0143]
当存储介质中一个或者多个程序可被一个或者多个处理器执行,以实现上述在电子设备侧执行的设备唤醒方法。
[0144]
处理器用于执行存储器中存储的设备唤醒程序,以实现以下在电子设备侧执行的设备唤醒方法的步骤:
[0145]
获取音频数据;
[0146]
将音频数据转换为文本数据;
[0147]
若确定文本数据中包含预设的唤醒词,则确定唤醒词在文本数据中的特指度值,特指度值与用户对设备的唤醒意图强度正相关;
[0148]
若确定特指度值属于预设区间,则唤醒设备。
[0149]
关于上述实施例中的装置,其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述,此处将不做详细阐述说明。
[0150]
可以理解的是,上述各实施例中相同或相似部分可以相互参考,在一些实施例中未详细说明的内容可以参见其他实施例中相同或相似的内容。
[0151]
需要说明的是,在本技术的描述中,术语“第一”、“第二”等仅用于描述目的,而不能理解为指示或暗示相对重要性。此外,在本技术的描述中,除非另有说明,“多个”的含义是指至少两个。
[0152]
流程图中或在此以其他方式描述的任何过程或方法描述可以被理解为,表示包括一个或更多个用于实现特定逻辑功能或过程的步骤的可执行指令的代码的模块、片段或部分,并且本技术的优选实施方式的范围包括另外的实现,其中可以不按所示出或讨论的顺
序,包括根据所涉及的功能按基本同时的方式或按相反的顺序,来执行功能,这应被本技术的实施例所属技术领域的技术人员所理解。
[0153]
应当理解,本技术的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中,多个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或固件来实现。例如,如果用硬件来实现,和在另一实施方式中一样,可用本领域公知的下列技术中的任一项或他们的组合来实现:具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路,具有合适的组合逻辑门电路的专用集成电路,可编程门阵列(pga),现场可编程门阵列(fpga)等。
[0154]
本技术领域的普通技术人员可以理解实现上述实施例方法携带的全部或部分步骤是可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,该程序在执行时,包括方法实施例的步骤之一或其组合。
[0155]
此外,在本技术各个实施例中的各功能单元可以集成在一个处理模块中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。所述集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读取存储介质中。
[0156]
上述提到的存储介质可以是只读存储器,磁盘或光盘等。
[0157]
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本技术的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。
[0158]
尽管上面已经示出和描述了本技术的实施例,可以理解的是,上述实施例是示例性的,不能理解为对本技术的限制,本领域的普通技术人员在本技术的范围内可以对上述实施例进行变化、修改、替换和变型。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献