信息检索方法、装置、设备及计算机可读存储介质与流程

2022-07-10 15:16:27 来源：中国专利 TAG：

1.本发明涉及音频处理领域，尤其涉及一种信息检索方法、装置、设备及计算机可读存储介质。

背景技术：

2.智能家居涵盖了大量的设备，每个设备又拥有各自的信息领域，对智能家居的统一管理最重要的一项是设备的使用情况，但是获取准确的设备信息是一件很困难的事情，需要有一种检索高效的方式。

技术实现要素：

3.本发明的主要目的在于提出一种信息检索方法、装置、设备及计算机可读存储介质，旨在提供一种搞笑的信息检索方法，所述信息检索方法包括以下步骤：
4.获取用户输入的用于检索的语音信息，并确定所述用户为授权用户；
5.提取所述语音信息中的关键词，输出与所述关键词对应的目标文本，以实现所述授权用户得到检索结果。
6.在一种实施方式中，所述确定所述用户为授权用户的步骤包括：
7.获取所述语音信息的音频特征，并比较所述音频特征与预存的声纹特征，得到比较结果；
8.根据所述比较结果确定所述用户为授权用户。
9.在一种实施方式中，所述比较所述音频特征与预存的声纹特征，得到比较结果的步骤包括：
10.计算所述音频特征与每个预设的声纹特征之间的相似度，得到多个相似度值；
11.确定最大的所述相似度值为目标相似度值，得到比较结果。
12.在一种实施方式中，所述根据所述比较结果确定所述用户为授权用户的步骤包括：
13.当所述比较结果中所述目标相似度值大于预设阈值时，确定所述目标相似度对应的所述声纹特征为目标声纹特征；
14.确定所述用户为与所述目标声纹特征对应的授权用户。
15.在一种实施方式中，所述提取所述语音信息中的关键词，输出与所述关键词对应的目标文本，以实现所述授权用户得到检索结果的步骤包括：
16.提取所述语音信息中的文本语句，基于预设的分词词典对所述文本语句进行分词处理，得到拆分词组；
17.基于预设的停用词词典对所述拆分词组进行抽取处理得到关键词，所述停用词词典为需要进行过滤的词汇所组成；
18.对预存的文本库中所有文本进行提取处理，得到每个文本对应的关键词列表；
19.若存在与所述关键词相匹配的所述关键词列表，则确定将与所述关键词相匹配的
所述关键词列表为目标列表；
20.将与所述目标列表所对应的文本作为目标文本输出。
21.在一种实施方式中，所述提取所述语音信息中的文本语句的步骤包括：
22.对所述语音信息进行特征提取得到语音特征向量；
23.将所述语音特征向量输入至预设的声学模型进行处理输出得到字符；
24.将所述字符输入至预设的语言模型进行处理输出得到文本语句。
25.在一种实施方式中，所述对所述语音信息进行特征提取得到语音特征向量的步骤还包括：
26.根据预设频率对所述语音信息进行采样处理得到采样语音信号；
27.对所述采样语音信号进行预加重处理得到第二语音信号；
28.对所述第二语音信号进行端点检测处理得到目标语音信号；
29.对所述目标语音信号进行特征提取得到所述语音特征向量。
30.此外，为实现上述目的，本发明还提供一种信息检索装置，所述信息检索装置包括：
31.获取模块，用于获取用户输入的用于检索的语音信息；
32.确定模块，用于确定所述用户为授权用户；
33.提取模块，用于提取所述语音信息中的关键词；
34.输出模块，用于输出与所述关键词对应的目标文本，以实现所述授权用户得到检索结果。
35.此外，为实现上述目的，本发明还提供一种信息检索设备，所述信息检索设备包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的信息检索程序，所述信息检索程序被所述处理器执行时实现如上所述的信息检索方法的步骤。
36.此外，为实现上述目的，本发明还提供一种计算机可读存储介质，所述计算机可读存储介质上存储有所述信息检索程序，所述信息检索程序被处理器执行时实现如上所述的信息检索方法的步骤。
37.本发明通过获取用户输入的用于检索的语音信息，并确定用户为诶授权用户时，提取语音信息中的关键词，输出与关键词对应的目标文本，使得授权用户得到检索结果，本发明提供的信息检索方法应用领域广泛，可以是家居设备管理领域，可以是业务信息管理领域等，既提高了信息的安全性，也提高了信息检索的效率。
附图说明
38.图1为实现本发明实施例一种设备的硬件结构示意图；
39.图2为本发明信息检索方法实施例的流程示意图。
40.本发明目的的实现、功能特点及优点将结合实施例，参照附图做说明。
具体实施方式
41.应当理解，此处所描述的具体实施例仅仅用以解释本发明，并不用于限定本发明。
42.本发明提供了一种信息检索设备，参照图1，图1是本发明实施例方案涉及的硬件运行环境的结构示意图。
43.需要说明的是，图1即可为信息检索设备的硬件运行环境的结构示意图。本发明实施例信息检索设备可以是pc(personal computer，个人电脑)，便携计算机，服务器等设备。
44.如图1所示，该信息检索设备可以包括：处理器1001，例如cpu，存储器1005，用户接口1003，网络接口1004，通信总线1002。其中，通信总线1002用于实现这些组件之间的连接通信。用户接口1003可以包括显示屏(display)、输入单元比如键盘(keyboard)，可选用户接口1003还可以包括标准的有线接口、无线接口。网络接口1004可选的可以包括标准的有线接口、无线接口(如wi-fi接口)。存储器1005可以是高速ram存储器，也可以是稳定的存储器(non-volatile memory)，例如磁盘存储器。存储器1005可选的还可以是独立于前述处理器1001的存储装置。
45.可选地，信息检索设备还可以包括rf(radio frequency，射频)电路，传感器、wifi模块等等。
46.本领域技术人员可以理解，图1中示出的信息检索设备结构并不构成信息检索设备的限定，可以包括比图示更多或更少的部件，或者组合某些部件，或者不同的部件布置。
47.如图1所示，作为一种计算机存储可读存储介质的存储器1005中可以包括操作系统、网络通信模块、用户接口模块以及信息检索程序。其中，操作系统是管理和控制信息检索设备硬件和软件资源的程序，支持信息检索程序以及其它软件或程序的运行。
48.图1所示的信息检索设备，可用于实施高效的信息检索方法，用户接口1003主要用于侦测关键词或者输出文本信息等各种信息；网络接口1004主要用于与后台服务器交互，进行通信；处理器1001可以用于调用存储器1005中存储的信息检索程序，并执行以下操作：
49.获取用户输入的用于检索的语音信息，并确定所述用户为授权用户；
50.提取所述语音信息中的关键词，输出与所述关键词对应的目标文本，以实现所述授权用户得到检索结果。
51.本发明通过获取用户输入的用于检索的语音信息，并确定用户为诶授权用户时，提取语音信息中的关键词，输出与关键词对应的目标文本，使得授权用户得到检索结果，本发明提供的信息检索方法应用领域广泛，可以是家居设备管理领域，可以是业务信息管理领域等，既提高了信息的安全性，也提高了信息检索的效率。
52.本发明移动终端具体实施方式与下述信息检索方法各实施例基本相同，在此不再赘述。
53.基于上述结构，提出本发明信息检索方法的实施例。
54.本发明提供一种信息检索方法。
55.参照图2，图2为本发明信息检索方法实施例的流程示意图。
56.在本实施例中，提供了信息检索方法的实施例，需要说明的是，虽然在流程图中示出了逻辑顺序，但是在某些情况下，可以以不同于此处的顺序执行所示出或描述的步骤。
57.在本实施例中，信息检索方法包括：
58.步骤s10，获取用户输入的用于检索的语音信息，并确定所述用户为授权用户；
59.本实施例提供的是基于语音信息实现信息检索的方法，语音信息的输入方便高效且体现了本实施例提供的检索方法的智能。首先通过麦克风等设备获取用户发出的语音，得到语音信息，在多数情况下为了防止信息泄露在输出用户需要的信息之前，需先判断该用户是否为授权用户，当该用户为授权用户时，才将信息显示于界面。
60.在一些实施例中，确定所述用户为授权用户的步骤包括：
61.步骤a，获取所述语音信息的音频特征，并比较所述音频特征与预存的声纹特征，得到比较结果；
62.步骤b，根据所述比较结果确定所述用户为授权用户。
63.预存的声纹特征为授权用户的声纹特征，声纹特征包括声学特征、词法特征、韵律特征等。预设的声纹特征与授权用户的名称进行关联存储。音频特征可以理解为输入语音信息的用户的声纹特征。本实施例将预设的声纹特征逐一与语音信息的音频特征作比较，由于声纹特征不易被破解，因此能够提高安全性。进一步的根据比较结果判断用户是否为授权用户。
64.对语音信息进行分块处理，得到音频区域集，提取音频区域集中每一帧对应的额特征参数，得到音频特征。
65.在一些实施例中，比较所述音频特征与预存的声纹特征，得到比较结果的步骤包括：
66.步骤c，计算所述音频特征与每个预设的声纹特征之间的相似度，得到多个相似度值；
67.步骤d，确定最大的所述相似度值为目标相似度值，得到比较结果。
68.得到音频特征与每个预设的声纹特征之间的相似度值之后，对每个相似度值按照从大到小的顺序排列，将排在第一为的相似度值作为目标相似度值，比较结果中记录该目标相似度值。
69.在一些实施例中，步骤b还包括：
70.步骤b1，当所述比较结果中所述目标相似度值大于预设阈值时，确定所述目标相似度对应的所述声纹特征为目标声纹特征；
71.步骤b2，确定所述用户为与所述目标声纹特征对应的授权用户。
72.当比较结果中目标相似度值大于预设阈值时，可确定与目标相似度值对应的音频特征和声纹特征来自同一个用户，那么音频特征所述用户即为授权用户。当用户为授权用户时，才具备检索信息的权限。
73.步骤s20，提取所述语音信息中的关键词，输出与所述关键词对应的目标文本，以实现所述授权用户得到检索结果。
74.当确定用户为授权用户后，获取语音信息中的关键词，当存储有与关键词对应的文本时，将该文本视作目标文本并输出，使得授权用户接收目标文本，得到检索结果。
75.在一些实施例中，步骤s20包括：
76.步骤e，提取所述语音信息中的文本语句，基于预设的分词词典对所述文本语句进行分词处理，得到拆分词组；
77.对语音信息进行语音识别处理，得到语音信息中所含的语句，即文本语句。对于得到的文本语句，根据预设的分词词典对应文本语句进行分词处理得到拆分词组，其中预设的分词词典是基于文本库中文本的内容、文本的标题、文本的发布网络渠道等信息作为参考，得到的包含大量词汇的词典，用于能准确地对一个文本语句进行分词处理得到多个拆分词组，便于对拆分词组进行提取得到用于进行检索的关键词。
78.步骤f，基于预设的停用词词典对所述拆分词组进行抽取处理得到关键词，所述停
用词词典为需要进行过滤的词汇所组成；
79.对于得到的拆分词组，基于预设的停用词词典对拆分词组进行抽取处理得到关键词，停用词词典为所有需要进行过滤的词汇所组成，其中需要进行过滤的词汇可以包含所有的语气词以及助词，当然还可以包含一些敏感词汇。
80.步骤g，对预存的文本库中所有文本进行提取处理，得到每个文本对应的关键词列表；
81.对于预存的文本库中所有文本进行提取处理，得到每个文本对应的关键词列表，关键词列表包含有每个文本的重要词汇，对于提取得到每个文本的关键词列表，将关键词列表与获得的关键词进行匹配，从而使得语音信息对应的关键词与文本库中每个文本的关键词列表能进行更加精准地匹配，使得检索结果的准确性更高。
82.步骤h，若存在与所述关键词相匹配的所述关键词列表，则确定将与所述关键词相匹配的所述关键词列表为目标列表；
83.步骤i，将与所述目标列表所对应的文本作为目标文本输出。
84.可以理解的是，关键词可以是多个，若关键词列表存在关键词的个数最多，则说明该关键词列表与关键词相匹配，，将存在关键词个数最多的关键词列表确定为目标列表，将与目标列表对应的文本视作目标文本输出。
85.在一些实施例中，提取所述语音信息中的文本语句的步骤包括：
86.步骤j，对所述语音信息进行特征提取得到语音特征向量；
87.步骤k，将所述语音特征向量输入至预设的声学模型进行处理输出得到字符；
88.步骤l，将所述字符输入至预设的语言模型进行处理输出得到文本语句。
89.对语音信息进行语音识别处理得到对应该语音信息的文本语句，其中对语音信息进行语音识别处理时，需要先对语音信息进行特征提取得到该语音信息对应的语音特征向量。
90.在一些实施例中，步骤j还包括：
91.步骤j1，根据预设频率对所述语音信息进行采样处理得到采样语音信号；
92.步骤j2，对所述采样语音信号进行预加重处理得到第二语音信号；
93.步骤j3，对所述第二语音信号进行端点检测处理得到目标语音信号；
94.步骤j4，对所述目标语音信号进行特征提取得到所述语音特征向量。
95.对语音信息进行特征提取得到该语音信息对应的语音特征向量时，需要根据预设频率对语音信息进行采样处理得到采样语音信号，以便于对语音信号进行后续的预处理，其中预设频率可以为8000hz或16000hz。
96.对于进行采样处理得到的采样语音信号，为了提高采样语音信号中的高频分量的分辨能力，还对采样语音信号进行预加重处理得到第一语音信号，通过对采样语音信号进行预加重处理，实现了对采样语音信号的高频分量进行补偿，以便于继续进行后续处理。其中对采样语音信号进行预加重处理得到第一语音信号的方法具体可以为：通过传递函数为h(z)＝1-αz-1
的一阶fir高通数字滤波器来实现预加重，其中传递函数中的α为预加重系数，预加重系数α满足的条件为0.9《α《1。
97.对于进行预加重处理得到的第一语音信号，还对第一语音信号进行加窗处理得到第二语音信号，经过加窗处理后得到的第二语音信号具有短时平稳性。此外，在本实施例
中，经过加窗处理后得到的第二语音信号的语音帧长一般为10-30毫秒。
98.对于进行加窗处理得到第二语音信号，还需要对第二语音信号进行端点检测处理得到目标语音信号，滤除第二语音信号中的静音部分以及噪声部分，从而将滤除静音部分以及噪声部分后的语音信号作为目标语音信号。而对第二语音信号进行端点检测处理的目的在于，既可以减少对语音信号进行特征提取时的计算量，节省时间，在排除噪音的干扰后，还可以增强对语音信号进行特征提取时的准确率。本实施例中对第二语音信号进行端点检测处理得到目标语音信号的方法具体可以为采用根据时域中的特征参数来对静音部分以及噪声部分进行区分的方法，也可以采用根据频域中的特征参数来对静音部分以及噪声部分进行区分的方法，或根据时域中的特征参数和频域中的特征参数来对静音部分以及噪声部分进行区分的方法，当然并不仅限于此。
99.对于进行端点检测处理得到目标语音信号，还需要对目标语音信号进行特征提取得到语音特征向量，其中对目标语音信号进行特征提取得到语音特征向量的方法具体可以为对目标语音信号进行mfcc(梅尔频率倒谱系数)特征提取。
100.其中在对目标语音信号mfcc特征提取的过程中，需要先通过快速傅里叶变换对目标语音信号进行处理，以实现将目标语音信号从时域信号转变为频域信号的功率谱；通过mel滤波器组对得到频域信号的功率谱进行滤波处理，其中进行滤波处理的滤波器个数设为m，一般在20到28之间。将mel滤波器组的三角滤波器的中心频率设为f(m)，其中m为1,2,..,m，各个频率中心f(m)之间的间隔随着m取值的增大而增宽，随着m取值的减少而缩小，以使得mel滤波器组的滤波效果更好，还需要对mel滤波器组的所有滤波器的输出依次取对数得到对数能量谱，且对mel滤波器组的所有滤波器的输出的m个对数能量谱执行离散余弦变换，以除去各个维度信号之间的相似性，实现将各个维度信号映射到低维空间得到mfcc特征的p阶分量的特征参数。其中mfcc特征的p阶分量的计算公式为其中p为mfcc特征的维度，c(p)表示mfcc特征的第p阶分量。将mfcc特征的p阶分量的特征参数以及mfcc特征的一阶差分参数进行组合，确定为目标语音信号所对应的语音特征向量。
101.步骤k中，对于进行特征提取得到的语音特征向量，将语音特征向量输入至预设的声学模型进行处理输出得到对应的字符，其中该字符具体为单个的字，即声学模型输入的是对语音特征向量进行处理后得到的多个不同的字，其中上述声学模型为经过训练得到。对于训练后的声学训练模型，需要对还需要其进行检验。进行校验的方法具体可以为将测试集中的每条样本数据包含的语音特征向量输入至训练后的声学训练模型，得到预测的字符；通过将预测的字符与语音特征向量对应的字符进行比对校验；当预测的字符与语音特征向量对应的字符的相似百分比达到预设值时，则说明校验通过，此时则可以将声学训练模型识别为声学模型。
102.步骤l中，对于预设的声学模型进行处理输出得到字符，将字符输入至预设的语言模型进行处理输出得到文本语句。其中该文本语句为字符信息所组成的文本语句，其中，上述语言模型为经过训练得到。对语言模型进行训练的方法为获取用于对语言模型进行训练的样本数据，并将样本数据分成训练集和测试集；其中，样本数据中的每条样本数据均包括文本语句的所有字符及所有字符所对应的文本语句；将训练集中的每条样本数据中包含的文本语句的所有字符及所有字符所对应的文本语句作为语言训练模型的输入，将所有字符所对应的文本语句作为语言训练模型的输出，对语言训练模型进行训练。
103.对于训练后的语言训练模型，需要对还需要其进行检验。进行校验的方法具体可以为将测试集中的每条样本数据包含的文本语句的所有字符输入至训练后的语言训练模型，得到预测文本语句；通过将预测文本语句与所有字符所对应的文本语句进行比对校验；当预测文本语句与所有字符所对应的文本语句的相似百分比达到预设值时，则说明校验通过，此时则可以将语言训练模型识别为语言模型。
104.本实施例通过获取用户输入的用于检索的语音信息，并确定用户为诶授权用户时，提取语音信息中的关键词，输出与关键词对应的目标文本，使得授权用户得到检索结果，本实施例提供的信息检索方法应用领域广泛，可以是家居设备管理领域，可以是业务信息管理领域等，既提高了信息的安全性，也提高了信息检索的效率。
105.此外，本发明实施例还提出一种信息检索方法装置，所述信息检索装置包括：
106.获取模块，用于获取用户输入的用于检索的语音信息；
107.确定模块，用于确定所述用户为授权用户；
108.提取模块，用于提取所述语音信息中的关键词；
109.输出模块，用于输出与所述关键词对应的目标文本，以实现所述授权用户得到检索结果。
110.本发明所述信息检索方法装置实施方式与上述信息检索方法各实施例基本相同，在此不再赘述。
111.此外，本发明实施例还提出一种计算机可读存储介质，所述计算机可读存储介质上存储有信息检索程序，所述信息检索程序被处理器执行时实现如上所述的信息检索方法的各个步骤。
112.需要说明的是，计算机可读存储介质可设置在信息检索设备中。
113.本发明计算机可读存储介质具体实施方式与上述信息检索各实施例基本相同，在此不再赘述。
114.需要说明的是，在本文中，术语“包括”、“包含”或者其任何其它变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素，而且还包括没有明确列出的其它要素，或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下，由语句“包括一个
……”
限定的要素，并不排除在包括该要素的过程、方法、物品或者设备中还存在另外的相同要素。
115.上述本发明实施例序号仅仅为了描述，不代表实施例的优劣。
116.通过以上的实施方式的描述，本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现，当然也可以通过硬件，但很多情况下前者是更佳的实施方式。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质(如rom/ram、磁碟、光盘)中，包括若干指令用以使得一台终端设备(可以是手机，计算机，服务器，空调器，或者网络设备等)执行本发明各个实施例所述的方法。
117.以上仅为本发明的优选实施例，并非因此限制本发明的专利范围，凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换，或直接或间接运用在其它相关的技术领域，均同理包括在本发明的专利保护范围内。

再多了解一些

1/2 1 2 下一页尾页

本文用于企业家、创业者技术爱好者查询，结果仅供参考。

上一篇：返回列表
下一篇：一种用于口音英语的识别方法及系统与流程

信息检索方法、装置、设备及计算机可读存储介质与流程

相关文献

最热文献