农林渔牧食品/饮料服装/饰品纺织/造纸医疗/保健机械/机床家具/门窗喷涂/染料道路/铁路

摄影/光学乐器/声学照明/工业冶金/铸造安全/消防建筑/工具控制/调节计算,推算其他产品

热搜：真空泵封装包装食品玩具

首页 > 乐器,声学设备的制造及制作,分析技术 > 正文

用于关联语音数据和检索语音数据的方法、装置、电子设备和可读存储介质与流程

2021-08-24 16:08:00 来源：中国专利 TAG：语音数据电子设备关联装置

本申请涉及语音搜索技术领域，例如涉及一种用于关联语音数据和检索语音数据的方法、装置、电子设备和可读存储介质。

背景技术：

随着手机技术和计算机技术的飞速发展，企业微信已经成为人们工作中一个重要的工具。在工作过程中，通常将工作录音储存在企业微信的服务器上，在需要服务评估、工作分析、排查问题等情况下，对储存的工作录音按照需求进行查找。

在实现本公开实施例的过程中，发现相关技术中至少存在如下问题：

查找语音数据不支持文本检索，需要对语音数据逐个进行查找，查找语音数据效率低。

技术实现要素：

为了对披露的实施例的一些方面有基本的理解，下面给出了简单的概括。所述概括不是泛泛评述，也不是要确定关键/重要组成元素或描绘这些实施例的保护范围，而是作为后面的详细说明的序言。

本公开实施例提供了一种用于关联语音数据和检索语音数据的方法、装置、电子设备和可读存储介质，以提高查找语音数据的效率。

在一些实施例中，用于关联语音数据的方法，包括：获取对话语音数据；所述对话语音数据带有第一断句标记信息；根据所述第一断句标记信息将所述对话语音数据分割成若干个语音片段数据；获取所述对话语音数据对应的对话文本数据，所述对话文本数据包括第二断句标记信息；根据所述第二断句标记信息将所述对话文本数据分割成若干个文本片段数据；所述文本片段数据的数量与所述语音片段数据的数量相同；将所述文本片段数据与所述语音片段数据关联存储在预设的语音片段数据库。

在一些实施例中，用于检索语音数据的方法，包括：获取检索关键词；获取所述检索关键词对应的文本片段数据；在预设的语音片段数据库中匹配出所述文本片段数据对应的语音片段数据；所述语音片段数据库中存储有文本片段数据和语音片段数据的关联关系。

在一些实施例中，用于关联语音数据的装置包括：第一获取模块，被配置为获取对话语音数据；所述对话语音数据带有第一断句标记信息；第一分割模块，被配置为根据所述第一断句标记信息将所述对话语音数据分割成若干个语音片段数据；第二获取模块，被配置为获取所述对话语音数据对应的对话文本数据，所述对话文本数据包括第二断句标记信息；第二分割模块，被配置为根据所述第二断句标记信息将所述对话文本数据分割成若干个文本片段数据；所述文本片段数据的数量与所述语音片段数据的数量相同；存储模块，被配置为将所述文本片段数据与所述语音片段数据关联存储在预设的语音片段数据库。

在一些实施例中，用于检索语音数据的装置包括：第三获取模块，被配置为获取检索关键词；第四获取模块，被配置为获取所述检索关键词对应的文本片段数据；匹配模块，被配置为在预设的语音片段数据库中匹配出所述文本片段数据对应的语音片段数据；所述语音片段数据库中存储有文本片段数据和语音片段数据的关联关系。

在一些实施例中，电子设备包括第一处理器和存储有程序指令的第一存储器，其特征在于，所述第一处理器被配置为在执行所述程序指令时，执行上述用于关联语音数据的方法。

在一些实施例中，电子设备包括第二处理器和存储有程序指令的第二存储器，其特征在于，所述第二处理器被配置为在执行所述程序指令时，执行上述用于检索语音数据的方法。

在一些实施例中，可读存储介质存储有可执行指令，所述可执行指令在运行时执行上述用于关联语音数据的方法。

在一些实施例中，可读存储介质存储有可执行指令，所述可执行指令在运行时执行上述用于检索语音数据的方法。

本公开实施例提供的用于关联语音数据和检索语音数据的方法、装置、电子设备和可读存储介质，可以实现以下技术效果：通过将带有第一断句标记信息的对话语音数据分割成若干个语音片段数据，将对话语音数据对应的对话文本数据分割成若干个文本片段数据，将文本片段数据与语音片段数据关联存储在预设的语音片段数据库。便于根据文本片段数据通过预设的语音片段数据库查找语音片段数据，能够实现通过文本数据对语音数据进行查找，相较于现有技术需要对语音数据逐个进行查找，提高了对语音数据的查找效率。

以上的总体描述和下文中的描述仅是示例性和解释性的，不用于限制本申请。

附图说明

一个或多个实施例通过与之对应的附图进行示例性说明，这些示例性说明和附图并不构成对实施例的限定，附图中具有相同参考数字标号的元件示为类似的元件，附图不构成比例限制，并且其中：

图1是本公开实施例提供的一个用于关联语音数据的方法的示意图；

图2是本公开实施例提供的一个用于检索语音数据的方法的示意图；

图3是本公开实施例提供的一个用于关联语音数据的装置的示意图；

图4是本公开实施例提供的一个用于检索语音数据的装置的示意图；

图5是本公开实施例提供的一个电子设备的示意图；

图6是本公开实施例提供的另一个电子设备的示意图。

具体实施方式

为了能够更加详尽地了解本公开实施例的特点与技术内容，下面结合附图对本公开实施例的实现进行详细阐述，所附附图仅供参考说明之用，并非用来限定本公开实施例。在以下的技术描述中，为方便解释起见，通过多个细节以提供对所披露实施例的充分理解。然而，在没有这些细节的情况下，一个或多个实施例仍然可以实施。在其它情况下，为简化附图，熟知的结构和装置可以简化展示。

本公开实施例的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象，而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换，以便这里描述的本公开实施例的实施例。此外，术语“包括”和“具有”以及他们的任何变形，意图在于覆盖不排他的包含。

除非另有说明，术语“多个”表示两个或两个以上。

本公开实施例中，字符“/”表示前后对象是一种“或”的关系。例如，a/b表示：a或b。

术语“和/或”是一种描述对象的关联关系，表示可以存在三种关系。例如，a和/或b，表示：a或b，或，a和b这三种关系。

结合图1所示，本公开实施例提供一种用于关联语音数据的方法，包括：

步骤s101，获取对话语音数据；对话语音数据带有第一断句标记信息；

步骤s102，根据第一断句标记信息将对话语音数据分割成若干个语音片段数据；获取对话语音数据对应的对话文本数据，对话文本数据包括第二断句标记信息；

步骤s103，根据第二断句标记信息将对话文本数据分割成若干个文本片段数据；文本片段数据的数量与语音片段数据的数量相同；

步骤s104，将文本片段数据与语音片段数据关联存储在预设的语音片段数据库。

采用本公开实施例提供的用于关联语音数据的方法，通过将带有第一断句标记信息的对话语音数据分割成若干个语音片段数据，将对话语音数据对应的对话文本数据分割成若干个文本片段数据，将文本片段数据与语音片段数据关联存储在预设的语音片段数据库。便于根据文本片段数据通过预设的语音片段数据库查找语音片段数据，能够实现通过文本数据对语音数据进行查找，相较于现有技术需要对语音数据逐个进行查找，提高了对语音数据的查找效率。

可选地，获取对话语音数据，包括：获取录音数据；去除录音数据中的静默片段，获得对话语音数据。

可选地，获取录音数据，包括：通过录音设备进行录音，获得录音数据。可选地，通过录音设备进行录音，包括：通过用户终端上的app(application，应用程序)将用户终端与录音设备进行绑定，通过用户终端控制对应的录音设备进行录音。可选地，通过用户终端上的app将用户终端与录音设备进行绑定，包括：通过用户终端上的app扫描录音设备对应的设备识别码，以使用户终端与录音设备进行绑定。可选地，app为企业微信。可选地，设备识别码包括二维码或条形码等。

在一些实施例中，用户在用户终端上通过工作账号登录企业微信，通过企业微信扫描录音设备的设备识别码，以使用户终端通过企业微信与录音设备进行绑定；用户通过企业微信向录音设备发送“开启录音”的开启录音指令，录音设备根据开启录音指令开始录音；用户通过企业微信向录音设备发送“停止录音”的停止录音指令，录音设备根据停止录音指令停止录音，获得录音数据。

可选地，录音数据包括音频文件和时间信息。

可选地，去除录音数据中的静默片段，获得对话语音数据，包括：去除录音数据中的噪音，获得去噪后的录音数据；通过vad(voiceactivitydetection，语音活动检测)技术去除去噪后的录音数据中的静默片段，获得待标记语音数据；对待标记语音数据进行标记，获得对话语音数据。

可选地，对待标记语音数据进行标记，获得对话语音数据，包括：获取待标记语音数据中的各语音帧数据对应的身份信息；在相邻两个语音帧数据对应的身份信息不相同的情况下，在该相邻两个语音帧数据之间添加语音角色标记信息；该语音角色标记信息为该相邻两个语音帧数据中后一个语音帧数据对应的身份信息；在待标记语音数据的开始位置添加语音开始标记信息；在待标记语音数据的结束位置添加语音结束标记信息；将语音开始标记信息、语音结束标记信息和语音角色标记信息确定为第一断句标记信息；将标记后的待标记语音数据确定为对话语音数据。可选的，身份信息包括服务人员、顾客等。

可选地，获取待标记语音数据中各语音帧数据对应的身份信息，包括：获取待标记语音数据中的各语音帧数据的声纹信息；根据声纹信息在预设的数据库中查找对应的身份信息；其中，数据库中储存声纹信息对应的身份信息。可选地，数据库中声纹信息对应的身份信息都为服务人员。在一些实施例中，在预设的数据库中查找到声纹信息对应的身份信息的情况下，该声纹信息对应的语音帧数据对应的身份信息为服务人员；若在预设的数据库中没有查找到声纹信息对应的身份信息的情况下，则该声纹信息对应的语音帧数据对应的身份信息为顾客。

可选地，根据第一断句标记信息将对话语音数据分割成若干个语音片段数据，包括：将对话语音数据中相邻两个第一断句标记信息之间的语音数据确定为语音片段数据。可选地，根据第一断句标记信息将对话语音数据分割成若干个语音片段数据后，还包括：根据时间信息对语音片段数据添加开始时间和结束时间。可选地，将语音片段数据按照时间先后顺序排序。

可选地，获取对话语音数据对应的对话文本数据，包括：通过asr(automaticspeechrecognition，自动语音识别技术)对对话语音数据进行识别，获得待标记文本数据；对待标记文本数据进行标记，获得对话文本数据。可选地，待标记文本数据包括对话文本和该对话文本对应的身份信息文本。例如，根据对话语音数据获取到的待标记文本数据为“您好，请问您有什么需要？顾客：我想买盒阿莫西林。服务人员：好的，您稍等。”。将对话语音数据进行识别获得对应的对话文本数据，相较于将各语音片段数据进行识别获得对应的文本数据，识别过程中具有对话语音数据的上下文联系，提高了对语音数据识别的准确性。

可选地，对待标记文本数据进行标记，获得对话文本数据，包括：在待标记文本数据的身份信息文本前添加文本角色标记信息；在待标记文本数据的开始位置添加文本开始标记信息；在待标记文本数据的结束位置添加文本结束标记信息；将文本开始标记信息、文本结束标记信息和文本角色标记信息确定为第二断句标记信息；将标记后的待标记文本数据确定为对话文本数据。

可选地，根据第二断句标记信息将对话文本数据分割成若干个文本片段数据，包括：依次将对话文本数据中相邻两个第二断句标记信息之间的文本数据确定为文本片段数据。

可选地，将文本片段数据与语音片段数据关联存储在预设的语音片段数据库，包括：将第n个文本片段数据与第n个语音片段数据之间建立关联关系；将文本片段数据与语音片段数据的关联关系储存在预设的语音片段数据库中；其中，n为正整数。

由于对话语音数据的第一断句标记信息根据身份信息获取，对话文本数据的第二断句信息同样根据身份信息获取，第一断句标记信息与第二断句标记信息的数量相同。根据第一断句标记信息获取语音片段数据并按照时间排序，根据第二断句标记信息依次获取文本片段数据，因此，语音片段数据与文本片段数据的数量相同并且按照排列顺序一一对应。依次将语音片段数据与文本片段数据之间建立关联关系，并储存在数据库，从而能够实现根据文本片段数据查找语音片段数据，便于用户通过文本数据对语音数据进行查找，相较于现有技术需要对语音数据逐个进行查找，提高对语音数据的查找效率。

结合图2所示，本公开实施例提供一种用于检索语音数据的方法，包括：

步骤s201，获取检索关键词；

步骤s202，获取检索关键词对应的文本片段数据；

步骤s203，在预设的语音片段数据库中匹配出文本片段数据对应的语音片段数据；语音片段数据库中存储有文本片段数据和语音片段数据的关联关系。

采用本公开实施例提供的用于检索语音数据的方法，获取检索关键词对应的文本片段数据，根据文本片段数据查找语音片段数据，能够实现通过文本数据对语音数据进行查找，相较于现有技术需要对语音数据逐个进行查找，提高了对语音数据的查找效率。

可选地，获取检索关键词对应的文本片段数据，包括：从预设的数据库中查找包含搜索关键词的文本片段数据；数据库中存储有文本片段数据。

可选地，语音片段数据库通过以下方式获取：获取对话语音数据；对话语音数据带有第一断句标记信息；根据第一断句标记信息将对话语音数据分割成若干个语音片段数据；获取对话语音数据对应的对话文本数据，对话文本数据包括第二断句标记信息；根据第二断句标记信息将对话文本数据分割成若干个文本片段数据；文本片段数据的数量与语音片段数据的数量相同；将文本片段数据与语音片段数据关联存储在预设的语音片段数据库。

可选地，获取对话语音数据，包括：获取录音数据；去除录音数据中的静默片段，获得对话语音数据。

可选地，获取录音数据，包括：通过录音设备进行录音，获得录音数据。可选地，通过录音设备进行录音，包括：通过用户终端上的app将用户终端与录音设备进行绑定，通过用户终端控制对应的录音设备进行录音。可选地，通过用户终端上的app将用户终端与录音设备进行绑定，包括：通过用户终端上的app扫描录音设备对应的设备识别码，以使用户终端与录音设备进行绑定。

可选地，录音数据包括音频文件和时间信息。

可选地，去除录音数据中的静默片段，获得对话语音数据，包括：去除录音数据中的噪音，获得去噪后的录音数据；通过vad技术去除去噪后的录音数据中的静默片段，获得待标记语音数据；对待标记语音数据进行标记，获得对话语音数据。

可选地，对待标记语音数据进行标记，获得对话语音数据，包括：获取待标记语音数据中的各语音帧数据对应的身份信息；在相邻两个语音帧数据对应的身份信息不相同的情况下，在该相邻两个语音帧数据之间添加语音角色标记信息；该语音角色标记信息为该相邻两个语音帧数据中后一个语音帧数据对应的身份信息；在待标记语音数据的开始位置添加语音开始标记信息；在待标记语音数据的结束位置添加语音结束标记信息；将语音开始标记信息、语音结束标记信息和语音角色标记信息确定为第一断句标记信息；将标记后的待标记语音数据确定为对话语音数据。

可选地，获取待标记语音数据中各语音帧数据对应的身份信息，包括：获取待标记语音数据中的各语音帧数据的声纹信息；根据声纹信息在预设的数据库中查找对应的身份信息；其中，数据库中储存声纹信息对应的身份信息。

可选地，根据第一断句标记信息将对话语音数据分割成若干个语音片段数据，包括：将对话语音数据中相邻两个第一断句标记信息之间的语音数据确定为语音片段数据。可选地，根据第一断句标记信息将对话语音数据分割成若干个语音片段数据后，还包括：根据时间信息对语音片段数据添加开始时间和结束时间。可选地，将语音片段数据按照时间先后顺序排序。

可选地，获取对话语音数据对应的对话文本数据，包括：通过asr对对话语音数据进行识别，获得待标记文本数据；对待标记文本数据进行标记，获得对话文本数据。可选地，待标记文本数据包括对话文本和该对话文本对应的身份信息文本。

可选地，对待标记文本数据进行标记，获得对话文本数据，包括：在待标记文本数据的身份信息文本前添加文本角色标记信息；在待标记文本数据的开始位置添加文本开始标记信息；在待标记文本数据的结束位置添加文本结束标记信息；将文本开始标记信息、文本结束标记信息和文本角色标记信息确定为第二断句标记信息；将标记后的待标记文本数据确定为对话文本数据。

可选地，根据第二断句标记信息将对话文本数据分割成若干个文本片段数据，包括：依次将对话文本数据中相邻两个第二断句标记信息之间的文本数据确定为文本片段数据。

可选地，将文本片段数据与语音片段数据关联存储在预设的语音片段数据库，包括：将第n个文本片段数据与第n个语音片段数据之间建立关联关系；将文本片段数据与语音片段数据的关联关系储存在预设的语音片段数据库中；其中，n为正整数。

在一些实施例中，用户在用户终端上通过工作账号登录企业微信，通过企业微信扫描录音设备的设备识别码，以使用户终端通过企业微信与录音设备进行绑定；在开始上班时，通过企业微信控制录音设备开始录音；在下班时，通过企业微信控制录音设备结束录音；录音设备发送开始录音与结束录音之间的对话语音数据给用户终端；用户终端获取话语音数据的第一断句标记信息；根据第一断句标记信息将对话语音数据分割成若干个语音片段数据；获取对话语音数据对应的对话文本数据，对话文本数据包括第二断句标记信息；根据第二断句标记信息将对话文本数据分割成若干个文本片段数据；文本片段数据的数量与语音片段数据的数量相同；将文本片段数据与语音片段数据关联存储在企业微信数据库中；用户想要了解今天是否有提到“阿莫西林”，在企业微信的“搜索框”中输入“阿莫西林”，搜索到包含“阿莫西林”的文本片段数据与文本片段数据对应的语音片段数据，并点击语音片段数据进行收听。

采用本公开实施例提供的用于关联语音数据的方法，通过获取语音片段数据并获取语音片段数据对应的文本片段数据，根据文本片段数据查找语音片段数据，能够实现通过文本数据对语音数据进行查找，相较于现有技术需要对语音数据逐个进行查找，提高了对语音数据的查找效率。该方法能够用于工作相关的智能设备技术领域，通过人机协同智能系统提高查找语音数据的效率，进而提高工作效率。

结合图3所示，本公开实施例提供一种用于关联语音数据的装置，包括第一获取模块301、第一分割模块302、第二获取模块303、第二分割模块304和存储模块305。第一获取模块301被配置为获取对话语音数据，对话语音数据带有第一断句标记信息；第一分割模块302被配置为根据第一断句标记信息将对话语音数据分割成若干个语音片段数据；第二获取模块303被配置为获取对话语音数据对应的对话文本数据，对话文本数据包括第二断句标记信息；第二分割模块304被配置为根据第二断句标记信息将对话文本数据分割成若干个文本片段数据；文本片段数据的数量与语音片段数据的数量相同；存储模块305被配置为将文本片段数据与语音片段数据关联存储在预设的语音片段数据库。

采用本公开实施例提供的用于关联语音数据的装置，通过将带有第一断句标记信息的对话语音数据分割成若干个语音片段数据，将对话语音数据对应的对话文本数据分割成若干个文本片段数据，将文本片段数据与语音片段数据关联存储在预设的语音片段数据库。便于根据文本片段数据通过预设的语音片段数据库查找语音片段数据，能够实现通过文本数据对语音数据进行查找，相较于现有技术需要对语音数据逐个进行查找，提高了对语音数据的查找效率。

可选地，第一获取模块被配置为获取录音数据；去除录音数据中的静默片段，获得对话语音数据。

可选地，录音数据包括音频文件和时间信息。

可选地，第一获取模块被配置为去除录音数据中的噪音，获得去噪后的录音数据；通过vad技术去除去噪后的录音数据中的静默片段，获得待标记语音数据；对待标记语音数据进行标记，获得对话语音数据。

可选地，第一获取模块被配置为获取待标记语音数据中的各语音帧数据对应的身份信息；在相邻两个语音帧数据对应的身份信息不相同的情况下，在该相邻两个语音帧数据之间添加语音角色标记信息；该语音角色标记信息为该相邻两个语音帧数据中后一个语音帧数据对应的身份信息；在待标记语音数据的开始位置添加语音开始标记信息；在待标记语音数据的结束位置添加语音结束标记信息；将语音开始标记信息、语音结束标记信息和语音角色标记信息确定为第一断句标记信息；将标记后的待标记语音数据确定为对话语音数据。

可选地，第一获取模块被配置为获取待标记语音数据中的各语音帧数据的声纹信息；根据声纹信息在预设的数据库中查找对应的身份信息；其中，数据库中储存声纹信息对应的身份信息。

可选地，第一分割模块被配置为将对话语音数据中相邻两个第一断句标记信息之间的语音数据确定为语音片段数据。可选地，根据第一断句标记信息将对话语音数据分割成若干个语音片段数据后，还包括：根据时间信息对语音片段数据添加开始时间和结束时间。可选地，将语音片段数据按照时间先后顺序排序。

可选地，第二获取模块被配置为通过asr对对话语音数据进行识别，获得待标记文本数据；对待标记文本数据进行标记，获得对话文本数据。可选地，待标记文本数据包括对话文本和该对话文本对应的身份信息文本。

可选地，第二获取模块被配置为在待标记文本数据的身份信息文本前添加文本角色标记信息；在待标记文本数据的开始位置添加文本开始标记信息；在待标记文本数据的结束位置添加文本结束标记信息；将文本开始标记信息、文本结束标记信息和文本角色标记信息确定为第二断句标记信息；将标记后的待标记文本数据确定为对话文本数据。

可选地，第二分割模块被配置为依次将对话文本数据中相邻两个第二断句标记信息之间的文本数据确定为文本片段数据。

可选地，存储模块被配置为将第n个文本片段数据与第n个语音片段数据之间建立关联关系；将文本片段数据与语音片段数据的关联关系储存在预设的语音片段数据库中；其中，n为正整数。

结合图4所示，本公开实施例提供一种用于检索语音数据的装置，包括第三获取模块401、第四获取模块402和匹配模块403。第三获取模块401被配置为获取检索关键词；第四获取模块402被配置为获取检索关键词对应的文本片段数据；匹配模块403被配置为在预设的语音片段数据库中匹配出文本片段数据对应的语音片段数据；语音片段数据库中存储有文本片段数据和语音片段数据的关联关系。

采用本公开实施例提供的用于检索语音数据的装置，获取检索关键词对应的文本片段数据，根据文本片段数据查找语音片段数据，能够实现通过文本数据对语音数据进行查找，相较于现有技术需要对语音数据逐个进行查找，提高了对语音数据的查找效率。

结合图5所示，本公开实施例提供一种电子设备，包括第一处理器(processor)500和第一存储器(memory)501。可选地，该电子设备还可以包括第一通信接口(communicationinterface)502和第一总线503。其中，第一处理器500、第一通信接口502、第一存储器501可以通过第一总线503完成相互间的通信。第一通信接口502可以用于信息传输。第一处理器500可以调用第一存储器501中的逻辑指令，以执行上述实施例的用于关联语音数据的方法。

采用本公开实施例提供的电子设备，通过将带有第一断句标记信息的对话语音数据分割成若干个语音片段数据，将对话语音数据对应的对话文本数据分割成若干个文本片段数据，将文本片段数据与语音片段数据关联存储在预设的语音片段数据库。便于根据文本片段数据通过预设的语音片段数据库查找语音片段数据，能够实现通过文本数据对语音数据进行查找，相较于现有技术需要对语音数据逐个进行查找，提高了对语音数据的查找效率。

此外，上述的第一存储器501中的逻辑指令可以通过软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。

第一存储器501作为一种计算机可读存储介质，可用于存储软件程序、计算机可执行程序，如本公开实施例中的方法对应的程序指令/模块。第一处理器500通过运行存储在第一存储器501中的程序指令/模块，从而执行功能应用以及数据处理，即实现上述实施例中用于关联语音数据的方法。

第一存储器501可包括存储程序区和存储数据区，其中，存储程序区可存储操作系统、至少一个功能所需的应用程序；存储数据区可存储根据终端设备的使用所创建的数据等。此外，第一存储器501可以包括高速随机存取存储器，还可以包括非易失性存储器。

可选地，电子设备包括计算机、服务器、手机、平板电脑等。

结合图6所示，本公开实施例提供一种电子设备，包括第二处理器600和第二存储器601。可选地，该电子设备还可以包第二括通信接口602和第二总线603。其中，第二处理器600、第二通信接口602、第二存储器601可以通过第二总线603完成相互间的通信。第二通信接口602可以用于信息传输。第二处理器600可以调用第二存储器601中的逻辑指令，以执行上述实施例的用于检索语音数据的方法。

采用本公开实施例提供的电子设备，获取检索关键词对应的文本片段数据，根据文本片段数据查找语音片段数据，能够实现通过文本数据对语音数据进行查找，相较于现有技术需要对语音数据逐个进行查找，提高了对语音数据的查找效率。

此外，上述的第二存储器601中的逻辑指令可以通过软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。

第二存储器601作为一种计算机可读存储介质，可用于存储软件程序、计算机可执行程序，如本公开实施例中的方法对应的程序指令/模块。第二处理器600通过运行存储在第二存储器601中的程序指令/模块，从而执行功能应用以及数据处理，即实现上述实施例中用于检索语音数据的方法。

第二存储器601可包括存储程序区和存储数据区，其中，存储程序区可存储操作系统、至少一个功能所需的应用程序；存储数据区可存储根据终端设备的使用所创建的数据等。此外，第二存储器601可以包括高速随机存取存储器，还可以包括非易失性存储器。

可选地，电子设备包括计算机、服务器、手机、平板电脑等。

本公开实施例提供了一种可读存储介质，存储有可执行指令，可执行指令在运行时执行上述用于关联语音数据的方法。

采用本公开实施例提供的可读存储介质，通过将带有第一断句标记信息的对话语音数据分割成若干个语音片段数据，将对话语音数据对应的对话文本数据分割成若干个文本片段数据，将文本片段数据与语音片段数据关联存储在预设的语音片段数据库。便于根据文本片段数据通过预设的语音片段数据库查找语音片段数据，能够实现通过文本数据对语音数据进行查找，相较于现有技术需要对语音数据逐个进行查找，提高了对语音数据的查找效率。

本公开实施例提供了一种可读存储介质，存储有可执行指令，可执行指令在运行时执行上述用于检索语音数据的方法。

采用本公开实施例提供的可读存储介质，获取检索关键词对应的文本片段数据，根据文本片段数据查找语音片段数据，能够实现通过文本数据对语音数据进行查找，相较于现有技术需要对语音数据逐个进行查找，提高了对语音数据的查找效率。

本公开实施例提供了一种计算机程序产品，所述计算机程序产品包括存储在可读存储介质上的计算机程序，所述计算机程序包括程序指令，当所述程序指令被计算机执行时，使所述计算机执行上述用于关联语音数据的方法。

本公开实施例提供了一种计算机程序产品，所述计算机程序产品包括存储在可读存储介质上的计算机程序，所述计算机程序包括程序指令，当所述程序指令被计算机执行时，使所述计算机执行上述用于检索语音数据的方法。

上述的可读存储介质可以是暂态计算机可读存储介质，也可以是非暂态计算机可读存储介质。

本公开实施例的技术方案可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括一个或多个指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行本公开实施例所述方法的全部或部分步骤。而前述的存储介质可以是非暂态存储介质，包括：u盘、移动硬盘、只读存储器(rom，read-onlymemory)、随机存取存储器(ram，randomaccessmemory)、磁碟或者光盘等多种可以存储程序代码的介质，也可以是暂态存储介质。

以上描述和附图充分地示出了本公开的实施例，以使本领域的技术人员能够实践它们。其他实施例可以包括结构的、逻辑的、电气的、过程的以及其他的改变。实施例仅代表可能的变化。除非明确要求，否则单独的部件和功能是可选的，并且操作的顺序可以变化。一些实施例的部分和特征可以被包括在或替换其他实施例的部分和特征。而且，本申请中使用的用词仅用于描述实施例并且不用于限制权利要求。如在实施例以及权利要求的描述中使用的，除非上下文清楚地表明，否则单数形式的“一个”(a)、“一个”(an)和“所述”(the)旨在同样包括复数形式。类似地，如在本申请中所使用的术语“和/或”是指包含一个或一个以上相关联的列出的任何以及所有可能的组合。另外，当用于本申请中时，术语“包括”(comprise)及其变型“包括”(comprises)和/或包括(comprising)等指陈述的特征、整体、步骤、操作、元素，和/或组件的存在，但不排除一个或一个以上其它特征、整体、步骤、操作、元素、组件和/或这些的分组的存在或添加。在没有更多限制的情况下，由语句“包括一个…”限定的要素，并不排除在包括所述要素的过程、方法或者设备中还存在另外的相同要素。本文中，每个实施例重点说明的可以是与其他实施例的不同之处，各个实施例之间相同相似部分可以互相参见。对于实施例公开的方法、产品等而言，如果其与实施例公开的方法部分相对应，那么相关之处可以参见方法部分的描述。

本领域技术人员可以意识到，结合本文中所公开的实施例描述的各示例的单元及算法步骤，能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行，可以取决于技术方案的特定应用和设计约束条件。所述技术人员可以对每个特定的应用来使用不同方法以实现所描述的功能，但是这种实现不应认为超出本公开实施例的范围。所述技术人员可以清楚地了解到，为描述的方便和简洁，上述描述的系统、装置和单元的具体工作过程，可以参考前述方法实施例中的对应过程，在此不再赘述。

本文所披露的实施例中，所揭露的方法、产品(包括但不限于装置、设备等)，可以通过其它的方式实现。例如，以上所描述的装置实施例仅仅是示意性的，例如，所述单元的划分，可以仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，例如多个单元或组件可以结合或者可以集成到另一个系统，或一些特征可以忽略，或不执行。另外，所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口，装置或单元的间接耦合或通信连接，可以是电性，机械或其它的形式。所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例。另外，在本公开实施例中的各功能单元可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中。

附图中的流程图和框图显示了根据本公开实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上，流程图或框图中的每个方框可以代表一个模块、程序段或代码的一部分，所述模块、程序段或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。在有些作为替换的实现中，方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如，两个连续的方框实际上可以基本并行地执行，它们有时也可以按相反的顺序执行，这可以依所涉及的功能而定。在附图中的流程图和框图所对应的描述中，不同的方框所对应的操作或步骤也可以以不同于描述中所披露的顺序发生，有时不同的操作或步骤之间不存在特定的顺序。例如，两个连续的操作或步骤实际上可以基本并行地执行，它们有时也可以按相反的顺序执行，这可以依所涉及的功能而定。框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合，可以用执行规定的功能或动作的专用的基于硬件的系统来实现，或者可以用专用硬件与计算机指令的组合来实现。

再多了解一些

1/2 1 2 下一页尾页

本文用于企业家、创业者技术爱好者查询，结果仅供参考。

上一篇：返回列表
下一篇：一种高精度的离线语音识别模块的制作方法

用于关联语音数据和检索语音数据的方法、装置、电子设备和可读存储介质与流程

相关文章

最热文献