音频处理方法、装置、设备、存储介质及计算机程序产品与流程

2022-06-05 07:52:06 来源：中国专利 TAG：

1.本技术涉及音频处理技术领域，尤其涉及一种音频处理方法、装置、设备、存储介质及计算机程序产品。

背景技术：

2.随着互联网的发展，网上购物也越来越普遍。用户通过购物app购买商品后，如果想咨询问题，可以直接通过购物app进行咨询。人工客服可以直接通过一些技术手段快速获得相关信息，例如购物app上用户可以通过发送订单链接的方式让人工客服知晓需要处理的订单信息等。
3.然而，在某些情况下，用户可能会通过拨打售后电话的方式咨询问题。人工客服只能在用户口述问题后，才能进行之后的服务。例如，通过键盘输入订单号之后获取订单信息，该方法效率较低。

技术实现要素：

4.为了解决上述技术问题，本技术提供了一种音频处理方法、装置、电子设备、存储介质及计算机程序产品。
5.根据本技术的第一方面，提供了一种音频处理方法，包括：
6.获取用户与人工客服通话过程中的通话语音数据，提取所述通话语音数据中的用户语音数据，并对所述用户语音数据进行语音识别，得到所述用户语音数据的对应的文本信息；
7.提取所述文本信息中的目标信息，并显示所述目标信息；
8.响应于针对所述目标信息的复制操作，复制所述目标信息；
9.响应于粘贴操作，将所述目标信息粘贴至人工客服页面的搜索框，以获取所述目标信息的搜索结果。
10.可选的，所述方法还包括：
11.获取目标文本信息；其中，所述目标文本信息对应的咨询频率大于预设频率；
12.在所述人工客服页面的预设位置显示针对所述目标文本信息的搜索结果。
13.可选的，所述提取所述文本信息中的目标信息，包括：
14.对所述文本信息进行拆词处理，得到至少一个关键词，并将所述关键词作为目标信息；或者
15.对所述文本信息进行概要生成，得到概要信息；
16.对所述概要信息进行拆词处理，得到至少一个关键词，并将所述关键词作为目标信息。
17.可选的，所述显示所述目标信息，包括：
18.显示所述文本信息，并将所述目标信息进行突出显示。
19.可选的，在所述对所述用户语音数据进行语音识别之前，所述方法还包括：
20.在所述对所述用户语音数据进行语音识别之前，响应于针对所述人工客服页面中语音识别功能的开启操作，开启语音识别功能；
21.在所述对所述用户语音数据进行语音识别之后，响应于针对所述人工客服页面中语音识别功能的关闭操作，关闭语音识别功能。
22.可选的，所述目标信息包括：订单标识信息，所述方法还包括：
23.在预设时间段内存储所述文本信息或所述目标信息；
24.当在所述预设时间段内接收到目标语音数据时，获取所述文本信息或所述目标信息；其中，针对所述目标语音数据语音识别得到的咨询信息中包括所述订单标识信息。
25.可选的，所述响应于针对所述目标信息的复制操作，复制所述目标信息，包括：
26.响应于针对所述目标信息的点击操作，复制所述目标信息。
27.根据本技术的第二方面，提供了一种音频处理装置，包括：
28.语音提取模块，用于获取用户与人工客服通话过程中的通话语音数据，提取所述通话语音数据中的用户语音数据；
29.语音识别模块，用于对所述用户语音数据进行语音识别，得到所述用户语音数据的对应的文本信息；
30.目标信息提取和显示模块，用于提取所述文本信息中的目标信息，并显示所述目标信息；
31.复制模块，用于响应于针对所述目标信息的复制操作，复制所述目标信息；
32.粘贴模块，用于响应于粘贴操作，将所述目标信息粘贴至人工客服页面的搜索框，以获取所述目标信息的搜索结果。
33.可选的，所述音频处理装置，还包括：
34.第一获取模块，用于获取目标文本信息；其中，所述目标文本信息对应的咨询频率大于预设频率；
35.搜索结果显示模块，用于在所述人工客服页面的预设位置显示针对所述目标文本信息的搜索结果。
36.可选的，所述目标信息提取和显示模块，具体用于通过下述方式实现提取所述文本信息中的目标信息：
37.对所述文本信息进行拆词处理，得到至少一个关键词，并将所述关键词作为目标信息；或者
38.对所述文本信息进行概要生成，得到概要信息；
39.对所述概要信息进行拆词处理，得到至少一个关键词，并将所述关键词作为目标信息。
40.可选的，所述目标信息提取和显示模块，具体用于通过下述方式实现显示所述目标信息：
41.显示所述文本信息，并将所述目标信息进行突出显示。
42.可选的，所述音频处理装置，还包括：
43.语音识别功能开关模块，用于在所述对所述用户语音数据进行语音识别之前，响应于针对所述人工客服页面中语音识别功能的开启操作，开启语音识别功能；以及在所述对所述用户语音数据进行语音识别之后，响应于针对所述人工客服页面中语音识别功能的
关闭操作，关闭语音识别功能。
44.可选的，所述目标信息包括：订单标识信息，所述音频处理装置，还包括：
45.信息存储模块，用于在预设时间段内存储所述文本信息或所述目标信息。
46.第二获取模块，用于当在所述预设时间段内接收到目标语音数据时，获取所述文本信息或所述目标信息；其中，针对所述目标语音数据语音识别得到的咨询信息中包括所述订单标识信息。
47.可选的，所述复制模块，具体用于响应于针对所述目标信息的点击操作，复制所述目标信息。
48.根据本技术的第三方面，提供了一种电子设备，包括：处理器，所述处理器用于执行存储于存储器的计算机程序，所述计算机程序被处理器执行时实现第一方面所述的音频处理方法。
49.根据本技术的第四方面，提供了一种计算机可读存储介质，其上存储有计算机程序，所述计算机程序被处理器执行时实现第一方面所述的音频处理方法。
50.根据本技术的第五方面，提供了一种计算机程序产品，当所述计算机程序产品在计算机上运行时，使得所述计算机执行第一方面所述的音频处理方法。
51.本技术实施例提供的技术方案与现有技术相比具有如下优点：
52.在用户与人工客服通话过程中，可以获取通话语音数据，提取通话语音数据中的用户语音数据，即用户所说的语音内容。对用户语音数据进行语音识别，得到用户语音数据的对应的文本信息。提取文本信息中的目标信息，并显示目标信息。这样，人工客服可以直接对目标信息进行复制粘贴来获取目标信息的搜索结果。可见，该过程省去了人工客服键盘输入目标信息的过程，提高了交互效率，从而使人工客服更好地服务于用户，提升客服满意度。
附图说明
53.此处的附图被并入说明书中并构成本说明书的一部分，示出了符合本技术的实施例，并与说明书一起用于解释本技术的原理。
54.为了更清楚地说明本技术实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，对于本领域普通技术人员而言，在不付出创造性劳动性的前提下，还可以根据这些附图获得其他的附图。
55.图1为本技术实施例中音频处理方法的一种流程图；
56.图2为本技术实施例中音频处理方法的又一种流程图；
57.图3为本技术实施例中音频处理装置的一种结构示意图；
58.图4为本技术实施例中电子设备的一种结构示意图。
具体实施方式
59.为了能够更清楚地理解本技术的上述目的、特征和优点，下面将对本技术的方案进行进一步描述。需要说明的是，在不冲突的情况下，本技术的实施例及实施例中的特征可以相互组合。
60.在下面的描述中阐述了很多具体细节以便于充分理解本技术，但本技术还可以采
用其他不同于在此描述的方式来实施；显然，说明书中的实施例只是本技术的一部分实施例，而不是全部的实施例。
61.本技术实施例的音频处理方法和装置可以应用于人工客服页面对应的服务器，其中，人工客服页面是人工客服查询信息的页面。
62.参见图1，图1为本技术实施例中音频处理方法的一种流程图，可以包括以下步骤：
63.步骤s110，获取用户与人工客服通话过程中的通话语音数据，提取通话语音数据中的用户语音数据，并对用户语音数据进行语音识别，得到用户语音数据的对应的文本信息。
64.步骤s120，提取文本信息中的目标信息，并显示目标信息。
65.步骤s130，响应于针对目标信息的复制操作，复制目标信息。
66.步骤s140，响应于粘贴操作，将目标信息粘贴至人工客服页面的搜索框，以获取目标信息的搜索结果。
67.本技术实施例的音频处理方法，在用户与人工客服通话过程中，可以获取通话语音数据，提取通话语音数据中的用户语音数据，即用户所说的语音内容。对用户语音数据进行语音识别，得到用户语音数据的对应的文本信息。提取文本信息中的目标信息，并显示目标信息。这样，人工客服可以直接对目标信息进行复制粘贴来获取目标信息的搜索结果。可见，该过程省去了人工客服键盘输入目标信息的过程，提高了交互效率，从而使人工客服更好地服务于用户，提升客服满意度。
68.参见图2，图2为本技术实施例中音频处理方法的又一种流程图，可以包括以下步骤：
69.步骤s210，响应于针对人工客服页面中语音识别功能的开启操作，开启语音识别功能。
70.人工客服页面是人工客服查询信息的页面，根据该人工客服页面可以搜索相关信息，并为用户提供相应的服务。在该人工客服页面中，可以提供人工客服使用的语音识别功能，即将语音数据转换为文本信息的功能。例如，在人工客服页面中可以包含开启或关闭该语音识别功能的按钮，当人工客服要使用该功能时，可以点击开启该按钮，开启语音识别功能。当然，该语音识别功能开启之后也可以随时关闭，例如，再次点击该按钮后，可以关闭语音识别功能。
71.步骤s220，获取用户与人工客服通话过程中的通话语音数据，提取通话语音数据中的用户语音数据，并对用户语音数据进行语音识别，得到用户语音数据的对应的文本信息。
72.在开启语音识别功能后，可以获取用户与人工客服通话过程中的通话语音数据，该通话语音数据是经过用户授权的语音数据。由于通话过程中包含用户语音数据和人工客服语音数据，而在此是为了识别用户的意图，因此可以提取通话语音数据中的用户语音数据。由于每个人均具有对应的语音特征，例如频谱特征、fbank特征、梅尔倒频谱系数mfcc特征等。因此可以通过语音特征提取不同说话人的语音数据。在一些实施例中，可以通过声纹识别技术提取通话语音数据中的用户语音数据。
73.通过对用户语音数据进行语音识别，可以得到对应的文本信息。另外，在对用户语音数据进行语音识别之后，人工客服也可以随时关闭语音识别功能。响应于针对人工客服
页面中语音识别功能的关闭操作，关闭语音识别功能。
74.步骤s230，提取文本信息中的目标信息，并显示目标信息。
75.由于文本信息中包含用户所说的完整内容，文本信息可能是一个完整的句子。而人工客服所需要内容的通常是文本信息中的目标信息，例如关键词等。因此，可以从文本信息中提取目标信息，并显示目标信息即可。例如，在线上购物场景下，如果文本信息是关于用户购买产品的咨询信息，目标信息可以包括订单标识信息。
76.在一些实施例中，可以直接对文本信息进行拆词处理，得到至少一个关键词，并将关键词作为目标信息。例如，文本信息中涉及到**产品**部件损坏，关键词可以包括：**产品、损坏等。或者，也可以先对文本信息进行概要生成，得到概要信息。例如，利用nlp(natural language processing，自然语言处理)的文本概要生成技术，归纳文本信息中的重要内容，生成概要信息。并对概要信息进行拆词处理(例如按功能进行拆词处理等)，得到至少一个关键词，并将关键词作为目标信息。
77.在一些实施例中，可以直接显示目标信息，也可以显示文本信息，即显示完整的内容，并将文本信息中的目标信息进行突出显示。例如，将目标信息加粗显示、黑体显示、加下划线显示等。这样，人工客服可以更直观地获取到目标信息。
78.在一些实施例中，如果目标信息包括：订单标识信息，还可以在预设时间段内(例如一个月内)存储该文本信息或目标信息。当在预设时间段内接收到目标语音数据时，获取文本信息或目标信息；其中，针对目标语音数据语音识别得到的咨询信息中包括订单标识信息。这样，当用户咨询同一个订单时，便于人工客服了解之前沟通的内容，避免因为同样的问题与用户进行交互，从而提升用户体验。
79.步骤s240，响应于针对目标信息的复制操作，复制目标信息。
80.针对显示的目标信息，人工客服可以根据实际需要，判断该目标信息是否为所需内容，如果是，可以直接复制目标信息。并通过步骤s250中的粘贴操作，将目标信息粘贴至人工客服页面的搜索框。这样，可以避免了人工客服手动输入目标信息的过程，提高了服务效率。
81.其中，复制操作可以是选中目标信息后，执行“ctrl c”的操作。在一些实施例中，也可以响应于针对目标信息的点击操作，复制该目标信息。即，复制操作也可以是针对目标信息的点击操作，例如单击、双击等。这样，人工客服的操作更简便快捷，可以进一步提高人工客服的服务效率。
82.步骤s250，响应于粘贴操作，将目标信息粘贴至人工客服页面的搜索框，以获取目标信息的搜索结果。
83.在执行复制操作后，人工客服在人工客服页面的搜索框执行粘贴操作，可以将目标信息粘贴至搜索框，以获取目标信息的搜索结果。类似地，粘贴操作可以是“ctrl v”的操作，也可以是点击操作，例如单击操作或双击操作等。
84.需要说明的是，人工客服在获取到搜索结果后，可以直接在通话过程中，将搜索结果提供给用户。或者，也可以将搜索结果发送至用户的终端设备上，用户可以通过终端设备查看搜索结果。或者，在通话过程中人工客服提供搜索结果的同时，向用户的终端设备发送搜索结果，从而更全面地为用户提供服务。
85.可以理解的是，人工客服通常可以有多个，不同用户可能会咨询不同的问题，也可
能会咨询相同的问题。针对咨询频率较高的问题，如果均按照上述方法获取搜索结果，人工客服将会多次执行重复的动作，影响客服效率。因此，在一些实施例中，可以获取目标文本信息，目标文本信息对应的咨询频率大于预设频率。也就是，获取咨询频率较高的问题，并在人工客服页面的预设位置(例如页面顶端)显示针对目标文本信息的搜索结果。这样，可以方便人工客服快速处理咨询频率较高的问题，进一步提高人工客服的服务效率，提升用户体验。
86.本技术实施例的音频处理方法，可以在人工客服页面为人工客服提供语音识别功能，人工客服可以根据实际需求开启或关闭该功能。在开启该功能后，可以从用户与人工客服通话过程中的通话语音数据中提取用户语音数据，并进行语音识别，得到对应的文本信息。从文本信息中提取目标信息，并显示目标信息。人工客服通过点击目标信息即可复制目标信息，并将目标信息粘贴至搜索框来获取目标信息的搜索结果，该过程省去了人工客服键盘输入目标信息的过程，并且，复制过程操作更简捷，提高了交互效率，从而使人工客服更好地服务于用户。在获取搜索结果后，除了可以在通话过程中告知用户搜索结果外，还可以将搜索结果发送至用户的终端设备，用户可以随时查看搜索结果，从而提升用户体验。
87.相应于上述方法实施例，本技术实施例还提供了一种音频处理装置，参见图3，图3为本技术实施例中音频处理装置的一种结构示意图，音频处理装置300包括：
88.语音提取模块310，用于获取用户与人工客服通话过程中的通话语音数据，提取通话语音数据中的用户语音数据；
89.语音识别模块320，用于对用户语音数据进行语音识别，得到用户语音数据的对应的文本信息；
90.目标信息提取和显示模块330，用于提取文本信息中的目标信息，并显示目标信息；
91.复制模块340，用于响应于针对目标信息的复制操作，复制目标信息；
92.粘贴模块350，用于响应于粘贴操作，将目标信息粘贴至人工客服页面的搜索框，以获取目标信息的搜索结果。
93.可选的，音频处理装置300，还包括：
94.第一获取模块，用于获取目标文本信息；其中，目标文本信息对应的咨询频率大于预设频率；
95.搜索结果显示模块，用于在人工客服页面的预设位置显示针对目标文本信息的搜索结果。
96.可选的，目标信息提取和显示模块330，具体用于通过下述方式实现提取文本信息中的目标信息：
97.对文本信息进行拆词处理，得到至少一个关键词，并将关键词作为目标信息；或者
98.对文本信息进行概要生成，得到概要信息；
99.对概要信息进行拆词处理，得到至少一个关键词，并将关键词作为目标信息。
100.可选的，目标信息提取和显示模块330，具体用于通过下述方式实现显示目标信息：
101.显示文本信息，并将目标信息进行突出显示。
102.可选的，音频处理装置300，还包括：
103.语音识别功能开关模块，用于在对用户语音数据进行语音识别之前，响应于针对人工客服页面中语音识别功能的开启操作，开启语音识别功能；以及在对用户语音数据进行语音识别之后，响应于针对人工客服页面中语音识别功能的关闭操作，关闭语音识别功能。
104.可选的，目标信息包括：订单标识信息，音频处理装置300，还包括：
105.信息存储模块，用于在预设时间段内存储存文本信息或目标信息。
106.第二获取模块，用于当在预设时间段内接收到目标语音数据时，获取文本信息或目标信息；其中，针对目标语音数据语音识别得到的咨询信息中包括订单标识信息。
107.可选的，音频处理装置300，还包括：
108.搜索结果发送模块，用于在获取目标信息的搜索结果后，将搜索结果发送至用户的终端设备上。
109.可选的，复制模块340，具体用于响应于针对目标信息的点击操作，复制该目标信息。
110.上述装置中各模块或单元的具体细节已经在对应的方法中进行了详细的描述，因此此处不再赘述。
111.应当注意，尽管在上文详细描述中提及了用于动作执行的设备的若干模块或者单元，但是这种划分并非强制性的。实际上，根据本技术的实施方式，上文描述的两个或更多模块或者单元的特征和功能可以在一个模块或者单元中具体化。反之，上文描述的一个模块或者单元的特征和功能可以进一步划分为由多个模块或者单元来具体化。
112.在本技术的示例性实施例中，还提供一种电子设备，包括：处理器；用于存储处理器可执行指令的存储器；其中，处理器被配置为执行本示例实施方式中上述音频处理方法。
113.图4为本技术实施例中电子设备的一种结构示意图。需要说明的是，图4示出的电子设备400仅是一个示例，不应对本技术实施例的功能和使用范围带来任何限制。
114.如图4所示，电子设备400包括中央处理单元(cpu)401，其可以根据存储在只读存储器(rom)402中的程序或者从存储部分408加载到随机访问存储器(ram)403中的程序而执行各种适当的动作和处理。在ram 403中，还存储有系统操作所需的各种程序和数据。中央处理单元401、rom 402以及ram 403通过总线404彼此相连。输入/输出(i/o)接口405也连接至总线404。
115.以下部件连接至i/o接口405：包括键盘、鼠标等的输入部分406；包括诸如阴极射线管(crt)、液晶显示器(lcd)等以及扬声器等的输出部分407；包括硬盘等的存储部分408；以及包括诸如局域网(lan)卡、调制解调器等的网络接口卡的通信部分409。通信部分409经由诸如因特网的网络执行通信处理。驱动器410也根据需要连接至i/o接口405。可拆卸介质411，诸如磁盘、光盘、磁光盘、半导体存储器等等，根据需要安装在驱动器410上，以便于从其上读出的计算机程序根据需要被安装入存储部分408。
116.特别地，根据本技术的实施例，上文参考流程图描述的过程可以被实现为计算机软件程序。例如，本技术的实施例包括一种计算机程序产品，其包括承载在计算机可读介质上的计算机程序，该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中，该计算机程序可以通过通信部分409从网络上被下载和安装，和/或从可拆卸介质411被安装。在该计算机程序被中央处理单元401执行时，执行本技术的装置中限定的各种
功能。
117.本技术实施例中，还提供了一种计算机可读存储介质，其上存储有计算机程序，所述计算机程序被处理器执行时实现上述音频处理方法。
118.需要说明的是，本技术所示的计算机可读存储介质例如可以是—但不限于—电、磁、光、电磁、红外线、或半导体的系统、装置或器件，或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于：具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器、只读存储器、可擦式可编程只读存储器(eprom或闪存)、光纤、便携式紧凑磁盘只读存储器(cd-rom)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本技术中，计算机可读存储介质可以是任何包含或存储程序的有形介质，该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。计算机可读存储介质上包含的程序代码可以用任何适当的介质传输，包括但不限于：无线、电线、光缆、射频等等，或者上述的任意合适的组合。
119.本技术实施例中，还提供了一种计算机程序产品，当计算机程序产品在计算机上运行时，使得计算机执行上述音频处理方法。
120.需要说明的是，在本文中，诸如“第一”和“第二”等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来，而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下，由语句“包括一个
……”
限定的要素，并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
121.以上所述仅是本技术的具体实施方式，使本领域技术人员能够理解或实现本技术。对这些实施例的多种修改对本领域的技术人员来说将是显而易见的，本文中所定义的一般原理可以在不脱离本技术的精神或范围的情况下，在其它实施例中实现。因此，本技术将不会被限制于本文所述的这些实施例，而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

再多了解一些

1/2 1 2 下一页尾页

本文用于企业家、创业者技术爱好者查询，结果仅供参考。

上一篇：返回列表
下一篇：数据处理方法、数据处理装置、电子设备和存储介质与流程

音频处理方法、装置、设备、存储介质及计算机程序产品与流程

相关文献

最热文献