一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

语音数据处理设备、方法、系统及存储介质与流程

2021-06-29 20:34:00 来源:中国专利 TAG:数据处理 语音 通信 计算机 申请


1.本申请属于计算机通信技术领域,尤其涉及一种语音数据处理的设备、方法、系统及存储介质。


背景技术:

2.一些智能手机的操作系统没有提供应用程序(application,app)处理语音通话的语音信号的应用程序接口(application programming interface,api),因此app无法实现对语音通话的深度控制,无法对通话内容进行全面的处理。


技术实现要素:

3.本申请实施例提供了一种语音数据处理的设备、方法系统及存储介质,可以解决以上问题的至少一部分。
4.第一方面,本申请实施例提供了一种语音数据处理设备,包括:
5.第一接口单元和数据处理单元,
6.所述第一接口单元与所述数据处理单元通信耦合;
7.所述第一接口单元,用于所述数据处理单元与终端设备间传输第一语音数据和第二语音数据;
8.所述数据处理单元,用于执行以下操作至少之一:
9.将通过所述第一接口单元接收到的第一语音数据转换为第二语音数据,将所述第二语音数据通过所述第一接口单元发送回所述终端设备;和,
10.将通过所述第一接口单元接收到的第二语音数据转换为第一语音数据,将所述第一语音数据通过所述第一接口单元发送回所述终端设备;
11.所述第一语音数据为所述终端设备的语音处理程序的输入输出数据;
12.所述第二语音数据为所述终端设备的通话单元的输入输出数据。
13.可以理解的是,语音数据处理设备通过将终端设备的通话单元发出的第一语音数据转换为第二语音数据,发送回终端设备,由终端设备的语音处理程序接收并处理第二语音数据;或者语音数据处理设备通过将终端设备的语音处理程序发出的第二语音数据转换为第一语音数据,发送回终端设备,由终端设备的通话单元接收并处理。可以使语音处理程序接管终端设备的通话,从而实现对通话设计的语音数据的全面和深度处理。
14.第二方面,本申请实施例提供了一种语音数据处理的方法,包括:
15.应用于语音数据处理设备;
16.所述语音数据处理设备包括第一接口单元和数据处理单元,所述方法包括以下步骤至少之一:
17.通过所述第一接口单元接收终端设备发送的第一语音数据,所述数据处理单元将第一语音数据转换为第二语音数据,通过所述第一接口单元将所述第二语音数据发送回终端设备;和,
18.通过所述第一接口单元接收终端设备发送的第二语音数据,所述数据处理单元将第二语音数据转换为第一语音数据,通过所述第一接口单元将所述第一语音数据发送回终端设备;
19.所述第一语音数据为所述终端设备的语音处理程序的输入输出数据;
20.所述第二语音数据为所述终端设备的通话单元的输入输出数据。
21.第三方面,本申请实施例提供了一种语音数据处理装置,应用于语音数据处理设备;
22.所述语音数据处理设备包括第一接口单元和数据处理单元,所述装置包括以下模块至少之一:
23.第一数据处理模块,用于通过所述第一接口单元接收终端设备发送的第一语音数据,所述数据处理单元将第一语音数据转换为第二语音数据,通过所述第一接口单元将所述第二语音数据发送回终端设备;和,
24.第二数据处理模块,通过所述第一接口单元接收终端设备发送的第二语音数据,所述数据处理单元将第二语音数据转换为第一语音数据,通过所述第一接口单元将所述第一语音数据发送回终端设备;
25.所述第一语音数据为所述终端设备的语音处理程序的输入输出数据;
26.所述第二语音数据为所述终端设备的通话单元的输入输出数据。
27.第四方面,本申请实施例提供了一种终端设备,包括:
28.存储单元、处理单元、通话单元、第二接口单元,以及存储在所述存储单元中并可在所述处理单元上运行的语音处理程序和控制程序;
29.所述存储单元与所述处理单元通信耦合;所述通话单元与所述处理单元通信耦合;所述通话单元与所述第二接口单元通信耦合;
30.所述通话单元用于处理第一语音数据;所述语音处理程序用于处理第二语音数据;
31.所述处理单元执行所述控制程序时实现以下操作至少之一:
32.将所述通话单元输出的第一语音数据,通过所述第二接口单元发送给语音数据处理设备;用于所述语音数据处理设备将所述第一语音数据转换为第二语音数据,将所述第二语音数据发送回所述终端设备;通过所述第二接口单元接收所述第二语音数据,将所述第二语音数据作为所述语音处理程序的输入数据;和,
33.将所述语音处理程序输出的第二语音数据,通过所述第二接口单元发送给语音数据处理设备;用于所述语音数据处理设备将所述第二语音数据转换为第一语音数据,将所述第一语音数据发送回所述终端设备;通过所述第二接口单元接收所述第一语音数据,将所述第一语音数据作为所述通话单元的输入数据。
34.第五方面,本申请实施例提供了一种语音数据处理的方法,
35.应用于终端设备,所述终端设备包括通话单元和第二接口单元,以及语音处理程序;
36.所述方法包括以下操作至少之一:
37.将所述通话单元输出的第一语音数据,通过所述第二接口单元发送给语音数据处理设备;用于所述语音数据处理设备将所述第一语音数据转换为第二语音数据,将所述第
二语音数据发送回所述终端设备;通过所述第二接口单元接收所述第二语音数据,将所述第二语音数据作为所述语音处理程序的输入数据;和,
38.将所述语音处理程序输出的第二语音数据,通过所述第二接口单元发送给语音数据处理设备;用于所述语音数据处理设备将所述第二语音数据转换为第一语音数据,将所述第一语音数据发送回所述终端设备;通过所述第二接口单元接收所述第一语音数据,将所述第一语音数据作为所述通话单元的输入数据。
39.第六方面,本申请实施例提供了一种语音数据处理的装置,
40.应用于终端设备,所述终端设备包括通话单元和第二接口单元,以及语音处理程序;
41.所述装置包括以下模块至少之一:
42.第三数据处理模块,用于将所述通话单元输出的第一语音数据,通过所述第二接口单元发送给语音数据处理设备;用于所述语音数据处理设备将所述第一语音数据转换为第二语音数据,将所述第二语音数据发送回所述终端设备;通过所述第二接口单元接收所述第二语音数据,将所述第二语音数据作为所述语音处理程序的输入数据;和,
43.第四数据处理模块,用于将所述语音处理程序输出的第二语音数据,通过所述第二接口单元发送给语音数据处理设备;用于所述语音数据处理设备将所述第二语音数据转换为第一语音数据,将所述第一语音数据发送回所述终端设备;通过所述第二接口单元接收所述第一语音数据,将所述第一语音数据作为所述通话单元的输入数据。
44.第七方面,本申请实施例提供了种语音数据处理的系统,包括:
45.上述第一方面所述的语音数据处理设备和上述第四方面所述的终端设备。
46.第八方面,本申请实施例提供了一种计算机可读存储介质,包括:所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述第一方面所述的方法步骤。
47.第九方面,本申请实施例提供了一种计算机程序产品,当计算机程序产品在电子设备上运行时,使得电子设备执行上述第一方面所述的方法步骤。
48.可以理解的是,上述第二方面至第九方面的有益效果可以参见上述第一方面中的相关描述,在此不再赘述。
附图说明
49.为了更清楚地说明本申请实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
50.图1是本申请一实施例提供的语音数据处理系统示意图;
51.图2是本申请一实施例提供的终端设备的结构示意图;
52.图3是本申请另一实施例提供的语音数据处理系统示意图;
53.图4是本申请另一实施例提供的语音数据处理系统示意图;
54.图5是本申请另一实施例提供的语音数据处理系统示意图;
55.图6是本申请另一实施例提供的语音数据处理系统示意图;
56.图7是本申请一实施例提供的语音数据处理的方法的流程示意图;
57.图8是本申请一实施例提供的语音数据处理的方法的数据流向示意图;
58.图9是本申请另一实施例提供的一种通话助理的示意图;
59.图10是本申请一个实施例提供的一种goip终端的示意图;
60.图11是本申请一个实施例提供的一种自动翻译机的示意图;
61.图12是本申请另一实施例提供的语音数据处理的方法的数据流向示意图;
62.图13是本申请一个实施例提供的一种通话背景音控制设备的示意图;
63.图14是本申请另一实施例提供的语音数据处理的方法的流程示意图。
具体实施方式
64.以下描述中,为了说明而不是为了限定,提出了诸如特定系统结构、技术之类的具体细节,以便透彻理解本申请实施例。然而,本领域的技术人员应当清楚,在没有这些具体细节的其它实施例中也可以实现本申请。在其它情况中,省略对众所周知的系统、装置、电路以及方法的详细说明,以免不必要的细节妨碍本申请的描述。
65.应当理解,当在本申请说明书和所附权利要求书中使用时,术语“包括”指示所描述特征、整体、步骤、操作、元素和/或组件的存在,但并不排除一个或多个其它特征、整体、步骤、操作、元素、组件和/或其集合的存在或添加。
66.还应当理解,在本申请说明书和所附权利要求书中使用的术语“和/或”是指相关联列出的项中的一个或多个的任何组合以及所有可能组合,并且包括这些组合。
67.如在本申请说明书和所附权利要求书中所使用的那样,术语“如果”可以依据上下文被解释为“当...时”或“一旦”或“响应于确定”或“响应于检测到”。类似地,短语“如果确定”或“如果检测到[所描述条件或事件]”可以依据上下文被解释为意指“一旦确定”或“响应于确定”或“一旦检测到[所描述条件或事件]”或“响应于检测到[所描述条件或事件]”。
[0068]
另外,在本申请说明书和所附权利要求书的描述中,术语“第一”、“第二”、“第三”等仅用于区分描述,而不能理解为指示或暗示相对重要性。
[0069]
在本申请说明书中描述的参考“一个实施例”或“一些实施例”等意味着在本申请的一个或多个实施例中包括结合该实施例描述的特定特征、结构或特点。由此,在本说明书中的不同之处出现的语句“在一个实施例中”、“在一些实施例中”、“在其他一些实施例中”、“在另外一些实施例中”等不是必然都参考相同的实施例,而是意味着“一个或多个但不是所有的实施例”,除非是以其他方式另外特别强调。术语“包括”、“包含”、“具有”及它们的变形都意味着“包括但不限于”,除非是以其他方式另外特别强调。
[0070]
一些智能手机的操作系统没有提供应用程序(application,app)双向处理语音通话的语音信号的应用程序接口(application programming interface,api),例如,在一些智能手机中,只有手机厂商内置的专门用于接打电话的电话app才可以处理双向的语音通话中的语音信号,并没有为其他app提供处理语音通话中的语音信号的api。语音处理app无法实现对语音通话的深度控制,即无法直接接收和处理语音通话中的语音信号,又无法直接将app的语音信号通过移动通信网络语音通话业务发送给远端设备。但是在某些应用场景中,用户需要对语音通话中的语音信号进行全面的处理,以满足用户需要的特定功能,例如,对语音通话中的语音信号进行识别处理、自然语音处理、文本转语音处理、音频的编解
码、基于ip的语音传输(voice over internet protocol,voip)或录制与播放等各种语音相关处理。但是手机厂商提供的内置电话app通常并不能提供处理上述应用场景中用的功能。为了解决以上缺陷,本申请实施例提供了一种语音数据处理的系统、语音数据处理设备、语音数据处理的方法。
[0071]
图1示出的是本申请实施例提供的一种语音数据处理的系统01,该系统包括:语音数据处理设备10和终端设备20。
[0072]
如图1所示,所述语音数据处理设备包括第一接口单元110和数据处理单元120;
[0073]
所述第一接口单元110与所述数据处理单元120通信耦合;
[0074]
其中,所述第一接口单元可以为通用串行总线接口(universal serial bus,usb)接口,包括但不限usbtype-c、usb mini-b、usb 3.0micro b、micro-usb b、闪电lighting接口;所述第一接口单元还可以为usbtype-c接口和模拟音频接口(tip ring sleeve,trs)的组合;所述第一接口单元还可以为闪电lighting和模拟音频接口(tip ring sleeve,trs)的组合;所述第一接口单元还可以为usb接口和trs接口的组合。
[0075]
所述数据处理单元包括处理器子单元,所述处理器子单元包括处理器和存储器;
[0076]
所述处理器可以是中央处理单元(central processing unit,cpu),该处理器还可以是其他通用处理器、数字信号处理器(digital signal processor,dsp)、专用集成电路(application specific integrated circuit,asic)、现成可编程门阵列(field-programmable gate array,fpga)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
[0077]
所述存储器在一些实施例中可以是所述语音数据处理设备的内部存储单元,例如语音数据处理设备的硬盘或内存。所述存储器在另一些实施例中也可以是所述语音数据处理设备的外部存储设备,例如所述语音数据处理设备上配备的插接式硬盘,智能存储卡(smart media card,smc),安全数字(secure digital,sd)卡,闪存卡(flash card)等。进一步地,所述存储器还可以既包括所述语音数据处理设备120的内部存储单元也包括外部存储设备。所述存储器用于存储操作系统、应用程序、引导装载程序(bootloader)、数据以及其他程序等,例如所述计算机程序的程序代码等。所述存储器还可以用于暂时地存储已经输出或者将要输出的数据。
[0078]
所述第一接口单元110,用于所述数据处理单元120与终端设备20间传输第一语音数据和第二语音数据;
[0079]
所述第一语音数据为所述终端设备20的语音处理程序221的输入输出数据;
[0080]
所述第二语音数据为所述终端设备20的通话单元230的输入输出数据。
[0081]
在一些实施例中,所述第一语音数据为模拟信号;所述第二语音数据为通用串行总线协议承载的数字信号。
[0082]
在一些实施例中,所述第一语音数据为数字音频信号,例如iis信号、pcm信号;所述第二语音数据为通用串行总线协议承载的数字信号。
[0083]
在一些实施例中,所述第一语音数据为通用串行总线协议承载的数字信号;所述第二语音数据为通用串行总线协议承载的数字信号;通过通用串行总线承载的数据包的标识信息区分第一语音数据和第二语音数据。
[0084]
所述第一语音数据为终端设备的通话单元发送或接收的数据,用于通话单元通过移动通信网络进行语音通信。在一些实施例中为模拟音频数据,通过模拟信号承载;在一些实施例中为数字音频数据,通过数字音频协议数据流承载;在一些实施例中为通用串行总线数据包,所述通用串行总线数据包的数据净荷为语音数据。
[0085]
所述第二语音数据为终端设备的语音处理程序发送或接收的数据,用于语音处理程序对其进行处理完成语音处理程序预设的功能,例如识别处理、自然语言处理、文本转语音处理、音频的编解码、voip传输或录制与播放等各种语音相关处理,在一些实施例中,第二语音数据为通用串行总线数据包,所述通用串行总线数据包的数据净荷为语音数据;在一些实施例中,第二语音数据经过再次协议转换后提取语音数据供语音处理程序处理。
[0086]
所述数据处理单元120,用于执行以下操作至少之一:
[0087]
将通过所述第一接口单元110接收到的第一语音数据转换为第二语音数据,将所述第二语音数据通过所述第一接口单元110发送回所述终端设备20;和,
[0088]
将通过所述第一接口单元110接收到的第二语音数据转换为第一语音数据,将所述第一语音数据通过所述第一接口单元110发送回所述终端设备20;
[0089]
所述第一语音数据为所述终端设备20的语音处理程序221的输入输出数据;
[0090]
所述第二语音数据为所述终端设备20的通话单元230的输入输出数据。
[0091]
所述第一接口子单元包括通用串行总线接口的模拟信号通道,或trs接口。
[0092]
可以理解的是,终端设备的语音处理程序具有通过终端设备的第二接口单元收发第二语音数据的权限的情况下,语音数据处理设备通过将终端设备的通话单元发出的第一语音数据转换为第二语音数据,发送回终端设备,由终端设备的语音处理程序接收并处理第二语音数据;或者语音数据处理设备通过将终端设备的语音处理程序发出的第二语音数据转换为第一语音数据,发送回终端设备,由终端设备的通话单元接收并处理。可以使语音处理程序接管终端设备的通话,从而实现对通话设计的语音数据的全面和深度处理。
[0093]
图2示出的是本申请实施例提供的一种终端设备,如图2所示,所述终端设备20,包括存储单元220、处理单元200、通话单元230、第二接口单元210,以及存储在所述存储单元220中并可在所述处理单元上运行的语音处理程序221和控制程序222;所述通话单元与所述处理单元通信耦合,用于处理第一语音数据;为了更方便的理解本申请实施例的工作原理,在图1中,只示出了终端设备20的部分部件。
[0094]
所述存储单元220与所述处理单元200通信耦合;所述通话单元230与所述处理单元200通信耦合;所述通话单元230与所述第二接口210单元通信耦合;
[0095]
所述通话单元230用于处理第一语音数据;所述语音处理程序221用于处理第二语音数据;
[0096]
所述处理单元200执行所述控制程序222时实现以下操作至少之一:
[0097]
将所述通话单元输出的第一语音数据,通过所述第二接口单元发送给语音数据处理设备;用于所述语音数据处理设备将所述第一语音数据转换为第二语音数据,将所述第二语音数据发送回所述终端设备;通过所述第二接口单元接收所述第二语音数据,将所述第二语音数据作为所述语音处理程序的输入数据;和,
[0098]
将所述语音处理程序221输出的第二语音数据,通过所述第二接口单元发送给语音数据处理设备;用于所述语音数据处理设备将所述第二语音数据转换为第一语音数据,
将所述第一语音数据发送回所述终端设备;通过所述第二接口单元接收所述第一语音数据,将所述第一语音数据作为所述通话单元的输入数据。所述语音处理程序可以为能单独实现上述功能的app,也可以为app和终端设备操作系统功能模块的组合。
[0099]
所述通话单元230用于实现与移动通信网络的通信,将移动通信网络的话音数据转换为第一语音数据输出,或者接收第一语音数据通过移动通信网络发送到远端设备。所述通话单元230包括但不限于由调制解调模块和音频编解码模块构成的功能单元,本领域技术人员可以根据实际情况实现所述通话单元230的功能。
[0100]
所述终端包括但不限于手机、平板电脑、可穿戴设备、车载设备、增强现实(augmented reality,ar)/虚拟现实(virtual reality,vr)设备等,可以通过移动通信网络进行语音通信业务,并具有操作系统,在所述操作系统可以运行语音处理软件,语音处理软件具有收发第二语音数据权限的设备。
[0101]
在图1所示的实施例的基础上,本申请一些实施例提供的语音数据处理设备,如图3所示,该语音数据处理设备10的第一接口单元110包括:第一接口子单元111和第二接口子单元112;
[0102]
所述第一接口子单元111,用于所述数据处理单元与所述终端设备间传输第一语音数据;
[0103]
所述第二接口子单元112,用于所述数据处理单元与所述终端设备间传输第二语音数据。
[0104]
在一些实施例中,所述第一语音数据为模拟信号;所述第二语音数据为数字信号。
[0105]
在一些实施例中,所述第一语音数据为数字音频信号,例如iis信号、pcm信号;所述第二语音数据为通用串行总线协议承载的数字信号。
[0106]
所述第一接口子单元111通过模拟信号线缆与终端设备的第五接口子单元211连接;所述第二接口子单元112通过数字信号线缆与终端设备的第六接口子单元212连接。
[0107]
在一些实施例中,所述第一接口子单元和第五接口子单元,为通用串行总线接口的模拟信号通道,包括但不限于usbtype-c总线的语音信号通道;所述第二接口子单元和第六接口子单元,为通用串行总线接口的数字信号通道,包括但不限于usbtype-c总线的数字信号通道。
[0108]
在另一些实施例中,所述第一接口子单元和第五接口子单元,为trs接口,包括但不限于trs 3.5mm接口;所述第二接口子单元和第六接口子单元为通用串行总线接口,包括但不限于usbtype-c、usb mini-b、usb 3.0micro b、micro-usb b、lighting接口等数字信号接口。
[0109]
在图3所示的实施例的基础上,如图4所示,在一些实施例中,语音数据处理设备10数据处理单元120包括:模拟数据处理子单元121和处理器子单元122;
[0110]
所述模拟数据处理子单元121与所述处理器子单元122通信耦合;
[0111]
所述模拟数据处理子单元与所述第一接口子单元通信耦合;
[0112]
所述模拟数据处理子单元用于将所述第一接口子单元接收的第一语音数据转换为数字信号发送给所述处理器子单元,或将所述处理器子单元输出的数字信号转换为第一语音数据发送给所述第一接口子单元。
[0113]
所述模拟处理子单元包括模数转换模块、数模转换模块和音频编解码模块;所述
模数转换模块与所述模拟信号接口子单元通信耦合;所述模数转换模块与所述音频编解码模块通信耦合;所述数模转换模块与所述模拟信号接口子单元通信耦合;所述数模转换模块与所述音频编解码模块通信耦合;所述音频编解码模块与所述处理器子单元通信耦合。所述模数转换模块用于将第一语音数据转换为数字信号;所述数模转换模块用于将音频编解码模块输出的数字信号转换为第一语音数据;所述音频编码模块用于数字信号编码和处理器子单元可识别的pcm信号之间的转换。
[0114]
所述处理器子单元包括处理器和存储器。
[0115]
如图5所示,在一些实施例中,语音数据处理设备10的第一接口单元包括:第三接口子单元;
[0116]
所述第三接口子单元与所述终端设备第二接口单元的第七接口子单元通过数字信号线缆连接。所述第三接口子单元和第七接口子单元包括通用串行总线接口,包括但不限于usbtype-c、usb mini-b、usb 3.0micro b、micro-usb b、lighting接口等数字信号接口。
[0117]
所述第三接口子单元,用于所述数据处理单元与所述终端设备间传输第一语音数据;
[0118]
所述第三接口子单元,还用于所述数据处理单元与所述终端设备间传输第二语音数据;
[0119]
所述第一语音数据和第二语音数据为通用串行总线协议承载的数据。
[0120]
所述语音数据处理设备通过第三接口子单元,执行以下操作至少一:
[0121]
通过所述第三接口子单元接收终端设备发送的第一语音数据,所述数据处理单元根据第一协议提取第一语音数据中的第一目标数据,根据第二协议将所述第一目标数据封装为第二语音数据,通过所述第三接口子单元发送回终端设备。
[0122]
通过所述第三接口子单元接收终端设备发送的第二语音数据,所述数据处理单元根据第二协议提取第二语音数据中的第二目标数据,根据第一协议将所述第二目标数据封装为第一语音数据,通过所述第三接口子单元发送回终端设备。
[0123]
在图1所示的实施例的基础上,如图6所示,在一些实施例中,语音数据处理设备10第一接口单元还包括第四接口子单元;
[0124]
所述第四接口子单元,用于所述数据处理单元与音频设备间传输数据;所述第四接口子单元用于传输模拟音频数据。
[0125]
所述音频设备包括以下设备至少之一:送话设备和监听设备。所述送话设备包括但不限于麦克风等用于收取用户语音的设备。所述监听设备包括但不限于耳机、音箱等用于播放语音的设备。
[0126]
在所述语音数据处理设备通过软件对当前处理的第一音频数据进行混音的实施例中,所述第四接口子单元为trs接口,数据处理单元的模拟处理子单元与第四接口子单元的trs接口通信耦合。在一些实施例中,所述第一接口子单元包括trs接口、数据转换模块、模数转换模块和音频编解码模块,所述音频解码模块接收数据处理单元输出的数字音频信号,例如pcm信号,数据转换模块、模数转换模块分别与音频编解码模块通信耦合,用于进行数模转换和模数转换,数据转换模块、模数转换模块分别与trs接口电性连接。
[0127]
在采用硬件混音模块的实施例中,所述第四接口子单元包括第四接口模块和混音
模块;所述第四接口模块与送话器和音频播放器通信耦合;所述混音模块与所述数据处理单元通信耦合;所述第四接口模块用于所述混音模块与音频设备间传输数据;所述混音模块用于将所述数据处理单元处理的第一音频数据进行混音处理。所述混音为将app发送出的语音信号和通话模块发送出的语音数据进行合成,在一些实施例中为根据时间顺序进行合成,形成第三语音数据的数据流,便于用户进行监听。
[0128]
图7示出了本申请实施例提供的语音处理的方法,应用于上述图1所示的语音处理系统01中的语音数据处理设备10,可由所述语音数据处理设备的软件和/或硬件实现。如图7所示,该方法包括步骤执行步骤s110和s120至少之一。各个步骤的具体实现原理如下:
[0129]
s110,通过所述第一接口单元接收终端设备发送的第一语音数据,所述数据处理单元将第一语音数据转换为第二语音数据,通过所述第一接口单元将所述第二语音数据发送回终端设备。
[0130]
s120,通过所述第一接口单元接收终端设备发送的第二语音数据,所述数据处理单元将第二语音数据转换为第一语音数据,通过所述第一接口单元将所述第一语音数据发送回终端设备。
[0131]
在一些实施例中,将第一语音数据转换为第二语音数据,以及将第二语音数据转换为第一语音数据,可以为存储转发的方式,例如将第一语音数据存储到第二语音数据缓存,再将第二语音数据缓存内的数据作为第二语音数据进行转发;或将第二语音数据存储到第一语音数据缓存,再将第一语音数据缓存内的数据作为第一语音数据进行转发。
[0132]
在一些实施例中,将第一语音数据转换为第二语音数据,以及将第二语音数据转换为第一语音数据,可以为协议转换的方式,例如,第一接口单元包括第三接口子单元,包括通用串行总线接口,包括但不限于usb type-c、usb mini-b、usb 3.0micro b、micro-usb b、lighting接口等数字信号接口。所述第一语音数据和第二语音数据为通用串行总线协议承载的数据。
[0133]
通过所述第三接口子单元接收终端设备发送的第一语音数据,所述数据处理单元根据第一协议提取第一语音数据中的第一目标数据,根据第二协议将所述第一目标数据封装为第二语音数据,通过所述第三接口子单元发送回终端设备;通过所述第三接口子单元接收终端设备发送的第二语音数据,所述数据处理单元根据第二协议提取第二语音数据中的第二目标数据,根据第一协议将所述第二目标数据封装为第一语音数据,通过所述第三接口子单元发送回终端设备。
[0134]
在一些实施例中,例如,终端设备采用语音处理程序221为电话记录程序,该电话记录程序需要接收话音业务发送到终端设备的话音数据,则只需要执行步骤s110,参考图8,数据的流向如图8中的数据流

所示。通过语音数据处理设备,将终端设备的通话单元输出的第一语音数据,即来电话音,转换为第二语音数据,发送回中终端设备,使录音程序可以进行接收到来电话音的内容,对该内容进行识别并记录。
[0135]
图8是本申请一实施例提供的语音数据处理的方法的数据流向示意图。
[0136]
在一些实施例中,终端设备采用语音处理程序221为电话通知程序,该程序需要实现拨打远端设备,并将电话通知程序中预存的话音,或者预存的文本转换为话音发送到远端设备,例如验证码的语音通知,则只需要执行步骤s120,参考图8,数据的流向如图8中的数据流

所示。通过语音数据处理设备,将电话通知程序发出的第二语音数据,转换成第一
语音数据发送回终端设备,终端设备的通话单元接收到该第一语音数据后,将其通过移动通信网络发送给远端设备。
[0137]
在一些实施例中,图9是本申请一个实施例提供的一种通话助理的示意图;终端设备20采用的语音处理程序221为通话助理程序,该通话助理程序在终端设备接听电话发送提示语音,并记录远端设备发送的语音。终端设备响应通话呼叫与远端设备建立通话连接,通话助理程序通过第二接口单元将提示语音以第二语音数据的形式发送给语音数据处理设备;语音数据处理设备通过第一接口单元接收到该第二语音数据,将其转换为第一语音数据后,通过第一接口单元发送给终端设备;终端设备通的通话单元过第二接口单元接收到所述第一语音数据后,将第一语音数据中的提示语音通过移动通信网络发送给远端设备。
[0138]
终端设备的通话单元接收到远端设备的话音数据后输出第一语音数据,终端设备通过第二接口单元将第一语音数据发送给语音数据处理设备;语音数据处理设备的数据处理单元通过第一接口单元接收所述第一语音数据,将该第一语音数据转换为第二语音数据后,通过第一接口单元将所述第二语音数据发送回终端设备;终端设备的通话助理程序在通过第二接口单元接收到所述第二语音数据后,提取第二语音数据中的话音数据并保存。直到响应于终端设备的电话挂机信号,通话助理程序停止接收语音数据处理设备发送的第二语音数据。
[0139]
参考图8,数据的流向包括图8中的数据流

和数据流

所示的两个流向的数据流。参见图8中数据流

,在终端设备接听电话后,通话助理程序向远端设备发送提示语音,例如,“你好,请留言”,该提示语音经通话助理编码并分装为通用串行总线数据包,即第二语音数据,通过第二接口单元发送给语音数据处理设备;语音处理设别通过第一接口单元接收到该第二语音数据,根据其数据类型,提取数据包中的数据,转换为pcm编码的数字音频信号,即第一语音信号,通过第一接口单元发送回终端设备;终端设备接收到该第一语音信号后,将该信号作为通话单元的输入信号,交由通话单元发送给远端终端。在一些实施例中,还可以将第二语音数据转换为模拟语音信号,作为第一语音信号,发送给终端设备的通话单元处理。参见图8中数据流

,在终端设备接收到远端设备的话音信号,该话音信号经通话单元处理,输出第一语音数据。第一语音数据可以是模拟信号数据,也可以是数字信号数据,这取决于第一接口单元和第二接口单元的具体实现,可以参考以上各个实施例。终端设备将该第一语音数据通过第二接口单元发送给语音数据处理设备,语音数据处理设备将第一语音数据转换为通话助理程序有权限获得的,并且能够处理的通用串行总线数据包,即第二语音数据,通过第一接口单元发送回终端设备,通过助理程序接收到第二语音数据,提取并记录该语音数据。
[0140]
在一些实施例中,语音数据处理设备通过连接规则配置用于对数据流的流向进行控制,所述连接配置规则为开关参数,或者开关参数矩阵。具体的,通过对第一语音数据转换为第二语音数据的开关控制,或通过对第二语音数据转换为第一语音数据的开关控制实现对数据流通断的控制。例如,参考图8,可以通过连接配置规则控制数据流

或数据流

的打开或关闭。
[0141]
可以理解的是,终端设备的语音处理程序具有通过终端设备的第二接口单元收发第二语音数据的权限的情况下,语音数据处理设备通过将终端设备的通话单元发出的第一
语音数据转换为第二语音数据,发送回终端设备,由终端设备的语音处理程序接收并处理第二语音数据;或者语音数据处理设备通过将终端设备的语音处理程序发出的第二语音数据转换为第一语音数据,发送回终端设备,由终端设备的通话单元接收并处理。可以使语音处理程序接管终端设备的通话,从而实现对通话设计的语音数据的全面和深度处理。
[0142]
图10是本申请一个实施例提供的一种goip终端的示意图;goip终端为电话网关,实现移动通信网络和voip平台间的通信。如图11所示,终端设备20采用的语音处理程序221为voip接入程序,该goip终端的voip接入程序221通过无线局域网与voip平台30间收发voip语音数据。voip接入程序接收到voip语音数据后,将其转换为第二语音数据;voip接入程序通过第二接口单元将voip语音数据第二语音数据的形式发送给语音数据处理设备;语音数据处理设备通过第一接口单元接收到该第二语音数据,将其转换为第一语音数据后,通过第一接口单元发送给终端设备;终端设备通的通话单元过第二接口单元接收到所述第一语音数据后,将第一语音数据中的提示语音通过移动通信网络发送给远端设备。
[0143]
终端设备的通话单元接收到远端设备的话音数据后输出第一语音数据,终端设备通过第二接口单元将第一语音数据发送给语音数据处理设备;语音数据处理设备的数据处理单元通过第一接口单元接收所述第一语音数据,将该第一语音数据转换为第二语音数据后,通过第一接口单元将所述第二语音数据发送回终端设备;终端设备的voip接入程序在通过第二接口单元接收到所述第二语音数据后,提取第二语音数据中的话音数据,将话音数据转换为voip语音数据发送给voip平台。通过以上步骤,实现了voip的电话网关的功能,可以灵活的接入voip语音服务。
[0144]
图11示出的是本申请实施例提供的一种自动翻译机的示意图;如图11所示,终端设备20采用的语音处理程序221为语音识别记录程序,该终端设备的语音识别记录程序221通过识别用户输入的文字信息,将所述文字信息转换为第二语音数据;语音识别记录程序通过第二接口单元将第二语音数据发送给语音数据处理设备;语音数据处理设备通过第一接口单元接收到该第二语音数据,将其转换为第一语音数据后,通过第一接口单元发送给终端设备;终端设备通的通话单元过第二接口单元接收到所述第一语音数据后,将第一语音数据中的提示语音通过移动通信网络发送给远端设备。
[0145]
终端设备的通话单元接收到远端设备的话音数据后输出第一语音数据,终端设备通过第二接口单元将第一语音数据发送给语音数据处理设备;语音数据处理设备的数据处理单元通过第一接口单元接收所述第一语音数据,将该第一语音数据转换为第二语音数据后,通过第一接口单元将所述第二语音数据发送回终端设备;终端设备的语音识别记录程序在通过第二接口单元接收到所述第二语音数据后,识别该第二语音数据获得与语音内容对应的文字信息。
[0146]
通过以上步骤实现了自动翻译机的功能,可以方便不同语种的用户通过电话实时交流。尤其是用户为语言障碍用户时,可以采用本申请实施例提供的自动翻译机实现语音通话。
[0147]
在图7所示的实施例的基础上,所述第一接口单元包括:第一接口子单元和第二接口子单元;
[0148]
通过所述第一接口单元接收终端设备发送的第一语音数据,所述数据处理单元将第一语音数据转换为第二语音数据,通过所述第一接口单元将所述第二语音数据发送回终
端设备,包括:
[0149]
通过所述第一接口子单元接收终端设备发送的第一语音数据,所述数据处理单元将所述第一语音数据转换为第二语音数据,通过所述第二接口子单元将所述第二语音数据发送回终端设备;
[0150]
通过所述第一接口单元接收终端设备发送的第二语音数据,所述数据处理单元将第二语音数据转换为第一语音数据,通过所述第一接口单元将所述第一语音数据发送回终端设备,包括:
[0151]
通过所述第二接口子单元接收终端设备发送的第二语音数据,所述数据处理单元将所述第二语音数据转换为第一语音数据,通过所述第一接口子单元将所述第一语音数据发送回终端设备。
[0152]
可以理解的是,所述第一语音数据为模拟信号,或者数字音频信号,例如pcm信号,第二语音数据为通用串行总线协议数据包,通过将模拟信号或数字音频信号转换为通用串行总线协议数据包,或者将通用串行总线协议数据包转换为模拟信号或数字音频信号,可以实现移动终端的操作系统没有为app提供api的情况下,app获得经第二接口单元收发通用串行总线协议数据包的权限即可实现app对语音通话业务中的语音数据的全面和深度的处理。
[0153]
在图7所示的实施例的基础上,所述第一接口单元包括第三接口子单元;所述语音处理的方法包括:
[0154]
通过所述第一接口单元接收终端设备发送的第一语音数据,所述数据处理单元将第一语音数据转换为第二语音数据,通过所述第一接口单元将所述第二语音数据发送回终端设备,包括:
[0155]
通过所述第三接口子单元接收终端设备发送的第一语音数据,所述数据处理单元根据第一协议提取第一语音数据中的第一目标数据,根据第二协议将所述第一目标数据封装为第二语音数据,通过所述第三接口子单元发送回终端设备;
[0156]
通过所述第一接口单元接收终端设备发送的第二语音数据,所述数据处理单元将第二语音数据转换为第一语音数据,通过所述第一接口单元将所述第一语音数据发送回终端设备,包括:
[0157]
通过所述第三接口子单元接收终端设备发送的第二语音数据,所述数据处理单元根据第二协议提取第二语音数据中的第二目标数据,根据第一协议将所述第二目标数据封装为第一语音数据,通过所述第三接口子单元发送回终端设备。
[0158]
其中,第一目标数据和第二目标数据包括但不限于iis或pcm数字音频编码数据。
[0159]
在一些实施例中,所述第一协议和第二协议可以为通用串行总线数据传输协议,或其他可以在通用串行总线上传输数据的通信协议。
[0160]
在一些实施例中,所述第一协议为iis或pcm数字音频编码数据传输协议;第二协议可以为通用串行总线数据传输协议,或其他可以在通用串行总线上传输数据的通信协议。
[0161]
在图7所示的实施例的基础上,在一些实施例中,所述第一接口单元还包括第四接口子单元;所述方法还包括:
[0162]
根据连接规则配置确定是否进行混音处理和通过第四接口子单元传输第三语音
数据。
[0163]
所述第四接口子单元用于连接音频设备,包括但不限于送话设备和监听设备。
[0164]
在一些实施例中,所述混音处理为数据处理单元将所述第一语音数据进行混音获得第三语音数据的操作;所述第一语音数据为所述数据处理单元从所述终端设备接收到的第一语音数据,或所述数据处理单元将第二语音数据转换得到的第一语音数据。
[0165]
在一些实施例中,第四接口子单元接收送话设备,例如麦克分输入的语音数据,即第三语音数据,将通过模拟处理子单元121间该语音数转换为数字音频信号。根据连接配置规则,将该数字音频信号转换为第一语音数据和/或第二语音数据,加入数据数据流

和/或数据流


[0166]
在一些实施例中,语音数据处理设备通过连接规则配置用于对数据流的流向进行控制,所述连接配置规则为开关参数,或者开关参数矩阵。
[0167]
图12示出的是本申请一实施例提供的语音数据处理的方法的数据流向示意图,如图11所示,通过连接规则配置,确定数据流

的通断。如果连接规则配置为数据流

导通,则对数据流

或数据流

进行混音处理,传输数据流

。实现外接音频设备的功能。如果连接规则配置为数据流

关断,则不对数据流

或数据流

进行混音处理,关闭外接音频设备的功能。图13是本申请一个实施例提供的一种通话背景音控制设备的示意图;如图13所示,终端设备20采用的语音处理程序221包括语音处理子程序2211和背景音生成子程序2212。
[0168]
终端设备的通话单元接收到远端设备的话音数据后输出第一语音数据,终端设备通过第二接口单元将第一语音数据发送给语音数据处理设备;语音数据处理设备的数据处理单元通过第一接口单元接收所述第一语音数据,将该第一语音数据转换为第二语音数据后,通过第一接口单元将所述第二语音数据发送回终端设备;终端设备的语音处理子程序在通过第二接口单元接收到所述第二语音数据后,对该第二语音数据中的话音数据进行预设处理;语音数据处理设备在将第一语音信号转换为第二语音信号时,根据连接配置规则确定是否将第一语音信号通过第四接口单元输出到音频播放设备。
[0169]
语音处理子程序获取语音数据,在一些实施例中,用户通过收音设备的第一接口单元向所述语音数据处理设备输入第三语音数据,语音数据处理设备根据连接规则配置确定是否将该第三语音数据通过发送到终端设备的语音处理子程序进行处理,若连接规则配置为接收收音设备语音数据,则将第三语音数据转换为第二语音数据发送给语音处理子程序进行处理。在一些实施例中,终端设备的语音处理子程序根据预设规则过通过voip等方式获得语音数据。
[0170]
语音处理子程序根据用户设置确定是否调用背景音生成子程序生成的背景音,所述背景音可以为音乐背景声音,也可以为自然环境背景声音。
[0171]
语音处理子程序将第二语音数据和背景音进行混音后,生成混音后的第二语音数据;语音处理子程序通过第二接口单元将第二语音数据送给语音数据处理设备;语音数据处理设备通过第一接口单元接收到该第二语音数据,将其转换为第一语音数据后,通过第一接口单元发送给终端设备;终端设备通的通话单元过第二接口单元接收到所述第一语音数据后,将第一语音数据中的提示语音通过移动通信网络发送给远端设备。通过以上步骤,实现了为用户语音添加背景音的功能。
[0172]
对应于上述图7所示的语音数据处理的方法,本申请实施例提供的一种语音数据处理的装置,包括:
[0173]
应用于语音数据处理设备;
[0174]
所述语音数据处理设备包括第一接口单元和数据处理单元,所述装置包括以下模块至少之一:
[0175]
第一数据处理模块,用于通过所述第一接口单元接收终端设备发送的第一语音数据,所述数据处理单元将第一语音数据转换为第二语音数据,通过所述第一接口单元将所述第二语音数据发送回终端设备;和,
[0176]
第二数据处理模块,通过所述第一接口单元接收终端设备发送的第二语音数据,所述数据处理单元将第二语音数据转换为第一语音数据,通过所述第一接口单元将所述第一语音数据发送回终端设备;
[0177]
所述第一语音数据为所述终端设备的语音处理程序的输入输出数据;
[0178]
所述第二语音数据为所述终端设备的通话单元的输入输出数据。
[0179]
可以理解的是,以上实施例中的各种实施方式和实施方式组合及其有益效果同样适用于本实施例,这里不再赘述。
[0180]
图14示出了本申请实施例提供的语音处理的方法,应用于上述图1所示的语音处理系统01中的终端设备20,可由所述终端设备的软件和/或硬件实现。如图14所示,该方法包括步骤执行步骤s210和s220至少之一。各个步骤的具体实现原理如下:
[0181]
所述终端设备包括通话单元和第二接口单元,以及语音处理程序;
[0182]
s210,将所述通话单元输出的第一语音数据,通过所述第二接口单元发送给语音数据处理设备;用于所述语音数据处理设备将所述第一语音数据转换为第二语音数据,将所述第二语音数据发送回所述终端设备;通过所述第二接口单元接收所述第二语音数据,将所述第二语音数据作为所述语音处理程序的输入数据;和,
[0183]
s220,将所述语音处理程序输出的第二语音数据,通过所述第二接口单元发送给语音数据处理设备;用于所述语音数据处理设备将所述第二语音数据转换为第一语音数据,将所述第一语音数据发送回所述终端设备;通过所述第二接口单元接收所述第一语音数据,将所述第一语音数据作为所述通话单元的输入数据。
[0184]
对应于上述图14所示的语音数据处理的方法,本申请实施例提供的一种语音数据处理的装置,包括:
[0185]
应用于终端设备,所述终端设备包括通话单元和第二接口单元,以及语音处理程序;
[0186]
所述装置包括以下模块至少之一:
[0187]
第三数据处理模块,用于将所述通话单元输出的第一语音数据,通过所述第二接口单元发送给语音数据处理设备;用于所述语音数据处理设备将所述第一语音数据转换为第二语音数据,将所述第二语音数据发送回所述终端设备;通过所述第二接口单元接收所述第二语音数据,将所述第二语音数据作为所述语音处理程序的输入数据;和,
[0188]
第四数据处理模块,用于将所述语音处理程序输出的第二语音数据,通过所述第二接口单元发送给语音数据处理设备;用于所述语音数据处理设备将所述第二语音数据转换为第一语音数据,将所述第一语音数据发送回所述终端设备;通过所述第二接口单元接
收所述第一语音数据,将所述第一语音数据作为所述通话单元的输入数据。
[0189]
可以理解的是,以上实施例中的各种实施方式和实施方式组合及其有益效果同样适用于本实施例,这里不再赘述。
[0190]
应理解,上述各个实施例均基于同一发明构思,因此各个实施例的步骤、模块等可以相互组合替换,这里不再赘述。
[0191]
应理解,上述实施例中各步骤的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本申请实施例的实施过程构成任何限定。
[0192]
需要说明的是,上述装置/单元之间的信息交互、执行过程等内容,由于与本申请方法实施例基于同一构思,其具体功能及带来的技术效果,具体可参见方法实施例部分,此处不再赘述。
[0193]
所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,仅以上述各功能单元、模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能单元、模块完成,即将所述装置的内部结构划分成不同的功能单元或模块,以完成以上描述的全部或者部分功能。实施例中的各功能单元、模块可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中,上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。另外,各功能单元、模块的具体名称也只是为了便于相互区分,并不用于限制本申请的保护范围。上述系统中单元、模块的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
[0194]
本申请实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现可实现上述各个方法实施例中的步骤。
[0195]
本申请实施例提供了一种计算机程序产品,当计算机程序产品在语音数据处理设备或终端设备上运行时,使得语音数据处理设备或终端设备执行时实现可实现上述各个方法实施例中的步骤。
[0196]
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请实现上述实施例方法中的全部或部分流程,可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一计算机可读存储介质中,该计算机程序在被处理器执行时,可实现上述各个方法实施例的步骤。其中,所述计算机程序包括计算机程序代码,所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质至少可以包括:能够将计算机程序代码携带到拍照装置/终端设备的任何实体或装置、记录介质、计算机存储器、只读存储器(read-only memory,rom)、随机存取存储器(random access memory,ram)、电载波信号、电信信号以及软件分发介质。例如u盘、移动硬盘、磁碟或者光盘等。在某些司法管辖区,根据立法和专利实践,计算机可读介质不可以是电载波信号和电信信号。
[0197]
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述或记载的部分,可以参见其它实施例的相关描述。
[0198]
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单
元及算法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请的范围。
[0199]
在本申请所提供的实施例中,应该理解到,所揭露的装置/网络设备和方法,可以通过其它的方式实现。例如,以上所描述的装置/网络设备实施例仅仅是示意性的,例如,所述模块或单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通讯连接可以是通过一些接口,装置或单元的间接耦合或通讯连接,可以是电性,机械或其它的形式。
[0200]
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
[0201]
以上所述实施例仅用以说明本申请的技术方案,而非对其限制;尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本申请各实施例技术方案的精神和范围,均应包含在本申请的保护范围之内。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文章

  • 日榜
  • 周榜
  • 月榜