播放音效控制方法、装置、电子设备和计算机存储介质与流程

2021-11-26 21:42:00 来源：中国专利 TAG：

1.本发明实施例涉及计算机技术领域，尤其涉及一种播放音效控制方法、装置、电子设备和计算机存储介质。

背景技术：

2.随着人们生活水平的提高，各类音箱进入了人们的生活。这些音箱中有些可以通过与手机蓝牙输出功能连接来播放音乐，有些通过闪存存储音乐文件来播放音乐，有些通过存储卡播放音乐。有些音箱中还在手机的音箱应用程序中用户提供了设置各种音效的入口，使得音箱用户可以选择不同的音乐风格进行播放。
3.但是，为了获取与播放曲目匹配的音效，往往需要用户基于自身的音乐知识进行设置，或者进行多次尝试进行设置，为用户带来了操作的不便。

技术实现要素：

4.有鉴于此，本发明实施例提供一种播放音效控制方法、装置、电子设备和计算机存储介质，以解决或缓解上述问题。
5.根据本发明实施例的第一方面，提供了一种播放音效控制方法，包括：获取播放对象的播放控制指令，所述播放控制指令中包括所述播放对象的音效信息；响应所述播放控制指令，基于所述音效信息进行播放音效设置，对所述播放对象进行播放。
6.根据本发明实施例的第二方面，提供了一种播放音效控制方法，包括：响应播放控制请求，至少基于播放对象的音效信息，生成所述播放对象的播放控制指令；发送所述播放控制指令，所述播放控制指令指示在对所述播放对象进行播放时根据所述音效信息对所述播放对象进行播放音效控制。
7.根据本发明实施例的第三方面，提供了一种播放音效控制装置，包括：指令获取模块，获取播放对象的播放控制指令，所述播放控制指令中包括所述播放对象的音效信息；播放控制模块，响应所述播放控制指令，基于所述音效信息进行播放音效设置，对所述播放对象进行播放。
8.根据本发明实施例的第四方面，提供了一种播放音效控制装置，包括：指令生成模块，响应播放控制请求，至少基于播放对象的音效信息，生成所述播放对象的播放控制指令；指令发送模块，发送所述播放控制指令，所述播放控制指令指示在对所述播放对象进行播放时根据所述音效信息对所述播放对象进行播放音效控制。
9.根据本发明实施例的第五方面，提供了一种电子设备，所述设备包括：一个或多个处理器；计算机可读介质，配置为存储一个或多个程序，当所述一个或多个程序被所述一个或多个处理器执行时，使得所述一个或多个处理器实现如第一方面或第二方面所述的方法。
10.根据本发明实施例的第六方面，提供了一种计算机可读介质，其上存储有计算机程序，该程序被处理器执行时实现如第一方面或第二方面所述的方法。
11.在本发明实施例的方案中，由于能够响应播放控制指令，基于所述音乐风格信息进行播放音效设置，对所述目标曲目进行播放，因此实现了在进行目标曲目播放时对播放音效实现了自动控制，提高了操作的便捷性。
附图说明
12.为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明实施例中记载的一些实施例，对于本领域普通技术人员来讲，还可以根据这些附图获得其他的附图。
13.图1为本发明的一个实施例的播放音效控制方法和装置所适用的网络架构的示意图；
14.图2a为本发明的另一实施例的播放音效控制方法的示意性流程图；
15.图2b为本发明的另一实施例的播放音效控制方法的示意图；
16.图3为本发明的另一实施例的播放音效控制方法的示意图；
17.图4a为本发明的另一实施例的播放音效控制方法的示意图；
18.图4b为本发明的另一实施例的播放音效控制方法的示意图；
19.图5为本发明的另一实施例的播放音效控制装置的示意性框图；
20.图6为本发明的另一实施例的播放音效控制装置的示意性框图；
21.图7为本发明的另一实施例的电子设备的示意性结构图；
22.图8为本发明的另一实施例的电子设备的硬件结构。
具体实施方式
23.为了使本领域的人员更好地理解本发明实施例中的技术方案，下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅是本发明实施例一部分实施例，而不是全部的实施例。基于本发明实施例中的实施例，本领域普通技术人员所获得的所有其他实施例，都应当属于本发明实施例保护的范围。
24.下面结合本发明实施例附图进一步说明本发明实施例具体实现。图1为本发明的一个实施例的播放音效控制方法和装置所适用的网络架构的示意图。如图所示，用户20通过人机交互界面11对电子设备10进行控制。电子设备10可以为嵌入式设备或物联网设备等。所述电子设备10具有语音唤醒模块13、音频播放模块12和网络接口14。应理解，网络接口14可以将对用户20针对电子设备10的语音控制信息发送到服务端60进行语音识别。上述的语音信息仅仅为示例性的，用户20针对电子设备10的操作指令还可以为其他形式的消息。例如，诸如指纹识别或人脸识别的生物特征信息指令等。上述的服务端60具有的语音识别功能仅仅为示例性的，例如，服务端60还可以包括对上述的生物特征信息进行识别的识别服务器。相应地，服务端60还包括存储装置61。存储装置61可以存储诸如语音识别样本、生物特征信息识别样本等。还应理解，用户20在人机交互界面输入的操作指令还可以经由电子设备10本地进行识别而做出响应。例如，上述的操作指令可以包括但不限于手势指令、触控指令、流设备输入指令、姿态指令、远程控制指令等。
25.内容服务端50可以包括内容服务器和数据存储(诸如，内容数据库)51。例如，内容
数据库51中可以存储诸如视频资源、音频资源等数字媒体资源。
26.内容服务器可以从内容数据库51中读取内容、存入内容、更新内容或删除内容等。内容服务器还可以管理内容的资源访问标识。在一个示例中，语音识别服务端60可以向内容服务器请求访问内容的资源访问标识(例如，统一资源标识或统一资源定位符等)。内容服务端50可以将访问内容的资源访问标识返回到语音识别服务端60或者电子设备10。在另一示例中，电子设备10可以向内容服务器请求访问内容的资源访问标识。内容服务端50可以将访问内容的资源访问标识返回到电子设备10。
27.上述的服务端60可以通过诸如互联网的网络30与电子设备10进行通信，以便进行控制消息的传输或数据的传输。图中所示的链路40可以仅仅为是示例性的，并且在其他示例中，链路40不必然直接接入网络30，也可以通过其他网络间接地与网络30连接。电子设备10、服务端50和服务端60可以位于同一接入点，也可以处于不同的接入点。本发明实施例对此不作限定。上述的网络30仅仅为示例性的，可替代地，网络30还可以为诸如移动网络或其他异构网络，来替代上述的互联网。在一些实施例中，服务端60可以绕过上述网络30与电子设备进行端到端的通信，或者经由其他网络与电子设备进行通信。
28.网络接口14可以为集成的网络接口，用于与服务端60进行通信。网络接口14还可以被配置为分离的接口，即，网络接口14被配置为两个网路接口模块，其中，第一网络接口模块与其他服务端进行通信。例如，第二网络接口模块与服务端60进行通信。语音唤醒模块13可以包括语音唤醒引擎。语音唤醒模块13还可以包括去噪处理子模块等。音频播放模块12可以包括压缩组件、音频播放组件等。应理解，上述的配置仅仅为示例性的，例如，可以配置音频模块，用于实现网络接口14、语音唤醒模块13或音频播放模块12中的至少一者的部分功能。本发明实施例对此不作限定。下面将具体说明和描述本发明实施例的各种实现方式，应理解，本发明实施例的数据处理方法可以适用于上述的网络架构，也可以适用于其他的网络架构。
29.图2a为本发明的另一实施例的播放音效控制方法的示意性流程图。图2a的播放音效控制方法可以适用于任意适当的具有数据处理能力的电子设备，包括但不限于：物联网设备、嵌入式设备、智能设备、服务器、移动终端(如手机、pad等)和pc机等。智能设备包括但不限于智能交通设备、智能家居设备、公共安全设备等。上述的智能家居设备包括但不限于智能空调、智能灯泡、智能桌椅、智能电视、智能音箱、智能仪器、智能摄像头、智能窗户传感器、智能门铃、智能探测器、其他智能安全设备等，本发明实施例对此不做限定。优选地，执行该方法的设备包括播放设备或具有播放能力的设备，该方法包括：
30.210：获取播放对象的播放控制指令，播放控制指令中包括播放对象的音效信息。
31.应理解，文中的播放对象可以为数字媒体对象，例如，音频对象、视频对象、图像对象、音频流对象、视频流对象等。例如，当上述播放对象可以为目标曲目时，上述播放对象的音效信息可以为音乐风格信息等。当播放对象为非音乐类的音频时，上述播放对象的音效信息可以为播放速度信息、语音风格信息、音质类型信息、声道类型信息等。当播放对象为视频时，上述播放对象的音效信息可以为视频的背景音乐音效信息、或语音音效信息等。上述的背景音乐音效信息或语音音效信息包括但不限于播放速度信息、语音风格信息、音质类型信息、声道类型信息等。声道类型信息指示左声道播放、右声道播放、环绕声播放、立体声播放等中的至少一者。文中的音乐风格可以指示诸如摇滚、流行、民谣、经典、爵士、嘻哈、
电子音乐等。还可以包括用户自定义的个性风格，例如，具有特定节奏、特定曲式(例如，中国风)、特定和声特征、特定旋律特征等。文中的播放控制指令可以为服务端下发的控制客户端设备进行音乐播放的指令。该播放控制指令可以由服务端主动下发，也可以由用户操作下发该播放控制指令。在一个智能场景中，服务端基于播放设备所在的当前环境推送匹配的音乐曲目，并且主动下发该播放控制指令。在另一智能场景中，服务端根据用户的诸如表情指令、手势指令、姿态指令、语音指令等人机交互指令，下发该播放控制指令。在另一智能场景中，服务端可以接收控制终端(例如，诸如手机的移动终端，或者局域网中的中控设备)中安装的对应于播放设备的应用程序发送的用户操作指令，并且基于该用户操作指令，生成上述播放控制指令。在另一智能场景中，播放设备响应所设置的实体按键的触发操作，向服务端发送操作指令。服务端并且基于该操作指令，生成上述播放控制指令。此外，在播放设备与服务端不具有直接的网络连接状态的情况下，播放设备可以通过端到端通信与控制终端连接，上述的操作指令和人机交互指令等都可以经由控制终端转发到服务端。此外，在播放设备与服务端具有网络连接状态的情况下，播放设备可以将上述的操作指令和人机交互指令通过诸如互联网的网络发送到服务端。此外，服务端可以提供具有诸如语音识别服务、人脸识别服务等。服务端还可以用于提供数字媒体资源的存储。该服务端可以实现为一个或多个服务器。每个服务器可以作为一个或多个物理实体。该服务端在逻辑上可以作为一个整体来配置，也可以被配置为应用服务端和资源服务器。应用服务器可以用于提供诸如语音识别服务、人脸识别服务等、与播放设备相关的应用服务(诸如，设备管理、用户管理、网络管理)等。资源服务器可以用于提供数字媒体资源的存储。应用服务端与资源服务器之间可以互相访问。例如，对于资源服务器的访问而言，应用服务端可以比播放设备具有更高的权限，以便保证了资源服务器的版权或数字安全。资源服务器可以经由应用服务端对播放设备进行用户授权、操作授权、设备授权等。
32.220：响应播放控制指令，基于音效信息进行播放音效设置，对播放对象进行播放。
33.应理解，对播放音效设置可以通过均衡器(equalizer)、扬声器、播放对象的编解码、播放对象的压缩比、播放对象的调制方式等至少一者来实现。上述的播放音效设置可以通过软件设置或硬件设置来实现。例如，可以通过改变均衡器参数、扬声器参数、播放对象的编解码方式、播放对象的压缩比、播放对象的调制方式等进行播放音效设置。文中的均衡器可以用于调节信号的各种频率成分放大量的电子设备。通过对各种不同频率的电信号的调节来补偿扬声器和声场的缺陷、补偿和修饰各种声源及其它特殊作用。文中的均衡器能够用于对诸如高频、中频、低频的多个频段的电信号分别进行调节。文中的均衡器可以作为实体设备设置在播放设备中。也可以作为软件安装在播放设备中，通过应用程序调用播放设备的音频底层接口，改变和调节播放设备的扬声器的各种不同频率的电信号。均衡器参数可以包括各个频段的音量的比例。各个频段包括但不限于超低音(20hz-40hz)、低音(40hz-150hz)、中低音(150hz-500hz)、中音(500hz-2khz)、中高音(2khz-5khz)、高音(7khz-8khz)或极高音(8khz-10khz)等。
34.在本发明实施例的方案中，由于能够响应播放控制指令，基于音效信息进行播放音效设置，对播放对象进行播放，因此在进行播放对象播放时对播放音效实现了自动控制，提高了操作的便捷性。
35.在一个示例中，响应播放控制指令，基于音乐风格信息进行播放音效设置，对目标
曲目进行播放，包括：响应播放控制指令，获取目标音频流，在对目标音频流进行播放之前，基于音乐风格信息进行播放音效设置。在另一示例中，响应播放控制指令，基于音乐风格信息进行播放音效设置，对目标曲目进行播放，包括：响应播放控制指令，确定本地的目标音频文件，在对目标音频文件进行播放之前，基于音乐风格信息进行播放音效设置。在另一示例中，响应播放控制指令，基于音乐风格信息进行播放音效设置，对目标曲目进行播放，包括：响应播放控制指令，获取目标音频流，并且在对目标音频流进行解码之前，基于音乐风格信息进行播放音效设置。在另一示例中，响应播放控制指令，基于音乐风格信息进行播放音效设置，对目标曲目进行播放，包括：响应播放控制指令，基于音乐风格信息进行播放音效设置，在播放音效的设置完成之后，获取目标音频流。
36.此外，可以通过与服务端建立的流媒体通信连接，传输目标音频流。也可以通过与诸如播放设备的其他终端设备建立的流媒体通信连接或端到端连接，传输目标音频流。上述的播放控制指令可以包括播放设备的标识信息或流媒体通信连接的信息。上述的流媒体通信连接和端到端可以为任意的，例如，可以为全双工通信、半双工通信等。
37.此外，播放控制指令中还包括目标曲目在服务端中对应的资源访问信息。在一个示例中，播放控制指令由应用服务端下发，播放设备基于资源访问信息访问应用服务端中的目标音频流。在另一示例中，播放控制指令由应用服务端下发，播放设备基于资源访问信息直接访问资源服务端中的目标音频流。其中，资源访问信息可以由应用服务端从资源服务端获取。在另一示例中，播放控制指令由应用服务端下发，播放设备基于资源访问信息经由应用服务端访问资源服务端中的目标音频流。其中，资源访问信息可以由应用服务端从资源服务端获取。如图2b所示。
38.在本发明的另一实现方式中，播放对象包括目标曲目，播放对象的音效信息包括目标曲目的音乐风格信息，其中，响应播放控制指令，基于音效信息进行播放音效设置，对播放对象进行播放：响应播放启动指令，基于预设对应关系，确定与音乐风格信息匹配的均衡器参数，预设对应关系指示至少一种音乐风格与其相应的均衡器参数之间的映射；响应均衡器参数的设置完成，开始播放目标曲目的音频流。
39.由于均衡器参数可以通过改变各个频段的音量的比例来进行音效设置，并且预设对应关系指示至少一种音乐风格与其相应的均衡器参数之间的映射，因此，提高了确定匹配的音乐风格的效率。
40.例如，该预设对应关系可以从应用服务端下载，也可以从外部设备导入，也可以预先安装或保存在诸如播放器的软件程序中。此外，用于可以在本地进行该预设对应关系的修改或更新，或者，通过控制终端经由应用服务器对该预设对应关系进行修改或更新。
41.在本发明的另一实现方式中，播放启动指令中还包括目标曲目在资源服务端中对应的资源访问信息，响应均衡器参数的设置完成，开始播放目标曲目的音频流，包括：响应均衡器参数的设置完成，基于资源访问信息，从资源服务端获取目标曲目的音频流进行播放。
42.由于响应均衡器参数的设置完成，基于资源访问信息，从资源服务端获取目标曲目的音频流进行播放，因此，确保了目标曲目的音频流以目标音乐风格进行播放，从而确保了用户的听觉体验。
43.在本发明的另一实现方式中，获取目标曲目的播放控制指令，包括：接收应用服务
端发送目标曲目的播放启动指令，其中，目标曲目的音乐风格信息经由应用服务端自资源服务端获取。
44.由于目标曲目的播放控制指令由应用服务端发送，因此，利用服务端的能力和资源实现了音乐风格的自动匹配。
45.在本发明的另一实现方式中，该方法还包括：从应用服务端获取预设对应关系。
46.由于预设对应关系从应用服务端获取，因此实现了应用服务端对播放设备的更全面的音效服务。
47.在一个示例中，应用服务端获取播放设备的播放器的型号信息或版本信息。应用服务端基于该型号信息或版本信息，确定匹配的对应关系，并且将该对应关系下发到播放设备。
48.在另一示例中，播放设备从应用服务端下载对应关系，该对应关系指示个性化音乐风格对应的均衡器参数表。由此，为用户提供了更丰富的备选音乐风格。
49.在本发明的另一实现方式中，该方法还包括：发送播放对象的播放时获取的人机交互指令，以便对人机交互指令进行识别，得到与音效信息对应的识别结果。
50.由于可以对人机交互指令进行识别，并且识别结果对应于音效信息，因此实现了智能交互播放控制。
51.应理解，对人机交互指令进行识别，可以为计算机视觉识别，也可以为语音识别。识别结果可以指示对播放对象的任何控制。例如，识别结果可以指示对播放对象进行音效控制，例如，音质控制、音调控制、音乐风格控制、语音风格控制等。识别结果也可以对播放对象的非音效控制，例如，播放速度控制、播放节奏控制、播放旋律控制、播放声道控制等。由此，可以基于指示音效控制的识别结果，生成音效信息。也可以基于指示播放对象的非音效控制信息的识别结果，生成音效信息。对于语音指令而言，语音识别结果可以包括音效的关键词(指示设置到该音效或者切换到该音效)。对于姿态指令而言，姿态识别结果可以包括(指示设置到该音效或者切换到该音效)。
52.还应理解，上述的音效控制可以包括音效设置控制或音效切换控制。音效设置控制可以通过用户指定或自动匹配在播放对象的播放开始时或者播放之前，确定音效信息，以便客户端可以根据音效信息，进行音效设置。此外，音效设置控制可以通过用户指定或自动匹配在播放对象的播放过程中，确定音效信息，以便客户端可以根据音效信息，进行音效切换。
53.在本发明的另一实现方式中，该方法还包括：以第一音效对播放对象进行播放，其中，响应播放控制指令，基于音效信息进行播放音效设置，对播放对象进行播放，包括：响应播放控制指令，基于音效信息，将第一音效切换到第二音效，对播放对象进行播放。
54.由于可以基于音效信息，将第一音效切换到第二音效，对播放对象进行播放，因此，实现了播放音效切换。例如，基于智能交互播放控制，能够实现智能交互播放音效切换。
55.在本发明的另一实现方式中，播放对象包括视频流，播放对象的音效信息包括视频流的播放音效信息，其中，响应播放控制指令，基于音效信息进行播放音效设置，对播放对象进行播放，包括：响应播放启动指令，基于预设对应关系，确定与所述播放音效信息匹配的播放器参数，所述预设对应关系指示至少一种播放音效与其相应的播放器参数之间的映射；响应所述播放器参数的设置完成，开始播放所述视频流的音频。
56.图3为本发明的另一实施例的播放音效控制方法的示意图。图3的播放音效控制方法可以适用于应用服务端或者具有应用服务能力的资源服务端。上述服务端可以为诸如公有云、私有云、专有云或混合云的云服务端，也可以适用于具有服务能力的其他终端设备，该方法包括：
57.310：响应播放控制请求，至少基于播放对象的音效信息，生成播放对象的播放控制指令。
58.应理解，文中的播放对象可以为数字媒体对象，例如，音频对象、视频对象、图像对象、音频流对象、视频流对象等。例如，当上述播放对象可以为目标曲目时，上述播放对象的音效信息可以为音乐风格信息等。当播放对象为非音乐类的音频时，上述播放对象的音效信息可以为播放速度信息、语音风格信息、音质类型信息、声道类型信息等。当播放对象为视频时，上述播放对象的音效信息可以为视频的背景音乐音效信息、或语音音效信息等。上述的背景音乐音效信息或语音音效信息包括但不限于播放速度信息、语音风格信息、音质类型信息、声道类型信息等。声道类型信息指示左声道播放、右声道播放、环绕声播放、立体声播放等中的至少一者。文中的音乐风格可以指示诸如摇滚、流行、民谣、经典、爵士、嘻哈、电子音乐等。还可以包括用户自定义的个性风格，例如，具有特定节奏、特定曲式(例如，中国风)、特定和声特征、特定旋律特征等。
59.320：发送播放控制指令，播放控制指令指示在对播放对象进行播放时根据音效信息对播放对象进行播放音效控制。
60.应理解，文中的播放控制指令可以为服务端下发的控制客户端设备进行音乐播放的指令。该播放控制指令可以由服务端主动下发，也可以由用户操作下发该播放控制指令。在一个智能场景中，服务端基于播放设备所在的当前环境推送匹配的音乐曲目，并且主动下发该播放控制指令。在另一智能场景中，服务端根据用户的诸如表情指令、手势指令、姿态指令、语音指令等人机交互指令，下发该播放控制指令。在另一智能场景中，服务端可以接收控制终端(例如，诸如手机的移动终端，或者局域网中的中控设备)中安装的对应于播放设备的应用程序发送的用户操作指令，并且基于该用户操作指令，生成上述播放控制指令。在另一智能场景中，播放设备响应所设置的实体按键的触发操作，向服务端发送操作指令。服务端并且基于该操作指令，生成上述播放控制指令。此外，在播放设备与服务端不具有直接的网络连接状态的情况下，播放设备可以通过端到端通信与控制终端连接，上述的操作指令和人机交互指令等都可以经由控制终端转发到服务端。此外，在播放设备与服务端具有网络连接状态的情况下，播放设备可以将上述的操作指令和人机交互指令通过诸如互联网的网络发送到服务端。此外，服务端可以提供具有诸如语音识别服务、人脸识别服务等。服务端还可以用于提供数字媒体资源的存储。该服务端可以实现为一个或多个服务器。每个服务器可以作为一个或多个物理实体。该服务端在逻辑上可以作为一个整体来配置，也可以被配置为应用服务端和资源服务器。应用服务器可以用于提供诸如语音识别服务、人脸识别服务等、与播放设备相关的应用服务(诸如，设备管理、用户管理、网络管理)等。资源服务器可以用于提供数字媒体资源的存储。应用服务端与资源服务器之间可以互相访问。例如，对于资源服务器的访问而言，应用服务端可以比播放设备具有更高的权限，以便保证了资源服务器的版权或数字安全。资源服务器可以经由应用服务端对播放设备进行用户授权、操作授权、设备授权等。
61.在本发明实施例的方案中，由于能够响应播放控制指令，基于音效信息进行播放音效设置，对播放对象进行播放，因此在进行播放对象播放时对播放音效实现了自动控制，提高了操作的便捷性。
62.在本发明的另一实现方式中，播放对象包括目标曲目，播放对象的音效信息包括目标曲目的音乐风格信息，其中，响应播放控制请求，至少基于播放对象的音效信息，生成播放对象的播放控制指令，包括：响应播放控制请求，从资源服务端，获取目标曲目对应的资源访问信息；基于目标曲目的音乐风格信息和资源访问信息，生成目标曲目的播放控制指令。
63.由于播放控制指令中包括目标曲目对应的资源访问信息和音乐风格信息，因此实现了在获取到目标曲目的资源访问信息时获取到音乐风格信息，从而实现了基于目标曲目的资源访问信息获取目标曲目的技术的后向兼容。
64.在本发明的另一实现方式中，该方法还包括：基于资源访问信息，从资源服务端，获取目标曲目；对目标曲目进行音频风格检测，得到目标曲目的音乐风格信息。
65.由于对目标曲目进行音频风格检测，得到目标曲目的音乐风格信息，因此，基于资源服务端的目标曲目，实现了为播放设备提供的音乐风格信息。
66.如图2b所示，在本示例中，音乐风格检测可以为基于预先训练的音频风格检测模型实现。音频风格检测模型的训练样本可以包括曲目的音频数据以及相应的标注音乐风格信息。可以对音频数据样本进行至少一个音频特征进行提取。例如，音频特征可以为音调特征信息、音量特征信息等。可以利用音频特征提取后的音频数据对诸如前馈神经网络、卷积神经网络的神经网络进行训练，得到音频风格检测模型。此外，曲目的音频数据可以为发行的版本的音频数据、也可以为用户创作的音频数据。
67.在本发明的另一实现方式中，该方法还包括：接收在资源服务端获得目标曲目时同步传输的目标曲目的音频元数据；对音频元数据进行提取，得到目标曲目的音乐风格信息。
68.由于目标曲目中的音频元数据中包括有关音乐风格的信息，因此从元数据中可以有效地提取音乐风格信息，并且还可以对曲目实现批量的提取元数据。通过音频元数据的同步传输，实现了音乐风格信息的及时更新。
69.在本发明的另一实现方式中，该方法还包括：对接收到的人机交互指令进行识别，得到识别结果；基于识别结果，生成播放对象的音效信息。
70.由于可以对人机交互指令进行识别，并且识别结果对应于音效信息，因此实现了智能交互播放控制。
71.在本发明的另一实现方式中，播放控制请求中包括用户信息，其中，响应播放控制请求，至少基于播放对象的音效信息，生成播放对象的播放控制指令，包括：响应播放控制请求，基于用户信息，生成播放对象的音效信息；至少基于播放对象的音效信息，封装播放对象的播放控制指令。
72.由于基于用户信息，生成播放对象的音效信息，并且，基于播放对象的音效信息，封装播放对象的播放控制指令，因此生成了对用户的个性化的音效信息。
73.例如，当上述播放对象可以为目标曲目时，上述播放对象的音效信息可以为音乐风格信息等。当播放对象为非音乐类的音频时，上述播放对象的音效信息可以为播放速度
信息、语音风格信息、音质类型信息、声道类型信息等。当播放对象为视频时，上述播放对象的音效信息可以为视频的背景音乐音效信息、或语音音效信息等。上述的背景音乐音效信息或语音音效信息包括但不限于播放速度信息、语音风格信息、音质类型信息、声道类型信息等。声道类型信息指示左声道播放、右声道播放、环绕声播放、立体声播放等中的至少一者。
74.应理解，用户信息可以为用户历史行为信息，也可以为用户标识，也可以为用户偏好信息。
75.在一个示例中，基于用户信息，生成播放对象的音效信息，可以包括：根据用户标识，确定多种音效的历史使用频率，确定推荐音效信息，作为播放对象的音效信息。例如，可以根据指示历史使用频率最高的音效，生成推荐音效信息。例如，也可以指示用户偏好信息指示的音效，生成推荐音效信息，作为播放对象的音效信息。
76.在另一示例中，基于用户信息，生成播放对象的音效信息，可以包括：至少根据用户历史行为信息，确定播放对象的音效信息。例如，根据用户历史行为信息，推送播放对象的音效信息，或者根据用户历史行为信息和当前操作信息，确定播放对象的音效信息。例如，可以预先训练音效预测模型，并且基于预先训练的音效预测模型，确定播放对象的音效信息。
77.对于音效预测模型的训练而言，可以将用户历史行为信息作为用户的音效预测模型的训练样本。也可以基于用户历史行为信息进行样本预处理，得到音效预测模型的训练样本。例如，可以将用户历史行为信息中的音效设定信息或音效选择信息作为音效维度数据。可以基于用户历史行为信息确定其他一种或多种维度数据，生成诸如用户行为向量或用户行为矩阵的用户行为数据。可以将该用户行为数据作为输入，并且将音效维度数据作为输出，对诸如多层感知机、前馈神经网络、卷积神经网络、递归神经网络等进行训练。得到音效预测模型。上述的音效预测模型可以针对一个用户而训练，也可以针对多个用户训练。例如，可以基于从用户行为信息数据库中，获取用户历史行为信息，并且基于用户历史行为信息，确定用户维度数据。用户维度数据中可以包括各个用户的标识。相应地，还可以将用户维度数据包括在模型训练输入数据中。
78.在确定播放对象的音效信息的一个场景中，当从客户端获取到播放控制请求时，可以将播放控制请求中包括的诸如播放对象的信息等，输入音效预测模型，得到用户的推荐音效信息。例如，可以基于该音效信息生成播放控制指令，返回到客户端。
79.在确定播放对象的音效信息的另一场景中，当来自客户端的指令的识别结果对应于特定播放控制请求时，可以将识别结果输入音效预测模型，得到用户的推荐音效信息，并且可以基于该音效信息生成播放控制指令，返回到客户端。
80.图3的实施例的方法与图2a的实施例的方法相对应，图2a的实施例类似的描述或限定同样适用于图3的实施例。
81.图4a为本发明的另一实施例的播放音效控制方法的示意图。如图所示，在步骤411中，应用服务端向播放设备发送播放控制指令，播放控制指令中包括音乐风格信息和资源访问标识。
82.在步骤412中，播放设备基于音乐风格信息，设置本地均衡器。在本示例中，播放设备可以在基于资源访问标识，访问音频流之前，基于音乐风格信息，设置本地均衡器。在其
他示例中，播放设备可以在基于资源访问标识，访问音频流之后，基于音乐风格信息，设置本地均衡器。例如，播放设备可以在播放音频流的过程中，基于音乐风格信息，设置本地均衡器。优选地，播放设置在基于资源访问标识获取音频流之后，并且在播放音频流之前，完成对均衡器的设置。
83.在步骤413中，播放设备基于资源访问标识，请求音频流。在本示例中，基于资源访问标识，请求音频流在基于音乐风格信息设置本地均衡器的处理之后，但是，在其他示例中，基于资源访问标识，请求音频流可以与基于音乐风格信息设置本地均衡器之前。换言之，两者可以并行地执行。在一个场景中，基于资源访问标识，请求音频流可以与基于音乐风格信息设置本地均衡器之前，由此，播放设备可以尽快请求音频流，并且在音频流播放之前，例如，在对播放音频流进行解码的过程中，完成对均衡器的设置，从而提高了用户对音频流的听觉体验的流畅性。
84.在步骤414中，基于音频流，采用设置的均衡器进行播放。
85.图4b为本发明的另一实施例的播放音效控制方法的示意图。如图所示，
86.在步骤421中，播放设备向应用服务端发送用户的语音指令。例如，播放设备可以具有诸如语音唤醒模块的语音交互功能。例如，播放设备可以将接收语音数据，将其发送到诸如云服务端的应用服务端中解析。播放设备也可以在本地解析接收到的语音数据。
87.在步骤422中，应用服务端解析语音指令，识别出语音指令指示目标音乐风格信息。例如，上述的识别可以为语音识别，基于识别出语音指令的内容，然后确定与该内容匹配(例如，关键词匹配)的音乐风格信息。
88.在步骤423中，应用服务端向播放设备发送目标音乐风格信息。例如，该音乐风格信息可以为音乐风格的标识。音乐风格信息也可以为音乐风格的语言描述，并且当播放设备接收到用户对该音乐风格的询问时，向用户回复音乐风格的描述或介绍。
89.在步骤424中，播放设备基于目标音乐风格信息，更新本地均衡器的参数。在本示例中，在播放设备中存储有诸如音乐风格信息与均衡器参数之间的对应关系。例如，该对应关系可以为映射表。具体地，播放设备基于目标音乐风格信息，在该对应关系中确定匹配的均衡器参数，并且利用该均衡器参数播放音频流。在另一示例中，该对应关系也可以存储在应用服务端侧，并且应用服务端基于该音乐风格信息，确定均衡器参数。应用服务端将均衡器参数发送到播放设备，以便播放设备基于该均衡器参数设置本地均衡器。
90.应理解，在本示例中，用户的语音指令仅仅为示例性的，在其他示例中，也可以对诸如用户的姿态指令、手势指令、表情指令等进行识别，得到与该指令匹配的音乐风格信息。
91.此外，播放设备可以从应服务端下载音乐风格信息与均衡器参数之间的对应表。应用服务端也可以控制播放设备的音乐风格的自动更新。
92.图5为本发明的另一实施例的播放音效控制装置的示意性框图。图5的播放音效控制装置可以适用于任意适当的具有数据处理能力的电子设备，包括但不限于：物联网设备、嵌入式设备、智能设备、服务器、移动终端(如手机、pad等)和pc机等。智能设备包括但不限于智能交通设备、智能家居设备、公共安全设备等。上述的智能家居设备包括但不限于智能空调、智能灯泡、智能桌椅、智能电视、智能音箱、智能仪器、智能摄像头、智能窗户传感器、智能门铃、智能探测器、其他智能安全设备等，本发明实施例对此不做限定。该装置包括：
93.指令获取模块510，获取播放对象的播放控制指令，播放控制指令中包括播放对象的音效信息；
94.播放控制模块520，响应播放控制指令，基于音效信息进行播放音效设置，对播放对象进行播放。
95.在本发明实施例的方案中，由于能够响应播放控制指令，基于音效信息进行播放音效设置，对播放对象进行播放，因此在进行播放对象播放时对播放音效实现了自动控制，提高了操作的便捷性。
96.在本发明的另一实现方式中，播放对象包括目标曲目，播放对象的音效信息包括目标曲目的音乐风格信息，其中，播放控制模块具体用于：响应播放启动指令，基于预设对应关系，确定与音乐风格信息匹配的均衡器参数，预设对应关系指示至少一种音乐风格与其相应的均衡器参数之间的映射；响应均衡器参数的设置完成，开始播放目标曲目的音频流。
97.在本发明的另一实现方式中，播放控制指令中还包括目标曲目在资源服务端中对应的资源访问信息，播放控制模块具体用于：响应均衡器参数的设置完成，基于资源访问信息，从资源服务端获取目标曲目的音频流进行播放。
98.在本发明的另一实现方式中，指令获取模块具体用于：接收应用服务端发送目标曲目的播放启动指令，其中，目标曲目的音乐风格信息经由应用服务端自资源服务端获取。
99.在本发明的另一实现方式中，该装置还包括信息获取模块，从应用服务端获取预设对应关系。
100.在本发明的另一实现方式中，该装置还包括：指令发送模块，发送播放对象的播放时获取的人机交互指令，以便对人机交互指令进行识别，得到与音效信息对应的识别结果。
101.在本发明的另一实现方式中，播放控制模块还用于：以第一音效对播放对象进行播放，其中，播放模块具体用于：响应播放控制指令，基于音效信息，将第一音效切换到第二音效，对播放对象进行播放。
102.本实施例的装置用于实现前述多个方法实施例中相应的方法，并具有相应的方法实施例的有益效果，在此不再赘述。此外，本实施例的装置中的各个模块的功能实现均可参照前述方法实施例中的相应部分的描述，在此亦不再赘述。
103.图6为本发明的另一实施例的播放音效控制装置的示意性框图。图6的播放音效控制装置可以适用于应用服务端或者具有应用服务能力的资源服务端。上述服务端可以为诸如公有云、私有云、专有云或混合云的云服务端，也可以适用于具有服务能力的其他终端设备，该装置包括：
104.指令生成模块610，响应播放控制请求，至少基于播放对象的音效信息，生成播放对象的播放控制指令。
105.指令发送模块620，发送播放控制指令，播放控制指令指示在对播放对象进行播放时根据音效信息对播放对象进行播放音效控制。
106.在本发明实施例的方案中，由于能够响应播放控制指令，基于音效信息进行播放音效设置，对播放对象进行播放，因此在进行播放对象播放时对播放音效实现了自动控制，提高了操作的便捷性。
107.在本发明的另一实现方式中，播放对象包括目标曲目，播放对象的音效信息包括
memory，ram)，只读存储介质(read only memory，rom)，可编程只读存储介质(programmable read-only memory，prom)，可擦除只读存储介质(erasable programmable read-only memory，eprom)，电可擦除只读存储介质(electric erasable programmable read-only memory，eeprom)等。
124.特别地，根据本公开的实施例，上文参考流程图描述的过程可以被实现为计算机软件程序。例如，本公开的实施例包括一种计算机程序产品，其包括承载在计算机可读介质上的计算机程序，该计算机程序包含配置为执行流程图所示的方法的程序代码。在这样的实施例中，该计算机程序可以通过通信部分从网络上被下载和安装，和/或从可拆卸介质被安装。在该计算机程序被中央处理单元(cpu)执行时，执行本发明的方法中限定的上述功能。需要说明的是，本发明所述的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读介质例如可以但不限于是电、磁、光、电磁、红外线、或半导体的系统、装置或器件，或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于：具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储介质(ram)、只读存储介质(rom)、可擦式可编程只读存储介质(eprom或闪存)、光纤、便携式紧凑磁盘只读存储介质(cd-rom)、光存储介质件、磁存储介质件、或者上述的任意合适的组合。在本发明中，计算机可读存储介质可以是任何包含或存储程序的有形介质，该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本发明中，计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号，其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式，包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质，该计算机可读介质可以发送、传播或者传输配置为由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输，包括但不限于：无线、电线、光缆、rf等等，或者上述的任意合适的组合。
125.可以以一种或多种程序设计语言或其组合来编写配置为执行本发明的操作的计算机程序代码，所述程序设计语言包括面向对象的程序设计语言—诸如java、smalltalk、c ，还包括常规的过程式程序设计语言—诸如”c”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中，远程计算机可以通过任意种类的网络：包括局域网(lan)或广域网(wan)—连接到用户计算机，或者，可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
126.附图中的流程图和框图，图示了按照本发明各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上，流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分，该模块、程序段、或代码的一部分包含一个或多个配置为实现规定的逻辑功能的可执行指令。上述具体实施例中有特定先后关系，但这些先后关系只是示例性的，在具体实现的时候，这些步骤可能会更少、更多或执行顺序有调整。即在有些作为替换的实现中，方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如，两个接连地表示的方框实际上可以基本并行地执行，它们有时也可以按相反的顺
序执行，这依所涉及的功能而定。也要注意的是，框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合，可以用执行规定的功能或操作的专用的基于硬件的系统来实现，或者可以用专用硬件与计算机指令的组合来实现。
127.描述于本发明实施例中所涉及到的模块可以通过软件的方式实现，也可以通过硬件的方式来实现。这些模块的名称在某种情况下并不构成对该模块本身的限定。
128.作为另一方面，本发明还提供了一种计算机可读介质，其上存储有计算机程序，该程序被处理器执行时实现如上述实施例所描述的方法。
129.作为另一方面，本发明还提供了一种计算机可读介质，该计算机可读介质可以是上述实施例中描述的装置中所包含的；也可以是单独存在，而未装配入该装置中。上述计算机可读介质承载有一个或者多个程序，当上述一个或者多个程序被该装置执行时，使得该装置：获取目标曲目的播放控制指令，所述播放控制指令中包括所述目标曲目的音乐风格信息；响应所述播放控制指令，基于所述音乐风格信息进行播放音效设置，对所述目标曲目进行播放，或者，
130.响应播放请求，至少基于目标曲目的音乐风格信息，生成所述目标曲目的播放控制指令；发送所述播放控制指令，所述播放控制指令指示在对所述目标曲目进行播放时根据所述音乐风格信息对所述目标曲目进行播放音效控制。
131.在本公开的各种实施方式中所使用的表述“第一”、“第二”、“所述第一”或“所述第二”可修饰各种部件而与顺序和/或重要性无关，但是这些表述不限制相应部件。以上表述仅配置为将元件与其它元件区分开的目的。例如，第一用户设备和第二用户设备表示不同的用户设备，虽然两者均是用户设备。例如，在不背离本公开的范围的前提下，第一元件可称作第二元件，类似地，第二元件可称作第一元件。
132.当一个元件(例如，第一元件)称为与另一元件(例如，第二元件)“(可操作地或可通信地)联接”或“(可操作地或可通信地)联接至”另一元件(例如，第二元件)或“连接至”另一元件(例如，第二元件)时，应理解为该一个元件直接连接至该另一元件或者该一个元件经由又一个元件(例如，第三元件)间接连接至该另一个元件。相反，可理解，当元件(例如，第一元件)称为“直接连接”或“直接联接”至另一元件(第二元件)时，则没有元件(例如，第三元件)插入在这两者之间。
133.以上描述仅为本发明的较佳实施例以及对所运用技术原理的说明。本领域技术人员应当理解，本发明中所涉及的发明范围，并不限于上述技术特征的特定组合而成的技术方案，同时也应涵盖在不脱离上述发明构思的情况下，由上述技术特征或其等同特征进行任意组合而形成的其它技术方案。例如上述特征与本发明中公开的(但不限于)具有类似功能的技术特征进行互相替换而形成的技术方案。

再多了解一些

1/2 1 2 下一页尾页

本文用于企业家、创业者技术爱好者查询，结果仅供参考。

上一篇：返回列表
下一篇：歌曲处理方法、装置、设备及计算机可读存储介质与流程

播放音效控制方法、装置、电子设备和计算机存储介质与流程

相关文献

最热文献