音频播放方法、装置、存储介质、客户端及直播系统与流程

2022-10-26 07:46:44 来源：中国专利 TAG：

1.本公开涉及音频技术领域，具体地，涉及一种音频播放方法、装置、存储介质、客户端及直播系统。

背景技术：

2.在虚拟现实场景中，用户听到的声音往往是固定的。例如，无论用户位于虚拟现实场景中的任何位置，其听到的同一声源发出的声音均是一致的。这就导致用户无法具有与现实一致的声音感受效果，极大降低了用户的沉浸式虚拟现实的体验。

技术实现要素：

3.提供该发明内容部分以便以简要的形式介绍构思，这些构思将在后面的具体实施方式部分被详细描述。该发明内容部分并不旨在标识要求保护的技术方案的关键特征或必要特征，也不旨在用于限制所要求的保护的技术方案的范围。
4.第一方面，本公开提供一种音频播放方法，应用于客户端，包括：
5.确定在虚拟场景中的第一虚拟对象的第一位置信息以及所述第一虚拟对象产生的原始音频信号；
6.根据第二虚拟对象在所述虚拟场景中的第二位置信息以及所述第一位置信息，对所述原始音频信号进行空间化处理，获得第一音频信号，其中，所述第二虚拟对象为所述客户端控制的虚拟角色；
7.根据所述第二虚拟对象的姿态信息，对所述第一音频信号进行处理，获得第二音频信号；
8.输出所述第二音频信号。
9.第二方面，本公开提供一种音频播放装置，应用于客户端，包括：
10.确定模块，配置为确定在虚拟场景中的第一虚拟对象的第一位置信息以及所述第一虚拟对象产生的原始音频信号；
11.第一音频模块，配置为根据第二虚拟对象在所述虚拟场景中的第二位置信息以及所述第一位置信息，对所述原始音频信号进行空间化处理，获得第一音频信号，其中，所述第二虚拟对象为所述客户端控制的虚拟角色；
12.第二音频模块，配置为根据所述第二虚拟对象的姿态信息，对所述第一音频信号进行处理，获得第二音频信号；
13.输出模块，配置为输出所述第二音频信号。
14.第三方面，本公开提供一种计算机可读存储介质，其上存储有计算机程序，该程序被处理装置执行时实现第一方面所述的音频播放方法的步骤。
15.第四方面，本公开提供一种客户端，包括：
16.存储装置，其上存储有计算机程序；
17.处理装置，用于执行所述存储装置中的所述计算机程序，以实现第一方面所述的
音频播放方法的步骤。
18.第四方面，本公开一种虚拟现实直播系统，包括：
19.主播端，配置为获取在真实场景中的主播的位置信息以及所述主播产生的第一原始音频信号，并将所述主播的位置信息以及所述第一原始音频信号发送至服务器；
20.所述服务器，配置为接收所述主播端发送的所述主播的位置信息以及所述第一原始音频信号，并将接收到的所述主播的位置信息以及所述第一原始音频信号分发至客户端；
21.所述客户端，配置为：
22.根据所述主播的位置信息，确定在所述虚拟场景中的第一虚拟对象的第一位置信息，其中，所述第一虚拟对象为所述主播端控制的虚拟角色；
23.根据第二虚拟对象在所述虚拟场景中的第二位置信息以及所述第一位置信息，对所述第一原始音频信号进行空间化处理，获得第一音频信号，其中，所述第二虚拟对象为所述客户端控制的虚拟角色；
24.根据所述第二虚拟对象的姿态信息，对所述第一音频信号进行处理，获得第二音频信号；
25.输出所述第二音频信号。
26.基于上述技术方案，通过根据第二虚拟对象在虚拟场景中的第二位置信息以及第一虚拟对象在虚拟场景中的第一位置信息，对原始音频信号进行空间化处理，获得第一音频信号，并根据第二虚拟对象的姿态信息，对第一音频信号进行处理，获得第二音频信号，输出的第二音频信号具有六自由度效果。第二音频信号能够随着第一虚拟对象与第二虚拟对象之间的相对位置变化而变化，使得用户能够在虚拟场景中具有真实的声音体验，极大提高了用户在虚拟现实中的沉浸感。
27.本公开的其他特征和优点将在随后的具体实施方式部分予以详细说明。
附图说明
28.结合附图并参考以下具体实施方式，本公开各实施例的上述和其他特征、优点及方面将变得更加明显。贯穿附图中，相同或相似的附图标记表示相同或相似的元素。应当理解附图是示意性的，原件和元素不一定按照比例绘制。在附图中：
29.图1是根据一些实施例示出的一种音频播放方法的应用场景示意图。
30.图2是根据另一些实施例示出的一种音频播放方法的应用场景示意图。
31.图3是根据一些实施例示出的一种音频播放方法的流程图。
32.图4是根据一些实施例示出的第一音频信号的示意图。
33.图5是根据一些实施例示出的第二音频信号的示意图。
34.图6是根据一些实施例示出的声音播放的逻辑示意图。
35.图7是根据一些实施例示出的获取目标音频设置参数的流程图。
36.图8是根据另一些实施例示出的一种音频播放方法的流程图。
37.图9是根据一些实施例示出的一种虚拟现实直播系统的结构示意图。
38.图10是根据一些实施例示出的主播端采集第一原始音频信号的示意图。
39.图11是根据一些实施例示出的一种音频播放装置的模块连接示意图。
40.图12是根据一些实施例示出的一种客户端的结构示意图。
具体实施方式
41.下面将参照附图更详细地描述本公开的实施例。虽然附图中显示了本公开的某些实施例，然而应当理解的是，本公开可以通过各种形式来实现，而且不应该被解释为限于这里阐述的实施例，相反提供这些实施例是为了更加透彻和完整地理解本公开。应当理解的是，本公开的附图及实施例仅用于示例性作用，并非用于限制本公开的保护范围。
42.应当理解，本公开的方法实施方式中记载的各个步骤可以按照不同的顺序执行，和/或并行执行。此外，方法实施方式可以包括附加的步骤和/或省略执行示出的步骤。本公开的范围在此方面不受限制。
43.本文使用的术语“包括”及其变形是开放性包括，即“包括但不限于”。术语“基于”是“至少部分地基于”。术语“一个实施例”表示“至少一个实施例”；术语“另一实施例”表示“至少一个另外的实施例”；术语“一些实施例”表示“至少一些实施例”。其他术语的相关定义将在下文描述中给出。
44.需要注意，本公开中提及的“第一”、“第二”等概念仅用于对不同的装置、模块或单元进行区分，并非用于限定这些装置、模块或单元所执行的功能的顺序或者相互依存关系。
45.需要注意，本公开中提及的“一个”、“多个”的修饰是示意性而非限制性的，本领域技术人员应当理解，除非在上下文另有明确指出，否则应该理解为“一个或多个”。
46.本公开实施方式中的多个装置之间所交互的消息或者信息的名称仅用于说明性的目的，而并不是用于对这些消息或信息的范围进行限制。
47.可以理解的是，在使用本公开各实施例公开的技术方案之前，均应当依据相关法律法规通过恰当的方式对本公开所涉及个人信息的类型、使用范围、使用场景等告知用户并获得用户的授权。
48.例如，在响应于接收到用户的主动请求时，向用户发送提示信息，以明确地提示用户，其请求执行的操作将需要获取和使用到用户的个人信息。从而，使得用户可以根据提示信息来自主地选择是否向执行本公开技术方案的操作的电子设备、应用程序、服务器或存储介质等软件或硬件提供个人信息。
49.作为一种可选的但非限定性的实现方式，响应于接收到用户的主动请求，向用户发送提示信息的方式例如可以是弹窗的方式，弹窗中可以以文字的方式呈现提示信息。此外，弹窗中还可以承载供用户选择“同意”或者“不同意”向电子设备提供个人信息的选择控件。
50.可以理解的是，上述通知和获取用户授权过程仅是示意性的，不对本公开的实现方式构成限定，其它满足相关法律法规的方式也可应用于本公开的实现方式中。
51.同时，可以理解的是，本技术方案所涉及的数据(包括但不限于数据本身、数据的获取或使用)应当遵循相应法律法规及相关规定的要求。
52.图1是根据一些实施例示出的一种音频播放方法的应用场景示意图。如图1所示，本公开实施例提出的一种音频播放方法可以应用于虚拟现实游戏场景，在服务器上运行有虚拟现实游戏，第一客户端、第二客户端、
……
、第n客户端与服务器通信连接，以通过服务器加入同一虚拟现实游戏中。在该虚拟现实游戏中，每一客户端均能够根据本客户端对应
的用户在真实环境的位置信息以及姿态信息，结合其他客户端对应的用户在真实环境的位置信息以及姿态信息，对该其他客户端发出的原始音频信号进行空间化，使得在本客户端听到的其他客户端发出的音频能够随着用户的位置信息以及姿态信息变化而变化。例如，当第二客户端对应的虚拟对象向第一客户端对应的虚拟对象靠近时，第二客户端对应的虚拟对象发出的声音的响度会变大。
53.应当理解的是，上述客户端可以为虚拟现实(virtual reality，vr)设备。
54.图2是根据另一些实施例示出的一种音频播放方法的应用场景示意图。如图2所示，本公开实施例提出的一种音频播放方法可以应用于虚拟现实直播场景中，在该虚拟现实直播场景中，包括主播端、服务器以及客户端。其中，主播端与服务器通信连接，主播端配置为采集在真实场景中的主播的位置信息、该主播产生的第一原始音频信号以及画面数据，并将该主播的位置信息、第一原始音频信号以及发送至服务器。服务器则配置为接收主播端发送的主播的位置信息、第一原始音频信号以及画面数据，并形成直播推流，以通过直播推流的方式将主播的位置信息、第一原始音频信号以及画面数据分发至客户端。客户端与服务器通信连接，该客户端从服务器中拉流，并配置为根据主播的位置信息确定该主播对应的第一虚拟对象在虚拟场景中的第一位置信息，并结合客户端对应的第二虚拟对象在虚拟场景中的第二位置信息，对第一音频信号进行空间化处理，获得第一音频信号，并根据第二虚拟对象的姿态信息对第一音频信号进行处理，获得第二音频信号，然后在客户端中输出第二音频信号。应当理解的是，在输出第二音频信号时，客户端会同步拉流获得的画面数据展示相应的虚拟现实画面。因此，在客户端中听到的第二音频信号能够随着用户和/或主播的位置以及姿态变化而变化，使得在虚拟现实直播的场景中，也能够具有真实的声音体验。
55.图3是根据一些实施例示出的一种音频播放方法的流程图。如图3所示，本公开实施例提出一种音频播放方法，应用于客户端，该方法可以包括以下步骤。
56.在步骤310中，确定在虚拟场景中的第一虚拟对象的第一位置信息以及所述第一虚拟对象产生的原始音频信号。
57.这里，虚拟场景可以是虚拟现实场景，如使用vr设备呈现的虚拟现实场景，当然，该虚拟场景也可以是除虚拟现实场景外的电子游戏场景。在本公开实施例中，主要以虚拟现实场景进行详细说明。第一虚拟对象是在虚拟现实场景中的一个三维模型，该第一虚拟对象的动作由其他客户端或主播端对应的真实对象控制。应当理解的是，第一虚拟对象可以是任意在虚拟现实场景中发出声音的对象，第一虚拟对象并不局限为虚拟人物对象，也可以为虚拟物品。例如，在虚拟现实的演唱会直播场景中，第一虚拟对象可以为虚拟现实的演唱会的主播，也可以为虚拟现实的演唱会中的虚拟乐器。
58.原始音频信号是指第一虚拟对象对应的真实对象在真实场景中发出的未经过处理的音频信号。示例性地，第一虚拟对象对应的原始音频信号可以由该第一虚拟对象的vr设备采集的，并将采集到的原始音频信号发送至客户端。
59.其中，可以在虚拟现实场景中构建一个三维坐标系，例如，以虚拟现实场景中的一个基准点为坐标原点，构建第一三维坐标系。该第一位置信息是第一虚拟对象在该第一三维坐标系中的坐标信息。
60.在一些实施例中，客户端接收第一虚拟对象对应的vr设备采集到的第一虚拟对象
对应的真实对象在真实环境中的真实位置信息，客户端根据该真实位置信息，获得第一虚拟对象在虚拟现实场景中的第一位置信息。
61.值得说明的是，由于在虚拟现实场景中，以虚拟现实场景中的一个基准点作为第一三维坐标系的坐标原点。vr设备在采集真实对象的真实位置信息时，也以真实环境中的一个参考点作为第二三维坐标系的坐标原点。真实位置信息是真实对象在第二三维坐标系中的坐标信息。在将真实位置信息转换为第一位置信息时，将参考点与基准点进行重合，获得真实位置信息映射在虚拟现实场景中的第一三维坐标系的第一位置信息。
62.在一些实施例中，在步骤310之后，所述方法还包括：
63.调整所述原始音频信号的响度，获得调整后的原始音频信号，其中，所述调整后的原始音频信号的响度维持在预设响度范围内。
64.这里，客户端在接收到原始音频信号之后，对原始音频信号的响度进行调整，以使调整后的原始音频信号的响度维持在预设响度范围内。
65.应当理解的是，通过对原始音频信号的响度进行调整，能够将第一虚拟对象对应的用户产生的原始音频信号的响度稳定在预设响度范围内，而不会使得客户端听到的声音出现时大时小的问题，以保证客户端的用户具有良好的声音感受。
66.在步骤320中，根据第二虚拟对象在所述虚拟场景中的第二位置信息以及所述第一位置信息，对所述原始音频信号进行空间化处理，获得第一音频信号，其中，所述第二虚拟对象为所述客户端控制的虚拟角色。
67.这里，第二虚拟对象是客户端对应的用户在虚拟场景中控制的虚拟角色。第二虚拟对象在虚拟场景中的第二位置信息是第二虚拟对象在第一三维坐标系中的坐标信息。应当理解的是，客户端获得第二位置信息的方法与上述实施方式获得第一位置信息的方法是一致的，在此不再赘述。
68.根据第二虚拟对象的第二位置信息以及第一虚拟对象的第一位置信息，可以在虚拟场景中确定到第二虚拟对象相对于第一虚拟对象的距离以及方位。
69.根据第二位置信息以及第一位置信息对原始音频信号进行空间化处理，实际上是将缺少位置信息的原始音频信号渲染到虚拟场景这种。示例性地，对原始音频信号进行空间化处理包括对原始音频信号进行距离处理和方位处理，其中，距离处理是根据第一虚拟对象相对于第二虚拟对象的距离参数改变原始音频信号的响度、频率、扩散度以及聚焦度中的一种或多种。方向处理是根据第一虚拟对象相对于第二虚拟对象的方位参数改变原始音频信号的音色。
70.值得说明的是，对原始音频信号进行空间化处理获得的第一音频信号，该第一音频信号实际上是一种ambisonic格式的音频。该ambisonic格式是一种基于空间位置表示声音的音频格式。ambisonic格式的音频是具有各向同性的，能够平等对待来自任何方向的声音。
71.图4是根据一些实施例示出的第一音频信号的示意图。如图4所示，在对原始音频信号进行空间化处理获得第一音频信号，实际上是将转换为分布在虚拟全景空间40的不同空间位置上的子声音信号(如图4中的灰色圆圈所示)。相当于在虚拟全景空间40分布有无数个扬声器，原始音频信号被转换为在不同空间位置上的扬声器中。图4所示的所有子声音信号构成第一音频信号。其中，在图4中的灰色圆圈的大小表示在该空间位置上的声音信号
的音量大小。
72.在步骤330中，根据所述第二虚拟对象的姿态信息，对所述第一音频信号进行处理，获得第二音频信号。
73.这里，第二虚拟对象的姿态信息包括第二虚拟对象的偏航角、滚转角以及俯仰角中的至少一种。该姿态信息反映了第二虚拟对象在虚拟现实场景中的朝向。
74.应当理解的是，由于该第二虚拟对象是由客户端对应的用户控制的虚拟角色，第二虚拟对象的姿态信息实际上相当于该客户端对应的用户在真实环境中的姿态信息。示例性地，客户端可以通过陀螺仪、惯性测量单元(inertial measurement unit，imu)等传感器来获得该用户在真实环境中的姿态信息，将该用户在真实环境中的姿态信息转换为第二虚拟对象的姿态信息。
75.根据第二虚拟对象的姿态信息对第一音频信号进行处理实际上是根据第二虚拟对象的姿态信息定义第一音频信号的朝向。图5是根据一些实施例示出的第二音频信号的示意图。如图5所示，通过第二虚拟对象51的姿态信息定义分布在虚拟全景空间50的不同空间位置上的子声音信号(如图5中的灰色圆圈所示)，获得第二音频信号。
76.应当理解的是，第二音频信号实际上是具有六自由度(6dof)的音频信号，包括前后、左右、上下、俯仰、滚转以及偏航六个自由度。
77.在步骤340中，输出所述第二音频信号。
78.这里，客户端输出第二音频信号是根据客户端配置的音频输出装置对应的参数输出第二音频信号。例如，当客户端配置的音频输出装置为耳机时，则对第二音频信号进行双耳化处理。当客户端配置的音频输出装置为独立扬声器时，则对第二音频信号进行扬声器处理。
79.由此，通过根据第二虚拟对象在虚拟现实场景中的第二位置信息以及第一虚拟对象在虚拟现实场景中的第一位置信息，对原始音频信号进行空间化处理，获得第一音频信号，并根据第二虚拟对象的姿态信息，对第一音频信号进行处理，获得第二音频信号，输出的第二音频信号具有六自由度效果。第二音频信号能够随着第一虚拟对象与第二虚拟对象之间的相对位置变化而变化，使得用户能够在虚拟现实场景中具有真实的声音体验，极大提高了用户在虚拟现实中的沉浸感。例如，当第二虚拟对象靠近第一虚拟对象时，第一虚拟对象发出的声音的响度会变大，当第二虚拟对象转头时，第一虚拟对象发出的声音也会跟着第二虚拟对象转动。
80.值得说明的是，在本公开实施例中，是在客户端中对第一虚拟对象产生的原始音频信号进行空间化处理。当在虚拟现实场景中存在多个客户端分别控制的虚拟角色时，传递给每一客户端的都是一样的原始音频信号，每一客户端均根据其自身的位置信息以及姿态信息对原始音频信号进行空间化处理，每一客户端的用户听到的声音是不一样的。
81.另外，在本公开实施例中，客户端是实时输出虚拟现实场景的画面的，画面输出的具体逻辑在本公开不作详细说明。
82.在一些可以实现的实施方式中，步骤320中，可以根据所述第二位置信息以及所述第一位置信息，结合与所述虚拟场景相匹配的目标音频设置参数，对所述原始音频信号进行空间化处理，获得所述第一音频信号。
83.这里，目标音频设置参数用于使得经过所述目标音频设置参数渲染后的声音在所
述虚拟现实场景中传播的声音效果与该声音在与所述虚拟现实场景对应的真实环境中传播的声音效果一致。
84.应当理解的是，针对不同类型的虚拟现实场景，其可以对应有不同的目标音频设置参数。每一虚拟现实场景均可以根据其场景内容的不同设置对应的音频设置参数，以使在该虚拟现实场景中传播的声音能够与在真实场景中传播的效果相似。
85.对于不同的虚拟现实场景，声音传播的效果并不一致，对应的目标音频设置参数也会不一致。例如，对于“鸟巢体育馆”的虚拟现实场景和“工人体育馆”的虚拟现实场景而言，声音在“鸟巢体育馆”中传播的混响效果相较于在“工人体育馆”中传播的混响效果更重。通过不同虚拟现实场景对应的目标音频设置参数，能够使得在该虚拟现实场景中呈现的声音效果与真实环境中传播的声音效果一致。
86.其中，目标音频设置参数包括声音衰减参数、在所述虚拟现实场景中各个虚拟物品模型的声学材质参数、早期反射声参数、混响参数以及环境声的空间化参数中的至少一种。
87.针对声音衰减参数，是其指声音的音量、频率、插件发送量、扩散度、音频焦点随距离变化而变化的关系。声学材质参数则是指不同材质对于不同频率的声音的吸收率以及反射率，其体现了虚拟现实场景中不同虚拟物品模型对于声音的吸收率和反射率。早期反射声是在直达声以后到达的对房间的音质起到有利作用的所有反射声，早期反射声参数可以包括早期反射声所占的比重、早期反射声的时间范围以及侧向到达的早期反射声等等。
88.混响是室内声反射和声扩散共同作用的结果，通过设置混响参数可以使得声音在虚拟现实场景中传播也能够产生对应的混响感。例如，当虚拟现实场景为大音乐厅时，其混响参数可以如下：混响时间：2.8s0.3-30.0s，高频衰减率：0.80.1-1.0，混响扩散：60-10，直达声与早期反射声之间的延迟时间：40.0ms0.1-200.0ms，低通滤波器的截止频率：7.0khz-16khz，高通滤波器的截止频率：32hz-8khz。
89.环境声的空间化参数是指用于对虚拟现实场景中产生的环境声进行空间化的参数，例如，当虚拟现实场景为大音乐厅时，在该虚拟场景中产生的如掌声、欢呼声或者房间底噪等等环境声，均可以基于该环境声的空间化参数进行处理。
90.通过根据第一位置信息、第二位置信息、设置的声音衰减参数、声学材质参数、早期反射声参数、混响参数以及环境声的空间化参数，对原始音频信号进行空间化处理，可以将原始音频信号处理为满足该虚拟现实场景的声学要求的第一音频信号。
91.图6是根据一些实施例示出的声音播放的逻辑示意图。如图6所示，声音播放的整体逻辑是：播放逻辑输出的声音经过空间化参数处理，经过空间化参数处理的声音进入声音的传播处理，经过声音的传播处理后的声音进入声音的载体处理，最后对经过声音的载体处理后的声音进行还放，输出声音。
92.其中，在对声音进行空间化参数处理时，使用的空间化参数可以包括声音衰减参数，由于声音衰减参数是指声音的音量、频率、插件发送量、扩散度、音频焦点随距离变化而变化的关系。因此，在空间化参数处理时，加入第一位置信息和第二位置信息，以根据第一位置信息和第二位置信息确定第一虚拟对象与第二虚拟对象之间的距离，并根据该距离确定对应的声音衰减参数。应当理解的是，在对声音进行空间化参数处理时，还可以加入第二虚拟对象的姿态信息。
93.在声音的传播处理中，则加入声学材质参数、混响参数、早期反射声参数对声音在虚拟现实场景中的传播进行模拟，以使输出的第二音频能够具有真实的效果。
94.在一些可以实现的实施方式中，目标音频设置参数通过以下步骤获得：
95.在加载所述虚拟场景时，同步加载所述虚拟场景对应的目标音频设置参数。
96.这里，虚拟场景对应的目标音频设置参数是在构建虚拟场景时，根据该虚拟场景对应的场景类型为该虚拟场景配置的音频设置参数。当客户端的用户选择某一虚拟现实场景时，在客户端中加载选择的虚拟现实场景，并同步加载对应的目标音频设置参数。
97.应当理解的是，在构建虚拟现实场景时，可以根据美术场景构建虚拟现实场景，然后根据构建的虚拟现实场景的场景类型对该虚拟现实场景的音频设置参数进行配置，以使得在虚拟现实场景中传播的声音能够与其场景类型相匹配。
98.作为一些示例，根据场景类型对虚拟场景的音频设置参数进行配置可以是根据虚拟场景的环境对音频设置参数进行配置。当然，作为另一些示例，根据场景类型对虚拟场景的音频设置参数进行配置还可以是根据在该虚拟场景中的内容对场景中的音频设置参数进行配置。例如，当在虚拟场景中进行演唱时，可以根据预先确定的演唱内容配置对应的音频设置参数。比如，当演唱内容需要使用钢琴时，可以预先配置钢琴声在虚拟现实空间中传播的音频设置参数，以使得钢琴声的输出更加真实。
99.由此，通过为每一虚拟场景配置对应的目标音频设置参数，不仅可以使得在虚拟场景中输出的音频更加具有真实感，而且可以根据虚拟场景中的内容对声音的传播进行定制化设计，使得在虚拟场景中的音频输出能够符合内容需求。
100.图7是根据一些实施例示出的获取目标音频设置参数的流程图。如图7所示，在一些可以实现的实施方式中，目标音频设置参数通过以下步骤获得：
101.在步骤701中，根据所述虚拟场景对应的初始音频设置参数，生成多个推荐音频设置参数。
102.这里，针对每一虚拟现实场景，其均可以配置有对应的初始音频设置参数，该初始音频设置参数可以是预先根据该虚拟现实场景对应的场景类型为该虚拟现实场景配置的音频设置参数。初始音频设置参数包括声音衰减参数、在所述虚拟现实场景中各个虚拟物品模型的声学材质参数、早期反射声参数、混响参数以及环境声的空间化参数。
103.在客户端中加载虚拟现实场景之后，客户端可以根据该客户端对应的场景类型和/或客户端对应的用户的用户需求，对初始音频设置参数进行调整，以生成多个推荐音频设置参数。
104.在步骤702中，在所述虚拟场景中展示所述多个推荐音频设置参数。
105.这里，客户端在获得多个推荐音频设置参数之后，可以展示多个推荐音频设置参数，以供客户端的用户选择。
106.示例性地，在虚拟现实场景中展示多个推荐音频设置参数可以是利用多个推荐音频设置参数分别播放同一音频，以使用户根据音频效果选择对应的推荐音频设置参数。
107.在步骤703中，响应于选择指令，将选中的所述推荐音频设置参数确定为所述目标音频设置参数。
108.这里，在展示多个推荐音频设置参数之后，客户端响应于用户选择某一推荐音频设置参数的选择指令，将选中的推荐音频设置参数确定为目标音频设置参数。
109.值得说明的是，上述初始音频设置参数是能够直接使用的音频设置参数，若客户端对应的用户未选择推荐音频设置参数，则可以默认使用初始音频设置参数。用户选择的推荐音频设置参数是更加符合用户需求的音频设置参数，经过推荐音频设置参数处理后的原始音频信号，能够符合用户需求的听感。
110.由此，通过对初始音频设置参数进行调整，并将用户选择的推荐音频设置参数确定为目标音频设置参数，可以实现客户端的用户定制个性化的音频需求。
111.在一些实施例中，所述第一虚拟对象包括通过主播端加入所述虚拟场景的主播控制的虚拟角色，所述原始音频信号包括所述主播在真实场景中产生的声音。
112.这里，第一虚拟对象其可以是由主播端控制的虚拟角色，则原始音频信号可以是通过主播端采集到的主播在真实场景中产生的声音。
113.其中，当第一虚拟对象是由主播端控制的虚拟角色时，实际上提供了一种虚拟现实的直播场景。在该直播场景中，主播端采集主播在真实场景中产生的原始音频信号、第一位置信息以及画面数据，并将原始音频信号、第一位置信息以及画面数据传输至服务器形成推流信号，客户端从服务器中拉流，获得对应的推流信号。客户端在获得推流信号之后，可以根据推流信号中的画面数据输出虚拟场景中的画面，并且根据原始音频信号以及第一位置信息输出第二音频信号。
114.在一些实施例中，在主播端中可以设置采集到的原始音频信号的声道以及格式、设置用于采集原始音频信号的麦克风、设置用于存储原始音频信号的音频信号路由。
115.其中，主播不仅可以是人物，其也可以是物品。例如，在虚拟现实的演唱会直播场景中，主播可以为虚拟现实的演唱会的演唱者，也可以为虚拟现实的演唱会中的乐器，如架子鼓、电吉他、贝斯等等。则对应的原始音频信号可以为人物和/或物品产生的原始音频。
116.在另一些实施例中，所述第一虚拟对象还包括通过其他客户端加入所述虚拟场景的目标对象控制的虚拟角色，所述第一音频信号包括所述目标对象在真实场景中产生的声音。
117.这里，在虚拟现实的直播场景中，其不仅可以包括主播端、本客户端，还可以包括其他客户端。例如，通过其他客户端加入虚拟现实的直播场景的观众。
118.在这一场景中，步骤310可以是：响应于语音请求，建立所述客户端与所述其他客户端之间的语音连接，接收所述其他客户端发送的所述目标对象在真实场景中的位置信息以及所述目标对象在真实场景中产生的声音，基于所述目标对象的位置信息确定所述第一位置信息，并将所述目标对象在真实场景中产生的声音确定为所述原始音频信号。
119.这里，语音请求可以是本客户端向其他客户端发起的语音请求，也可以是其他客户端向本客户端发起的语音请求。在同一虚拟现实场景中，无论是本客户端或者是其他客户端，均可以通过选取虚拟现实场景中的虚拟对象，并向该虚拟对象发起申请建立语音连接的语音请求，当另一客户端同意该语音请求时，建立本客户端与其他客户端之间的语音连接。例如，在虚拟现实场景中，虚拟对象a可以请求与虚拟对象b进行语音，当虚拟对象b同意语音请求时，建立虚拟对象a与虚拟对象b之间的语音连接。
120.当建立语音连接之后，本客户端接收其他客户端发送的目标对象在真实场景中的位置信息以及目标对象在真实场景中产生的声音。值得说明的是，在上述实施例中已经对其他客户端如何采集目标对象在真实场景中的位置信息以及目标对象在真实场景中产生
的声音进行了详细说明，在此不再赘述。
121.本客户端在接收到目标对象的位置信息之后，将该目标对象的位置信息转换为第一虚拟对象的第一位置信息。并且，将目标对象在真实场景中产生的声音确定为原始音频信号。
122.由此，在虚拟现实的直播场景中，不仅能够对主播端的主播产生的原始音频信号进行空间化处理，而且还能够对其他客户端的目标对象产生的原始音频信号进行空间化处理，使得在虚拟现实场景中的连麦沟通产生的语音也具有六自由度的效果。即在虚拟现实场景中，不同观众之间的语音交流也能够随着观众的位置、姿态变化产生空间变化。例如，当观众a与观众b之间的距离变近时，语音的音量也会变大。
123.值得说明的是，主播端与其他客户端是可以同时产生对应的原始音频信号的，此时，需要对主播端产生的原始音频信号以及其他客户端产生的原始音频信号之间的时间轴进行同步，以保证主播端产生的原始音频信号以及其他客户端产生的原始音频信号能够同步输出。
124.另外，当在虚拟现实场景中同时存在主播端产生的原始音频信号以及其他客户端产生的原始音频信号时，对于原始音频信号的处理过程是一致的，只是使用的参数不同。例如，在对主播端产生的原始音频信号进行空间化处理时，是使用主播端对应的第一位置信息和本客户端的第二位置信息。在对其他客户端产生的原始音频信号进行空间化时，是使用其他客户端对应的第一位置信息和本客户端的第二位置信息。
125.图8是根据另一些实施例示出的一种音频播放方法的流程图。如图8所示，在一些可以实现的实施方式中，该音频播放方法还可以包括以下步骤：
126.在步骤801中，响应于用于指示在所述虚拟场景中触发环境声的触发指令，获取对应的环境音频信号。
127.这里，触发指令可以是主播端发送的，主播端可以触发用于指示在虚拟场景中触发环境声的触发指令。示例性地，该触发指令可以是与某一画面数据绑定的，当在客户端展示特定画面数据时，触发该触发指令。当然，该触发指令也可以是后台触发的。
128.客户端响应于上述触发指令，获取对应的环境音频信号。值得说明的是，针对每一虚拟现实场景，其均可以配置有不同的环境音频信号。例如，对于虚拟演唱会场景，可以配置有欢呼声、掌声、烟花声等等环境音频信号。
129.另外，该环境音频信号是在加载虚拟现实场景时存储在客户端上的。当主播端需要触发环境音频信号时，主播端向客户端发送触发指令，客户端响应于该触发指令，从本地数据库中获取对应的环境音频信号。
130.应当理解的是，通过将环境音频信号存储在客户端本地，不仅无需实际采集对应的环境音频信号，以节省传输音频信号的带宽，而且还能够保证环境音频信号的质量。
131.在步骤802中，根据所述环境音频信号在所述虚拟场景中的触发位置以及所述第二位置信息，对所述环境音频信号进行空间化处理，获得第三音频信号。
132.这里，根据环境音频信号在虚拟现实场景中的触发位置以及第二位置信息对环境音频信号进行空间化处理获得第三音频信号的原理与获得第一音频信号的原理是一致的，在此不再赘述。其本质是对环境音频信号进行空间化处理，使得在虚拟现实场景中的环境音频信号也能够具有六自由度的效果。
133.在步骤803中，根据所述第二虚拟对象的姿态信息，对所述第三音频信号进行处理，获得第四音频信号。
134.这里，根据第二虚拟对象的姿态信息对第三音频信号进行处理获得第四音频信号的原理与获得第二音频信号的原理是一致的，在此不再赘述。
135.在步骤804中，输出所述第四音频信号。
136.这里，输出第四音频信号的原理与输出第二音频信号的原理是一致的，在此不再赘述。
137.由此，通过将环境音频信号存储在客户端本地，不仅无需实际采集对应的环境音频信号，以节省传输音频信号的带宽，而且还能够保证环境音频信号的质量。另外，通过对环境音频信号进行处理，使得输出的环境音频信号也能够具有六自由度的效果。
138.值得说说明的是，当在虚拟现实场景中存在主播端对应的原始音频信号、其他客户端的原始音频信号以及环境音频信号中的一种或多种时，其空间化的流程是一致的。
139.图9是根据一些实施例示出的一种虚拟现实直播系统的结构示意图。如图9所示，本公开实施例提供一种虚拟现实直播系统，该直播系统包括主播端901、服务器902以及客户端903。
140.其中，主播端901配置为获取在真实场景中的主播的位置信息以及所述主播产生的第一原始音频信号，并将所述主播的位置信息以及所述第一原始音频信号发送至服务器902。
141.这里，主播端901可以通过设置在主播端901上的定位模块采集主播的位置信息，其中，定位模块可以是通过uwb(ultra wideband，超宽带)空间定位技术，或wifi 6.0(一种无线网网络标准)空间定位技术来计算得到主播的位置信息。
142.值得说明的是，采集到的主播的位置信息是主播在第二三维坐标系中的坐标信息。
143.在主播端901中可以设置采集到的音频信号的声道以及格式、设置用于采集音频信号的麦克风、设置用于存储音频信号的音频信号路由。主播端901通过麦克风采集主播产生的第一原始音频信号，并且根据设置的音频信号路由、声道以及格式存储采集到的第一原始音频信息。然后，主播端901将采集到的主播的位置信息以及第一原始音频信号发送至服务器902。
144.应当理解的是，主播端901还会同步采集主播的画面数据，并将该画面数据发送至服务器902。在本公开实施例中，并不涉及画面数据的采集以及画面数据的输出，因此不对其进行详细说明。作为一个示例，主播端901可以通过摄像装置采集主播的画面数据，在客户端903中则直接在虚拟现实场景中展示该画面数据。作为另一个示例，主播端901可以采集主播的人体姿态数据作为画面数据，在客户端903中则根据该人体姿态数据控制主播对应的第一虚拟对象的动作，并在虚拟现实场景中展示第一虚拟对象的画面。
145.图10是根据一些实施例示出的主播端采集第一原始音频信号的示意图。如图10所示，以虚拟现实的演唱会距离说明如何采集第一原始音频信号，该第一原始音频信号包括人声以及乐器声。架子鼓-底鼓、架子鼓-军鼓、架子鼓-镲片、电吉他、贝斯、合成器、人声-主唱以及人声-和声，可以通过现场混音台进行混音，并通过现场音箱输出，由设置在现场的麦克风采集形成第一原始音频信号。
146.当然，架子鼓-镲片、电吉他、贝斯、合成器、人声-主唱以及人声-和声可以经过现场的预混音台进行混音，并将通过音画同步设备将架子鼓-镲片、电吉他、贝斯、合成器、人声-主唱以及人声-和声与摄像装置采集到的画面数据进行同步，发送至服务器形成推流信号。
147.服务器902配置为接收所述主播端901发送的所述主播的位置信息以及所述第一原始音频信号，并将接收到的所述主播的位置信息以及所述第一原始音频信号分发至客户端903。
148.这里，服务器902在接收到主播端901发送的主播的位置信息以及第一原始音频信号之后，将接收到的主播的位置信息以及第一原始音频信号打包形成推流信号，并以推流信号的形式将主播的位置信息以及第一原始音频信号分发至客户端903。
149.其中，在服务器902中并不会对第一原始音频信号进行处理，而是将其打包为推流信号。
150.客户端903，配置为：
151.根据所述主播的位置信息，确定在所述虚拟场景中的第一虚拟对象的第一位置信息，其中，所述第一虚拟对象为所述主播端901控制的虚拟角色；
152.根据第二虚拟对象在所述虚拟场景中的第二位置信息以及所述第一位置信息，对所述第一原始音频信号进行空间化处理，获得第一音频信号，其中，所述第二虚拟对象为所述客户端903控制的虚拟角色；
153.根据所述第二虚拟对象的姿态信息，对所述第一音频信号进行处理，获得第二音频信号；
154.输出所述第二音频信号。
155.这里，客户端903通过从服务器902中拉流，获取到主播的位置信息以及第一原始音频信号。根据主播的位置信息，可以确定到主播映射在虚拟现实场景中的第一虚拟对象在虚拟现实场景中的第一位置信息。
156.应当理解的是，第二三维坐标系的主播的位置信息如何转换为在虚拟现实场景中的第一三维坐标系中的第一位置信息，已经在上述实施例中进行了详细说明，在此不再赘述。
157.在一些实施例中，客户端903还配置为：在接收到第一原始音频信号之后，调整所述第一原始音频信号的响度，获得调整后的第一原始音频信号，其中，所述调整后的第一原始音频信号的响度维持在预设响度范围内。
158.应当理解的是，通过对第一原始音频信号的响度进行调整，能够将主播产生响度不一的第一原始音频信号的响度稳定在预设响度范围内，而不会使得客户端903听到的声音出现时大时小的问题，以保证客户端903的用户具有良好的声音感受。
159.第二虚拟对象是客户端903在虚拟现实场景中控制的虚拟角色，根据第二虚拟对象在虚拟现实场景中的第二位置信息以及第一位置信息，对第一原始音频信号进行空间化处理，获得第一音频信号。
160.其中，在上述实施例中已经详细说明了如何获取第二虚拟对象的第二位置信息，在此不再赘述。
161.而且，在上述实施例中，已经明确说明了根据第一位置信息和第二位置信息对原
始音频信号进行空间化处理的过程，根据第一位置信息和第二位置信息对第一原始音频信号进行空间化处理的过程与其是一致的，故在此不再详细说明。
162.在获得第一音频信号之后，客户端903基于第二虚拟对象的姿态信息，对所述第一音频信号进行处理，获得第二音频信号。其中，由于该第二虚拟对象是由客户端903对应的用户控制的虚拟角色，第二虚拟对象的姿态信息实际上相当于该客户端903对应的用户在真实环境中的姿态信息。根据第二虚拟对象的姿态信息对第一音频信号进行处理实际上是根据第二虚拟对象的姿态信息定义第一音频信号的朝向。在上述实施例中已经对第二音频信号进行了详细后面，在此不再赘述。
163.客户端903输出第二音频信号是根据客户端903配置的音频输出装置对应的参数输出第二音频信号。例如，当客户端903配置的音频输出装置为耳机时，则对第二音频信号进行双耳化处理。当客户端903配置的音频输出装置为独立扬声器时，则对第二音频信号进行扬声器处理。
164.由此，在虚拟现实的直播场景中，通过根据第二虚拟对象在虚拟现实场景中的第二位置信息以及第一虚拟对象在虚拟现实场景中的第一位置信息，对第一原始音频信号进行空间化处理，获得第一音频信号，并根据第二虚拟对象的姿态信息，对第一音频信号进行处理，获得第二音频信号。使得在虚拟现实的直播场景中输出的声音能够具有六自由度的效果，在虚拟现实场景中的声音能够随着第一虚拟对象与第二虚拟对象之间的相对位置变化而变化，使得用户能够在虚拟现实直播过程中具有真实的声音体验，极大提高了用户在虚拟现实直播中的沉浸感。
165.在一些实施例中，所述客户端903具体配置为：
166.根据所述第二位置信息以及所述第一位置信息，结合与所述虚拟场景相匹配的目标音频设置参数，对所述第一原始音频信号进行空间化处理，获得所述第一音频信号；
167.其中，所述目标音频设置参数用于使得经过所述目标音频设置参数渲染后的声音在所述虚拟场景中传播的声音效果与该声音在与所述虚拟场景对应的真实环境中传播的声音效果一致。
168.值得说明的是，在上述实施例中已经详细说明了如何结合目标音频设置参数对原始音频信号进行空间化处理的过程，在此不再详细描述。
169.在一些实施例中，所述客户端903具体配置为：
170.在加载所述虚拟场景时，同步加载所述虚拟场景对应的目标音频设置参数，其中，所述目标音频设置参数是根据所述虚拟场景对应的场景类型为所述虚拟场景配置的音频设置参数，其中，所述音频设置参数包括声音衰减参数、在所述虚拟场景中各个虚拟物品模型的声学材质参数、早期反射声参数、混响参数以及环境声的空间化参数中的至少一种。
171.值得说明的是，在上述实施例中已经详细说明了如何配置目标音频设置参数，在此不再详细描述。
172.在一些实施例中，所述客户端903具体配置为：
173.根据所述虚拟场景对应的初始音频设置参数，生成多个推荐音频设置参数；
174.在所述虚拟场景中展示所述多个推荐音频设置参数；
175.响应于选择指令，将选中的所述推荐音频设置参数确定为所述目标音频设置参数。
176.值得说明的是，在上述实施例中已经详细说明了如何根据推荐音频设置参数确定目标音频设置参数的过程，在此不再详细描述。
177.在一些实施例中，所述主播端901还配置为：
178.向所述客户端903发送用于指示在所述虚拟场景中触发环境声的触发指令；
179.所述客户端903还配置为：
180.响应于所述触发指令，获取对应的环境音频信号，其中，所述环境音频信号是在所述客户端903加载所述虚拟场景时存储在所述客户端903上的；
181.根据所述环境音频信号在所述虚拟场景中的触发位置以及所述第二位置信息，对所述环境音频信号进行空间化处理，获得第三音频信号；
182.根据所述第二虚拟对象的姿态信息，对所述第三音频信号进行处理，获得第四音频信号；
183.输出所述第四音频信号。
184.值得说明的是，在上述实施例中已经详细说明了如何对环境音频信号进行处理，在此不再详细说明。
185.在一些实施例中，所述客户端903还配置为：
186.响应于语音请求，建立所述客户端903与其他客户端之间的语音连接，其中，所述其他客户端为加入所述虚拟场景的第三虚拟对象对应的客户端903；
187.接收所述第三虚拟对象对应的目标对象在真实场景中的位置信息以及所述目标对象在真实场景中产生的第二原始音频信号；
188.基于所述目标对象的位置信息确定所述第三虚拟对象在所述虚拟场景中的第三位置信息；
189.根据所述第三位置信息以及所述第二位置信息，对所述第二原始音频信号进行空间化处理，获得第五音频信号，
190.根据所述第二虚拟对象的姿态信息，对所述第五音频信号进行处理，获得第六音频信号；
191.输出所述第六音频信号。
192.这里，在虚拟现实的直播场景中，其他客户端可以通过第三虚拟对象加入虚拟现实场景中，则其他客户端与本客户端903可以建立语音通信。
193.语音请求可以是本客户端903向其他客户端发起的语音请求，也可以是其他客户端向本客户端903发起的语音请求。在同一虚拟现实场景中，无论是本客户端903或者是其他客户端，均可以通过选取虚拟现实场景中的虚拟对象，并向该虚拟对象发起申请建立语音连接的语音请求，当另一客户端903同意该语音请求时，建立本客户端903与其他客户端之间的语音连接。例如，在虚拟现实场景中，虚拟对象a可以请求与虚拟对象b进行语音，当虚拟对象b同意语音请求时，建立虚拟对象a与虚拟对象b之间的语音连接。
194.当建立语音连接之后，本客户端903接收其他客户端发送的目标对象在真实场景中的位置信息以及目标对象在真实场景中产生的声音。值得说明的是，在上述实施例中已经对其他客户端如何采集目标对象在真实场景中的位置信息以及目标对象在真实场景中产生的声音进行了详细说明，在此不再赘述。
195.本客户端903在接收到目标对象的位置信息之后，将该目标对象的位置信息转换
为第三虚拟对象的第三位置信息。然后根据第三位置信息以及第二位置信息，对第二原始音频信号进行空间化处理，获得第五音频信号，并根据第二虚拟对象的姿态信息，对第五音频信号进行处理，获得第六音频信号，并输出该第六音频信号。
196.其中，对第二原始音频信号进行空间化处理获得第五音频信号的原理与获得第一音频信号的原理一致，在此不再赘述。获得第六音频信号的原理与获得第三音频信号的原理一致，在此也不再赘述。而且，输出第六音频信号的原理与输出第二音频信号的原理一直，在此也不再赘述。
197.值得说明的是，本客户端903获取其他客户端发送的目标对象的位置信息和第二原始音频信号的过程可以是：其他客户端将采集到的目标对象的位置信息和第二原始音频信号发送至服务器902，服务器902将目标对象的位置信息和第二原始音频信号打包形成推流信号，本客户端903从服务器902中拉流获得目标对象的位置信息和第二原始音频信号。
198.客户端903是可以同时获取到第一原始音频信号和第二原始音频信号的，此时，需要对主播端901产生的第一原始音频信号以及其他客户端产生的第二原始音频信号之间的时间轴进行同步，以保证主播端901产生的第一原始音频信号以及其他客户端产生的第二原始音频信号能够同步输出。
199.由此，在虚拟现实的直播场景中，不仅能够对主播端901的主播产生的第一原始音频信号进行空间化处理，而且还能够对其他客户端的目标对象产生的第二原始音频信号进行空间化处理，使得在虚拟现实场景中的连麦沟通产生的语音也具有六自由度的效果。即在虚拟现实的直播场景中，不同观众之间的语音交流也能够随着观众之间的位置、姿态变化产生空间变化。例如，当观众a与观众b之间的距离变近时，语音的音量也会变大。
200.图11是根据一些实施例示出的一种音频播放装置的模块连接示意图。如图11所示，本公开实施例提供一种音频播放装置，该装置1100应用于客户端，包括：
201.确定模块1101，配置为确定在虚拟场景中的第一虚拟对象的第一位置信息以及所述第一虚拟对象产生的原始音频信号；
202.第一音频模块1102，配置为根据第二虚拟对象在所述虚拟场景中的第二位置信息以及所述第一位置信息，对所述原始音频信号进行空间化处理，获得第一音频信号，其中，所述第二虚拟对象为所述客户端控制的虚拟角色；
203.第二音频模块1103，配置为根据所述第二虚拟对象的姿态信息，对所述第一音频信号进行处理，获得第二音频信号；
204.输出模块1104，配置为输出所述第二音频信号。
205.可选地，所述第一音频模块1102具体配置为：
206.根据所述第二位置信息以及所述第一位置信息，结合与所述虚拟场景相匹配的目标音频设置参数，对所述原始音频信号进行空间化处理，获得所述第一音频信号；
207.其中，所述目标音频设置参数用于使得经过所述目标音频设置参数渲染后的声音在所述虚拟场景中传播的声音效果与该声音在与所述虚拟场景对应的真实环境中传播的声音效果一致。
208.可选地，所述第一音频模块1102具体配置为：
209.在加载所述虚拟场景时，同步加载所述虚拟场景对应的目标音频设置参数，其中，所述目标音频设置参数是根据所述虚拟场景对应的场景类型为所述虚拟场景配置的音频
设置参数，所述目标音频设置参数包括声音衰减参数、在所述虚拟场景中各个虚拟物品模型的声学材质参数、早期反射声参数、混响参数以及环境声的空间化参数中的至少一种。
210.可选地，所述第一音频模块1102具体配置为：
211.根据所述虚拟场景对应的初始音频设置参数，生成多个推荐音频设置参数；
212.在所述虚拟场景中展示所述多个推荐音频设置参数；
213.响应于选择指令，将选中的所述推荐音频设置参数确定为所述目标音频设置参数。
214.可选地，所述第一虚拟对象包括通过主播端加入所述虚拟场景的主播控制的虚拟角色，所述原始音频信号包括所述主播在真实场景中产生的声音。
215.可选地，所述第一虚拟对象还包括通过其他客户端加入所述虚拟场景的目标对象控制的虚拟角色，所述第一音频信号包括所述目标对象在真实场景中产生的声音；
216.所述确定模块1101具体配置为：
217.响应于语音请求，建立所述客户端与所述其他客户端之间的语音连接；
218.接收所述其他客户端发送的所述目标对象在真实场景中的位置信息以及所述目标对象在真实场景中产生的声音；
219.基于所述目标对象的位置信息确定所述第一位置信息，并将所述目标对象在真实场景中产生的声音确定为所述原始音频信号。
220.可选地，所述装置1100还包括：
221.音频获取模块，配置为响应于用于指示在所述虚拟场景中触发环境声的触发指令，获取对应的环境音频信号；
222.第一音频处理模块，配置为根据所述环境音频信号在所述虚拟场景中的触发位置以及所述第二位置信息，对所述环境音频信号进行空间化处理，获得第三音频信号；
223.第二音频处理模块，配置为根据所述第二虚拟对象的姿态信息，对所述第三音频信号进行处理，获得第四音频信号；
224.音频模块，配置为输出所述第四音频信号。
225.关于上述装置1100中的各个功能模块的具体执行逻辑已在关于方法的部分进行了详细说明，在此不再详细说明。
226.下面参考图12，其示出了适于用来实现本公开实施例的客户端600的结构示意图。本公开实施例中的客户端可以包括但不限于vr设备。图12示出的客户端仅仅是一个示例，不应对本公开实施例的功能和使用范围带来任何限制。
227.如图12所示，客户端600可以包括vr装置(图12中未示出)、处理装置(例如中央处理器、图形处理器等)601，其可以根据存储在只读存储器(rom)602中的程序或者从存储装置608加载到随机访问存储器(ram)603中的程序而执行各种适当的动作和处理。在ram 603中，还存储有客户端600操作所需的各种程序和数据。处理装置601、rom 602以及ram 603通过总线604彼此相连。输入/输出(i/o)接口605也连接至总线604。
228.通常，以下装置可以连接至i/o接口605：包括例如触摸屏、触摸板、键盘、鼠标、摄像头、麦克风、加速度计、陀螺仪等的输入装置606；包括例如液晶显示器(lcd)、扬声器、振动器等的输出装置607；包括例如磁带、硬盘等的存储装置608；以及通信装置609。通信装置609可以允许客户端600与其他设备进行无线或有线通信以交换数据。虽然图12示出了具有
各种装置的客户端600，但是应理解的是，并不要求实施或具备所有示出的装置。可以替代地实施或具备更多或更少的装置。
229.特别地，根据本公开的实施例，上文参考流程图描述的过程可以被实现为计算机软件程序。例如，本公开的实施例包括一种计算机程序产品，其包括承载在非暂态计算机可读介质上的计算机程序，该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中，该计算机程序可以通过通信装置609从网络上被下载和安装，或者从存储装置608被安装，或者从rom 602被安装。在该计算机程序被处理装置601执行时，执行本公开实施例的方法中限定的上述功能。
230.需要说明的是，本公开上述的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件，或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于：具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(ram)、只读存储器(rom)、可擦式可编程只读存储器(eprom或闪存)、光纤、便携式紧凑磁盘只读存储器(cd-rom)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本公开中，计算机可读存储介质可以是任何包含或存储程序的有形介质，该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本公开中，计算机可读信号介质可以包括在基带中或者作为载波一部分传播的数据信号，其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式，包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读信号介质还可以是计算机可读存储介质以外的任何计算机可读介质，该计算机可读信号介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输，包括但不限于：电线、光缆、rf(射频)等等，或者上述的任意合适的组合。
231.在一些实施方式中，客户端、服务器、主播端可以利用诸如http(hypertext transfer protocol，超文本传输协议)之类的任何当前已知或未来研发的网络协议进行通信，并且可以与任意形式或介质的数字数据通信(例如，通信网络)互连。通信网络的示例包括局域网(“lan”)，广域网(“wan”)，网际网(例如，互联网)以及端对端网络(例如，ad hoc端对端网络)，以及任何当前已知或未来研发的网络。
232.上述计算机可读介质可以是上述客户端中所包含的；也可以是单独存在，而未装配入该客户端中。
233.上述计算机可读介质承载有一个或者多个程序，当上述一个或者多个程序被该客户端执行时，使得该客户端：确定在虚拟场景中的第一虚拟对象的第一位置信息以及所述第一虚拟对象产生的原始音频信号；根据第二虚拟对象在所述虚拟场景中的第二位置信息以及所述第一位置信息，对所述原始音频信号进行空间化处理，获得第一音频信号，其中，所述第二虚拟对象为所述客户端控制的虚拟角色；根据所述第二虚拟对象的姿态信息，对所述第一音频信号进行处理，获得第二音频信号；输出所述第二音频信号。
234.可以以一种或多种程序设计语言或其组合来编写用于执行本公开的操作的计算机程序代码，上述程序设计语言包括但不限于面向对象的程序设计语言—诸如java、smalltalk、c ，还包括常规的过程式程序设计语言——诸如“c”语言或类似的程序设计语
言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中，远程计算机可以通过任意种类的网络——包括局域网(lan)或广域网(wan)——连接到用户计算机，或者，可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
235.附图中的流程图和框图，图示了按照本公开各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上，流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分，该模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意，在有些作为替换的实现中，方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如，两个接连地表示的方框实际上可以基本并行地执行，它们有时也可以按相反的顺序执行，这依所涉及的功能而定。也要注意的是，框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合，可以用执行规定的功能或操作的专用的基于硬件的系统来实现，或者可以用专用硬件与计算机指令的组合来实现。
236.描述于本公开实施例中所涉及到的模块可以通过软件的方式实现，也可以通过硬件的方式来实现。其中，模块的名称在某种情况下并不构成对该模块本身的限定。
237.本文中以上描述的功能可以至少部分地由一个或多个硬件逻辑部件来执行。例如，非限制性地，可以使用的示范类型的硬件逻辑部件包括：现场可编程门阵列(fpga)、专用集成电路(asic)、专用标准产品(assp)、片上系统(soc)、复杂可编程逻辑设备(cpld)等等。
238.在本公开的上下文中，机器可读介质可以是有形的介质，其可以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的程序。机器可读介质可以是机器可读信号介质或机器可读储存介质。机器可读介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备，或者上述内容的任何合适组合。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(ram)、只读存储器(rom)、可擦除可编程只读存储器(eprom或快闪存储器)、光纤、便捷式紧凑盘只读存储器(cd-rom)、光学储存设备、磁储存设备、或上述内容的任何合适组合。
239.以上描述仅为本公开的较佳实施例以及对所运用技术原理的说明。本领域技术人员应当理解，本公开中所涉及的公开范围，并不限于上述技术特征的特定组合而成的技术方案，同时也应涵盖在不脱离上述公开构思的情况下，由上述技术特征或其等同特征进行任意组合而形成的其它技术方案。例如上述特征与本公开中公开的(但不限于)具有类似功能的技术特征进行互相替换而形成的技术方案。
240.此外，虽然采用特定次序描绘了各操作，但是这不应当理解为要求这些操作以所示出的特定次序或以顺序次序执行来执行。在一定环境下，多任务和并行处理可能是有利的。同样地，虽然在上面论述中包含了若干具体实现细节，但是这些不应当被解释为对本公开的范围的限制。在单独的实施例的上下文中描述的某些特征还可以组合地实现在单个实施例中。相反地，在单个实施例的上下文中描述的各种特征也可以单独地或以任何合适的子组合的方式实现在多个实施例中。
241.尽管已经采用特定于结构特征和/或方法逻辑动作的语言描述了本主题，但是应当理解所附权利要求书中所限定的主题未必局限于上面描述的特定特征或动作。相反，上面所描述的特定特征和动作仅仅是实现权利要求书的示例形式。关于上述实施例中的装置，其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述，此处将不做详细阐述说明。

再多了解一些

1/2 1 2 下一页尾页

本文用于创业者技术爱好者查询，仅供学习研究，如用于商业用途，请联系技术所有人。

上一篇：返回列表
下一篇：全局布线的预测方法、装置、设备及存储介质与流程

音频播放方法、装置、存储介质、客户端及直播系统与流程

相关文献

最热文献