一种语音数据处理方法、装置、设备以及介质与流程

2021-09-15 01:35:00 来源：中国专利 TAG：互联网数据处理介质语音装置

1.本技术涉及互联网技术领域，尤其涉及一种语音数据处理方法、装置、设备以及介质。

背景技术：

2.现有的具有即时通讯功能的应用客户端(例如，社交客户端)在将语音消息转换为文本信息时，需要目标用户(例如，用户a)对语音消息(例如，语音消息1)进行手动操作来发起语音转换请求，以获取该语音消息1对应的文本信息(例如，文本信息1)。这意味着现有的语音转文本方案属于一种被动的转换方案，难以实现文本信息的主动触达。
3.此外，现有的社交客户端的语音转文本方案，在对用户a所接收到的上述语音消息1进行转换处理时，依赖于该社交客户端的本地数据，在发起语音转换请求时需要社交客户端将该语音消息1的本地语音数据上传给服务器。显然，这在网络环境不稳定的情况下，会出现语音数据的上传速度慢，而无法快速地为用户a提供文本信息，甚至会出现语音数据的上传失败，进而降低了语音消息的转换效率。

技术实现要素：

4.本技术实施例提供一种语音数据处理方法、装置、设备以及介质，可以实现转换文本信息的主动触达，并可以提高语音消息的转换效率。
5.本技术实施例一方面提供了一种语音数据处理方法，包括：
6.在应用客户端获取到会话界面的语音消息时，获取语音消息对应的语音标识，将语音标识添加至初始标识队列，将添加语音标识的初始标识队列作为目标标识队列；
7.基于目标标识队列中的语音标识的队列位置，生成携带语音标识的语音转换请求，将语音转换请求发送至服务器，以使服务器基于语音转换请求获取语音标识对应的转换文本信息；
8.接收服务器返回的转换文本信息，在会话界面中将转换文本信息输出至语音消息所在的位置区域；位置区域中的语音消息与转换文本信息之间具有关联关系。
9.本技术实施例一方面提供了一种语音数据处理装置，包括：
10.语音获取模块，用于在应用客户端获取到会话界面的语音消息时，获取语音消息对应的语音标识，将语音标识添加至初始标识队列，将添加语音标识的初始标识队列作为目标标识队列；
11.请求发送模块，用于基于目标标识队列中的语音标识的队列位置，生成携带语音标识的语音转换请求，将语音转换请求发送至服务器，以使服务器基于语音转换请求获取语音标识对应的转换文本信息；
12.文本接收模块，用于接收服务器返回的转换文本信息，在会话界面中将转换文本信息输出至语音消息所在的位置区域；位置区域中的语音消息与转换文本信息之间具有关联关系。
13.其中，会话界面中包含与第一用户相关联的第二用户；初始标识队列包括第一子队列和第二子队列；第一子队列用于存储第一语音标识；第一语音标识用于表征应用客户端中的待发送语音转换请求的第一语音消息的标识；第二子队列用于存储第二语音标识；第二语音标识用于表征应用客户端中的已发送语音转换请求的第二语音消息的标识；
14.语音获取模块包括：
15.语音接收单元，用于第一用户对应的应用客户端接收第二用户通过服务器转发的语音消息，且接收服务器为语音消息所配置的语音标识；
16.时间戳确定单元，用于获取与会话界面相关联的语音转换条件，基于语音转换条件将接收到的语音标识确定为目标语音标识，将应用客户端接收到语音消息作为目标语音消息，将目标语音消息对应的接收时间戳记为目标接收时间戳；
17.标识添加单元，用于基于目标接收时间戳，在包含第一语音消息的标识的第一子队列中确定目标语音消息的目标语音标识的队列位置，基于队列位置将目标语音标识添加至第一子队列，得到初始第一子队列；
18.队列确定单元，用于基于初始第一子队列和包含第二语音消息的标识的第二子队列，确定目标标识队列。
19.其中，第二子队列的请求优先级大于第一子队列的请求优先级；
20.语音获取模块还包括：
21.第一触发单元，用于响应针对第二用户所在的会话界面的触发操作，将目标语音消息输出至会话界面，获取语音转换条件中的初始等级调整指令；
22.第一调整单元，用于基于初始等级调整指令在初始第一子队列中将目标语音标识的队列位置确定为第一位置，在初始第一子队列中将目标语音标识的队列位置由第一位置调整至第二位置，得到调整后的初始第一子队列；第二位置对应的标识的请求优先级大于第一位置对应的标识的请求优先级；
23.第一更新单元，用于基于调整后的初始第一子队列和第二子队列，更新目标标识队列。
24.其中，语音获取模块还包括：
25.第二触发单元，用于在会话界面中响应针对目标语音消息的触发操作，获取语音转换条件中的目标等级调整指令；
26.第二调整单元，用于基于目标等级调整指令，将调整后的初始第一子队列中确定为目标第一子队列，在目标第一子队列中将目标语音标识的队列位置由第二位置调整至第三位置，得到调整后的目标第一子队列；第三位置对应的标识的请求优先级大于第二位置对应的标识的请求优先级；
27.第二更新单元，用于基于调整后的目标第一子队列和第二子队列，对更新后的目标标识队列进行更新处理。
28.其中，目标标识队列包括待请求标识队列和已请求标识队列；语音标识位于待请求标识队列中；已请求标识队列包括m个队列位置；已请求标识队列中的一个队列位置用于存储一个待转换语音消息的标识；m为已发送语音转换请求的待转换语音消息的标识的总数量；
29.请求发送模块包括：
30.信息接收单元，用于接收服务器返回的针对已发送语音转换请求的m个待转换语音消息的转换成功信息，将接收到的转换成功信息的转换数量记为n；n为小于或者等于m的正整数；
31.位置确定单元，用于在目标标识队列的待请求标识队列中，获取语音标识的队列位置，在语音标识的队列位置满足语音转换条件时，在已请求标识队列中确定语音标识的目标队列位置；
32.请求生成单元，用于基于目标队列位置将语音标识添加至已请求标识队列，基于添加语音标识的已请求标识队列，生成携带语音标识的语音转换请求，将语音转换请求发送至服务器。
33.其中，装置还包括：
34.标识删除模块，用于在接收到服务器返回的转换文本信息时，获取针对语音消息的目标转换成功信息，基于目标转换成功信息从目标标识队列中删除语音标识。
35.本技术实施例一方面提供了一种语音数据处理方法，包括：
36.在获取到应用客户端的语音消息时，生成语音消息对应的语音标识，将语音消息和语音标识发送至用户终端，以使用户终端将语音标识添加至初始标识队列，将添加语音标识的初始标识队列作为目标标识队列；
37.接收用户终端发送的语音转换请求，从语音转换请求中获取语音标识；语音转换请求是基于语音标识在目标标识队列中的队列位置所生成的；
38.在查询到语音标识对应的语音消息时，对语音消息进行转换处理，得到语音消息对应的转换文本信息；
39.向用户终端返回转换文本信息，以使用户终端在应用客户端的会话界面中将转换文本信息输出至语音消息所在的位置区域。
40.本技术实施例一方面提供了一种语音数据处理装置，包括：
41.语音发送模块，用于在获取到应用客户端的语音消息时，生成语音消息对应的语音标识，将语音消息和语音标识发送至用户终端，以使用户终端将语音标识添加至初始标识队列，将添加语音标识的初始标识队列作为目标标识队列；
42.请求接收模块，用于接收用户终端发送的语音转换请求，从语音转换请求中获取语音标识；语音转换请求是基于语音标识在目标标识队列中的队列位置所生成的；
43.文本获取模块，用于在查询到语音标识对应的语音消息时，对语音消息进行转换处理，得到语音消息对应的转换文本信息；
44.文本发送模块，用于向用户终端返回转换文本信息，以使用户终端在应用客户端的会话界面中将转换文本信息输出至语音消息所在的位置区域。
45.本技术实施例一方面提供了一种计算机设备，包括存储器和处理器，存储器存储有计算机程序，计算机程序被处理器执行时，使得处理器执行本技术实施例中一方面中方法的步骤。
46.本技术实施例一方面提供了一种计算机可读存储介质，计算机可读存储介质存储有计算机程序，计算机程序包括程序指令，程序指令当被处理器执行时，执行如本技术实施例中一方面中方法的步骤。
47.本技术实施例一方面提供了一种计算机程序产品或计算机程序，该计算机程序产
品或计算机程序包括计算机指令，该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令，处理器执行该计算机指令，使得该计算机设备执行上述一方面的各种可选方式中提供的方法。
48.在本技术实施例中，在应用客户端获取到会话界面的语音消息时，用户终端可以获取语音消息对应的语音标识，将语音标识添加至初始标识队列，并将添加语音标识的初始标识队列作为目标标识队列。其中，会话界面的语音消息可以为应用客户端所发送的语音消息，还可以为应用客户端所接收的语音消息。进一步的，用户终端可以基于目标标识队列中的语音标识的队列位置，生成携带语音标识的语音转换请求，将语音转换请求发送至服务器，以使服务器基于语音转换请求查询语音标识对应的语音消息，对语音消息进行转换处理后得到转换文本信息。进一步的，用户终端可以接收服务器返回的转换文本信息，在会话界面中将转换文本信息输出至语音消息所在的位置区域。其中，位置区域中的语音消息与转换文本信息之间具有关联关系，比如，该语音消息和转换文本信息可以在会话界面中具有相邻位置关系。应当理解，通过引入目标标识队列，在获取到语音消息以及语音消息对应语音标识时，无需用户终端对应的第一用户执行触发操作，用户终端可以在应用客户端的会话界面中输出语音消息对应的转换文本信息，进而可以自动将语音消息转换为其对应的转换文本信息，可以实现转换文本信息的主动触达。其中，在基于目标标识队列中的语音标识对语音消息进行转换处理时，本技术实施例无需用户终端将本地内存中的语音消息上传给服务器，而是由服务器根据上传的语音标识来智能查询该语音标识对应的语音消息，并对查询到的语音消息进行转换处理，从而可以在网络环境不稳定的情况下，解决语音消息上传失败等引起的问题，进而可以有效提高语音消息的转换效率。
附图说明
49.为了更清楚地说明本技术实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本技术的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。
50.图1是本技术实施例提供的一种网络架构的结构示意图；
51.图2是本技术实施例提供的一种进行数据交互的场景示意图；
52.图3是本技术实施例提供的一种语音数据处理方法的流程示意图；
53.图4是本技术实施例提供的一种添加语音标识的场景示意图；
54.图5是本技术实施例提供的一种用户打开会话的场景示意图；
55.图6是本技术实施例提供的一种用户进行选择的场景示意图；
56.图7是本技术实施例提供的一种接收转换文本信息的场景示意图；
57.图8是本技术实施例提供的一种语音数据处理方法的流程示意图；
58.图9是本技术实施例提供的一种进行语音消息转发的场景示意图；
59.图10是本技术实施例提供的一种语音转文本方案的流程示意图；
60.图11是本技术实施例提供的一种进行语音转文本的场景示意图；
61.图12是本技术实施例提供的一种语音数据处理装置的结构示意图；
62.图13是本技术实施例提供的一种计算机设备的结构示意图；
63.图14是本技术实施例提供的一种语音数据处理装置的结构示意图；
64.图15是本技术实施例提供的一种计算机设备的结构示意图；
65.图16是本技术实施例提供的一种语音数据处理系统。
具体实施方式
66.下面将结合本技术实施例中的附图，对本技术实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本技术一部分实施例，而不是全部的实施例。基于本技术中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本技术保护的范围。
67.具体的，请参见图1，图1是本技术实施例提供的一种网络架构的结构示意图。如图1所示，该网络架构可以包括服务器3000和用户终端集群。其中，用户终端集群具体可以包括一个或者多个用户终端，这里将不对用户终端集群中的用户终端的数量进行限制。如图1所示，多个用户终端具体可以包括用户终端3000a、用户终端3000b、用户终端3000c、
…
、用户终端3000n。其中，用户终端3000a、用户终端3000b、用户终端3000c、
…
、用户终端3000n可以分别与服务器3000通过有线或无线通信方式进行直接或间接地网络连接，以便于每个用户终端可以通过该网络连接与服务器3000之间进行数据交互。
68.其中，如图1所示的服务器3000可以是独立的物理服务器，也可以是多个物理服务器构成的服务器集群或者分布式系统，还可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、cdn、以及大数据和人工智能平台等基础云计算服务的云服务器。
69.其中，如图1所示的用户终端集群中的每个用户终端均可以包括：智能手机、平板电脑、笔记本电脑等具有语音数据处理功能的智能终端。应当理解，如图1所示的用户终端集群中的每个用户终端均可以集成安装有应用客户端，当该应用客户端运行于各用户终端中时，可以基于客户端/服务器(client/server，简称c/s)架构分别与上述图1所示的服务器3000之间进行数据交互。其中，该应用客户端可以理解为一种能够加载并显示语音数据的即时通讯客户端，例如，这里的应用客户端具体可以包括：社交客户端(例如，微信客户端)、办公客户端(例如，企业微信客户端)、娱乐客户端(例如，游戏客户端)以及车载客户端等。
70.本技术实施例提供的语音数据处理方法可以涉及人工智能领域中的语音技术方向。可以理解的是，所谓人工智能(artificial intelligence，简称ai)是指利用数字计算机或者数据计算机控制的计算机设备(例如，图1所示服务器3000)来进行模拟、延伸和扩展人的智能的理论、方法、技术以及应用系统的一门新的技术科学。换句话说，人工智能是计算机科学的一个综合技术，它企图了解智能的实质，并生产出一种新的能以人类智能相似的方式做出反应的智能机器。人工智能也就是研究各种智能机器的设计原理与实现方法，使机器具有感知、推理与决策的功能。
71.人工智能技术是一门综合学科，涉及领域广泛，既有硬件层面的技术也有软件层面的技术。人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、操作/交互系统、机电一体化等技术。人工智能软件技术主要包括计算机视觉技术、语音处理技术、自然语言处理技术以及机器学习/深度学习等方向。
72.其中，语音技术(speech technology)的关键技术有自动语音识别技术(automatic speech recognition，简称asr)和语音合成技术(text to speech，简称tts)以及声纹识别技术。让计算机能听、能看、能说、能感觉，是未来人机交互的发展方向，其中语音成为未来最被看好的人机交互方式之一。
73.可以理解的是，本技术实施例提供的语音数据处理方法还可以涉及云技术领域，所谓云技术(cloud technology)是指在广域网或局域网内将硬件、软件、网络等系列资源统一起来，实现数据的计算、储存、处理和共享的一种托管技术。其中，云技术(cloud technology)基于云计算商业模式应用的网络技术、信息技术、整合技术、管理平台技术、应用技术等的总称，可以组成资源池，按需所用，灵活便利。云计算技术将变成重要支撑。技术网络系统的后台服务需要大量的计算、存储资源，如视频网站、图片类网站和更多的门户网站。伴随着互联网行业的高度发展和应用，将来每个物品都有可能存在自己的识别标志，都需要传输到后台系统进行逻辑处理，不同程度级别的数据将会分开处理，各类行业数据皆需要强大的系统后盾支撑，以能通过云计算来实现。
74.为便于理解，本技术实施例可以从上述用户终端集群中任意选择一个用户终端作为第一终端为例，用以阐述在该第一终端中进行语音数据处理的具体过程，例如，本技术实施例可以将图1所示的用户终端集群中的用户终端3000c作为第一终端。应当理解，本技术实施例可以将在该第一终端中通过第一账号信息(例如，账号信息1)登录该应用客户端的用户称之为第一用户，即该第一用户可以为使用该第一终端的用户。可以理解的是，本技术实施例中的第一用户可以为通过第一终端中的应用客户端接收语音消息的用户，即消息接收者。
75.可以理解的是，本技术实施例可以将通过第二账号信息(例如，账号信息2)登录该应用客户端的用户称之为第二用户，该第二用户对应的用户终端可以称之为第二终端，即该第二用户可以为使用该第二终端的用户。本技术实施例可以在上述用户终端集群中任意选择一个用户终端作为第二终端，例如，本技术实施例可以将图1所示的用户终端集群中的用户终端3000a作为第二终端。可以理解的是，本技术实施例中的第二用户可以为通过第二终端中的应用客户端发送语音消息的用户，即消息发送者。
76.应当理解，本技术实施例中的第一用户既可以作为上述消息接收者，也可以作为上述消息发送者，比如，第一用户可以通过第一终端中的应用客户端成为消息接收者，第一用户还可以通过第一终端中的应用客户端成为消息发送者。同理，本技术实施例中的第二用户既可以作为上述消息发送者，也可以作为上述消息接收者，比如，第二用户可以通过第二终端中的应用客户端成为消息发送者，第二用户还可以通过第二终端中的应用客户端成为消息接收者。
77.可以理解的是，消息发送者与消息接收者之间可以通过服务器(例如，上述服务器3000)进行连接，服务器将语音消息从消息发送者对应的用户终端(例如，第二用户对应的第二终端)同步至消息接收者对应的用户终端(例如，第一用户对应的第一终端)，并在后续步骤中可以对该语音消息进行转换处理，以使第一用户与第二用户可以直接获取该语音消息对应的转换文本信息。其中，第一终端与第二终端均运行有服务器对应的应用客户端，通过该应用客户端可以实现第一终端与第二终端之间语音消息的发送与接收。
78.为便于理解，请参见图2，图2是本技术实施例提供的一种进行数据交互的场景示
意图。如图2所示的服务器可以为上述图1所对应实施例中的服务器3000，如图2所示的用户终端x可以为上述图1所对应实施例的用户终端集群中的任意一个用户终端，为便于理解，本技术实施例以上述图1所示的用户终端3000c作为该用户终端x为例，以阐述图2所示的用户终端x和服务器进行数据交互的具体过程。
79.可以理解的是，如图2所示的应用数据库中具体可以包括多个数据库，多个数据库具体可以包含图2所示的数据库10a、数据库10b、
…
、数据库10n。这意味着该应用数据库可以用于存储应用客户端(例如，办公客户端)中不同的语音消息对应的语音内容1。比如，数据库10a可以用于存储语音消息x1对应的语音内容，数据库10b可以用于存储语音消息x2对应的语音内容2，
…
，数据库10n语音消息xn(未在图上示出)对应的语音内容n。
80.其中，应用数据库可以简称为数据库(database)，所谓数据库简而言之可视为电子化的文件柜——存储电子文件的处所，用户可以对文件中的数据进行新增、查询、更新、删除等操作。所谓“数据库”是以一定方式储存在一起、能与多个用户共享、具有尽可能小的冗余度、与应用程序彼此独立的数据集合。
81.如图2所示，用户终端x在获取到会话界面2a的语音消息时，可以将语音消息对应的语音标识添加至初始标识队列。应当理解，在会话界面2a中，该用户终端x接收到的语音消息的数量可以为一个或者多个，这里将不对接收到的语音消息的具体数量进行限定。
82.为便于理解，这里以接收到的语音数量为多个为例，具体的，这里的语音消息可以包括但不限于图2所示的语音消息x1，语音消息x2，语音消息x3和语音消息x4，此时，用户终端x还可以一并接收到这些语音消息的语音标识，即一个语音消息对应一个语音标识。然后，用户终端x可以将接收到的语音消息x1对应的语音标识为x1，语音消息x2对应的语音标识为x2，语音消息x3对应的语音标识为x3，语音消息x4对应的语音标识为x4按照接收到的接收时间戳的先后顺序依次添加至初始标识队列，比如可以添加至初始标识队列的第一子队列，以得到目标标识队列。其中，这里的初始标识队列可以包括第一子队列和第二子队列，该第一子队列可以用于存储待发送语音转换请求的语音标识，该第二子队列可以用于存储已发送语音转换请求的语音标识。应当理解，本技术实施例可以将当前已添加新的语音标识所对应的第一子队列统称为待请求标识队列，并可以将当前已发送语音转换请求、且仍处于待转换状态的语音消息(即待转换语音消息)的语音标识所对应的第二子队列统称为已请求标识队列。
83.其中，应当理解，若用户终端在t2时刻将上述4个语音标识添加至第一子队列，以得到上述待请求标识队列。那么，在该t2时刻的上一时刻(例如，t1时刻，即将上述4个语音标识添加至第一子队列之前)时，上述第一子队列中具体可以包括l个队列位置，该第一子队列中的每个队列位置可以分别用于存储一个待发送语音转换请求的语音标识。这里的l为正整数，这里将不对l的取值进行限定。为便于理解，比如，在t1时刻时，若该第一子队列当前存储有6个待发送语音转换请求的语音标识，则说明该第一子队列的l个队列位置中有6个位置是处于占用状态，有(l
‑
6)个位置是处于未占用状态，所以，当将上述4个语音标识在t2时刻添加至第一子队列时，该第一子队列的l个队列位置中将会有10(即6 4)个位置是处于占用状态的，本技术实施例可以将在t2时刻的第一子队列作为上述待请求标识队列。
84.又比如，第二子队列中具体可以包括m个队列位置，第二子队列中的每个队列位置可以分别对应一个已发送语音转换请求的语音标识。m为正整数。其中，为便于理解，这里以
第二子队列在上述t1时刻时包括5(例如，m等于5)个队列位置为例，这意味着在该第二子队列的m个位置中当前存储有5个已发送语音转换请求的语音标识，例如，语音标识y1、语音标识y2、语音标识y3、语音标识y4、语音标识y5。若在t2时刻时，这5个已发送语音转换请求的待转换语音消息的语音标识仍处于待转换状态时，则可以在t2时刻时将这5个已发送语音转换请求、且处于待转换状态的语音标识所对应的第二子队列作为上述已请求标识队列。
85.应当理解，可选的，当服务器在t2时刻的下一时刻(例如，t3时刻)成功获取到已请求标识队列中的3(例如，n等于3)个已发送语音转换请求的语音标识的转换文本信息(例如，语音标识y1的转换文本信息1、语音标识y2的转换文本信息2、语音标识y3的转换文本信息3)时，可以向用户终端x发送针对这3个语音标识的转换成功信息。此时，用户终端x可以将这3个已发送语音转换请求的语音标识的转换文本信息输出至用户终端x的会话界面进行显示。应当理解，用户终端x在获取到针对这3个语音标识的转换成功信息时，可以进一步在该已请求标识队列(即目标标识队列)中释放这3个语音标识(即语音标识y1、语音标识y2、语音标识y3)所占据的队列位置。这意味着此时，该已请求标识队列中目前有三个队列位置是处于未占用状态的。这样，用户终端可以在目标标识队列中按照预设的语音转换条件对当前所存储的每个语音标识的队列位置进行调整。例如，可以在目标标识队列的待请求标识队列中，按照这10个语音标识的接收时间戳的先后顺序，从待请求标识队列中挑选出3个优先级最高的语音标识(例如，语音标识x1、语音标识x2、语音标识x3)，添加至前述已请求标识队列，从而可以生成针对这3个语音标识(例如，语音标识x1、语音标识x2、语音标识x3)的语音转换请求，进而可以将这3个语音转换请求发送图2所示的服务器。
86.如图2所示，服务器可以接收到针对这3个语音标识(例如，语音标识x1、语音标识x2、语音标识x3)的语音转换请求，并可以将这3个语音转换请求中的语音标识所对应的语音内容分发至语音处理服务器集群，以通过分布式处理的方式来提高语音转换效率。比如，该语言处理服务器集群可以包含一个或者多个语音处理服务器。为便于理解，这里以多个语音处理服务器可以具体包括语音处理服务器100a、语音处理服务器100b以及语音处理服务器100c。例如，图2所示的服务器可以将在数据库10a中所查找到的语音标识x1所对应的语音内容1转发给语音处理服务器100a，以使该语音处理服务器100a可以对该语音内容1进行转换处理，进而可以将转换后的文本信息(例如，图2所示的文本信息1)返回给图2所示的服务器，以使该服务器可以将该转换后的文本信息(例如，图2所示的文本信息1)输出至图2所示的用户终端x的会话界面(例如，图2所示的会话界面2b)。又比如，例如，图2所示的服务器可以将在数据库10b中所查找到的语音标识x2所对应的语音内容2转发给语音处理服务器100b，以使该语音处理服务器100b可以对该语音内容2进行转换处理，进而可以将转换后的文本信息(例如，图2所示的文本信息2)返回给图2所示的服务器，以使该服务器可以将该转换后的文本信息(例如，图2所示的文本信息2)输出至图2所示的用户终端x的会话界面(例如，图2所示的会话界面2b)。以此类推，例如，图2所示的服务器可以将在数据库10c中所查找到的语音标识x3所对应的语音内容3转发给语音处理服务器100c，以使该语音处理服务器100c可以对该语音内容3进行转换处理。应当理解，本技术实施例可以将上述转换后的文本信息统称为转换文本信息。
87.这里的语音处理服务器100a、语音处理服务器100b以及语音处理服务器100c可以为用于提供转换处理服务的同一语音处理服务器，也可以为彼此相互独立的用于提供转换
处理服务的语音处理服务器，这里将不对其进行限定。可选的，图2所示，具有转换处理服务的一个或者多个语音处理服务器可以运行在图2所示的服务器中，也可以独立于图2所示的服务器而存在，这里将不对其进行限定。
88.其中，这里的语音转换条件可以包含以下转换条件中的一种或者多种：第一转换条件、第二转换条件和第三转换条件。可以理解的是，对于当前位于第一子队列中的同一语音消息的语音标识而言，若分别采用三种转换条件对该语音标识的队列位置(例如，队列位置1)进行调整，则采用第一转换条件所调整得到的该语音标识的新的队列位置(例如，队列位置a)的请求优先级，会高于采用采用第二转换条件所调整得到的该语音标识的新的队列位置(例如，队列位置b)的请求优先级；与此同时，采用该第二转换条件所调整得到的该语音标识的新的队列位置(例如，队列位置b)的请求优先级，也会高于采用采用第三转换条件所调整得到的该语音标识的新的队列位置(例如，队列位置c)的请求优先级。可以理解的是，在第一子队列中，队列位置c的请求优先级会高于该语音标识原有的队列位置1的请求优先级。
89.比如，第一转换条件可以理解为用户终端x对应的用户针对会话界面中的某个语音消息(例如，语音消息1)执行触发操作时，可以在目标标识队列中按照预设的语音转换条件的第一转换条件，对该语音消息1的语音标识的队列位置1进行调整，以便于后续可以最为快速地添加至已请求标识队列。又比如，第二转换条件可以理解为用户通过用户终端x打开当前会话界面时，用户终端x可以在目标标识队列中按照预设的语音转换条件的第二转换条件，将打开当前会话界面时所阅读到的语音消息(例如，将语音消息的阅读状态从未阅读状态变更为已阅读状态的语音消息2)的语音标识的队列位置2进行调整，以便于后续可以相对较快的添加至已请求标识队列。又比如，第三转换条件可以理解为用户终端x按照接收语音消息的接收时间戳的先后顺序，依次在目标标识队列中按照预设的语音转换条件的第三转换条件，对满足第三转换条件的语音消息(例如，语音消息3)的语音标识的队列位置3进行调整，以便于可以相对较快的添加至已请求标识队列。
90.在本技术实施例中，用户终端可以基于目标标识队列中的语音标识向服务器发送语音转换请求，无需用户终端将本地内存中的语音消息上传给服务器，而是由服务器根据上传的语音标识来智能查询该语音标识对应的语音消息，并对查询到的语音消息进行转换处理，从而可以提高语音消息的转换效率。
91.其中，本技术实施例中集成有应用客户端的用户终端在获取到语音消息的基础上，通过用户终端与服务器对该语音消息进行转换处理，以得到转换文本信息的具体过程，可以参见如下图3至图11所对应的实施例。
92.进一步的，请参见图3，图3是本技术实施例提供的一种语音数据处理方法的流程示意图。如图3所示，该方法可以由计算机设备执行，该计算机设备可以为安装有上述办公客户端的用户终端，该用户终端可以为上述图2所对应实施例中的用户终端x；可选的，该计算机设备还可以为办公客户端对应的服务器，该服务器可以为上述图2所对应实施例中的服务器。换言之，本技术实施例所涉及的方法可以由用户终端执行，也可以由服务器执行，还可以由用户终端和服务器共同执行。为便于理解，本实施例以该方法由用户终端执行为例进行说明，以阐述在用户终端中获取语音消息对应的转换文本信息的具体过程。其中，该方法至少可以包括以下步骤s101
‑
步骤s103：
93.步骤s101：在应用客户端获取到会话界面的语音消息时，获取语音消息对应的语音标识，将语音标识添加至初始标识队列，将添加语音标识的初始标识队列作为目标标识队列；
94.具体的，第一用户对应的用户终端中的应用客户端可以接收第二用户通过服务器转发的语音消息，且接收服务器为语音消息所配置的语音标识。其中，会话界面中包含与第一用户相关联的第二用户。初始标识队列包括第一子队列和第二子队列，该第一子队列用于存储第一语音标识，第一语音标识用于表征应用客户端中的待发送语音转换请求的第一语音消息的标识；该第二子队列用于存储第二语音标识，第二语音标识用于表征应用客户端中的已发送语音转换请求的第二语音消息的标识。进一步的，用户终端可以获取与会话界面相关联的语音转换条件，基于语音转换条件将接收到的语音标识确定为目标语音标识，将应用客户端接收到语音消息作为目标语音消息，将目标语音消息对应的接收时间戳记为目标接收时间戳。进一步的，用户终端可以基于目标接收时间戳，在包含第一语音消息的标识的第一子队列中确定目标语音消息的目标语音标识的队列位置，基于队列位置将目标语音标识添加至第一子队列，得到初始第一子队列。进一步的，用户终端可以基于初始第一子队列和包含第二语音消息的标识的第二子队列，确定目标标识队列。
95.为便于理解，请参见图4，图4是本技术实施例提供的一种添加语音标识的场景示意图。如图4所示，初始标识队列包括第一子队列和第二子队列，该第一子队列可以用于存储待发送语音转换请求的语音标识，该第二子队列可以用于存储已发送语音转换请求的语音标识。其中，待发送语音转换请求的语音标识可以统称为第一语音消息的标识，已发送语音转换请求的语音标识可以统称为第二语音消息的标识。
96.其中，第一子队列中具体可以包括l个队列位置(例如，图4所示的6个队列位置，即l等于6)，第二子队列中具体可以包括m个队列位置(例如，图4所示的3个队列位置，即m等于3)，这里的l和m为正整数。假设图4所示的初始标识队列所对应的时刻为t1时刻，此时第一子队列中可以存储有1个待发送语音转换请求的语音标识，例如，语音标识z1；第二子队列中可以存储有3个已发送语音转换请求的语音标识，例如，语音标识y1，语音标识y2，语音标识y3和语音标识y4。
97.应当理解，用户终端可以获取到会话界面的语音消息，在t1时刻的下一时刻(例如，t2时刻)时，将语音消息确定为目标语音消息，将目标语音消息对应的语音标识确定为目标语音标识，并将目标语音标识(例如，语音标识x1，语音标识x2，语音标识x3和语音标识x4)按照目标接收时间戳(即接收时间戳)的先后顺序依次添加至第一子队列，以得到初始第一子队列{z1、x1、x2、x3、x4}。应当理解，本技术实施例可以将当前已添加新的语音标识的第一子队列(例如，初始第一子队列)统称为待请求标识队列，并将上述第二子队列和初始第一子队列统称为目标标识队列，即图4所示的标识队列4。其中，用户终端获取到的语音消息的数量可以为一个或者多个，这里将不对获取到的语音消息的具体数量进行限定。进一步的，用户终端可以在后续步骤中基于语音转换条件，向服务器发送携带目标语音标识的语音转换请求。
98.其中，可以理解的是，用户终端获取到的语音标识的接收时间戳越早，则表示将目标语音标识添加至第一子队列时，目标语音标识所在的队列位置的请求优先级越高，比如，获取到上述目标语音标识x1的目标接收时间戳为t1时刻，获取到上述目标语音标识x2的接
收时间戳为目标t2时刻，若t1时刻为t2时刻之前的某一时刻，则在将目标语音标识x1和目标语音标识x2添加至第一子队列后，目标语音标识x1所在的队列位置的请求优先级大于目标语音标识x2所在的队列位置的请求优先级。如图4所示，同理可知，目标语音标识x2所在的队列位置的请求优先级大于目标语音标识x3所在的队列位置的请求优先级，目标语音标识x3所在的队列位置的请求优先级大于目标语音标识x4所在的队列位置的请求优先级。
99.可以理解的是，用户终端可以响应针对第一用户(这里的第一用户可以为使用该用户终端的用户)所执行的触发操作(例如，第一触发操作和第二触发操作)，对目标标识队列的初始第一子队列中的目标语音标识的请求优先级进行更改，即调整目标语音标识在第一子队列中的队列位置，以便于后续可以继续执行下述步骤s102。其中，该第一触发操作和第二触发操作可以包括点击、长按、滑动等接触性操作，也可以包括语音、手势等非接触性操作，本技术在此不做限定。
100.应当理解，用户终端可以响应针对第二用户所在的会话界面的触发操作(这里的触发操作可以为第一触发操作)，将目标语音消息输出至会话界面，获取语音转换条件中的初始等级调整指令。其中，第二子队列的请求优先级大于第一子队列的请求优先级，即第二子队列的请求优先级大于初始第一子队列的请求优先级。进一步的，用户终端可以基于初始等级调整指令在初始第一子队列中将目标语音标识的队列位置确定为第一位置，在初始第一子队列中将目标语音标识的队列位置由第一位置调整至第二位置，得到调整后的初始第一子队列。其中，第二位置对应的标识的请求优先级大于第一位置对应的标识的请求优先级。进一步的，用户终端可以基于调整后的初始第一子队列和第二子队列，更新目标标识队列。
101.为便于理解，请参见图5，图5是本技术实施例提供的一种用户打开会话的场景示意图。如图5所示，标识队列5a可以为会话界面50a对应的目标标识队列，标识队列5b可以为会话界面50b对应的目标标识队列，该标识队列5a可以为上述图4所对应实施例中的标识队列4。可以理解的是，用户终端在获取到用户“bbb”发送的语音消息时(且打开用户“bbb”对应的会话界面，这里的语音消息可以为语音消息z1)，可以显示有会话界面50a，此时，若收到用户“aaa”发送的目标语音消息(这里的目标语音消息可以为语音消息x1、语音消息x2、语音消息x3和语音消息x4)，则可以得到图5所示的标识队列5a，其中，标识队列5a的第二子队列中可以包括语音标识{y1、y2、y3}、初始第一子队列中可以包括语音标识{z1、x1、x2、x3、x4}。其中，语音标识x1为语音消息x1对应的语音标识，语音标识x2为语音消息x2对应的语音标识，语音标识x3为语音消息x3对应的语音标识，语音标识x4为语音消息x4对应的语音标识。
102.可以理解的是，若第一用户针对图5所示的用户“aaa”(用户“aaa”可以称之为第二用户)的会话执行第一触发操作(例如，第一触发操作可以为点击操作)，则用户终端可以响应该点击操作，打开用户“aaa”对应的会话界面(即会话界面50b)，并调整语音标识x1、语音标识x2、语音标识x3和语音标识x4在标识队列5a中的队列位置，以改变语音标识x1、语音标识x2、语音标识x3和语音标识x4的请求优先级，得到图5所示的标识队列5b，其中，标识队列5b的第二子队列中可以包括语音标识{y1、y2、y3}、调整后的初始第一子队列中可以包括语音标识{x1、x2、x3、x4、z1}。
103.可选的，可以理解的是，若第一用户收到用户“ccc”(用户“ccc”可以称之为第三用
户)发送的目标语音消息(这里的目标语音消息可以为语音消息x5，未在图上示出)，则第二子队列中可以包括语音标识{y1、y2、y3}、初始第一子队列中可以包括语音标识{x1、x2、x3、x4、z1、x5}。其中，语音标识x5为语音消息x5对应的语音标识。若第二用户针对图5所示的用户“bbb”的会话执行第一触发操作之后，针对用户“ccc”的会话执行又一第一触发操作(例如，又一第一触发操作可以为点击操作)，则用户终端可以响应该点击操作，打开用户“ccc”对应的会话界面，调整语音消息x5对应的语音标识x5在标识队列5b中的队列位置，以改变语音标识x5的请求优先级，其中，标识队列5b的第二子队列中可以包括语音标识{y1、y2、y3}、调整后的初始第一子队列中可以包括语音标识{x5、x1、x2、x3、x4、z1}。可选的，标识队列5b的第二子队列中可以包括语音标识{y1、y2、y3}、调整后的初始第一子队列中可以包括语音标识{x1、x2、x3、x4、x5、z1}。
104.应当理解，用户终端可以在会话界面中响应针对目标语音消息的触发操作(这里的触发操作可以为第二触发操作)，获取语音转换条件中的目标等级调整指令。进一步的，用户终端可以基于目标等级调整指令，将调整后的初始第一子队列中确定为目标第一子队列，在目标第一子队列中将目标语音标识的队列位置由第二位置调整至第三位置，得到调整后的目标第一子队列。其中，第三位置对应的标识的请求优先级大于第二位置对应的标识的请求优先级。进一步的，用户终端可以基于调整后的目标第一子队列和第二子队列，对更新后的目标标识队列进行更新处理。
105.为便于理解，请参见图6，图6是本技术实施例提供的一种用户进行选择的场景示意图。如图6所示，标识队列6a和标识队列6b可以为会话界面60对应的目标标识队列，该标识队列6a可以为上述图5所对应实施例中的标识队列5b。可以理解的是，用户终端在获取到用户“aaa”(用户“aaa”可以称之为第二用户)发送的目标语音消息(且打开用户“aaa”对应的会话界面，这里的目标语音消息可以为上述图5所对应实施例中的语音消息x1、语音消息x2、语音消息x3和语音消息x4)时，可以显示有会话界面60，其中，标识队列6a第二子队列中可以包括语音标识{y1、y2、y3}、目标第一子队列中可以包括语音标识{x1、x2、x3、x4、z1}。
106.可以理解的是，若第一用户针对语音消息x3执性第二触发操作(例如，第二触发操作可以为在执行右击操作之后，执行的点击操作)，则用户终端可以响应该点击操作，调整语音消息x3对应的语音标识x3在标识队列6a中的队列位置，以改变语音标识x3的请求优先级，得到图6所示的标识队列6b，其中，标识队列6b的第二子队列中可以包括语音标识{y1、y2、y3}，调整后的目标第一子队列中可以包括语音标识{x3、x1、x2、x4、z1}。
107.可选的，可以理解的是，若第一用户针对语音消息x3执行第二触发操作之后，针对语音消息x4执行又一第二触发操作(例如，又一第二触发操作可以为在执行右击操作之后，执行的点击操作)，则用户终端可以响应该点击操作，调整语音消息x4对应的语音标识x4在标识队列6b中的队列位置，以改变语音标识x4的请求优先级，其中，标识队列6b的第二子队列中可以包括语音标识{y1、y2、y3}，调整后的目标第一子队列中可以包括语音标识{x4、x3、x1、x2、z1}。可选的，标识队列6b的第二子队列中可以包括语音标识{y1、y2、y3}，调整后的目标第一子队列中可以包括语音标识{x3、x4、x1、x2、z1}。
108.可选的，可以理解的是，第一用户可以在会话界面60中，同时针对多个目标语音消息(例如，语音消息x3和语音消息x4)执行第二触发操作(例如，第二触发操作可以为在执行多选操作后，执行的点击操作)，以使用户终端可以响应该点击操作，同时调整语音标识x3
和语音标识x3在标识队列6a中的队列位置，以改变语音标识x3和语音标识x4的请求优先级，进而得到调整后的目标第一子队列{x3、x4、x1、x2、z1}。
109.其中，可以理解的是，第一用户可以无需在执行针对会话界面的第一触发操作之后，执行针对目标语音消息的第二触发操作，而是直接在当前会话界面执行针对目标语音消息的第二触发操作。此时，应用客户端的当前会话界面可以为第二用户对应的会话界面，则用户终端获取到的会话界面的语音消息，即为第二用户对应的当前会话界面的语音消息，此时，用户无需针对第二用户的会话界面执行第一触发操作，则已经打开第二用户的会话界面，即可实现与第一触发操作相同的效果，即将“未读”消息转换为“已读”消息，以在后续步骤中针对第二用户的会话界面中的目标语音消息执行第二触发操作。
110.其中，可以理解的是，本技术实施例可以将上述初始第一子队列、调整后的初始第一子队列(即目标第一子队列)以及调整后的目标第一子队列统称为待请求标识队列，并可以将已发送语音转换请求、且仍处于待转换状态的语音消息的语音标识所对应的第二子队列(即上述第二子队列)统称为已请求标识队列，因此，该待请求标识队列和已请求标识队列可以统称为目标标识队列。基于此，第二子队列和初始第一子队列可以统称为目标标识队列，第二子队列和调整后的初始第一子队列(即目标第一子队列)可以统称为目标标识队列，第二子队列和调整后的目标第一子队列可以统称为目标标识队列。
111.可以理解的是，语音转换条件可以包含以下转换条件中的一种或者多种：第一转换条件、第二转换条件和第三转换条件，这里的第二转换条件对应上述初始等级调整指令，这里的第一转换条件对应上述目标等级调整指令。可以理解的是，对于当前位于第一子队列(或待请求标识队列)中的同一语音消息的语音标识而言，若分别采用三种转换条件对该语音标识的队列位置(例如，队列位置1)进行调整，则采用第一转换条件所调整得到的该语音标识的新的队列位置(例如，队列位置a)的请求优先级，会高于采用采用第二转换条件所调整得到的该语音标识的新的队列位置(例如，队列位置b)的请求优先级；与此同时，采用该第二转换条件所调整得到的该语音标识的新的队列位置(例如，队列位置b)的请求优先级，也会高于采用采用第三转换条件所调整得到的该语音标识的新的队列位置(例如，队列位置c)的请求优先级。可以理解的是，在第一子队列中，队列位置c的请求优先级会高于该语音标识原有的队列位置1的请求优先级。
112.比如，第一转换条件可以理解为用户终端对应的第一用户针对会话界面中的某个语音消息(例如，语音消息1)执行触发操作时，可以在目标标识队列中按照预设的语音转换条件的第一转换条件，对该语音消息1的语音标识的队列位置1进行调整，以便于后续可以最为快速地添加至已请求标识队列。又比如，第二转换条件可以理解为第一用户通过用户终端打开当前会话界面时，用户终端可以在目标标识队列中按照预设的语音转换条件的第二转换条件，将打开当前会话界面时所阅读到的语音消息(例如，将语音消息的阅读状态从未阅读状态变更为已阅读状态的语音消息2)的语音标识的队列位置2进行调整，以便于后续可以相对较快的添加至已请求标识队列。又比如，第三转换条件可以理解为用户终端按照接收语音消息的接收时间戳的先后顺序，依次在目标标识队列中按照预设的语音转换条件的第三转换条件，对满足第三转换条件的语音消息(例如，语音消息3)的语音标识的队列位置3进行调整，以便于可以相对较快的添加至已请求标识队列。
113.步骤s102：基于目标标识队列中的语音标识的队列位置，生成携带语音标识的语
音转换请求，将语音转换请求发送至服务器，以使服务器基于语音转换请求获取语音标识对应的转换文本信息；
114.具体的，用户终端可以接收服务器返回的针对已发送语音转换请求的m个待转换语音消息的转换成功信息，将接收到的转换成功信息的转换数量记为n。其中，目标标识队列包括待请求标识队列和已请求标识队列；语音标识位于待请求标识队列中，已请求标识队列包括m个队列位置，已请求标识队列中的一个队列位置用于存储一个待转换语音消息的标识，这里的m可以为已发送语音转换请求的待转换语音消息的标识的总数量。其中，这里的n可以为小于或者等于m的正整数。进一步的，用户终端可以在目标标识队列的待请求标识队列中，获取语音标识的队列位置，在语音标识的队列位置满足语音转换条件时，在已请求标识队列中确定语音标识的目标队列位置。进一步的，用户终端可以基于目标队列位置将语音标识添加至已请求标识队列，基于添加语音标识的已请求标识队列，生成携带语音标识的语音转换请求，将语音转换请求发送至服务器。
115.其中，在接收到n个待转换语音消息的转换成功信息时，用户终端可以基于待请求标识队列中的待请求语音消息的语音标识向服务器发送语音转换请求。可以理解的是，用户终端可以在待请求标识队列中，获取n个待请求语音消息的语音标识，将该n个语音标识添加至已请求标识队列的目标队列位置，并基于该n个语音标识向服务器发送语音转换请求。可选的，若待请求标识队列中不包含n个待请求语音消息的语音标识，例如，待请求标识队列中可以包含k个待请求语音消息的语音标识，这里的k可以为小于n的正整数，则用户终端可以在待请求标识队列中，获取k个待请求语音消息的语音标识，将该k个语音标识添加至已请求标识队列的目标队列位置，并基于该k个语音标识向服务器发送语音转换请求。
116.可选的，用户终端可以在获取到语音消息时，直接基于待请求标识队列中的待请求语音消息的语音标识向服务器发送语音转换请求，此时已请求标识队列中的m个队列位置处于未占用状态，用户可以在待请求标识队列中，获取m个待请求语音消息的语音标识，将该m个语音标识添加至已请求标识队列的目标队列位置，并基于该m个语音标识向服务器发送语音转换请求。可选的，若已请求标识队列中包含待转换语音消息，例如，已请求表示队列中可以包含(m
‑
l)个待转换语音消息的语音标识，这里的l可以为小于m的正整数，此时已请求标识队列中的l个队列位置处于未占用状态，则用户终端可以在待请求标识队列中，获取l个待请求语音消息的语音标识，将该l个语音标识添加至已请求标识队列的目标队列位置，并基于该l个语音标识向服务器发送语音转换请求。可选的，若待请求标识队列中不包含上述m个或l个待请求语音消息的语音标识，例如，待请求标识队列中可以包含k个待请求语音消息的语音标识，这里的k可以为小于m或l的正整数，则用户终端可以在待请求标识队列中，获取k个待请求语音消息的语音标识，将该k个语音标识添加至已请求标识队列的目标队列位置，并基于该k个语音标识向服务器发送语音转换请求。
117.其中，为便于理解，请参见图7，图7是本技术实施例提供的一种接收转换文本信息的场景示意图。如图7所示，该标识队列7a可以为上述图4所对应实施例中的标识队列4，在图4所示的标识队列4所对应的t2时刻的下一时刻(例如，t3时刻)时，即在图7所示的标识队列7a所对应的t2时刻的下一时刻(例如，t3时刻)时，服务器可以基于已请求标识队列中的3个已发送语音转换请求的语音标识，向用户终端返回转换成功信息(例如，针对语音标识y1和语音标识y2所返回的转换成功信息)，此时，用户终端可以将语音标识y1和语音标识y2对
应的转换文本信息输出至用户终端的会话界面。应当理解，用户终端可以在获取到针对语音标识y1和语音标识y2返回的转换成功信息时，在目标标识队列的已请求标识队列中释放这2个语音标识所占据的队列位置，得到图7所示标识队列7b，这意味着此时，该已请求标识队列中目前有两个队列位置是处于未占用状态的。基于此，用户终端可以在标识队列7b的待请求标识队列中，挑选两个具有最高请求优先级的语音标识(例如，语音标识z1和语音标识x1)，并将这两个语音标识添加至上述已请求标识队列的目标队列位置，其中，根据目标队列位置的不同，已请求标识队列中可以包括语音标识{y3、z1、x1}，此时已请求标识队列中的语音标识按照发送语音转换请求的时间进行排序。可选的，已请求标识队列中可以包括语音标识{z1、x1，y3}，此时已请求标识队列中的语音标识无需按照语音转换请求的时间进行排序，这里对已请求标识队列中的标识所在的队列位置不做限制。
118.可选的，用户终端可以响应针对第一用户所执行的触发操作(例如，第一触发操作和第二触发操作)，对上述标识队列7b的待请求标识队列中的语音标识的队列位置进行调整，以更改语音标识的请求优先级，以便于可以执行步骤s102和步骤s103的同时，执行上述步骤s101。其中，该第一触发操作和第二触发操作可以包括点击、长按、滑动等接触性操作，也可以包括语音、手势等非接触性操作，本技术在此不做限定。
119.步骤s103：接收服务器返回的转换文本信息，在会话界面中将转换文本信息输出至语音消息所在的位置区域。
120.其中，位置区域中的语音消息与转换文本信息之间具有关联关系，比如，该语音消息和转换文本信息可以在会话界面中具有相邻位置关系(例如，转换文本信息可以位于语音消息的下方位置)。
121.可以理解的是，用户终端接收到的服务器返回的转换文本信息，可以为一个语音消息对应的完整转换文本信息，还可以为多个语音消息对应的完整转换文本信息。比如，语音转换请求中可以包括语音标识x1，语音标识x2和语音标识x3，则服务器在返回转换文本信息时，可以在第一时间戳将语音标识x1对应的文本信息1和语音标识x2对应的文本信息2返回给用户终端，还可以在第二时间戳将语音标识x3对应的文本信息3返回给用户终端。
122.同理，可以理解的是，第一终端接收到的服务器返回的转换文本信息，还可以为一个语音消息对应的部分转换文本信息。比如，服务器在对上述语音标识x2对应的语音消息x2进行转换处理时，可以分批转换得到文本信息2中的内容，并分批将获取到的部分文本信息返回给用户终端。例如，文本信息2可以为“我今天上午把上周的文档整理好了！”，在t11时刻，服务器可以向用户终端返回“我今天上午”，此时，用户终端的会话界面上可以包括文本信息y2的部分转换文本信息，即“我今天上午
…”
；在t22时刻，服务器可以向用户终端返回“把上周的文档”，此时，用户终端的会话界面上可以包括文本信息y2的部分转换文本信息，即“我今天上午把上周的文档
…”
；在t33时刻，服务器可以向用户终端x返回“整理好了！”，此时，用户终端的会话界面上可以包括文本信息2的完整转换文本信息，即“我今天上午把上周的文档整理好了！”。其中，t11时刻早于t22时刻，t22时刻早于t33时刻。
123.进一步的，可以理解的是，若用户终端接收到的转换文本信息为语音消息对应的部分转换文本信息，则将该部分转换文本信息输出至应用客户端的会话界面中，等待接收该语音消息对应的完整转换文本信息。若用户终端接收到的转换文本信息为语音消息对应的完整转换文本信息，或者用户终端已经接收到一个或多个语音消息对应的完整转换文本
信息，则获取服务器发送的针对一个或多个语音消息的转换成功信息(例如，针对目标语音消息的目标转换成功信息)，基于该转换成功信息从目标标识队列的已请求标识队列中删除语音标识(例如，针对目标转换成功信息从目标标识队列的已请求标识队列中删除目标语音标识)，以便于用户终端可以在后续步骤中继续向服务器发送语音转换请求。
124.其中，可以理解是，用户终端在接收到服务器返回的转换文本信息时，可以将该转换文本信息存储在本地内存中，当第一用户在应用客户端中查看历史接收的语音消息对应的转换文本信息时(假设历史接收的语音消息对应的转换文本信息不会直接显示在会话界面中，或者该转换文本信息已经被第一用户进行隐藏处理)，用户终端可以无需对历史接收到的语音消息进行重新转换处理，而是直接从本地内存中获取该语音消息对应的转换文本信息，并将该转换文本信息输出至应用客户端的会话界面中该语音消息所在的位置。
125.可选的，可以理解的是，当第一用户在查看历史接收的语音消息对应的转换文本信息时，第一用户可以针对历史接收的语音消息中的一个或多个语音消息执行触发操作，以使用户终端可以基于该一个或多个语音消息对应的语音标识生成语音转换请求，并向服务器发送该语音转换请求。这样，在服务器端的语音转换算法进行更新时，第一用户可以获取最新的转换文本信息，以提高第一用户获取的转换文本信息的准确性，此时，用户终端可以使用该最新的转换文本信息更新本地内存中的转换文本信息。
126.应当理解，用户终端在相邻时刻发送的语音标识和接收的转换文本信息不一定是相对应的。比如，用户终端可以在t1时刻时，基于语音标识x1和语音标识x2向服务器发送语音转换请求，在t2时刻时，基于语音标识x3向服务器发送语音转换请求。在t3时刻时，用户终端可以接收服务器返回的转换文本信息，该转换文本信息可以为语音标识x1(或语音标识x2)对应的转换文本信息，也可以为语音标识x3对应的转换文本信息。其中，t1时刻、t2时刻和t3时刻可以为按时间排序的相邻时刻，t1时刻早于t2时刻，t2时刻早于t3时刻。
127.在本技术实施例中，在应用客户端获取到会话界面的语音消息时，用户终端可以获取语音消息对应的语音标识，将语音标识添加至初始标识队列，并将添加语音标识的初始标识队列作为目标标识队列。其中，会话界面的语音消息可以为应用客户端所发送的语音消息，还可以为应用客户端所接收的语音消息。进一步的，用户终端可以基于目标标识队列中的语音标识的队列位置，生成携带语音标识的语音转换请求，将语音转换请求发送至服务器，以使服务器基于语音转换请求查询语音标识对应的语音消息，对语音消息进行转换处理后得到转换文本信息。进一步的，用户终端可以接收服务器返回的转换文本信息，在会话界面中将转换文本信息输出至语音消息所在的位置区域。其中，位置区域中的语音消息与转换文本信息之间具有关联关系，比如，该语音消息和转换文本信息可以在会话界面中具有相邻位置关系。应当理解，通过引入目标标识队列，在获取到语音消息以及语音消息对应语音标识时，无需用户终端对应的第一用户执行触发操作，用户终端可以在应用客户端的会话界面中输出语音消息对应的转换文本信息，进而可以自动将语音消息转换为其对应的转换文本信息，可以实现转换文本信息的主动触达。其中，在基于目标标识队列中的语音标识对语音消息进行转换处理时，本技术实施例无需用户终端将本地内存中的语音消息上传给服务器，而是由服务器根据上传的语音标识来智能查询该语音标识对应的语音消息，并对查询到的语音消息进行转换处理，从而可以在网络环境不稳定的情况下，解决语音消息上传失败等引起的问题，进而可以有效提高语音消息的转换效率。
128.进一步的，请参见图8，图8是本技术实施例提供的一种语音数据处理方法的流程示意图。如图8所示，该方法可以由计算机设备执行，该计算机设备可以为安装有上述办公客户端的用户终端，该用户终端可以为上述图2所对应实施例中的用户终端x；可选的，该计算机设备还可以为办公客户端对应的服务器，该服务器可以为上述图2所对应实施例中的服务器。换言之，本技术实施例所涉及的方法可以由用户终端执行，也可以由服务器执行，还可以由用户终端和服务器共同执行。为便于理解，本实施例以该方法由用户终端和服务器共同执行为例进行说明。其中，该方法可以包括以下步骤：
129.步骤s201：服务器在获取到应用客户端的语音消息时，生成语音消息对应的语音标识，将语音消息和语音标识发送至用户终端，以使用户终端将语音标识添加至初始标识队列，将添加语音标识的初始标识队列作为目标标识队列；
130.可以理解的是，本技术实施例中的用户终端可以为第一终端，第一终端所对应的用户称之为第一用户，即该第一用户可以为使用该第一终端的用户，该第一终端可以为上述图1所对应实施例的用户终端集群中的用户终端3000c。同理，本技术实施例可以将第二终端所对应的用户称之为第二用户，即该第二用户可以为使用该第二终端的用户，该第二终端可以为上述图1所对应实施例的用户终端集群中的用户终端3000a。其中，第一用户可以为在第一终端中通过第一账号信息(例如，账号信息1)登录办公客户端的用户，第二用户可以为在第二终端中通过第二账号信息(例如，账号信息2)登录办公客户端的用户。
131.可以理解的是，本技术实施例中的第一用户可以为通过第一终端中的应用客户端接收语音消息的用户，即消息接收者；本技术实施例中的第二用户可以为通过第二终端中的应用客户端发送语音消息的用户，即消息发送者。应当理解，本技术实施例中的第一用户既可以作为上述消息接收者，也可以作为上述消息发送者，比如，第一用户可以通过第一终端成为消息接收者，第一用户还可以通过第一终端成为消息发送者。同理，本技术实施例中的第二用户既可以作为上述消息发送者，还可以作为上述消息接收者，比如，第二用户可以通过第二终端成为消息发送者，第二用户还可以通过第二终端成为消息接收者。
132.可以理解的是，消息发送者与消息接收者之间可以通过服务器进行连接，服务器将语音消息从消息发送者对应的用户终端(例如，第二用户对应的第二终端)同步至消息接收者对应的用户终端(例如，第一用户对应的第一终端)，并在后续步骤中可以对该语音消息进行转换处理，以使第一用户与第二用户可以直接获取该语音消息对应的转换文本信息。其中，第一终端与第二终端均运行有服务器对应的应用客户端，通过该应用客户端可以实现第一终端与第二终端之间语音消息的发送与接收。
133.其中，可以理解的是，若第二用户作为消息发送者，则服务器可以接收第二终端的应用客户端发送的语音消息，生成该语音消息对应的语音标识(即配置语音消息对应的语音标识)，将语音消息对应的语音内容和语音标识存储在应用数据库后，向第一终端转发语音消息和语音标识，以使第一终端可以在应用客户端的会话界面中输出该语音消息。与此同时，服务器可以将第二终端发送的语音消息返回至第二终端，以使第二终端可以在应用客户端的会话界面中输出该语音消息，同时，服务器可以将语音消息对应的语音标识返回至第二终端，以使第二终端可以基于第二用户发送的语音消息对应的语音标识向服务器发送语音转换请求。
134.为便于理解，请参见图9，图9是本技术实施例提供的一种进行语音消息转发的场
景示意图。如图9所示，第二用户(即用户“aaa”)使用第二终端向第一用户(即用户“fff”)发送语音消息，该语音消息可以由服务器进行转发。其中，服务器可以接收第二终端发送的语音消息，生成该语音消息对应的语音标识(即配置语音消息对应的语音标识)，并将该语音标识与语音消息对应的语音内容存储在应用数据库中。进一步的，服务器可以向第一终端发送语音消息和语音标识，以使第一终端将语音消息输出至第一终端的会话界面，以在后续步骤第一终端可以基于语音标识向服务器发送语音转换请求。与此同时，图9所示的服务器向第一终端发送语音消息和语音标识时，可以向第二终端发送语音消息和语音标识，以使第二终端将语音消息输出至第二终端的会话界面，以在后续步骤第二终端可以基于语音标识向服务器发送语音转换请求。
135.其中，可以理解的是，对于第二用户发送的语音消息，第二终端可以在获取到该语音消息对应的语音标识时，将该语音标识添加至初始标识队列，以使第二终端可以自动基于该语音标识向服务器发送语音转换请求。可选的，第二终端可以在获取到语音消息对应的语音标识时，无需将该语音标识添加至初始标识队列，在第二用户针对语音消息执行触发操作(这里的触发操作可以为上述图3所对应实施例中的第二触发操作)时，将获取到的语音标识添加至初始标识队列，以使第二终端可以基于该语音标识向服务器发送语音转换请求。
136.步骤s202：在应用客户端获取到会话界面的语音消息时，用户终端获取语音消息对应的语音标识，将语音标识添加至初始标识队列，将添加语音标识的初始标识队列作为目标标识队列；
137.其中，用户终端可以为上述步骤s201中的第一终端，该用户终端获取的语音消息可以为第一用户作为消息接收者接收的语音消息，还可以为第一用户作为消息发送者发送的语音消息。
138.可以理解的是，初始标识队列和目标标识队列(简称标识队列或队列)可以用来存储语音标识，本技术实施例中的初始标识队列可以包括第一子队列和第二子队列，目标标识队列可以包括待请求标识队列和已请求标识队列，一般来说，队列就是一群人或者事物按照排好的顺序等待接受服务或者处理。
139.应当理解，第一子队列(或待请求标识队列)中的语音消息的队列位置是由语音消息的接收时间戳所确定的，用户终端在响应针对第一用户所执行的触发操作时，可以将语音消息在第一子队列(或待请求标识队列)中的队列位置进行调整，以使调整后的队列位置的请求优先级大于调整前的队列位置的请求优先级。其中，在将语音标识添加至初始标识队列时，可以对第一子队列执行入队操作，在向服务器发送语音转换请求时，可以对待请求标识队列执行出队操作。
140.应当理解，第二子队列(或已请求标识队列)中的语音消息的队列位置是由语音转换请求的时间戳所确定的，第二子队列(或已请求标识队列)包括的m个队列位置表示第二子队列中所能容纳的标识的总数量为m个，用户终端可以向服务器发送针对m个语音标识的语音转换请求，该m的取值如果太大，这样会造成服务器所承受的压力太大，该m的取值如果太小，这样会造成语音消息转换处理的速度太慢，因此，本技术实施例可以将m设置为5个。其中，在向服务器发送语音转换请求时，可以对第二子队列执行入队操作，在用户终端接收转换文本信息时，可以对已请求标识队列执行出队操作。
141.为便于理解，请参见图10，图10是本技术实施例提供的一种语音转文本方案的流程示意图。如图10所示的应用客户端可以为办公客户端，该办公客户端可以为安装在用户终端上的客户端，如图10所示的目标用户可以为使用该用户终端的第一用户，例如，上述用户“fff”。在应用客户端收到语音消息(即获取到应用客户端的显示界面的语音消息)和语音标识时，可以将语音消息对应的语音标识添加至初始标识队列，得到目标标识队列，并在目标标识队列中按优先级(即请求优先级)排序，即根据语音消息的接收时间戳将语音标识添加至初始标识队列。
142.应当理解，如图10所示，在目标用户打开会话(即目标用户执行上述图5所对应实施例中的第一触发操作)或点击语音转文本(即目标用户执行上述图6所对应实施例中的第二触发操作)时，应用客户端可以调整语音消息在目标标识队列中的队列位置，以使调整后的队列位置的请求优先级大于调整前的队列位置的请求优先级，即更新语音消息的请求优先级。其中，第二触发操作对应的语音消息可以具有第一优先级，第一触发操作对应的语音消息可以具有第二优先级，其他语音消息(即除第一优先级和第二优先级之外的语音消息)可以具有第三优先级。其中，第一优先级的请求优先级大于第二优先级的请求优先级，第二优先级的请求优先级大于第三优先级的请求优先级。
143.其中，可以理解的是，第一触发操作可以为目标用户针对群消息的会话界面所执行的触发操作，此时，用户终端可以获取多个用户(例如，第二用户和第三用户)通过服务器转发的语音消息对应的语音标识，并将该语音标识添加至初始标识队列，得到目标标识队列。在用户终端响应该第一触发操作，将该语音消息输出至会话界面时，用户终端可以调整该语音消息对应的语音标识在目标标识队列中的队列位置。其中，用户终端调整群消息的语音消息对应的语音标识在目标标识队列中队列位置的具体实现方式，可以参见用户终端调整第二用户的语音消息对应的语音标识在目标标识队列中的队列位置的描述，这里将不再进行赘述。
144.其中，用户终端按照请求优先级动态调整目标标识队列中的语音标识的队列位置的具体实现方式，可以参加上述图3所对应实施例中对步骤s101的描述，这里将不再进行赘述。
145.步骤s203：用户终端基于目标标识队列中的语音标识的队列位置，生成携带语音标识的语音转换请求，将语音转换请求发送至服务器，以使服务器基于语音转换请求获取语音标识对应的转换文本信息；
146.其中，如图10所示，在满足语音转换条件时，应用客户端可以发起转文本请求，即向服务器发送语音转换请求。
147.其中，用户终端向服务器发送语音转换请求的具体实现方式，可以参见上述图3所对应实施例中对步骤s102的描述，这里将不再进行赘述。
148.步骤s204：服务器接收用户终端发送的语音转换请求，从语音转换请求中获取语音标识；
149.其中，语音转换请求是基于语音标识在目标标识队列中的队列位置所生成的。
150.可以理解的是，在语音转换请求中的语音标识为群消息中的语音消息所对应的语音标识时，服务器可以接收多个用户终端(例如，第二终端和第三终端)发送的多个语音转换请求，并从多个语音转换请求中获取相同的语音标识，以在后续步骤中查询到该同一语
音标识对应的同一语音内容后，可以对同一个语音内容进行多次转换处理。
151.可选的，为提高转换处理的速度，服务器可以在获取到语音消息时，对该语音消息对应的语音内容进行转换处理，以将得到的转换文本信息存储在应用数据库中，在接收用户终端发送的语音转换请求时，基于语音转换请求携带的语音标识在应用数据库中查询该语音标识对应的转换文本信息。同理，可选的，为提高转换处理的速度，服务器可以在第一次接收到某一个语音标识时，基于这个语音标识在应用数据库中查询该语音标识对应的语音内容，并对该语音内容进行转换处理，以将得到的转换文本信息存储在应用数据库中，则服务器可以在第二次接收到上述语音标识时，基于这个语音标识在应用数据库中查询该语音标识对应的转换文本信息。
152.步骤s205：在查询到语音标识对应的语音消息时，服务器对语音消息进行转换处理，得到语音消息对应的转换文本信息；
153.应当理解，本技术实施例将语音消息所对应的语音内容转换处理为转换文本信息的语音转换算法可以为模式匹配法，即在训练阶段，将词汇表中的每一个词语说一遍，并将其特征矢量作为模板存入模板库；在识别阶段，将输入语音的特征矢量依次与模板库中的每个模板进行相似度比较，将相似度最高者作为识别结果输出。可选的，本技术实施例中的语音转换算法可以为基于参数模型的隐马尔可夫模型(hidden markov model，简称hmm)的方法，也可以为基于动态时间规整(dynamic time warping，简称dtw)的算法，还可以为基于非参数模型的矢量量化(vector quantization，简称vq)的方法，本技术实施例对语音转换算法的具体类型不做限制。其中，语音消息转换处理为转换文本信息可以称之为语音识别，上述语音转换算法可以称之为语音识别方法。
154.为便于理解，请参见图11，图11是本技术实施例提供的一种进行语音转文本的场景示意图。如图11所示，服务器可以在接收用户终端基于语音标识(例如，语音标识x1和语音标识x2)发送的语音转换请求时，基于语音转换请求携带的语音标识在服务器对应的应用数据库中查询语音标识x1和语音标识x2对应的语音内容1和语音内容2，并将该语音内容1和语音内容2转发给语音处理服务器，以使该语音处理服务器可以对语音内容1和语音内容2进行转换处理，进而可以将转换处理后的转换文本信息(例如，图11所示的文本信息1和文本信息2，即转换文本信息)返回给服务器，以使该服务器可以将该转换处理后的文本信息1和文本信息2输出至图11所示的用户终端。
155.其中，这里的语音处理服务器可以为用于提供转换处理服务的同一语音处理服务器，还可以为彼此相互独立的用于提供转换处理服务的语音处理服务器集群，比如，该语音处理服务器集群可以包括语音处理服务器100a、语音处理服务器100b，
…
，语音处理服务器100n(即通过语音处理服务器100a可以对上述语音内容1进行转换处理，通过语音处理服务器100b可以对上述语音内容2进行转换处理，同理，通过语音处理服务器100c可以对语音内容3进行转换处理)，这里将不对其进行限定。可选的，提供转换处理服务的一个或多个语音处理服务器可以运行在图11所示的服务器中，也可以独立于图11所示的服务器而存在，这里将不对其进行限定。
156.步骤s206：服务器向用户终端返回转换文本信息，以使用户终端在应用客户端的会话界面中将转换文本信息输出至语音消息所在的位置区域；
157.其中，如图10所示，服务器在对语音消息转换处理时，若转换处理成功，则可以将
语音消息对应的文本信息(即转换文本信息)返回给应用客户端，以使应用客户端展示该转换文本信息，进而目标用户可以直观的在应用客户端的会话界面中查看到应用客户端接收到的转换文本信息。同理，若语音消息的转换处理失败，则服务器可以向应用客户端返回拒绝提示信息，以使目标用户可以重新向服务器发送语音转换请求。其中，语音消息转换处理失败的原因可以有多种，例如，语音消息的语速太快，语音消息为方言，语音消息的杂音太大以及语音消息为不支持的语言类型等。
158.其中，可以理解的是，由于网络不稳定，服务器在将转换文本信息返回给用户终端时，可以出现返回失败的情况，此时，用户终端也可以接收服务器返回的拒绝提示信息。同理，由于网络不稳定，用户终端在向服务器发送语音转换请求时，可以出现发送失败的情况，此时，用户终端也可以接收服务器返回的拒绝提示信息。
159.其中，服务器向用户终端返回拒绝提示信息的方式可以为在应用客户端的会话界面上弹出一个独立于原有会话界面的子界面，该子界面上可以提示：“语音转换失败，请重试”。可以理解的是，根据返回拒绝提示信息的原因的不同，子界面上的提示信息可以不同。
160.步骤s207：用户终端接收服务器返回的转换文本信息，在会话界面中将转换文本信息输出至语音消息所在的位置区域。
161.其中，位置区域中的语音消息与转换文本信息之间具有关联关系。
162.其中，可以理解的是，在本技术实施例中，第一用户还可以在上述群消息的会话界面所对应的群列表中选择自己感兴趣的一个或者多个用户，这样，当用户终端接收到这些用户所发送的语音消息时，可以将这些用户的语音消息所对应的转换文本信息输出在这个会话界面上。此外，可选的，用户终端还可以在其他显示界面上展示自己所选取的这些用户的语音消息所对应的转换文本信息，从而可以在其他显示界面中只听自己所选取的这些用户的语音消息，以及只看自己所选取的这些用户的语音消息所对应的转换文本信息。
163.其中，可以理解的是，服务器在获取到语音消息(例如，第二用户向第一用户发送的语音消息a)时，可以为该语音消息a配置唯一的语音标识，从而可以将该语音标识以及该语音消息a一并分发给第一用户对应的用户终端(即上述第一终端)以及第二用户对应的用户终端(即上述第二终端)，这样第二用户可以在第二终端的会话界面上看到自己发送的语音消息a，同理，第一用户可以在第一终端的会话界面上看到对方发来的这个语音消息a。此时，第一终端和服务器可以通过上述步骤s201
‑
步骤s207所描述的数据交互的方式，获取到该语音消息a对应的转换文本信息。
164.可选的，为便于理解，本技术实施例以获取该语音消息a的语音标识的用户终端为第一用户对应的用户终端(即上述第一终端)为例，以阐述该第一终端自动接收由该服务器下发的该语音消息a对应的转换文本信息的另一实现方式。
165.比如，考虑到语音消息a对应的语音内容可以存储在该服务器中，所以，为了提高转换处理的速度，本技术实施例中的服务器在向上述第一用户对应的用户终端(即第一终端)下发该语音消息a和该语音消息a对应的语音标识的同时，还可以进一步在该服务器的本地对该语音消息a对应的语音内容进行转换处理，从而可以无需接收用户终端基于上述语音标识在目标标识队列中的队列位置发送的语音转换请求。随后，当服务器完成对该语音消息a的语音内容的转换处理时，该服务器可以直接将转换处理所得到的该语音消息a的转换文本信息，智能下发给第一用户对应的用户终端，以在该第一用户对应的用户终端的
会话界面中显示该语音消息a对应的转换文本信息。
166.可选的，服务器在对该语音消息a的语音内容的转换处理的过程中，该服务器还可以对该语音消息a所对应的语音内容进行语义分析，以在检测到该语音消息a中存在预设的关键字的语义信息时，可以进一步在该语音消息a所对应的转换文本信息中对该预设的关键字进行标识处理(例如，在转换文本信息中亮高显示预设的关键字)，进而可以将该标识处理后的携带关键字的转换文本信息返回给用户终端。其中，可以理解的是，用户终端在接收到在上述标识处理后的携带关键字的转换文本信息时，可以在当前的会话界面中显示该标识处理后的携带关键字的转换文本信息和语音消息。
167.可选的，若该关键字的类型属于群会话中的特定类型的关键字时，用户终端还可以将接收到的该标识处理后的携带关键字的转换文本信息输出显示在独立于该会话界面的另一显示界面，比如，可以在独立于当前会话界面的弹窗中显示该标识处理后的携带关键字的转换文本信息，本技术实施例将不对用于显示该标识处理后的携带关键字的转换文本信息的具体显示界面进行限定。
168.应当理解，通过引入目标标识队列，在获取到语音消息以及语音消息对应语音标识时，无需用户终端对应的第一用户执行触发操作，用户终端可以在应用客户端的会话界面中输出语音消息对应的转换文本信息，进而可以自动将语音消息转换为其对应的转换文本信息，可以实现转换文本信息的主动触达。其中，在基于目标标识队列中的语音标识对语音消息进行转换处理时，本技术实施例无需用户终端将本地内存中的语音消息上传给服务器，而是由服务器根据上传的语音标识来智能查询该语音标识对应的语音消息，并对查询到的语音消息进行转换处理，从而可以在网络环境不稳定的情况下，解决语音消息上传失败等引起的问题，进而可以有效提高语音消息的转换效率。
169.进一步的，请参见图12，图12是本技术实施例提供的一种语音数据处理装置的结构示意图。语音数据处理装置1可以应用于上述用户终端，该用户终端可以为上述图1所对应实施例中的用户终端3000c。其中，该语音数据处理装置1可以包括：语音获取模块10，请求发送模块20，文本接收模块30；进一步的，语音数据处理装置1还可以包括：标识删除模块40；
170.语音获取模块10，用于在应用客户端获取到会话界面的语音消息时，获取语音消息对应的语音标识，将语音标识添加至初始标识队列，将添加语音标识的初始标识队列作为目标标识队列；
171.其中，会话界面中包含与第一用户相关联的第二用户；初始标识队列包括第一子队列和第二子队列；第一子队列用于存储第一语音标识；第一语音标识用于表征应用客户端中的待发送语音转换请求的第一语音消息的标识；第二子队列用于存储第二语音标识；第二语音标识用于表征应用客户端中的已发送语音转换请求的第二语音消息的标识；
172.语音获取模块10包括：语音接收单元101，时间戳确定单元102，标识添加单元103，队列确定单元104；可选的，语音获取模块10可以进一步包括：第一触发单元105，第一调整单元106，第一更新单元107，第二触发单元108，第二调整单元109，第二更新单元110；
173.语音接收单元101，用于第一用户对应的应用客户端接收第二用户通过服务器转发的语音消息，且接收服务器为语音消息所配置的语音标识；
174.时间戳确定单元102，用于获取与会话界面相关联的语音转换条件，基于语音转换
条件将接收到的语音标识确定为目标语音标识，将应用客户端接收到语音消息作为目标语音消息，将目标语音消息对应的接收时间戳记为目标接收时间戳；
175.标识添加单元103，用于基于目标接收时间戳，在包含第一语音消息的标识的第一子队列中确定目标语音消息的目标语音标识的队列位置，基于队列位置将目标语音标识添加至第一子队列，得到初始第一子队列；
176.队列确定单元104，用于基于初始第一子队列和包含第二语音消息的标识的第二子队列，确定目标标识队列。
177.可选的，其中，第二子队列的请求优先级大于第一子队列的请求优先级；
178.第一触发单元105，用于响应针对第二用户所在的会话界面的触发操作，将目标语音消息输出至会话界面，获取语音转换条件中的初始等级调整指令；
179.第一调整单元106，用于基于初始等级调整指令在初始第一子队列中将目标语音标识的队列位置确定为第一位置，在初始第一子队列中将目标语音标识的队列位置由第一位置调整至第二位置，得到调整后的初始第一子队列；第二位置对应的标识的请求优先级大于第一位置对应的标识的请求优先级；
180.第一更新单元107，用于基于调整后的初始第一子队列和第二子队列，更新目标标识队列。
181.可选的，第二触发单元108，用于在会话界面中响应针对目标语音消息的触发操作，获取语音转换条件中的目标等级调整指令；
182.第二调整单元109，用于基于目标等级调整指令，将调整后的初始第一子队列中确定为目标第一子队列，在目标第一子队列中将目标语音标识的队列位置由第二位置调整至第三位置，得到调整后的目标第一子队列；第三位置对应的标识的请求优先级大于第二位置对应的标识的请求优先级；
183.第二更新单元110，用于基于调整后的目标第一子队列和第二子队列，对更新后的目标标识队列进行更新处理。
184.其中，语音接收单元101，时间戳确定单元102，标识添加单元103以及队列确定单元104的具体实现方式，可以参见上述图3所对应实施例中对步骤s101的描述，这里将不再进行赘述。可选的，第一触发单元105，第一调整单元106，第一更新单元107，第二触发单元108，第二调整单元109以及第二更新单元110的具体实现方式，可以参见上述图3所对应实施例中对步骤s101的描述，这里将不再进行赘述。
185.请求发送模块20，用于基于目标标识队列中的语音标识的队列位置，生成携带语音标识的语音转换请求，将语音转换请求发送至服务器，以使服务器基于语音转换请求获取语音标识对应的转换文本信息；
186.其中，目标标识队列包括待请求标识队列和已请求标识队列；语音标识位于待请求标识队列中；已请求标识队列包括m个队列位置；已请求标识队列中的一个队列位置用于存储一个待转换语音消息的标识；m为已发送语音转换请求的待转换语音消息的标识的总数量；
187.请求发送模块20包括：信息接收单元201，位置确定单元202，请求生成单元203；
188.信息接收单元201，用于接收服务器返回的针对已发送语音转换请求的m个待转换语音消息的转换成功信息，将接收到的转换成功信息的转换数量记为n；n为小于或者等于m
的正整数；
189.位置确定单元202，用于在目标标识队列的待请求标识队列中，获取语音标识的队列位置，在语音标识的队列位置满足语音转换条件时，在已请求标识队列中确定语音标识的目标队列位置；
190.请求生成单元203，用于基于目标队列位置将语音标识添加至已请求标识队列，基于添加语音标识的已请求标识队列，生成携带语音标识的语音转换请求，将语音转换请求发送至服务器。
191.其中，信息接收单元201，位置确定单元202以及请求生成单元203的具体实现方式，可以参见上述图3所对应实施例中对步骤s102的描述，这里将不再进行赘述。
192.文本接收模块30，用于接收服务器返回的转换文本信息，在会话界面中将转换文本信息输出至语音消息所在的位置区域；位置区域中的语音消息与转换文本信息之间具有关联关系。
193.可选的，标识删除模块40，用于在接收到服务器返回的转换文本信息时，获取针对语音消息的目标转换成功信息，基于目标转换成功信息从目标标识队列中删除语音标识。
194.其中，语音获取模块10，请求发送模块20以及文本接收模块30的具体实现方式，可以参见上述图3所对应实施例中对步骤s101
‑
步骤s103的描述，这里将不再进行赘述。可选的，标识删除模块40的具体实现方式，可以参见上述图3所对应实施例中对步骤s103的描述，这里将不再进行赘述。另外，对采用相同方法的有益效果描述，也不再进行赘述。
195.请参见图13，图13是本技术实施例提供的一种计算机设备的结构示意图。如图13所示，该计算机设备1000可以包括：处理器1001，网络接口1004和存储器1005，此外，上述计算机设备1000还可以包括：用户接口1003，和至少一个通信总线1002。其中，通信总线1002用于实现这些组件之间的连接通信。其中，用户接口1003可以包括显示屏(display)、键盘(keyboard)，可选用户接口1003还可以包括标准的有线接口、无线接口。可选的，网络接口1004可以包括标准的有线接口、无线接口(如wi
‑
fi接口)。存储器1005可以是高速ram存储器，也可以是非不稳定的存储器(non
‑
volatile memory)，例如至少一个磁盘存储器。可选的，存储器1005还可以是至少一个位于远离前述处理器1001的存储装置。如图13所示，作为一种计算机可读存储介质的存储器1005中可以包括操作系统、网络通信模块、用户接口模块以及设备控制应用程序。
196.在如图13所示的计算机设备1000中，网络接口1004可提供网络通讯功能；而用户接口1003主要用于为用户提供输入的接口；而处理器1001可以用于调用存储器1005中存储的设备控制应用程序，以实现：
197.在应用客户端获取到会话界面的语音消息时，获取语音消息对应的语音标识，将语音标识添加至初始标识队列，将添加语音标识的初始标识队列作为目标标识队列；
198.基于目标标识队列中的语音标识的队列位置，生成携带语音标识的语音转换请求，将语音转换请求发送至服务器，以使服务器基于语音转换请求获取语音标识对应的转换文本信息；
199.接收服务器返回的转换文本信息，在会话界面中将转换文本信息输出至语音消息所在的位置区域；位置区域中的语音消息与转换文本信息之间具有关联关系。
200.应当理解，本技术实施例中所描述的计算机设备1000可执行前文图3或图8所对应
实施例中对数据处理方法的描述，也可执行前文图12所对应实施例中对数据处理装置1的描述，在此不再赘述。另外，对采用相同方法的有益效果描述，也不再进行赘述。
201.此外，这里需要指出的是：本技术实施例还提供了一种计算机可读存储介质，且计算机可读存储介质中存储有前文提及的数据处理装置1所执行的计算机程序，且计算机程序包括程序指令，当处理器执行程序指令时，能够执行前文图3或图8所对应实施例中对语音数据处理方法的描述，因此，这里将不再进行赘述。另外，对采用相同方法的有益效果描述，也不再进行赘述。对于本技术所涉及的计算机可读存储介质实施例中未披露的技术细节，请参照本技术方法实施例的描述。
202.进一步的，请参见图14，图14是本技术实施例提供的一种语音数据处理装置的结构示意图。语音数据处理装置2可以应用于上述服务器，该服务器可以为上述图1所对应实施例中的服务器3000。其中，该语音数据处理装置2可以包括：语音发送模块100，请求接收模块200，文本获取模块300，文本发送模块400；
203.语音发送模块100，用于在获取到应用客户端的语音消息时，生成语音消息对应的语音标识，将语音消息和语音标识发送至用户终端，以使用户终端将语音标识添加至初始标识队列，将添加语音标识的初始标识队列作为目标标识队列；
204.请求接收模块200，用于接收用户终端发送的语音转换请求，从语音转换请求中获取语音标识；语音转换请求是基于语音标识在目标标识队列中的队列位置所生成的；
205.文本获取模块300，用于在查询到语音标识对应的语音消息时，对语音消息进行转换处理，得到语音消息对应的转换文本信息；
206.文本发送模块400，用于向用户终端返回转换文本信息，以使用户终端在应用客户端的会话界面中将转换文本信息输出至语音消息所在的位置区域。
207.其中，语音发送模块100，请求接收模块200，文本获取模块300以及文本发送模块400的具体实现方式，可以参见上述图8所对应实施例中对步骤s201
‑
步骤s207的描述，这里将不再进行赘述。另外，对采用相同方法的有益效果描述，也不再进行赘述。
208.请参见图15，图15是本技术实施例提供的一种计算机设备的结构示意图。如图15所示，该计算机设备2000可以包括：处理器2001，网络接口2004和存储器2005，此外，上述计算机设备2000还可以包括：用户接口2003，和至少一个通信总线2002。其中，通信总线2002用于实现这些组件之间的连接通信。其中，用户接口2003可以包括显示屏(display)、键盘(keyboard)，可选用户接口2003还可以包括标准的有线接口、无线接口。可选的，网络接口2004可以包括标准的有线接口、无线接口(如wi
‑
fi接口)。存储器2005可以是高速ram存储器，也可以是非不稳定的存储器(non
‑
volatile memory)，例如至少一个磁盘存储器。可选的，存储器2005还可以是至少一个位于远离前述处理器2001的存储装置。如图15所示，作为一种计算机可读存储介质的存储器2005中可以包括操作系统、网络通信模块、用户接口模块以及设备控制应用程序。
209.在如图15所示的计算机设备2000中，网络接口2004可提供网络通讯功能；而用户接口2003主要用于为用户提供输入的接口；而处理器2001可以用于调用存储器2005中存储的设备控制应用程序，以实现：
210.在获取到应用客户端的语音消息时，生成语音消息对应的语音标识，将语音消息和语音标识发送至用户终端，以使用户终端将语音标识添加至初始标识队列，将添加语音
标识的初始标识队列作为目标标识队列；
211.接收用户终端发送的语音转换请求，从语音转换请求中获取语音标识；语音转换请求是基于语音标识在目标标识队列中的队列位置所生成的；
212.在查询到语音标识对应的语音消息时，对语音消息进行转换处理，得到语音消息对应的转换文本信息；
213.向用户终端返回转换文本信息，以使用户终端在应用客户端的会话界面中将转换文本信息输出至语音消息所在的位置区域。
214.应当理解，本技术实施例中所描述的计算机设备2000可执行前文图8所对应实施例中对语音数据处理方法的描述，也可执行前文图14所对应实施例中对数据处理装置2的描述，在此不再赘述。另外，对采用相同方法的有益效果描述，也不再进行赘述。
215.此外，这里需要指出的是：本技术实施例还提供了一种计算机可读存储介质，且计算机可读存储介质中存储有前文提及的数据处理装置2所执行的计算机程序，且计算机程序包括程序指令，当处理器执行程序指令时，能够执行前文图8所对应实施例中对数据处理方法的描述，因此，这里将不再进行赘述。另外，对采用相同方法的有益效果描述，也不再进行赘述。对于本技术所涉及的计算机可读存储介质实施例中未披露的技术细节，请参照本技术方法实施例的描述。
216.进一步的，请参见图16，图16是本技术实施例还提供一种语音数据处理系统。该语音数据处理系统3中可以包含用户终端1和服务器2，所述用户终端1可以为前述图12所对应实施例中的语音数据处理装置1；所述服务器2可以为前述图14所对应实施例中的语音数据处理装置2。可以理解的是，对采用相同方法的有益效果描述，也不再进行赘述。
217.此外，需要说明的是：本技术实施例还提供了一种计算机程序产品或计算机程序，该计算机程序产品或者计算机程序可以包括计算机指令，该计算机指令可以存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令，处理器可以执行该计算机指令，使得该计算机设备执行前文图3或图8所对应实施例中对语音数据处理方法的描述，因此，这里将不再进行赘述。另外，对采用相同方法的有益效果描述，也不再进行赘述。对于本技术所涉及的计算机程序产品或者计算机程序实施例中未披露的技术细节，请参照本技术方法实施例的描述。
218.本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程，是可以通过计算机程序来指令相关的硬件来完成，计算机程序可存储于一计算机可读取存储介质中，该程序在执行时，可包括如上述各方法的实施例的流程。其中，存储介质可为磁碟、光盘、只读存储存储器(read
‑
only memory，rom或随机存储存储器(random access memory，ram)等。
219.以上所揭露的仅为本技术较佳实施例而已，当然不能以此来限定本技术之权利范围，因此依本技术权利要求所作的等同变化，仍属本技术所涵盖的范围。

再多了解一些

1/2 1 2 下一页尾页

本文用于企业家、创业者技术爱好者查询，结果仅供参考。

上一篇：返回列表
下一篇：一种可自由调整高度的乐器工作台的制作方法

一种语音数据处理方法、装置、设备以及介质与流程

相关文章

最热文献