语音消息处理方法、装置、电子设备及介质与流程

2022-03-02 03:19:33 来源：中国专利 TAG：

1.本技术属于通信技术领域，具体涉及一种语音消息处理方法、装置、电子设备及介质。

背景技术：

2.随着终端技术以及移动互联网技术的迅猛发展，用户可以随时随地通过即时社交应用程序与其他用户聊天，其中，语音聊天的方式，因其方便快捷的优势而备受用户喜欢。
3.相关技术中，在用户通过即时社交应用与其他用户进行语音聊天的过程中，仅能发送和接收语音消息，不能对语音消息进行处理，难以从多人语音消息中获取所需的信息。

技术实现要素：

4.本技术实施例的目的是提供一种语音消息处理方法、装置、电子设备及可读存储介质，能够解决现有技术中仅能发送和接收语音消息，不能对语音消息进行处理，难以从多人语音消息中获取所需信息的问题。
5.第一方面，本技术实施例提供了一种语音消息处理方法，该方法包括：
6.接收用户对会话界面的第一语音消息和目标对象的第一输入，其中，所述第一语音消息包括至少两个联系人的语音信息，所述至少两个联系人包括目标联系人，所述目标联系人为所述目标对象指示的联系人；
7.响应于所述第一输入，从所述第一语音消息中，提取所述目标联系人的语音片段，得到目标语音片段。
8.第二方面，本技术实施例提供了一种语音消息处理装置，所述装置包括：
9.第一接收模块，用于接收用户对会话界面的第一语音消息和目标对象的第一输入，其中，所述第一语音消息包括至少两个联系人的语音信息，所述至少两个联系人包括目标联系人，所述目标联系人为所述目标对象指示的联系人；
10.提取模块，用于响应于所述第一输入，从所述第一语音消息中，提取所述目标联系人的语音片段，得到目标语音片段。
11.第三方面，本技术实施例提供了一种电子设备，该电子设备包括处理器、存储器及存储在所述存储器上并可在所述处理器上运行的程序或指令，所述程序或指令被所述处理器执行时实现如第一方面所述的方法的步骤。
12.第四方面，本技术实施例提供了一种可读存储介质，所述可读存储介质上存储程序或指令，所述程序或指令被处理器执行时实现如第一方面所述的方法的步骤。
13.第五方面，本技术实施例提供了一种芯片，所述芯片包括处理器和通信接口，所述通信接口和所述处理器耦合，所述处理器用于运行程序或指令，实现如第一方面所述的方法。
14.在本技术实施例中，接收用户对会话界面的第一语音消息和目标对象的第一输入，响应于第一输入，从第一语音消息中，提取目标对象指示的目标联系人的语音片段，得
到目标语音片段，其中，第一语音消息包括至少两个联系人的语音信息，这样，可以根据用户的实际使用需求，从包括至少两个联系人语音信息的第一语音消息中，提取出目标联系人的语音片段，提取准确性高，操作简单。并且，用户可以对提取出目标语音片段执行相应的操作，也可以对经提取处理后的第一语音消息执行相应的操作，交互方式更灵活。
附图说明
15.图1是本技术实施例提供的语音消息处理方法的流程图；
16.图2是本技术实施例提供的会话界面的示意图之一；
17.图3是本技术实施例提供的会话界面的示意图之二；
18.图4是本技术实施例提供的会话界面的示意图之三；
19.图5是本技术实施例提供的会话界面的示意图之四；
20.图6是本技术实施例提供的语音消息处理装置的结构示意图；
21.图7是本技术实施例提供的电子设备的结构示意图；
22.图8是实现本技术实施例的一种电子设备的硬件结构示意图。
具体实施方式
23.下面将结合本技术实施例中的附图，对本技术实施例中的技术方案进行清楚地描述，显然，所描述的实施例是本技术一部分实施例，而不是全部的实施例。基于本技术中的实施例，本领域普通技术人员获得的所有其他实施例，都属于本技术保护的范围。
24.本技术的说明书和权利要求书中的术语“第一”、“第二”等是用于区别类似的对象，而不用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换，以便本技术的实施例能够以除了在这里图示或描述的那些以外的顺序实施，且“第一”、“第二”等所区分的对象通常为一类，并不限定对象的个数，例如第一对象可以是一个，也可以是多个。此外，说明书以及权利要求中“和/或”表示所连接对象的至少其中之一，字符“/”，一般表示前后关联对象是一种“或”的关系。
25.下面结合附图，通过具体的实施例及其应用场景对本技术实施例提供的语音消息处理方法进行详细地说明。
26.请参看图1，其是本技术实施例提供的一种语音消息处理方法的流程图。该方法可以应用于电子设备中，该电子设备可以为手机、平板电脑、笔记本电脑等。如图1所示，该方法可以包括步骤1100-步骤1200，以下予以详细说明。
27.步骤1100，接收用户对会话界面的第一语音消息和目标对象的第一输入，其中，所述第一语音消息包括至少两个联系人的语音信息，所述至少两个联系人包括目标联系人，所述目标联系人为所述目标对象指示的联系人。
28.在本实施例中，会话界面可以是用于显示电子设备发送和接收消息的界面。例如，用于显示电子设备发送和接收语音消息的会话界面。该会话界面例如可以是短信会话界面、即时通信应用程序的聊天会话界面、评论会话界面等，本技术实施例对此不作具体限制。在本实施例中，该会话界面可以是不同联系人对应的会话界面，也可以是不同好友群组对应的会话界面，本技术实施例对此不作具体限制。
29.在本实施例中，第一语音消息包括至少两个联系人的语音信息。至少两个联系人
中包括目标联系人。目标联系人可以是用户所要获取其语音信息的联系人。也就是说，第一语音消息包括目标联系人的语音信息。
30.在本实施例中，目标对象可以用于指示目标联系人。示例性地，目标对象可以是目标联系人的联系人标识。其中，所述联系人标识用于指示所述目标联系人的身份信息。例如，联系人标识可以是目标联系人的头像，也可以是目标联系人的昵称，本技术实施例对此不做具体限制。
31.示例性地，目标对象可以是目标联系人的第二语音消息。所述第二语音消息为所述目标联系人的历史语音消息。也就是说，第二语音消息可以是用户从目标联系人的多条历史语音消息中选取的语音消息。例如，用户从会话界面中显示的目标联系人的多条历史语音消息中选取一条语音消息。
32.在本技术的一些实施例中，所述目标对象为所述目标联系人的联系人标识或所述目标联系人的第二语音消息；其中，所述联系人标识用于指示所述目标联系人的身份信息，所述第二语音消息为所述目标联系人的历史语音消息。
33.在本实施例中，第一输入可以是用户对目标对象的点击输入，或者是用户输入的语音指令，或者是用户输入的特定手势，具体的可以根据实际使用需求确定，本技术实施例对此不做限定。本技术实施例中的特定手势可以为单击手势、滑动手势、拖动手势、压力识别手势、长按手势、面积变化手势、双按手势、双击手势中的任意一种；本技术实施例中的点击输入可以为单击输入、双击输入或任意次数的点击输入等，还可以为长按输入或短按输入。示例性地，第一输入具体可以是用户通过手指或手写笔等触控装置将目标联系人的联系人标识拖动至第一语音消息所在的位置的输入。示例性地，第一输入具体可以是用户通过手指或手写笔等触控装置将目标联系人的一条历史语音消息拖动至第一语音消息所在的位置的输入。示例性地，第一输入具体可以是用户点击目标联系人的头像，再点击第一语音消息的输入。
34.步骤1200，响应于所述第一输入，从所述第一语音消息中，提取所述目标联系人的语音片段，得到目标语音片段。
35.在本实施例中，响应于第一输入，根据目标对象，确定目标联系人的语音特征，根据目标联系人的语音特征，从第一语音消息中提取与目标联系人的语音特征匹配的语音片段，得到目标语音片段。
36.在本技术的一些实施例中，所述目标对象为所述目标联系人的联系人标识，所述接收用户对会话界面的第一语音消息和目标对象的第一输入，可以包括：接收用户对所述联系人标识和所述第一语音消息的输入；所述从所述第一语音消息中，提取所述目标联系人的语音片段，得到目标语音片段，可以进一步包括：获取所述联系人标识指示的目标联系人的第三语音消息，其中，所述第三语音消息为所述目标联系人的历史语音消息；根据所述第三语音消息，确定所述目标联系人的语音特征；从所述第一语音消息中，提取与所述语音特征匹配的语音片段，得到目标语音片段。
37.在本实施例中，第三语音消息可以是目标联系人的历史语音消息。示例性地，第三语音消息可以是会话界面中显示的多条历史语音消息中满足预设条件的语音消息。示例性地，第三语音消息也可以是电子设备中存储的目标联系人的历史语音消息中满足预设条件的语音消息。
38.预设条件可以是语音时长达到预设时长的条件。例如，会话界面中显示的多条语音消息中语音时长超过预设时长阈值的语音消息。还例如，电子设备中存储的目标联系人近七天的历史语音消息中语音时长超过预设时长阈值的语音消息。预设时长阈值可以用于衡量第三语音消息的语音信息量是否满足要求。在第三语音消息的语音时长超过预设时长阈值，说明第三语音消息包含的语音信息量满足要求，可以根据第三语音消息确定目标联系人的语音特征。在第三语音消息的语音时长未超过预设时长阈值，说明第三语音消息包含的语音信息量过少，根据第三语音消息难以确定目标联系人的语音特征。
39.在本实施例中，目标联系人的语音特征可以是目标联系人的声纹信息。在具体实施时，对第三语音消息进行声纹提取，将提取到的声纹信息作为目标联系人的语音特征，之后，将目标联系人的语音特征与第一语音消息进行比对，从第一语音消息中提取与目标联系人语音特征匹配的语音片段，得到目标语音片段。
40.示例性地，请参见图2，其是本技术实施例的一种会话界面的示意图。具体来讲，电子设备的会话界面显示有第一语音消息201和目标联系人的联系人标识202，用户将联系人标识202拖动至第一语音消息201所在的位置，或者用户依次点击联系人标识202和第一语音消息201，获取联系人标识202指示的目标联系人的第三语音消息，根据第三语音信息确定目标联系人的语音特征，并从第一语音消息中提取与该语音特征匹配的语音片段，得到目标语音片段。需要说明的是，联系人标识202可以是目标联系人的头像，也可以是目标联系人的昵称。
41.在本实施例中，在当前显示的会话界面不包括目标联系人的历史语音消息的情况下，通过用户对会话界面的联系人标识和第一语音消息的输入，可以获取联系人标识指示的目标联系人的语音特征，并从第一语音消息中提取与目标联系人的语音特征匹配的语音片段，得到目标语音片段，用户不需要查找目标联系人的历史语音消息，操作简便。并且，通过语音特征进行语音识别，可以提高语音识别的准确性。
42.在本技术的一些实施例中，所述目标对象为所述目标联系人的第二语音消息，所述接收用户对会话界面的第一语音消息和目标对象的第一输入，包括：接收用户对所述第二语音消息和所述第一语音消息的输入；所述从所述第一语音消息中，提取所述目标联系人的语音片段，得到目标语音片段，包括：根据所述第二语音消息，确定所述目标联系人的语音特征；从所述第一语音消息中，提取与所述语音特征匹配的语音片段，得到目标语音片段。
43.第二语音消息为目标联系人的历史语音消息。也就是说，第二语音消息可以是用户从目标联系人的多条历史语音消息中选取的语音消息。例如，用户从会话界面中显示的目标联系人的多条历史语音消息中选取的语音消息。
44.示例性地，请参见图3，其是本技术实施例的另一种会话界面的示意图。具体来讲，电子设备的会话界面显示有第一语音消息301和目标联系人的第二语音消息302，用户将第二语音消息302拖动至第一语音消息301所在的位置，或者用户依次点击第二语音消息302和第一语音消息301，根据第二语音消息302确定目标联系人的语音特征，并从第一语音消息中提取与语音特征匹配的语音片段，得到目标语音片段。
45.在本实施例中，在当前显示的会话界面包括目标联系人所发送的第二语音消息的情况下，用户通过对会话界面中目标联系人的第二语音消息和第一语音消息的输入，根据
第二语音消息确定目标联系人的语音特征，并从第一语音消息中提取与目标联系人的语音特征匹配的语音片段，得到目标语音片段，提供了多样化的语音消息提取方式，电子设备不用从聊天历史中获取目标联系人的历史语音消息，减少了电子设备运算量，提高响应速度，可以快速提取目标语音片段。并且，通过语音特征进行语音识别，可以提高语音识别的准确性。
46.在一些可选的实施例中，根据所述第二语音消息，确定所述目标联系人的语音特征，可以进一步包括：在第二语音消息满足预设条件的情况下，根据第二语音消息，确定目标联系人的语音特征；在第二语音消息不满足预设条件的情况下，显示提示信息。
47.在本实施例中，第二语音消息满足预设条件可以是第二语音信息的时长满足预设条件，例如，第二语音消息的时长超过预设时间阈值。预设时长阈值可以用于衡量第二语音消息的语音信息量是否满足要求。在第二语音消息的语音时长超过预设时长阈值，说明第二语音消息包含的语音信息量满足要求，可以根据第二语音消息确定目标联系人的语音特征。在第二语音消息的语音时长未超过预设时长阈值，说明第二语音消息包含的语音信息量过少，根据第二语音消息难以确定目标联系人的语音特征。
48.提示信息用于提示用户第二语音消息不满足预设条件，以及提示用户重新选择第二语音消息。
49.在本实施例中，在第二语音消息不满足预设条件的情况下，难以获取到目标联系人的语音特征，对此，可以向用户发出提示信息，以提醒用户选择符合要求的第二语音消息，提高语音片段提取的成功率。
50.在本技术的一些实施例中，所述从所述第一语音消息中，提取所述目标联系人的语音片段，得到目标语音片段之后，该方法还可以包括：在所述第一语音消息关联的第一区域，显示所述目标联系人的联系人标识；接收对所述联系人标识的第二输入；响应于所述第二输入，播放或者转发所述目标语音片段。
51.在本实施例中，第一区域是会话界面中与第一语音消息关联的区域。例如，第一语音消息所在的区域。还例如，第一语音消息的邻近区域。
52.联系人标识可以用于指示第一语音消息中的目标联系人的语音片段已被提取。并且，通过联系人标识，可以对目标语音片段执行目标处理。例如，播放目标语音片段。还例如，转发目标语音片段。需要说明的是，联系人标识可以是目标联系人的头像，也可以是目标联系人的昵称。
53.这里需要说明的是，第二输入可以是对目标语音片段执行目标处理的输入。示例性地，第二输入可以是用户对第一语音消息关联的第一区域显示的联系人标识的点击输入，或者是用户输入的语音指令，或者是用户输入的特定手势，具体的可以根据实际使用需求确定，本技术实施例对此不做限定。本技术实施例中的特定手势可以为单击手势、滑动手势、拖动手势、压力识别手势、长按手势、面积变化手势、双按手势、双击手势中的任意一种；本技术实施例中的点击输入可以为单击输入、双击输入或任意次数的点击输入等，还可以为长按输入或短按输入。例如，第二输入具体可以是用户通过手指或手写笔等触控装置点击第一区域显示的联系人标识的输入。
54.示例性地，请参见图4，其是本技术实施例的另一种会话界面的示意图。具体来讲，在会话界面显示第一语音消息401，在从第一语音消息中提取出联系人a的语音片段之后，
在第一语音消息401上显示联系人a的头像402，在从第一语音消息中提取出联系人b的语音片段之后，在第一语音消息401上显示联系人b的头像403。再之后，响应于用户对联系人a的头像402的点击输入，可以播放提取出的联系人a的语音片段，响应于用户对联系人a的头像402的长按输入，可以转发提取出的联系人a的语音片段；同时，响应于用户对联系人b的头像403的点击输入，可以播放提取出的联系人b的语音片段，响应于用户对联系人b的头像403的长按输入，可以转发提取出的联系人b的语音片段。
55.在本技术实施例中，在从第一语音消息中，提取目标联系人的语音片段，得到目标语音片段之后，在会话界面的第一区域显示目标联系人的联系人标识，可以提示用户已从第一语音消息中提取出目标联系人的语音片段，并且，用户可以通过第一区域显示的目标联系人的联系人标识，对提取出的目标语音片段执行相应的处理，操作简单，可以提升用户的语音交互体验。
56.在本技术的一些实施例中，所述在所述第一语音消息关联的第一区域，显示所述目标联系人的联系人标识之后，该方法还可以包括：隐藏所述目标联系人的联系人标识，并在所述第一语音消息关联的第二区域显示第一标识，其中，所述第一标识用于指示所述第一语音消息中的至少一个语音片段已提取；在接收到用户对所述第一标识的第三输入的情况下，响应于所述第三输入，在所述会话界面的第一区域，显示所述目标联系人的联系人标识。
57.在本实施例中，第二区域是会话界面中与第一语音消息关联的区域。例如，第一语音消息所在的区域；还例如，第一语音消息的邻近区域。第二区域与第一区域不重叠。
58.第一标识可以用于指示第一语音消息中的至少一个语音片段已提取。也就是说，第一标识可以指示第一语音消息包括至少两个联系人的语音信息，且第一语音消息中目标联系人的语音片段已被提取，至少两个联系人中包括目标联系人。示例性地，第一标识可以是如图5所示标注有“混合”字样的标识。第一标识也可以是其他标识，例如，图形标识、颜色标识、号码标识等，具体的可以根据实际使用需求确定，本技术实施例对此不作限定。
59.第三输入可以是用于在第一区域显示目标联系人的联系人标识的输入。示例性地，第三输入可以是用户对第二区域显示的第一标识的点击输入，或者是用户输入的语音指令，或者是用户输入的特定手势，具体的可以根据实际使用需求确定，本技术实施例对此不做限定。本技术实施例中的特定手势可以为单击手势、滑动手势、拖动手势、压力识别手势、长按手势、面积变化手势、双按手势、双击手势中的任意一种；本技术实施例中的点击输入可以为单击输入、双击输入或任意次数的点击输入等，还可以为长按输入或短按输入。例如，第三输入具体可以是用户通过手指或手写笔等触控装置点击第二区域显示的第一标识的输入。
60.示例性地，请继续参见图5，其是本技术实施例的另一种会话界面的示意图。具体来讲，在电子设备的当前会话界面显示第一语音消息501，在从第一语音消息中提取出目标联系人的目标语音片段之后，随即在当前会话界面的第一区域显示目标联系人的联系人标识，例如，在第一语音消息501上显示联系人a的头像503和联系人b的头像504。之后，在用户离开当前会话界面或者提取出目标语音片段一定时间之后，隐藏目标联系人的联系人标识，即隐藏联系人a的头像503和联系人b的头像504，并相应地在第一语音消息上显示标注有“混合”的第一标识502。再之后，响应于用户对第一标识502的点击输入，在第一区域显示
目标联系人的联系人标识，即在第一语音消息501上显示联系人a的头像503和联系人b的头像504，以供用户通过联系人标识，播放或转发目标语音片段。需要说明的是，联系人标识可以是目标联系人的头像，也可以是目标联系人的昵称。
61.在本实施例中，在从第一语音消息中提取目标联系人的语音片段，并在第一语音消息关联的第一区域，显示目标联系人的联系人标识之后，可以隐藏目标联系人的联系人标识，并在第一语音消息关联的第二区域显示第一标识，这样，在从第一语音消息提取目标联系人的语音片段之后，通过第一标识对第一语音消息标记，可以区分第一语音消息和其他语音消息，方便用户快速找到第一语音消息。并且，在接收到用户对第一标识的第三输入的情况下，显示目标联系人的联系人标识，可以使得会话界面保持整洁，避免提取多个目标联系人的语音片段时，会话界面的显示内容过于繁杂，影响会话界面的显示效果。
62.在本技术的一些实施例中，在从所述第一语音消息中，提取所述目标联系人的语音片段，得到目标语音片段之后，该方法还可以包括：在目标联系人的联系人标识附近显示第二标识，第二标识用于指示目标联系人的语音片段已提取完成。第二标识例如可以是如图5所示的标识505。
63.在本实施例中，在目标联系人的语音片段提取结束时，可以在目标联系人的联系人标识附近显示第二标识，可以向用户显示提取进度，以提示用户可以对提取到的目标语音片段进行下一步操作。
64.在本技术的一些实施例中，在从所述第一语音消息中，提取所述目标联系人的语音片段，得到目标语音片段之后，该方法还可以包括：删除所述第一语音消息中的所述目标语音片段；更新所述第一语音消息的语音消息标识的显示参数；接收用户对更新显示参数后的所述语音消息标识的第四输入；响应于所述第四输入，播放所述第一语音消息。
65.在本实施例中，语音消息标识可以指示语音消息的时长。语音消息标识的显示参数可以包括语音消息标识的长度、面积、颜色等。更新第一语音消息的语音消息标识的显示参数，可以是更新第一语音消息的语音消息标识的长度，也可以是更新第一语音消息的语音消息标识的面积，也可以是更新第一语音消息的语音消息标识的颜色，本技术实施例对此不做具体限定。
66.在本实施例中，第四输入可以是对播放第一语音消息的输入，示例性地，第四输入可以是用户对更新显示参数后的语音消息标识的点击输入，或者是用户输入的语音指令，或者是用户输入的特定手势，具体的可以根据实际使用需求确定，本技术实施例对此不做限定。本技术实施例中的特定手势可以为单击手势、滑动手势、拖动手势、压力识别手势、长按手势、面积变化手势、双按手势、双击手势中的任意一种；本技术实施例中的点击输入可以为单击输入、双击输入或任意次数的点击输入等，还可以为长按输入或短按输入。例如，第四输入具体可以是用户通过手指或手写笔等触控装置点击更新显示参数后的语音消息标识的输入。
67.示例性地，会话界面显示的第一语音消息的时长为20s，如果从第一语音消息中提取出的目标语音片段的时长为6s，在从第一语音消息中提取目标联系人的目标语音片段之后，会话界面显示的第一语音消息的时长更新为14s。也就是说，在从第一语音消息中提取目标联系人的目标语音片段之后，第一语音消息的语音消息标识的显示长度减小。之后，在接收到用户对更新后的第一语音消息的语音消息标识的第四输入，播放已删除目标语音片
段后剩余的语音片段，即其余的14s语音片段。
68.在本实施例中，在从第一语音消息中，提取目标联系人的语音片段之后，删除第一语音消息中的目标语音片段，并更新第一语音消息的语音消息标识的显示参数，这样，用户可以分别对提取出的目标语音片段和剩余的语音片段执行相应的处理，并且，在用户需要提取其他目标联系人的语音片段时，可以减少比对的数据量，缩短处理时间，提高响应速度。
69.在本技术实施例中，接收用户对会话界面的第一语音消息和目标对象的第一输入，响应于第一输入，从第一语音消息中，提取目标对象指示的目标联系人的语音片段，得到目标语音片段，其中，第一语音消息包括至少两个联系人的语音信息，这样，可以根据用户的实际使用需求，从包括至少两个联系人的语音信息的第一语音消息中，提取出所需的目标联系人的语音片段，提取准确性高，操作简单。并且，用户可以对提取出目标语音片段执行相应的操作，也可以对提取处理后的第一语音消息执行相应的操作，交互方式更灵活。
70.需要说明的是，本技术实施例提供的语音消息处理方法，执行主体可以为语音消息处理装置，或者该语音消息处理装置中的用于执行语音消息处理的方法的控制模块。本技术实施例中以语音消息处理装置执行语音消息处理的方法为例，说明本技术实施例提供的语音消息处理的装置。
71.与上述实施例相对应，参见图6，本技术实施例还提供一种语音消息处理装置600，该语音消息处理装置600包括第一接收模块601和提取模块602。
72.该第一接收模块601，用于接收用户对会话界面的第一语音消息和目标对象的第一输入，其中，所述第一语音消息包括至少两个联系人的语音信息，所述至少两个联系人包括目标联系人，所述目标联系人为所述目标对象指示的联系人。
73.该提取模块602，用于响应于所述第一输入，从所述第一语音消息中，提取所述目标联系人的语音片段，得到目标语音片段。
74.在本技术实施例中，接收对会话界面的第一语音消息的第一输入，响应于第一输入，根据第一输入包括的目标对象的设定信息，从第一语音消息中提取目标对象的语音信息，这样，用户可以根据实际需要，从包含多人语音信息的第一语音消息中部分语音信息，使得用户可以对提取出的目标对象的语音信息进行相应操作，方便快捷。并且，用户可以选择播放包含多人语音信息的第一语音消息或者目标对象的语音信息，交互方式更灵活。
75.在本技术实施例中，接收用户对会话界面的第一语音消息和目标对象的第一输入，响应于第一输入，从第一语音消息中，提取目标对象指示的目标联系人的语音片段，得到目标语音片段，其中，第一语音消息包括至少两个联系人的语音信息，这样，可以根据用户的实际使用需求，从包括至少两个联系人的语音信息的第一语音消息中，提取出所需的目标联系人的语音片段，提取准确性高，操作简单。并且，用户可以对提取出目标语音片段执行相应的操作，也可以对经提取处理后的第一语音消息执行相应的操作，交互方式更灵活。
76.可选地，所述目标对象为所述目标联系人的联系人标识或所述目标联系人的第二语音消息；其中，所述联系人标识用于指示所述目标联系人的身份信息，所述第二语音消息为所述目标联系人的历史语音消息。
77.在本实施例中，可以通过目标联系人的联系人标识，从第一语音消息中提取目标
联系人的语音片段，也可以通过目标联系人的第二语音消息，从第一语音消息中提取目标联系人的语音片段，操作方式更灵活，可以快速提取目标联系人的语音片段。
78.可选地，所述目标对象为所述目标联系人的联系人标识，该第一接收模块601，具体用于接收用户对所述联系人标识和所述第一语音消息的输入；该提取模块602，包括：获取单元，用于获取所述联系人标识指示的目标联系人的第三语音消息，其中，所述第三语音消息为所述目标联系人的历史语音消息；第一确定单元，用于根据所述第三语音消息，确定所述目标联系人的语音特征；第一提取单元，用于从所述第一语音消息中，提取与所述语音特征匹配的语音片段，得到目标语音片段。
79.在本实施例中，在当前显示的会话界面不包括目标联系人的历史语音消息的情况下，通过用户对会话界面的联系人标识和第一语音消息的输入，可以获取联系人标识指示的目标联系人的语音特征，并从第一语音消息中提取与目标联系人的语音特征匹配的语音片段，得到目标语音片段，用户不需要查找目标联系人的历史语音消息，操作简便。并且，通过语音特征进行语音识别，可以提高语音识别的准确性。
80.可选地，所述目标对象为所述目标联系人的第二语音消息，该第一接收模块601，具体用于接收用户对所述第二语音消息和所述第一语音消息的输入；该提取模块602，包括：第二确定单元，用于根据所述第二语音消息，确定所述目标联系人的语音特征；第二提取单元，用于从所述第一语音消息中，提取与所述语音特征匹配的语音片段，得到目标语音片段。
81.在本实施例中，在当前显示的会话界面包括目标联系人的第二语音消息的情况下，用户通过对会话界面的目标联系人的第二语音消息和第一语音消息的输入，根据第二语音消息确定目标联系人的语音特征，并从第一语音消息中提取与目标联系人的语音特征匹配的语音片段，得到目标语音片段，这样，省去了从电子设备中获取目标联系人的历史语音消息的步骤，可以减少电子设备运算量，提高响应速度，可以快速提取目标语音片段。并且，通过语音特征进行语音识别，可以提高语音识别的准确性。
82.可选地，所述语音消息处理装置600，还包括：显示模块，用于在所述第一语音消息关联的第一区域，显示所述目标联系人的联系人标识；第二接收模块，用于接收对所述联系人标识的第二输入；控制模块，用于响应于所述第二输入，播放或者转发所述目标语音片段。
83.在本技术实施例中，在从第一语音消息中，提取目标联系人的语音片段，得到目标语音片段之后，在会话界面的第一区域显示目标联系人的联系人标识，可以提示用户已从第一语音消息中提取出目标联系人的语音片段，并且，用户可以通过第一区域显示的目标联系人的联系人标识，对提取出的目标语音片段执行相应的处理，操作简单，可以提升用户的语音交互体验。
84.可选地，显示模块，还用于：隐藏所述目标联系人的联系人标识，并在所述第一语音消息关联的第二区域显示第一标识，其中，所述第一标识用于指示所述第一语音消息中的至少一个语音片段已提取；在接收到用户对所述第一标识的第三输入的情况下，响应于所述第三输入，在所述会话界面的第一区域，显示所述目标联系人的联系人标识。
85.在本实施例中，在从第一语音消息中提取目标联系人的语音片段，并在第一语音消息关联的第一区域，显示目标联系人的联系人标识之后，可以隐藏目标联系人的联系人
标识，并在第一语音消息关联的第二区域显示第一标识，这样，在从第一语音消息提取目标联系人的语音片段之后，通过第一标识对第一语音消息标记，可以区分第一语音消息和其他语音消息，方便用户快速找到第一语音消息。并且，在接收到用户对第一标识的第三输入的情况下，显示目标联系人的联系人标识，可以使得会话界面保持整洁，避免提取多个目标联系人的语音片段时，会话界面的显示内容过于繁杂，影响会话界面的显示效果。
86.可选地，所述语音消息处理装置600，还包括：语音删除模块，用于删除所述第一语音消息中的所述目标语音片段；更新模块，用于更新所述第一语音消息的语音消息标识的显示参数；第三接收模块，用于接收用户对更新显示参数后的所述语音消息标识的第四输入；播放模块，用于响应于所述第四输入，播放所述第一语音消息。
87.在本实施例中，在从第一语音消息中，提取目标联系人的语音片段之后，删除第一语音消息中的目标语音片段，并更新第一语音消息的语音消息标识的显示参数，这样，用户可以分别对提取出的目标语音片段和剩余的语音片段执行相应的处理，并且，在用户需要提取其他目标联系人的语音片段时，可以减少比对的数据量，缩短处理时间，提高响应速度。
88.本技术实施例中的语音消息处理装置可以是装置，也可以是终端中的部件、集成电路、或芯片。该装置可以是移动电子设备，也可以为非移动电子设备。示例性的，移动电子设备可以为手机、平板电脑、笔记本电脑、掌上电脑、车载电子设备、可穿戴设备、超级移动个人计算机(ultra-mobile personal computer，umpc)、上网本或者个人数字助理(personal digital assistant，pda)等，本技术实施例不作具体限定。
89.本技术实施例中的语音消息处理装置可以为具有操作系统的装置。该操作系统可以为安卓(android)操作系统，可以为ios操作系统，还可以为其他可能的操作系统，本技术实施例不作具体限定。
90.本技术实施例提供的语音消息处理装置能够实现图1至图5的方法实施例实现的各个过程，为避免重复，这里不再赘述。
91.可选地，如图7所示，本技术实施例还提供一种电子设备700，包括处理器701，存储器702，存储在存储器702上并可在所述处理器701上运行的程序或指令，该程序或指令被处理器701执行时实现上述语音消息处理方法实施例的各个过程，且能达到相同的技术效果，为避免重复，这里不再赘述。
92.需要说明的是，本技术实施例中的电子设备包括上述所述的移动电子设备。
93.图8为实现本技术实施例的一种电子设备的硬件结构示意图。
94.该电子设备800包括但不限于：射频单元801、网络模块802、音频输出单元803、输入单元804、传感器805、显示单元806、用户输入单元807、接口单元808、存储器809、以及处理器810等部件。
95.本领域技术人员可以理解，电子设备800还可以包括给各个部件供电的电源(比如电池)，电源可以通过电源管理系统与处理器810逻辑相连，从而通过电源管理系统实现管理充电、放电、以及功耗管理等功能。图8中示出的电子设备结构并不构成对电子设备的限定，电子设备可以包括比图示更多或更少的部件，或者组合某些部件，或者不同的部件布置，在此不再赘述。
96.其中，用户输入单元807，用于接收用户对会话界面的第一语音消息和目标对象的
第一输入，其中，所述第一语音消息包括至少两个联系人的语音信息，所述至少两个联系人包括目标联系人，所述目标联系人为所述目标对象指示的联系人；处理器810，用于响应于所述第一输入，从所述第一语音消息中，提取所述目标联系人的语音片段，得到目标语音片段。
97.在本技术实施例中，接收用户对会话界面的第一语音消息和目标对象的第一输入，响应于第一输入，从第一语音消息中，提取目标对象指示的目标联系人的语音片段，得到目标语音片段，其中，第一语音消息包括至少两个联系人的语音信息，这样，可以根据用户的实际使用需求，从包括至少两个联系人的语音信息的第一语音消息中，提取出所需的目标联系人的语音片段，提取准确性高，操作简单。并且，用户可以对提取出目标语音片段执行相应的操作，也可以对经提取处理后的第一语音消息执行相应的操作，交互方式更灵活。
98.可选地，所述目标对象为所述目标联系人的联系人标识或所述目标联系人的第二语音消息；其中，所述联系人标识用于指示所述目标联系人的身份信息，所述第二语音消息为所述目标联系人的历史语音消息。
99.在本实施例中，可以通过目标联系人的联系人标识，从第一语音消息中提取目标联系人的语音片段，也可以通过目标联系人的第二语音消息，从第一语音消息中提取目标联系人的语音片段，操作方式更灵活，可以快速提取目标联系人的语音片段。
100.可选地，所述目标对象为所述目标联系人的联系人标识，用户输入单元807，具体用于接收用户对所述联系人标识和所述第一语音消息的输入；处理器810在从所述第一语音消息中，提取所述目标联系人的语音片段，得到目标语音片段时，用于：获取所述联系人标识指示的目标联系人的第三语音消息，其中，所述第三语音消息为所述目标联系人的历史语音消息；根据所述第三语音消息，确定所述目标联系人的语音特征；从所述第一语音消息中，提取与所述语音特征匹配的语音片段，得到目标语音片段。
101.在本实施例中，在当前显示的会话界面不包括目标联系人的历史语音消息的情况下，通过用户对会话界面的联系人标识和第一语音消息的输入，可以获取联系人标识指示的目标联系人的语音特征，并从第一语音消息中提取与目标联系人的语音特征匹配的语音片段，得到目标语音片段，用户不需要查找目标联系人的历史语音消息，操作简便。并且，通过语音特征进行语音识别，可以提高语音识别的准确性。
102.可选地，所述目标对象为所述目标联系人的第二语音消息，用户输入单元807，具体用于接收用户对所述第二语音消息和所述第一语音消息的输入；处理器810在从所述第一语音消息中，提取所述目标联系人的语音片段，得到目标语音片段时，用于：根据所述第二语音消息，确定所述目标联系人的语音特征；从所述第一语音消息中，提取与所述语音特征匹配的语音片段，得到目标语音片段。
103.在本实施例中，在当前显示的会话界面包括目标联系人的第二语音消息的情况下，用户通过对会话界面的目标联系人的第二语音消息和第一语音消息的输入，根据第二语音消息确定目标联系人的语音特征，并从第一语音消息中提取与目标联系人的语音特征匹配的语音片段，得到目标语音片段，这样，省去了从电子设备中获取目标联系人的历史语音消息的步骤，可以减少电子设备运算量，提高响应速度，可以快速提取目标语音片段。并且，通过语音特征进行语音识别，可以提高语音识别的准确性。
104.可选地，在所述从所述第一语音消息中，提取所述目标联系人的语音片段，得到目标语音片段之后，显示单元806，用于在所述第一语音消息关联的第一区域，显示所述目标联系人的联系人标识；用户输入单元807，还用于接收对所述联系人标识的第二输入；处理器810，还用于响应于所述第二输入，播放或者转发所述目标语音片段。
105.在本技术实施例中，在从第一语音消息中，提取目标联系人的语音片段，得到目标语音片段之后，在会话界面的第一区域显示目标联系人的联系人标识，可以提示用户已从第一语音消息中提取出目标联系人的语音片段，并且，用户可以通过第一区域显示的目标联系人的联系人标识，对提取出的目标语音片段执行相应的处理，操作简单，可以提升用户的语音交互体验。
106.可选地，在所述第一语音消息关联的第一区域，显示所述目标联系人的联系人标识之后，显示单元806，还用于：隐藏所述目标联系人的联系人标识，并在所述第一语音消息关联的第二区域显示第一标识，其中，所述第一标识用于指示所述第一语音消息中的至少一个语音片段已提取；在接收到用户对所述第一标识的第三输入的情况下，响应于所述第三输入，在所述会话界面的第一区域，显示所述目标联系人的联系人标识。
107.在本实施例中，在从第一语音消息中提取目标联系人的语音片段，并在第一语音消息关联的第一区域，显示目标联系人的联系人标识之后，可以隐藏目标联系人的联系人标识，并在第一语音消息关联的第二区域显示第一标识，这样，在从第一语音消息提取目标联系人的语音片段之后，通过第一标识对第一语音消息标记，可以区分第一语音消息和其他语音消息，方便用户快速找到第一语音消息。并且，在接收到用户对第一标识的第三输入的情况下，显示目标联系人的联系人标识，可以使得会话界面保持整洁，避免提取多个目标联系人的语音片段时，会话界面的显示内容过于繁杂，影响会话界面的显示效果。
108.可选地，在所述从所述第一语音消息中，提取所述目标联系人的语音片段，得到目标语音片段之后，处理器810，还用于：删除所述第一语音消息中的所述目标语音片段；更新所述第一语音消息的语音消息标识的显示参数；用户输入单元807，还用于接收用户对更新显示参数后的所述语音消息标识的第四输入；处理器810，还用于响应于所述第四输入，播放所述第一语音消息。
109.在本实施例中，在从第一语音消息中，提取目标联系人的语音片段之后，删除第一语音消息中的目标语音片段，并更新第一语音消息的语音消息标识的显示参数，这样，用户可以分别对提取出的目标语音片段和剩余的语音片段执行相应的处理，并且，在用户需要提取其他目标联系人的语音片段时，可以减少比对的数据量，缩短处理时间，提高响应速度。
110.应理解的是，本技术实施例中，输入单元804可以包括图形处理器(graphics processing unit，gpu)8041和麦克风8042，图形处理器8041对在视频捕获模式或图像捕获模式中由图像捕获装置(如摄像头)获得的静态图片或视频的图像数据进行处理。显示单元806可包括显示面板8061，可以采用液晶显示器、有机发光二极管等形式来配置显示面板8061。用户输入单元807包括触控面板8071以及其他输入设备8072。触控面板8071，也称为触摸屏。触控面板8071可包括触摸检测装置和触摸控制器两个部分。其他输入设备8072可以包括但不限于物理键盘、功能键(比如音量控制按键、开关按键等)、轨迹球、鼠标、操作杆，在此不再赘述。存储器809可用于存储软件程序以及各种数据，包括但不限于应用程序
和操作系统。处理器810可集成应用处理器和调制解调处理器，其中，应用处理器主要处理操作系统、用户界面和应用程序等，调制解调处理器主要处理无线通信。可以理解的是，上述调制解调处理器也可以不集成到处理器810中。
111.本技术实施例还提供一种可读存储介质，所述可读存储介质上存储有程序或指令，该程序或指令被处理器执行时实现上述语音消息处理方法实施例的各个过程，且能达到相同的技术效果，为避免重复，这里不再赘述。
112.其中，所述处理器为上述实施例中所述的电子设备中的处理器。所述可读存储介质，包括计算机可读存储介质，如计算机只读存储器(read-only memory，rom)、随机存取存储器(random access memory，ram)、磁碟或者光盘等。
113.本技术实施例另提供了一种芯片，所述芯片包括处理器和通信接口，所述通信接口和所述处理器耦合，所述处理器用于运行程序或指令，实现上述语音消息处理方法实施例的各个过程，且能达到相同的技术效果，为避免重复，这里不再赘述。
114.应理解，本技术实施例提到的芯片还可以称为系统级芯片、系统芯片、芯片系统或片上系统芯片等。
115.需要说明的是，在本文中，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下，由语句“包括一个
……”
限定的要素，并不排除在包括该要素的过程、方法、物品或者装置中还存在另外的相同要素。此外，需要指出的是，本技术实施方式中的方法和装置的范围不限按示出或讨论的顺序来执行功能，还可包括根据所涉及的功能按基本同时的方式或按相反的顺序来执行功能，例如，可以按不同于所描述的次序来执行所描述的方法，并且还可以添加、省去、或组合各种步骤。另外，参照某些示例所描述的特征可在其他示例中被组合。
116.通过以上的实施方式的描述，本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现，当然也可以通过硬件，但很多情况下前者是更佳的实施方式。基于这样的理解，本技术的技术方案本质上或者说对现有技术做出贡献的部分可以以计算机软件产品的形式体现出来，该计算机软件产品存储在一个存储介质(如rom/ram、磁碟、光盘)中，包括若干指令用以使得一台终端(可以是手机，计算机，服务器，或者网络设备等)执行本技术各个实施例所述的方法。
117.上面结合附图对本技术的实施例进行了描述，但是本技术并不局限于上述的具体实施方式，上述的具体实施方式仅仅是示意性的，而不是限制性的，本领域的普通技术人员在本技术的启示下，在不脱离本技术宗旨和权利要求所保护的范围情况下，还可做出很多形式，均属于本技术的保护之内。

再多了解一些

1/2 1 2 下一页尾页

本文用于企业家、创业者技术爱好者查询，结果仅供参考。

上一篇：返回列表
下一篇：CDN节点控制方法、装置、电子设备及可读存储介质与流程

语音消息处理方法、装置、电子设备及介质与流程

相关文献

最热文献