音频文件的展示方法、装置、计算机设备和存储介质与流程

2022-03-01 18:05:30 来源：中国专利 TAG：

1.本技术涉及计算机技术领域，特别是涉及一种音频文件的展示方法、装置、计算机设备和存储介质。

背景技术：

2.随着计算机技术的发展，5g时代的来临，互联网的出现给现代生活带来了极大的便利，越来越多的用户可以通过使用终端设备登录不同的应用程序获取多种类型的音频文件进行播放，如有声读物、fm(frequency modulation)调频广播、趣配音等应用软件，用户也可以通过终端设备录制自定义的音频文件，上传至不同的应用程序中，使得其他用户也可以收听该音频文件。
3.然而，目前的音频文件播放方式中，对于有声书、自定义广播音频等大型的音频文件和其他音频形式的媒体文件，如果用户想要听取特定片段的音频信息，通常需要一段一段地跳着听并验证新片段，确定哪些部分是用户想听的内容，户需要经过一系列的操作才能筛选出特定的音频内容，操作比较繁琐，需要耗费大量的时间。

技术实现要素：

4.基于此，有必要针对上述技术问题，提供一种能够简化操作的音频文件的展示方法、装置、计算机设备和存储介质。
5.一种音频文件的展示方法，所述方法包括：
6.当在播放音频文件的过程中检测到对播放进度条的触发操作时，获取所述触发操作在所述播放进度条中的触发位置；
7.根据所述触发位置确定所述音频文件的触发播放时刻，并根据所述触发播放时刻确定对应的目标时段；
8.从所述音频文件中获取所述目标时段对应的音频片段，将所述音频片段转换为对应的文本数据；
9.在所述触发位置展示所述文本数据。
10.在其中一个实施例中，所述在播放音频文件的过程中检测到对播放进度条的触发操作之前，所述方法还包括：
11.获取播放所述音频文件的应用程序标识；
12.根据所述应用程序标识获取所述播放进度条的总长度；
13.获取所述音频文件对应的时长信息；
14.将所述时长信息与所述播放进度条的总长度进行映射处理，得到对应的映射关系；
15.所述根据所述触发位置确定所述音频文件的触发播放时刻包括：
16.根据所述映射关系，确定所述触发位置对应的所述音频文件的触发播放时刻。
17.在其中一个实施例中，所述根据所述触发播放时刻确定对应的目标时段包括：
18.将所述触发播放时刻标记为所述目标时段对应的起始点；
19.获取所述起始点之后预设时长对应的所述音频文件的目标播放时刻，将所述目标播放时刻标记为所述目标时段对应的结束点。
20.在其中一个实施例中，所述根据所述触发播放时刻确定对应的目标时段包括：
21.将所述触发播放时刻标记为所述目标时段对应的结束点；
22.获取所述结束点之前预设时长对应的所述音频文件的目标播放时刻，将所述目标播放时刻标记为所述目标时段对应的起始点。
23.在其中一个实施例中，所述根据所述触发播放时刻确定对应的目标时段包括：
24.将所述触发播放时刻标记为所述目标时段中除首尾外的任意一点；
25.获取所述触发播放时刻之前第一预设时长对应的所述音频文件的第一播放时刻，将所述第一播放时刻标记为所述目标时段对应的起始点；
26.获取所述触发播放时刻之后第二预设时长对应的所述音频文件的第二播放时刻，将所述第二播放时刻标记为所述目标时段对应的结束点。
27.在其中一个实施例中，所述将所述音频片段转换为对应的文本数据之后，所述方法还包括：
28.根据所述文本数据，生成对应的缩略图；
29.所述在所述触发位置展示所述文本数据包括：
30.在所述触发位置将所述文本数据按照所述缩略图的方式进行展示。
31.在其中一个实施例中，所述将所述音频片段转换为对应的文本数据之后，所述方法还包括：
32.提取所述文本数据中的关键词信息；
33.根据所述关键词信息，生成与所述文本数据对应的摘要；
34.所述在所述触发位置展示所述文本数据包括：
35.在所述触发位置将所述文本数据对应的摘要按照所述缩略图的方式进行展示。
36.在其中一个实施例中，所述在所述触发位置展示所述文本数据包括：
37.获取播放所述音频文件的应用程序标识；
38.获取与所述应用程序标识对应的预设文本框展示样式；
39.在所述触发位置将所述文本数据按照所述预设文本框展示样式进行展示。
40.在其中一个实施例中，所述将所述音频片段转换为对应的文本数据之后，所述方法还包括：
41.获取与用户标识对应的语言类型偏好信息；
42.根据所述语言类型偏好信息，将所述文本数据转换为对应语言类型的文本数据；
43.在所述触发位置展示所述文本数据，包括：
44.在所述触发位置展示所述语言类型的文本数据。
45.一种音频文件的展示装置，所述装置包括：
46.获取模块，用于当在播放音频文件的过程中检测到对播放进度条的触发操作时，获取所述触发操作在所述播放进度条中的触发位置；
47.确定模块，用于根据所述触发位置确定所述音频文件的播放时刻，并根据所述播放时刻确定对应的目标时段；
48.转换模块，用于从所述音频文件中获取所述目标时段对应的音频片段，将所述音频片段转换为对应的文本数据；
49.展示模块，用于在所述触发位置展示所述文本数据。
50.一种计算机设备，包括存储器和处理器，所述存储器存储有计算机程序，所述处理器执行所述计算机程序时实现以下步骤：
51.当在播放音频文件的过程中检测到对播放进度条的触发操作时，获取所述触发操作在所述播放进度条中的触发位置；
52.根据所述触发位置确定所述音频文件的触发播放时刻，并根据所述触发播放时刻确定对应的目标时段；
53.从所述音频文件中获取所述目标时段对应的音频片段，将所述音频片段转换为对应的文本数据；
54.在所述触发位置展示所述文本数据。
55.一种计算机可读存储介质，其上存储有计算机程序，所述计算机程序被处理器执行时实现以下步骤：
56.当在播放音频文件的过程中检测到对播放进度条的触发操作时，获取所述触发操作在所述播放进度条中的触发位置；
57.根据所述触发位置确定所述音频文件的触发播放时刻，并根据所述触发播放时刻确定对应的目标时段；
58.从所述音频文件中获取所述目标时段对应的音频片段，将所述音频片段转换为对应的文本数据；
59.在所述触发位置展示所述文本数据。
60.上述音频文件的展示方法、装置、计算机设备和存储介质，当用户想要听取大型音频文件中特定片段的音频信息时，用户可以通过触发操作对应用程序显示界面中的播放进度条的位置进行移动，当在播放音频文件的过程中检测到对播放进度条的触发操作时，通过获取触发操作在播放进度条中的触发位置，根据触发位置确定音频文件的触发播放时刻，并根据触发播放时刻确定对应的目标时段。同时，从音频文件中获取目标时段对应的音频片段，将音频片段转换为对应的文本数据之后，在触发位置展示对应的文本数据，即可实现将播放进度条触发位置对应的目标时段内的音频片段转换为文本数据进行展示，避免了传统方式中繁琐的操作流程和耗费大量的时间，极大的简化了对音频文件筛选的操作流程，在不同类型的应用程序中能够将目标时段内的音频片段转换为文本数据进行直观展示，使得用户能够快速的筛选出特定的音频片段信息，同时也为用户提供了便捷。
附图说明
61.图1为一个实施例中音频文件的展示方法的应用环境图；
62.图2为一个实施例中音频文件的展示方法的流程示意图；
63.图3为一个实施例中根据触发播放时刻确定对应的目标时段步骤的流程示意图；
64.图4为另一个实施例中根据触发播放时刻确定对应的目标时段步骤的流程示意图；
65.图5为另一个实施例中根据触发播放时刻确定对应的目标时段步骤的流程示意
图；
66.图6a为另一个实施例中音频文件的展示方法的流程示意图；
67.图6b为一个实施例中音频列表的界面显示图；
68.图6c为一个实施例中播放音频文件的界面显示图；
69.图7为一个实施例中音频文件的展示装置的结构框图；
70.图8为一个实施例中计算机设备的内部结构图。
具体实施方式
71.为了使本技术的目的、技术方案及优点更加清楚明白，以下结合附图及实施例，对本技术进行进一步详细说明。应当理解，此处描述的具体实施例仅仅用以解释本技术，并不用于限定本技术。
72.本技术提供的音频文件的展示方法，可以应用于如图1所示的应用环境中。其中，终端102通过网络与服务器104通过网络进行通信。终端102可以通过向服务器104发送请求，从服务器104获取对应的音频文件。当终端102在播放音频文件的过程中检测到对播放进度条的触发操作时，终端102获取触发操作在播放进度条中的触发位置。终端102根据触发位置确定音频文件的触发播放时刻，并根据触发播放时刻确定对应的目标时段。终端102从音频文件中获取目标时段对应的音频片段，终端102将音频片段转换为对应的文本数据，在触发位置展示文本数据。其中，终端102可以但不限于是各种个人计算机、笔记本电脑、智能手机、平板电脑和便携式可穿戴设备，服务器104可以用独立的服务器或者是多个服务器组成的服务器集群来实现。
73.在一个实施例中，如图2所示，提供了一种音频文件的展示方法，以该方法应用于图1中的终端为例进行说明，包括以下步骤：
74.步骤202，当在播放音频文件的过程中检测到对播放进度条的触发操作时，获取触发操作在播放进度条中的触发位置。
75.移动终端是一类嵌入式计算机系统设备，软件结构可以分为系统软件和应用软件。在移动终端的软件结构中，系统软件主要是操作系统和中间件，常见的移动终端操作系统有苹果的ios、谷歌的android、惠普的webos及微软windows等。使用不同操作系统移动终端的用户均可以通过移动终端中的应用市场界面下载多种类型的多媒体播放应用程序，例如目前常见的多媒体播放应用程序包括但不限于fm(frequency modulation)调频广播、趣配音、斗鱼直播、虎牙直播和有声读物等，且均支持自定义上传或下载多媒体文件的功能。
76.具体的，用户可以通过点击移动终端设备主界面中的某个特定的多媒体播放应用程序，启动该应用程序，并进入该应用程序对应的播放页面中。在应用程序的播放界面中，可以显示预先设置的菜单列表，快进或者暂停按钮以及播放文件时对应的播放进度条。用户可以上传自定义的音频文件至移动终端设备本地文件中，用户也可以通过触发操作发起音频文件获取请求，从服务器的数据库中获取对应的音频文件。用户可在已登录的某应用程序对应的菜单列表中选取特定的音频文件进行播放，同时，用户也可以对当前播放的音频文件进行一系列的菜单操作，例如，用户可以通过点击当前音频播放界面中的快进或者快退按钮，控制当前音频文件的播放进度。用户也可以通过滑动当前音频播放界面中的亮度调节、声音调节图标，控制当前音频播放界面的亮度和音量。当终端在播放音频文件的过
程中检测到用户对播放进度条的触发操作时，终端可以获取该触发操作在该应用程序播放界面的播放进度条中对应的触发位置。其中，播放进度条是指一种展示在播放控制界面中的图标，用户可以通过拖动播放进度条来调节多媒体文件的播放进度。播放进度条主要由如下部分组成：播放进度条左边的时间用于表示已经播放的时间长度，播放进度条右边的时间用于表示音频文件对应的总时间长度。触发操作是指用户通过预设手势、点击、长按等一系列操作触发对应的事件。用户可以在不同播放应用程序的控制面板中预先设置与播放进度条对应的不同触发操作的功能，例如，可以设置单击播放进度条的操作触发暂停播放当前文件，双击播放进度条的操作触发从当前播放文件跳转至下一个播放文件等。用户可以将鼠标图标悬停在播放进度条中的某个位置上，则终端在播放音频文件的过程中检测到该用户对播放进度条的触发操作时，终端可以获取该触发操作在播放进度条中对应的触发位置，即终端可以获取鼠标图标悬停在播放进度条中某个位置对应的坐标，触发位置是指用户的操作触发对应事件的位置，上述该鼠标图标悬停在播放进度条中某个位置即为该用户触发操作对应的触发位置。
77.步骤204，根据触发位置确定音频文件的触发播放时刻，并根据触发播放时刻确定对应的目标时段。
78.当终端在播放音频文件的过程中检测到对播放进度条的触发操作时，终端获取触发操作在播放进度条中的触发位置之后，终端根据触发位置确定音频文件的触发播放时刻，并根据触发播放时刻确定对应的目标时段。其中，触发播放时刻是指在播放进度条中触发位置对应的音频文件的播放时刻。在应用程序中播放音频文件时，终端可以通过调用预设控件对该音频文件的总时长和播放进度条的总长度进行映射处理。例如，用户可以拖动播放进度条至任意位置处，终端可以利用预设控件计算上述拖动后的播放进度条对应的已播放音频的时长，并计算已播放音频时长在该音频文件总时长中所占的百分比，终端根据已播放音频时长所占的百分比，在该拖动播放进度条的位置处显示该音频对应的播放时刻。当用户将鼠标图标悬停在播放进度条上的某个位置时，在该位置对应的上方或下方会显示该音频文件对应的播放时刻。目标时段是指音频文件中特定音频片段对应的音频时段，在不同应用程序中，可以预先设置播放音频文件时计算目标时段对应的算法规则。例如，在播放音频文件的过程中，当用户将鼠标图标悬停在播放进度条中的某个位置时，终端可以获取该触发事件在播放进度条中的触发位置，终端根据该触发位置获取此时音频文件对应的触发播放时刻为1：30s，则终端可以根据预设算法规则，计算与该触发播放时刻1：30s对应目标时段的起始点和结束点，得到与该触发播放时刻1：30s对应的目标时段。
79.步骤206，从音频文件中获取目标时段对应的音频片段，将音频片段转换为对应的文本数据。
80.终端根据触发位置确定音频文件的触发播放时刻，并根据触发播放时刻确定对应的目标时段之后，终端可以从音频文件中获取目标时段对应的音频片段，并将音频片段转换为对应的文本数据。其中，音频片段是指音频文件中的部分音频内容，可以包括与目标时长对应的音频数据。文本数据是指不能参与算术运算的任何字符，也称为字符型数据。如英文字母、汉字、不作为数值使用的数字(以单引号开头)和其他可输入的字符。终端可以利用预设的多种识别模型将音频片段中的音频数据转化为对应文本数据。例如，终端可以从音频文件中获取目标时段对应的音频片段，终端利用语音转文字的ml(machine learning)机
器学习模型将音频片段中的音频数据转换为文本格式，其中，ml模型即为机器学习模型，可以包括多种类型的机器学习模型，如可以为预先训练好的神经网络识别模型等。
81.步骤208，在触发位置展示文本数据。
82.终端从音频文件中获取目标时段对应的音频片段，并将音频片段转换为对应的文本数据之后，终端可以在播放进度条对应的触发位置展示对应的文本数据。其中，终端可以根据用户偏好信息设置对应的展示样式以及将文本数据转换为不同语言类型的文本信息进行展示。例如，终端可以提取文本数据中的关键信息，生成对应的文本摘要，并将该文本摘要在播放进度条对应的触发位置处按照预设展示样式进行展示。
83.本实施例中，当用户想要听取大型音频文件中特定片段的音频信息时，用户可以通过触发操作对应用程序显示界面中的播放进度条的位置进行移动，当在播放音频文件的过程中检测到对播放进度条的触发操作时，通过获取触发操作在播放进度条中的触发位置，根据触发位置确定音频文件的触发播放时刻，并根据触发播放时刻确定对应的目标时段。同时，从音频文件中获取目标时段对应的音频片段，将音频片段转换为对应的文本数据之后，在触发位置展示对应的文本数据，即可实现将播放进度条触发位置对应的目标时段内的音频片段转换为文本数据进行展示，避免了传统方式中繁琐的操作流程和耗费大量的时间，极大的简化了对音频文件筛选的操作流程，在不同类型的应用程序中能够将目标时段内的音频片段转换为文本数据进行直观展示，使得用户能够快速的筛选出特定的音频片段信息，同时也为用户提供了便捷。
84.在一个实施例中，在播放音频文件的过程中检测到对播放进度条的触发操作之前，该方法还包括将时长信息与播放进度条的总长度进行映射处理的步骤，具体包括：
85.获取播放音频文件的应用程序标识。
86.根据应用程序标识获取播放进度条的总长度。
87.获取音频文件对应的时长信息。
88.将时长信息与播放进度条的总长度进行映射处理，得到对应的映射关系。
89.当终端在播放音频文件的过程中检测到对播放进度条的触发操作之前，终端可以获取用户选取的播放音频文件对应的应用程序标识，终端根据应用程序标识获取该应用程序显示界面中播放进度条的总长度。终端获取当前需要播放的音频文件对应的时长信息。终端可以利用预设ai(artificial intelligence)模型即人工智能模型，将音频文件的时长信息与该应用程序中播放进度条的总长度进行映射处理，得到对应的映射关系。当终端在播放音频文件的过程中检测到用户对播放进度条的触发操作时，则终端可以根据该映射关系，确定用户触发操作的位置对应的音频文件的播放时刻。例如，当用户上传某个自定义录制的音频文件至调频广播应用程序中时，则终端可以获取用户选取的调频广播应用程序标识，如该应用程序图标或标识号等。终端根据该调频广播应用程序标识获取该应用程序显示界面中播放进度条的总长度。同时，终端获取用户自定义上传的音频文件对应的时长信息，终端可以利用预先训练好的神经网络模型，对上述自定义音频文件的时长信息和该调频广播应用程序显示界面中播放进度条的总长度进行映射处理，得到对应的映射关系。即终端可以根据不同应用程序对应的不同显示界面，将需要播放的音频文件的总时长与该应用程序的播放进度条的总长度进行映射处理，使得用户拖动该应用程序中的播放进度条时，可以在播放进度条对应的位置显示该音频文件对应的播放时刻，便于用户直观获取当
前音频文件的播放进度信息。进一步的，当终端在播放该音频文件的过程中检测到用户对播放进度条的触发操作时，则终端获取该触发操作在播放进度条中的触发位置。终端可以根据已建立的映射关系，确定该触发位置对应的音频文件的播放时刻，并在播放进度条的左边出显示该音频文件对应的已播放时长。本实施例中，通过将音频文件和应用程序播放界面中的播放进度条进行映射处理，由此使得，用户将鼠标悬停在播放进度条中的某个位置时，相应位置就会显示该音频文件对应的播放时刻以及对应的文字片段提示，便于用户直观获取当前音频文件的播放信息。
90.在一个实施例中，如图3所示，根据触发播放时刻确定对应的目标时段的步骤包括：
91.步骤302，将触发播放时刻标记为目标时段对应的起始点。
92.步骤304，获取起始点之后预设时长对应的音频文件的目标播放时刻，将目标播放时刻标记为目标时段对应的结束点。
93.终端在播放音频文件的过程中可以实时监测是否存在对播放进度条的触发操作，当终端获取触发操作在播放进度条中的触发位置之后，终端可以根据触发位置确定音频文件的触发播放时刻，并根据触发播放时刻确定对应的目标时段。具体的，终端可以按照预设的目标时段计算规则，终端将触发操作对应的触发播放时刻标记为目标时段对应的起始点。终端获取起始点之后预设时长对应的音频文件的目标播放时刻，并将该目标播放时刻标记为目标时段对应的结束点。例如，用户可以预先设置目标时段计算规则，如预设时长为3min，则终端根据预设计算规则，将触发操作对应的触发播放时刻1：30s标记为目标时段对应的起始点，终端获取起始点1：30s之后3min对应的音频文件的目标播放时刻为4：30s，则终端将该目标播放时刻4：30s标记为目标时段对应的结束点，即该触发播放时刻对应的目标时段为1：30s-4：30s。本实施例中，通过预设目标时段的计算规则，使得用户将鼠标悬停在播放进度条中的某个位置时，相应位置就会显示下一时段将要播放的音频数据对应的文字片段提示，便于用户直观的了解即将播放的音频段落中对应的内容。
94.在其中一个实施例中，如图4所示，根据触发播放时刻确定对应的目标时段的步骤包括：
95.步骤402，将触发播放时刻标记为目标时段对应的结束点。
96.步骤404，获取结束点之前预设时长对应的音频文件的目标播放时刻，将目标播放时刻标记为目标时段对应的起始点。
97.当终端获取触发操作在播放进度条中的触发位置之后，终端根据触发位置确定音频文件的触发播放时刻，并根据触发播放时刻确定对应的目标时段。具体的，终端可以按照预设的目标时段计算规则，终端将触发操作对应的触发播放时刻标记为目标时段对应的结束点。终端可以获取该结束点之前预设时长对应的音频文件的目标播放时刻，并将该目标播放时刻标记为目标时段对应的起始点。例如，用户可以预先设置目标时段计算规则，如预设时长为1min，则终端根据预设计算规则，将触发操作对应的触发播放时刻1：30s标记为目标时段对应的结束点，终端获取结束点1：30s之前1min对应的音频文件的目标播放时刻为0：30s，则终端将该目标播放时刻0：30s标记为目标时段对应的起始点，即该触发播放时刻对应的目标时段为0：30s-1：30s。由此使得，当用户将鼠标悬停在播放进度条中触发播放时刻为1：30s时的播放位置时，该位置就会显示0：30s-1：30s的音频数据对应的文字片段提
示，便于用户直观的了解该播放时刻之前的音频段落中对应的内容，使得用户能够快速的筛选出特定的音频片段信息，避免了传统方式中繁琐的操作流程和耗费大量的时间，极大的简化了对音频文件筛选的操作流程。
98.在一个实施例中，如图5所示，根据触发播放时刻确定对应的目标时段的步骤包括：
99.步骤502，将触发播放时刻标记为目标时段中除首尾外的任意一点。
100.步骤504，获取触发播放时刻之前第一预设时长对应的音频文件的第一播放时刻，将第一播放时刻标记为目标时段对应的起始点。
101.步骤506，获取触发播放时刻之后第二预设时长对应的音频文件的第二播放时刻，将第二播放时刻标记为目标时段对应的结束点。
102.当终端获取触发操作在播放进度条中的触发位置之后，终端根据触发位置确定音频文件的触发播放时刻，并根据触发播放时刻确定对应的目标时段。具体的，终端可以按照预设的目标时段计算规则，终端将触发操作对应的触发播放时刻标记为目标时段中除首尾外的任意一点。终端可以获取该取触发播放时刻之前第一预设时长对应的音频文件的第一播放时刻，并将第一播放时刻标记为目标时段对应的起始点。终端还可以获取该触发播放时刻之后第二预设时长对应的音频文件的第二播放时刻，并将第二播放时刻标记为目标时段对应的结束点。例如，用户可以预先设置目标时段计算规则，如第一预设时长为1min，第二预设时长为2min，则终端根据预设计算规则，终端将触发操作对应的触发播放时刻1：30s标记为目标时段中除首尾外的任意一点，终端获取该触发播放时刻1：30s之前第一预设时长1min对应的音频文件的第一播放时刻为0：30s，终端将该第一播放时刻1：30s标记为目标时段对应的起始点。进一步的，终端获取该触发播放时刻1：30s之后第二预设时长2min对应的音频文件的第二播放时刻为3：30s，终端将该第二播放时刻3：30s标记为目标时段对应的结束点，即该触发播放时刻对应的目标时段为0：30s-3：30s。由此使得当用户将鼠标悬停在播放进度条中触发播放时刻为1：30s时的播放位置时，该位置就会显示0：30s-3：30s的音频数据对应的文字片段提示，使得用户能够快速的筛选出特定的音频片段信息，避免了传统方式中繁琐的操作流程和耗费大量的时间，极大的简化了对音频文件筛选的操作流程。
103.在一个实施例中，如图6a所示，提供了一种音频文件的展示方法，以该方法应用于图1中的终端为例进行说明，包括以下步骤：
104.步骤602，当在播放音频文件的过程中检测到对播放进度条的触发操作时，获取触发操作在播放进度条中的触发位置。
105.步骤604，根据触发位置确定音频文件的触发播放时刻，将触发播放时刻标记为目标时段对应的起始点。
106.步骤606，获取起始点之后预设时长对应的音频文件的目标播放时刻，将目标播放时刻标记为目标时段对应的结束点。
107.步骤608，从音频文件中获取目标时段对应的音频片段，将音频片段转换为对应的文本数据。
108.步骤610，提取文本数据中的关键词信息。
109.步骤612，根据关键词信息，生成与文本数据对应的摘要。
110.步骤614，在触发位置将文本数据对应的摘要按照缩略图的方式进行展示。
111.用户可以通过点击移动终端设备主界面中的某个特定的多媒体播放应用程序，启动该应用程序，并进入该应用程序对应的主页中。在应用程序的主界面中，用户可以通过触发操作进入与用户标识对应的音频列表显示界面中，如图6b所示，该界面图中可以显示与用户标识对应的自定义音频列表。用户可以通过点击界面中的上传图标，上传自定义的音频文件至移动终端设备本地文件中，用户也可以通过点击该界面中的下载图标，发起音频文件获取请求，从服务器的数据库中下载对应的音频文件。用户可在已登录的该应用程序对应的音频列表中选取特定的音频文件进行播放，例如，当用户点击菜单项“我喜欢的音频”中的英语听力01时，则触发跳转至对应的播放界面中，播放该音频文件的界面显示图，如图6c示，用户可以将鼠标图标悬停在播放进度条中的某个位置上，终端在播放音频文件的过程中检测到用户对播放进度条的上述触发操作时，则终端可以获取该触发操作在播放进度条中的触发位置，即终端可以获取鼠标图标悬停在播放进度条中某个位置对应的坐标，该位置对应的坐标即为触发位置坐标。用户可以预先设置目标时段计算规则，如预设时长为10min，终端可以根据该触发位置获取音频文件对应的触发播放时刻，如终端获取该音频文件对应的触发播放时刻为2：30s，则终端按照预先目标时段计算规则，将该音频文件对应的触发播放时刻2：30s标记为目标时段对应的起始点。终端获取该起始点之后预设时长10min对应的音频文件的目标播放时刻为12：30s，则终端将该目标播放时刻12：30s标记为目标时段对应的结束点，即该触发播放时刻对应的目标时段为2：30s-12：30s。终端从音频文件中获取该目标时段2：30s-12：30s对应的音频片段，终端利用预设神经网络模型将上述2：30s-12：30s的音频片段转换为对应的文本数据。进一步的，终端可以提取上述文本数据中的关键词信息，终端可以根据所提取的关键词信息，生成与该文本数据对应的摘要。在播放该音频文件的播放进度条对应的触发位置处，终端将该文本数据对应的摘要按照预设缩略图的方式进行展示。由此使得当用户将鼠标悬停在音频进度条上时，会显示对应的文本格式的缩略图，使得用户能够快速的筛选出特定的音频片段信息，直接跳转到与缩略图对应的音频段落，避免了传统方式中繁琐的操作流程和耗费大量的时间，极大的简化了对音频文件筛选的操作流程。
112.在其中一个实施例中，在触发位置展示文本数据的步骤包括：
113.获取播放音频文件的应用程序标识。
114.获取与应用程序标识对应的预设文本框展示样式。
115.在触发位置将文本数据按照预设文本框展示样式进行展示。
116.终端利用预设神经网络模型将目标时段对应的音频片段转换为对应的文本数据之后，终端可以获取用户选取的播放音频文件的应用程序标识，终端还可以获取与该应用程序标识对应的预设文本框展示样式，如预设文本框展示样式为心形、圆形、椭圆形以及自定义图形等。终端在播放该音频文件的播放界面中的触发位置处，将该文本数据按照预设文本框展示样式进行展示。例如，终端利用预设神经网络模型将上述2：30s-12：30s的音频片段转换为对应的文本数据之后，终端可以获取播放音频文件的应用程序标识，终端还可以获取与该应用程序标识对应的预设文本框展示样式为圆形，则终端在播放该音频文件的播放界面中的触发位置处，将该文本数据按照预设的圆形文本框展示样式进行展示。若该文本数据对应的字节数超过了预设的圆形文本框所能容纳的字节数，则终端可以提取上述文本数据中的关键词信息，终端可以根据所提取的关键词信息，生成与该文本数据对应的
摘要。在播放该音频文件的播放进度条对应的触发位置处，终端将该文本数据对应的摘要按照预设的圆形文本框展示样式进行展示。由此使得当用户将鼠标悬停在音频进度条上时，会显示对应音频片段的文本摘要，使得用户能够根据文本摘要快速的筛选出特定的音频片段，直接跳转到对应的音频段落，避免了传统方式中繁琐的操作流程和耗费大量的时间，极大的简化了对音频文件筛选的操作流程。
117.在其中一个实施例中，将音频片段转换为对应的文本数据之后，该方法还包括将文本数据转换为对应语言类型的文本数据的步骤包括：
118.获取与用户标识对应的语言类型偏好信息。
119.根据语言类型偏好信息，将文本数据转换为对应语言类型的文本数据。
120.终端利用预设神经网络模型将目标时段对应的音频片段转换为对应的文本数据之后，终端可以获取与该用户标识对应的语言类型偏好信息，终端可以根据语言类型偏好信息，将文本数据转换为对应语言类型的文本数据，并在播放该音频文件的播放进度条对应的触发位置处，将该文本数据按照缩略图的方式进行展示。例如，用户可以通过用户名和密码的方式登录不同类型的应用程序，在应用程序对应的用户设置界面中，用户可以输入自定义设置的偏好信息，例如，某学校的交流学生来自英国，则该交流学生可以在用户设置界面中，输入自定义设置的语言类型偏好信息为英语，当该交流学生选取某个应用程序播放音频文件时，终端利用预设神经网络模型将目标时段对应的音频片段转换为对应的文本数据之后，终端可以获取与该交流学生用户标识对应的语言类型偏好信息为英语，则终端可以根据语言类型偏好信息，将文本数据转换为对应英文文本格式，并该播放进度条对应的触发位置处，终端将该英文文本数据按照缩略图的方式进行展示。由此使得当用户将鼠标悬停在音频进度条上时，会显示与用户语言偏好信息对应语言类型的文本摘要，使得用户能够根据偏好的语言类型的文本摘要快速的筛选出特定的音频片段，直接跳转到对应的音频段落，避免了传统方式中繁琐的操作流程和耗费大量的时间，极大的简化了对音频文件筛选的操作流程。
121.应该理解的是，虽然图1-6的流程图中的各个步骤按照箭头的指示依次显示，但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明，这些步骤的执行并没有严格的顺序限制，这些步骤可以以其它的顺序执行。而且，图1-6中的至少一部分步骤可以包括多个步骤或者多个阶段，这些步骤或者阶段并不必然是在同一时刻执行完成，而是可以在不同的时刻执行，这些步骤或者阶段的执行顺序也不必然是依次进行，而是可以与其它步骤或者其它步骤中的步骤或者阶段的至少一部分轮流或者交替地执行。
122.在一个实施例中，如图7所示，提供了一种音频文件的展示装置，包括：获取模块702、确定模块704、转换模块706和展示模块708，其中：
123.获取模块702，用于当在播放音频文件的过程中检测到对播放进度条的触发操作时，获取触发操作在播放进度条中的触发位置。
124.确定模块704，用于根据触发位置确定音频文件的播放时刻，并根据播放时刻确定对应的目标时段。
125.转换模块706，用于从音频文件中获取目标时段对应的音频片段，将音频片段转换为对应的文本数据。
126.展示模块708，用于在触发位置展示文本数据。
127.在一个实施例中，该装置还包括：处理模块。
128.获取模块还用于获取播放音频文件的应用程序标识，根据应用程序标识获取播放进度条的总长度，获取音频文件对应的时长信息。处理模块用于将时长信息与播放进度条的总长度进行映射处理，得到对应的映射关系。确定模块还用于根据映射关系，确定触发位置对应的音频文件的触发播放时刻。
129.在一个实施例中，该装置还包括：标记模块。
130.标记模块用于将触发播放时刻标记为目标时段对应的起始点，获取起始点之后预设时长对应的音频文件的目标播放时刻，将目标播放时刻标记为目标时段对应的结束点。
131.在一个实施例中，标记模块还用于将触发播放时刻标记为目标时段对应的结束点，获取结束点之前预设时长对应的音频文件的目标播放时刻，将目标播放时刻标记为目标时段对应的起始点。
132.在一个实施例中，标记模块还用于将触发播放时刻标记为目标时段中除首尾外的任意一点，获取触发播放时刻之前第一预设时长对应的音频文件的第一播放时刻，将第一播放时刻标记为目标时段对应的起始点；获取触发播放时刻之后第二预设时长对应的音频文件的第二播放时刻，将第二播放时刻标记为目标时段对应的结束点。
133.在一个实施例中，该装置还包括：提取模块和生成模块。
134.提取模块用于提取文本数据中的关键词信息。生成模块用于根据关键词信息，生成与文本数据对应的摘要。展示模块还用于在触发位置将文本数据对应的摘要按照缩略图的方式进行展示。
135.在一个实施例中，获取模块还用于获取播放音频文件的应用程序标识，获取与应用程序标识对应的预设文本框展示样式。转换模块还用于根据语言类型偏好信息，将文本数据转换为对应语言类型的文本数据。展示模块还用于在触发位置将文本数据按照预设文本框展示样式进行展示。
136.在一个实施例中，获取模块还用于获取与用户标识对应的语言类型偏好信息。展示模块还用于在触发位置展示语言类型的文本数据。
137.关于音频文件的展示装置的具体限定可以参见上文中对于音频文件的展示方法的限定，在此不再赘述。上述音频文件的展示装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中，也可以以软件形式存储于计算机设备中的存储器中，以便于处理器调用执行以上各个模块对应的操作。
138.在一个实施例中，提供了一种计算机设备，该计算机设备可以是终端，其内部结构图可以如图8所示。该计算机设备包括通过系统总线连接的处理器、存储器、通信接口、显示屏和输入装置。其中，该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统和计算机程序。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的通信接口用于与外部的终端进行有线或无线方式的通信，无线方式可通过wifi、运营商网络、nfc(近场通信)或其他技术实现。该计算机程序被处理器执行时以实现一种音频文件的展示方法。该计算机设备的显示屏可以是液晶显示屏或者电子墨水显示屏，该计算机设备的输入装置可以是显示屏上覆盖的触摸层，也可以是计算机设备外壳上设置的按
键、轨迹球或触控板，还可以是外接的键盘、触控板或鼠标等。
139.本领域技术人员可以理解，图8中示出的结构，仅仅是与本技术方案相关的部分结构的框图，并不构成对本技术方案所应用于其上的计算机设备的限定，具体的计算机设备可以包括比图中所示更多或更少的部件，或者组合某些部件，或者具有不同的部件布置。
140.在一个实施例中，提供了一种计算机设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，处理器执行计算机程序时实现上述各个方法实施例的步骤。
141.本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程，是可以通过计算机程序来指令相关的硬件来完成，所述的计算机程序可存储于一非易失性计算机可读取存储介质中，该计算机程序在执行时，可包括如上述各方法的实施例的流程。其中，本技术所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用，均可包括非易失性和易失性存储器中的至少一种。非易失性存储器可包括只读存储器(read-only memory，rom)、磁带、软盘、闪存或光存储器等。易失性存储器可包括随机存取存储器(random access memory，ram)或外部高速缓冲存储器。作为说明而非局限，ram可以是多种形式，比如静态随机存取存储器(static random access memory，sram)或动态随机存取存储器(dynamic random access memory，dram)等。
142.以上实施例的各技术特征可以进行任意的组合，为使描述简洁，未对上述实施例中的各个技术特征所有可能的组合都进行描述，然而，只要这些技术特征的组合不存在矛盾，都应当认为是本说明书记载的范围。
143.以上所述实施例仅表达了本技术的几种实施方式，其描述较为具体和详细，但并不能因此而理解为对发明专利范围的限制。应当指出的是，对于本领域的普通技术人员来说，在不脱离本技术构思的前提下，还可以做出若干变形和改进，这些都属于本技术的保护范围。因此，本技术专利的保护范围应以所附权利要求为准。

再多了解一些

1/2 1 2 下一页尾页

本文用于企业家、创业者技术爱好者查询，结果仅供参考。

上一篇：返回列表
下一篇：交互式动态流体效果处理方法、装置及电子设备与流程

音频文件的展示方法、装置、计算机设备和存储介质与流程

相关文献

最热文献