字幕显示方法、浏览器及存储介质和终端设备与流程

2022-02-22 05:59:20 来源：中国专利 TAG：

1.本发明涉及基于人工智能的信息处理技术领域，特别涉及字幕显示方法、浏览器及存储介质和终端设备。

背景技术：

2.字幕是指以文字形式显示电视剧、电影、综艺、新闻和动漫等视频中的对话等非影像内容，也泛指影视作品后期加工的文字，在电影银幕或电视机屏幕下方出现的解说文字以及种种文字，如影片的片名、演职员表、唱词、对白、说明词以有人物介绍、地名和年代等都称为字幕。
3.一般情况下，视频包括的音频内容以字幕方式显示，使得字幕文字的显示和音频内容的显示同步，其中，字幕文字的内容可以与音频内容一致，也可以为音频内容的翻译文字，比如音频内容的语言为英语，字幕文字可以为对应的中文字幕，方便不懂视频中音频内容的用户了解视频内容。
4.目前，外文视频对应的中文字幕一般由专门的翻译、后期整合到视频文件中，但是限于人力和版权等问题，导致对外文视频的翻译数量有限以及发行的渠道有局限，这样，观看用户只能被动地等待翻译好的外文视频的发行，不能满足用户了解外文视频的需求。

技术实现要素：

5.本发明实施例提供字幕显示方法、浏览器及存储介质和终端设备，实现了通过字幕转换模型进行字幕实时转换。
6.本发明实施例一方面提供一种字幕显示方法，包括：
7.当前网页进程确定要将目标视频中的已有字幕转换为新字幕，所述已有字幕对应的第一语言类型与新字幕对应的第二语言类型不相同；
8.所述当前网页进程获取字幕转换模型；
9.当通过所述字幕转换模型将所述已有字幕转换为新字幕时，所述当前网页进程将字幕事件对象传送给浏览器主进程；
10.当所述浏览器主进程根据所述字幕事件对象确定所述新字幕的显示时间到达时，通知所述当前网页进程在所述目标视频的显示界面显示所述新字幕。
11.本发明实施例另一方面还提供一种浏览器，包括：
12.转换确定单元，用于确定要将目标视频中的已有字幕转换为新字幕，所述已有字幕对应的第一语言类型与新字幕对应的第二语言类型不相同；
13.模型单元，用于获取字幕转换模型；
14.转换单元，用于通过所述字幕转换模型将所述已有字幕转换为新字幕，将字幕事件对象传送给浏览器主进程，当所述浏览器主进程根据所述字幕事件对象确定所述新字幕的显示时间到达时，通知显示单元进行字幕显示；
15.显示单元，用于在所述目标视频的显示界面显示所述新字幕。
16.本发明实施例另一方面还提供一种计算机可读存储介质，所述计算机可读存储介质储存多个计算机程序，所述计算机程序适于由处理器加载并执行如本发明实施例一方面所述的字幕显示方法。
17.本发明实施例另一方面还提供一种终端设备，包括处理器和存储器；
18.所述存储器用于储存多个计算机程序，所述计算机程序用于由处理器加载并执行如本发明实施例一方面所述的字幕显示方法；所述处理器，用于实现所述多个计算机程序中的各个计算机程序。
19.可见，在本实施例的方法中，浏览器主进程启动的当前网页进程在确定需要将目标视频的已有字幕转换新字幕时，会获取字幕转换模型，并通过字幕转换模型完成字幕转换，将字幕事件对象传送给浏览器主进程，当在目标视频显示的过程中，当浏览器主进程确定新字幕的显示时间到达时，通知当前网页进程在目标视频的显示界面显示新字幕。这样通过浏览器中当前网页进程获取的字幕转换模型可以实现对目标视频中已有字幕的实时转换，而不用通过专门的翻译团队进行字幕的转换，满足了用户对各种语言类型的视频进行观看的实时性需求。
附图说明
20.为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动性的前提下，还可以根据这些附图获得其他的附图。
21.图1是本发明实施例提供的一种字幕显示方法的示意图；
22.图2是本发明一个实施例提供的一种字显示换方法的流程图；
23.图3是本发明一个实施例中训练字幕转换模型的方法流程图；
24.图4是本发明一个应用实施例中字幕显示方法的示意图；
25.图5是本发明一个应用实施例中字幕显示方法的流程图；
26.图6是本发明另一应用实施例中字幕显示方法所应用于的分布式系统的示意图；
27.图7是本发明另一应用实施例中区块结构的示意图；
28.图8是本发明实施例提供的一种浏览器的逻辑结构示意图；
29.图9是本发明实施例提供的一种终端设备的逻辑结构示意图。
具体实施方式
30.下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。
31.本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”、“第三”“第四”等(如果存在)是用于区别类似的对象，而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换，以便这里描述的本发明的实施例例如能够以除了在这里图示或描述的那些以外的顺序实施。此外，术语“包括”和“具有”以及他们的任何
变形，意图在于覆盖不排它的包含，例如，包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元，而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
32.本发明实施例提供了一种字幕显示方法，主要应用于浏览器中，如图1所示，浏览器可以按照如下方法实现对目标视频中字幕的显示：
33.当前网页进程确定要将目标视频中的已有字幕转换为新字幕，所述已有字幕对应的第一语言类型与新字幕对应的第二语言类型不相同；所述当前网页进程获取字幕转换模型；当通过所述字幕转换模型将所述已有字幕转换为新字幕时，所述当前网页进程将字幕事件对象传送给浏览器主进程；当所述浏览器主进程根据所述字幕事件对象确定所述新字幕的显示时间到达时，通知所述当前网页进程在所述目标视频的显示界面显示所述新字幕。
34.上述字幕转换模型是一种基于人工智能的机器学习模型。其中，人工智能(artificial intelligence,ai)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能，感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。换句话说，人工智能是计算机科学的一个综合技术，它企图了解智能的实质，并生产出一种新的能以人类智能相似的方式做出反应的智能机器。人工智能也就是研究各种智能机器的设计原理与实现方法，使机器具有感知、推理与决策的功能。
35.人工智能技术是一门综合学科，涉及领域广泛，既有硬件层面的技术也有软件层面的技术。人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、操作/交互系统、机电一体化等技术。人工智能软件技术主要包括计算机视觉技术、语音处理技术、自然语言处理技术以及机器学习/深度学习等几大方向。
36.而机器学习(machine learning,ml)是一门多领域交叉学科，涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为，以获取新的知识或技能，重新组织已有的知识结构使之不断改善自身的性能。机器学习是人工智能的核心，是使计算机具有智能的根本途径，其应用遍及人工智能的各个领域。机器学习和深度学习通常包括人工神经网络、置信网络、强化学习、迁移学习、归纳学习、式教学习等技术。
37.这样通过浏览器中当前网页进程获取的字幕转换模型可以实现对目标视频中已有字幕的实时转换，而不用通过专门的翻译团队进行字幕的转换，满足了用户对各种语言类型的视频进行观看的实时性需求。
38.本发明一个实施例提供一种字幕显示方法，主要是由浏览器所执行的方法，流程图如图2所示，包括：
39.步骤101，当前网页进程确定要将目标视频中的已有字幕转换为新字幕，已有字幕对应的第一语言类型与新字幕对应的第二语言类型不相同。
40.可以理解，当通过浏览器打开一网页时，浏览器主进程可以启动一网页进程(比如当前网页进程)，由当前网页进程显示网页，并在网页显示目标视频，且会将目标视频中涉及到的字幕显示到相应位置，在目标视频的显示过程中，可以发起本实施例的字幕显示流程。
41.在一种情况下，当显示目标视频后，在目标视频的显示界面上会包括字幕切换接
口，当用户操作该字幕切换接口时，比如将英文字幕切换为中文字幕的接口，当前网页进程可以确定需要将目标视频中的已有字幕转换为新字幕。这种情况是在显示目标视频的过程中，通过用户在其显示界面的操作发起字幕的转换。
42.另一种情况下，在显示目标视频之前，显示用户选择界面，用户选择界面包括切换字幕的选择接口，响应于对切换字幕的选择接口的操作，当前网页进程确定需要将目标视频中的已有字幕转换为新字幕。在这种情况下，如果在显示目标视频之前就通过本实施例的步骤完成字幕转换，则当前网页进程在显示目标视频的同时即可显示转换后的新字幕。
43.在其它情况下，在显示目标视频之前，当前网页进程可以根据用户在当前网页进程的历史访问信息来确定是否需要进行字幕转换，例如，用户在当前网页进程的历史访问中，访问内容的语言类型为新字幕对应的第二语言类型的历史访问与所有历史访问的比值大于阈值时，则认为用户对第二语言类型的文本比较熟悉，确定需要将已有字幕转换为新字幕。其中，历史访问可以是网页或多媒体数据等信息的访问。
44.步骤102，获取字幕转换模型。
45.该字幕转换模型是一种机器学习模型，可以通过一定的训练方法训练得到，一种情况下，字幕转换模型的运行逻辑可以事先会储存到本地系统中，具体用于将一种语言类型的文本转换为另一种语言类型的文本，且一种语言类型的文本与另一语言类型的文本的内容是一致的。
46.需要说明的是，字幕转换模型可以包括多种类型，浏览器可以事先在本地预置至少一种类型的字幕转换模型，任一种类型的字幕转换模型用于将一种语言类型的文本转换为另一种语言类型的文本。其中，在本地预置多种类型的字幕转换模型时，具体可以直接向视频服务器或者浏览器对应的服务器请求获取字幕转换模型的信息，并储存到本地系统；或者直接通过训练样本训练得到字幕转换模型后，将其运行逻辑储存到本地。这样，当发起本实施例的字幕显示流程时，可以直接调用字幕转换模型，具体可以调用预置的至少一种类型的字幕转换模型中第一类型字幕转换模型，第一类型字幕转换模型用于将第一语言类型的文本转换为第二语言类型的文本。
47.另一种情况下，当发起本实施例的流程时，若在本地系统还未预置相应的字幕转换模型，则需要先从向视频服务器或者浏览器对应的服务器请求获取字幕转换模型的信息，然后再执行如下步骤103。
48.这样，通过预置多种类型的字幕转换模型，可以将任一视频中的已有字幕转换为多种语言类型的字幕，比如可以将视频中的英文字幕转换为中文字幕，或其它小语种字幕等，从而满足了不同的视频观看用户的需求。另外，由于字幕转换模型是根据一定的训练样本训练得到的，这样，针对任意两种特定语言类型的文本之间的转换，可以训练对应的一种字幕转换模型，精确性会比较高，比如，训练字幕转换模型1用于将中文文本转换为英文文本，训练字幕转换模型2用于将英文文本转换为中文文本，训练字幕转换模型3用于将中文文本转换为其它小语种文本等。
49.步骤103，当通过字幕转换模型将已有字幕转换为新字幕时，当前网页进程将字幕事件对象传送给浏览器主进程。
50.需要说明的是，当前网页进程在显示目标视频时，具体可以获取目标视频的资源并进行显示，其中，目标视频的资源可以包括目标视频的各帧图片和音频数据，还会包括字
幕文件，在字幕文件中包括已有字幕的字幕文本和字幕显示时间，字幕文本中可以包括多条已有字幕，而字幕显示时间为各条已有字幕分别对应的显示时间。当前网页进程在显示目标视频的已有字幕时，主要是通过直接读取目标视频的字幕文本，并显示到目标视频的显示界面。
51.在本实施例的步骤中，当前网页进程可以直接读取字幕文本，将字幕文本输入到调用的字幕转换模型中，这样，字幕转换模型即可将字幕文本中的已有字幕转换为新字幕，并输出新字幕的文本，其中，新字幕的文本中可以包括每条已有字幕分别对应的一条新字幕，即已有字幕与新字幕一一对应，则各条已有字幕的显示时间即为对应的各条新字幕的显示时间。
52.这样，当前网页进程会向浏览器主进程传送字幕事件对象时，还可以将已有字幕的字幕显示时间传送给浏览器主进程，由浏览器主进程确定各条新字幕的显示时间是否到达，而浏览器主进程在接收到字幕事件对象时，可以启动一个定时器，该定时器的定时时长可以是当前时间到新字幕的显示时间之间的时长，当定时器的定时时长到达时，可以确定新字幕的显示时间到达。
53.步骤104，当浏览器主进程根据字幕事件对象确定新字幕的显示时间到达时，通知当前网页进程在目标视频的显示界面显示新字幕。进一步地，在目标视频的显示界面显示新字幕的同时，当前网页进程还可以显示对应的已有字幕，实现双字幕的显示。
54.需要说明的是，当前网页进程可以将已有字幕逐条分别地输入到字幕转换模型中，由字幕转换模型逐条地输出新字幕的文本，由浏览器主进程逐条地确定新字幕的显示时间是否达到。
55.可以理解，对于目标视频的已有字幕中可以包括多条已有字幕，每条已有字幕对应目标视频中的至少一帧图像，即该条已有字幕需要显示到目标视频的至少一帧图像中，则每条已有字幕的显示时间为至少一帧图像的显示时间。其中，如果相邻的多条已有字幕对应一个完整的句子，即一个完整的句子的长度比较长，需要分为多条字幕来显示，而对不同语言类型的文本，由于语法的不同，使得对一个完整句子的表述顺序也不同，这样，多条已有字幕在转换为多条新字幕后，多条新字幕的显示顺序与多条已有字幕在目标视频中的显示顺序不同，因此，在显示这多条新字幕时，具体地：
56.当前网页进程需要先根据第二语言类型的语法确定多条已有字幕对应的多条新字幕的显示顺序，然后当多条新字幕的显示时间到达时，按照确定的显示顺序显示这多条新字幕。
57.可见，在本实施例的方法中，浏览器主进程启动的当前网页进程在确定需要将目标视频的已有字幕转换新字幕时，会获取字幕转换模型，并通过字幕转换模型完成字幕转换，将字幕事件对象传送给浏览器主进程，当在目标视频显示的过程中，当浏览器主进程确定新字幕的显示时间到达时，通知当前网页进程在目标视频的显示界面显示新字幕。这样通过浏览器中当前网页进程获取的字幕转换模型可以实现对目标视频中已有字幕的实时转换，而不用通过专门的翻译团队进行字幕的转换，满足了用户对各种语言类型的视频进行观看的实时性需求。
58.参考图3所示，在具体的实现过程中，浏览器具体可以通过如下步骤实现对上述字幕转换模型的训练，包括：
59.步骤201，确定初始字幕转换模型。
60.具体地，浏览器可以确定初始字幕转换模型所包括的多层结构，及确定各层结构中参数对应的初始值。其中，各层结构中的参数是指初始字幕转换模型中各层结构在计算过程中所用到的固定的参数，即不需要随着后期模型的调整随时赋值的参数，比如参数规模、网络层数、用户向量长度等参数。
61.而初始字幕转换模型的结构可以包括：特征提取模块和转换模块，其中，特征提取模块，用于一种语言类型的文本的特征信息；转换模块，用于根据所述特征提取模块提取的特征信息将一种语言类型的文本转换为另一种语言类型的文本，且一种语言类型的文本与另一种语言类型的文本的内容是一致的。
62.步骤202，获取训练样本，训练样本中包括多个样本对，每个样本对包括第一语言类型的文本及其对应的第二语言类型的文本。
63.步骤203，通过初始字幕转换模型对样本对中的第一语言类型的文本进行转换，得到第二语言类型的文本。
64.步骤204，根据初始字幕转换模型得到的第二语言类型的文本与样本对中相应的第二语言类型的文本，调整初始字幕转换模型，以得到最终的字幕转换模型。
65.具体地，浏览器会先根据初始字幕转换模型得到的第二语言类型的文本和训练样本中相应的第二语言类型的文本，计算与初始字幕转换模型相关的损失函数，该损失函数用于指示初始字幕转换模型得到的第二语言类型的文本，与训练样本中实际的第二语言类型的文本之间的误差，比如交叉熵损失函数等。
66.而字幕转换模型的训练过程就是需要尽量减少上述误差的值，该训练过程是通过反向传播求导以及梯度下降等一系列数学优化手段不断的优化上述初始字幕转换模型中参数的参数值，并使得上述损失函数的计算值降至最低。
67.比如，当计算的损失函数的函数值较大时，比如大于预置的值，则需要改变参数值，比如将某个神经元连接的权重值减小等，使得按照调整后的参数值计算的损失函数的函数值减小。
68.需要说明的是，上述步骤201到204是通过初始字幕转换模型得到的第二语言类型的文本对初始字幕转换模型中参数的参数值的一次调整，而在实际应用中，需要通过不断地循环执行上述步骤203到204，直到对参数值的调整满足一定的训练停止条件为止。
69.因此，浏览器在执行了上述实施例步骤204之后，还需要判断当前对参数值的调整是否满足预置的训练停止条件。其中，预置的训练停止条件包括但不限于如下条件中的任何一个：当前调整的参数值与上一次调整的参数值的差值小于一阈值，即调整的参数值达到收敛；及对参数值的调整次数等于预置的次数等。
70.可以理解的是，当浏览器在训练得到字幕转换模型后，获取特定格式的字幕转换模型的信息，这里特定格式具体为浏览器对应应用所支持的格式，并储存特定格式的字幕转换模型的信息到浏览器。这样，可以实现多种视频应用(比如浏览器等可以播放视频的应用)在显示视频时实时地进行字幕转换。
71.另外需要说明的是，上述对字幕转换模型的训练是通过浏览器来训练的，在其它实施例中，可以通过服务器来训练字幕转换模型并将训练好的字幕转换模型的信息储存到服务器，当浏览器需要调用字幕转换模型时，可以从服务器下载，这样可以节省浏览器的资
源。
72.以下以一个具体的应用实例来说明本发明的字幕显示方法，在本实施例中方法主要可以包括如下两个部分：
73.(1)通过服务器训练字幕转换模型
74.具体可以按照上述图3所述的方法来训练字幕转换模型，本实施例中以从英文文本转换为中文文本的字幕转换模型为例来说明，在具体训练过程中：对于训练样本中样本对的选择，可以采用中英双语平行语料中选择；对于初始字幕转换模型的确定，可以选择t5来完成英文文本到中文文本的转换。
75.为了适应浏览器的处理，同时可以减小二进制文件的大小，可以将训练的字幕转换模型的信息(包括模型的结构信息和权重信息等)转换为直译式脚本语言(javascript，js)格式的信息，并将转换格式后的字幕转换模型的信息储存到服务器(比如云服务器)中，方便浏览器根据需要动态拉取与浏览器对应格式的字幕转换模型的信息。
76.(2)参考图4和图5所示，浏览器可以通过如下步骤实现字幕实时转换并显示：
77.步骤301，浏览器打开一网页，则浏览器主进程会启动一网页进程(即当前网页进程)，当前网页进程会向视频服务器获取目标视频，并在显示的网页中显示目标视频。
78.步骤302，当前网页进程会从云服务器动态地获取字幕转换模型的信息并储存到本地系统，具体地，当前网页进程首先从云服务器下载字幕转换模型的权重清单(包括权重的存储地址)即model.json，然后发出额外的超文本传输协议(hypertext transfer protocol，http)请求以获取model.json权重清单中引用的权重文件分片；下载字幕转换模型的文件例如en2zh.tflite，该字幕转换模型用于将英文文本转换为中文文本。
79.其中，model.json和权重文件的大小一般都小于典型的缓存文件大小的限制，因此，字幕转换模型可能会在随后使用时更快地被加载和调用。
80.步骤303，当前网页进程加载该字幕转换模型，并在目标视频的显示界面上显示字幕切换接口，比如从英文字幕切换为中文字幕的切换按钮。
81.步骤304，当用户操作字幕切换接口，确定需要将目标视频中已有的英文字幕转换为中文字幕，当前网页进程会调用相应的字幕转换模型，通过字幕转换模型将目标视频中的英文字幕逐条地转换为中文字幕。
82.步骤305，当前网页进程传送字幕事件对象给浏览器主进程，同时也会将字幕显示时间传送给浏览器进程，该字幕事件对象用于触发中文字幕的显示。
83.步骤306，浏览器主进程根据字幕事件对象确定中文字幕的显示时间到达时，通知当前网页进程在目标视频的画面中显示中文字幕。
84.可见，本实施例中通当前网页进程调用的字幕转换模型将任一视频中的已有字幕实时地转换为另一语言类型的新字幕，并实时地显示在视频的显示界面。这样无需请求服务器就能得到字幕的转换结果，字幕数据也不用上传，能够缩短转换的延迟以及隐私保护。在实际应用中，由于在较多的应用中可以实现浏览器功能，这样在较多的应用中可以采用本发明实施例的字幕显示方法，从而实现了跨平台的字幕实时显示。
85.以下以另一具体的应用实例来说明本发明中字幕显示方法，本发明实施例中的浏览器主要为分布式系统100，该分布式系统可以包括客户端300及多个节点200(接入网络中的任意形式的计算设备，如服务器、用户终端)，客户端300与节点200之间通过网络通信的
形式连接。
86.以分布式系统为区块链系统为例，参见图6是本发明实施例提供的分布式系统100应用于区块链系统的一个可选的结构示意图，由多个节点200(接入网络中的任意形式的计算设备，如服务器、用户终端)和客户端300形成，节点之间形成组成的点对点(p2p，peer to peer)网络，p2p协议是一个运行在传输控制协议(tcp，transmission control protocol)协议之上的应用层协议。在分布式系统中，任何机器如服务器、终端都可以加入而成为节点，节点包括硬件层、中间层、操作系统层和应用层。
87.参见图6示出的区块链系统中各节点的功能，涉及的功能包括：
88.1)路由，节点具有的基本功能，用于支持节点之间的通信。
89.节点除具有路由功能外，还可以具有以下功能：
90.2)应用，用于部署在区块链中，根据实际业务需求而实现特定业务，记录实现功能相关的数据形成记录数据，在记录数据中携带数字签名以表示任务数据的来源，将记录数据发送到区块链系统中的其它节点，供其它节点在验证记录数据来源以及完整性成功时，将记录数据添加到临时区块中。
91.例如，应用实现的业务包括实现字幕显示功能的代码，该字幕显示功能主要包括：
92.当前网页进程确定要将目标视频中的已有字幕转换为新字幕，所述已有字幕对应的第一语言类型与新字幕对应的第二语言类型不相同；所述当前网页进程获取字幕转换模型；当通过所述字幕转换模型将所述已有字幕转换为新字幕时，所述当前网页进程将字幕事件对象传送给浏览器主进程；当所述浏览器主进程根据所述字幕事件对象确定所述新字幕的显示时间到达时，通知所述当前网页进程在所述目标视频的显示界面显示所述新字幕。
93.3)区块链，包括一系列按照产生的先后时间顺序相互接续的区块(block)，新区块一旦加入到区块链中就不会再被移除，区块中记录了区块链系统中节点提交的记录数据。
94.参见图7为本发明实施例提供的区块结构(block structure)一个可选的示意图，每个区块中包括本区块存储交易记录的哈希值(本区块的哈希值)、以及前一区块的哈希值，各区块通过哈希值连接形成区块链。另外，区块中还可以包括有区块生成时的时间戳等信息。区块链(blockchain)，本质上是一个去中心化的数据库，是一串使用密码学方法相关联产生的数据块，每一个数据块中包含了相关的信息，用于验证其信息的有效性(防伪)和生成下一个区块。
95.本发明实施例还提供一种浏览器，其结构示意图如图8所示，具体可以包括：
96.转换确定单元10，用于确定要将目标视频中的已有字幕转换为新字幕，所述已有字幕对应的第一语言类型与新字幕对应的第二语言类型不相同。
97.模型单元11，用于当所述转换确定单元10确定要进行转换时，调用字幕转换模型。
98.转换单元12，用于当通过所述模型单元11获取的字幕转换模型将所述已有字幕转换为新字幕时，将字幕事件对象传送给浏览器主进程，当所述浏览器主进程根据所述字幕事件对象确定所述新字幕的显示时间到达时，通知显示单元13进行字幕显示。
99.显示单元13，用于在所述目标视频的显示界面显示所述转换单元12得到的新字幕。
100.其中，转换确定单元10，具体用于当所述目标视频的显示界面包括：字幕切换接
口；响应于对所述字幕切换接口的操作，确定要将所述目标视频中的已有字幕转换为新字幕。或者，转换确定单元10，具体用于在显示所述目标视频之前，显示用户选择界面，所述用户选择界面包括切换字幕的选择接口；响应于对所述切换字幕的选择接口的操作，确定要将目标视频中的已有字幕转换为新字幕。或者，转换确定单元10，具体用于当用户的历史访问中，访问内容的语言类型为所述第二语言类型的历史访问与所有历史访问的比值大于一阈值，确定要将所述目标视频中的已有字幕转换为新字幕。
101.上述显示单元13，具体用于当所述目标视频的已有字幕包括相邻的多条已有字幕，所述多条已有字幕对应一个句子；根据所述第二语言类型的语法确定所述多条已有字幕对应的多条新字幕的显示顺序；当所述多条新字幕的显示时间到达时，按照所述显示顺序显示所述多条新字幕。
102.进一步地，本实施例的浏览器还包括：
103.预置单元14，用于在本地预置至少一种类型的字幕转换模型，任一种类型的字幕转换模型用于将一种语言类型的文本转换为另一种语言类型的文本；这样，上述模型单元11，具体用于调用所述预置单元14预置的至少一种类型的字幕转换模型中第一类型的字幕转换模型，所述第一类型的字幕转换模型用于将所述第一语言类型的文本转换为第二语言类型的文本。
104.训练单元15，用于确定初始字幕转换模型；确定训练样本，所述训练样本中包括多个样本对，每个样本对包括第一语言类型的文本及其对应的第二语言类型的文本；通过所述初始字幕转换模型对所述样本对中的第一语言类型的文本进行转换，得到第二语言类型的文本；根据所述初始字幕转换模型得到的第二语言类型的文本与所述样本对中相应的第二语言类型的文本，调整所述初始字幕转换模型，以得到最终的字幕转换模型。这样，上述预置单元14可以将训练单元15训练得到的最终的字幕转换模型的信息预置到本地。
105.可见，在本实施例的浏览器中，当转换确定单元10在确定需要将目标视频的已有字幕转换新字幕时，模型单元11会调用字幕转换模型，转换单元12通过字幕转换模型完成字幕转换，当在目标视频显示的过程中，当新字幕的显示时间到达时，显示单元13在目标视频的显示界面显示新字幕。这样通过浏览器中获取的字幕转换模型可以实现对目标视频中已有字幕的实时转换，而不用通过专门的翻译团队进行字幕的转换，满足了用户对各种语言类型的视频进行观看的实时性需求。
106.本发明实施例还提供一种终端设备，其结构示意图如图9所示，该终端设备可因配置或性能不同而产生比较大的差异，可以包括一个或一个以上中央处理器(central processing units，cpu)20(例如，一个或一个以上处理器)和存储器21，一个或一个以上存储应用程序221或数据222的存储介质22(例如一个或一个以上海量存储设备)。其中，存储器21和存储介质22可以是短暂存储或持久存储。存储在存储介质22的程序可以包括一个或一个以上模块(图示没标出)，每个模块可以包括对终端设备中的一系列指令操作。更进一步地，中央处理器20可以设置为与存储介质22通信，在终端设备上执行存储介质22中的一系列指令操作。
107.具体地，在存储介质22中储存的应用程序221包括字幕显示的应用程序，且该程序可以包括上述字幕显示装置中的转换确定单元10，模型单元11，转换单元12，显示单元13，预置单元14和训练单元15，在此不进行赘述。更进一步地，中央处理器20可以设置为与存储
介质22通信，在终端设备上执行存储介质22中储存的字幕显示的应用程序对应的一系列操作。
108.终端设备还可以包括一个或一个以上电源23，一个或一个以上有线或无线网络接口24，一个或一个以上输入输出接口25，和/或，一个或一个以上操作系统223，例如windows servertm，mac os xtm，unixtm,linuxtm，freebsdtm等等。
109.上述方法实施例中所述的由上述浏览器所执行的步骤可以基于该图9所示的终端设备的结构。
110.本发明实施例另一方面还提供一种计算机可读存储介质，所述计算机可读存储介质储存多个计算机程序，所述计算机程序适于由处理器加载并执行上述浏览器所执行的字幕显示方法。
111.本发明实施例另一方面还提供一种终端设备，包括处理器和存储器；
112.所述存储器用于储存多个计算机程序，所述计算机程序用于由处理器加载并执行上述浏览器所执行的字幕显示方法；所述处理器，用于实现所述多个计算机程序中的各个计算机程序。
113.本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成，该程序可以存储于一计算机可读存储介质中，存储介质可以包括：只读存储器(rom)、随机存取存储器(ram)、磁盘或光盘等。
114.以上对本发明实施例所提供的一种字幕显示方法、终端及存储介质和终端设备进行了详细介绍，本文中应用了具体个例对本发明的原理及实施方式进行了阐述，以上实施例的说明只是用于帮助理解本发明的方法及其核心思想；同时，对于本领域的一般技术人员，依据本发明的思想，在具体实施方式及应用范围上均会有改变之处，综上所述，本说明书内容不应理解为对本发明的限制。

再多了解一些

1/2 1 2 下一页尾页

本文用于企业家、创业者技术爱好者查询，结果仅供参考。

字幕显示方法、浏览器及存储介质和终端设备与流程

相关文献

最热文献