译文确定方法、装置及电子设备与流程

2022-05-21 06:00:04 来源：中国专利 TAG：

1.本技术属于通信技术领域，具体涉及一种译文确定方法、装置及电子设备。

背景技术：

2.随着通信技术的发展，电子设备在用户的日常生活中的应用越来越广泛。例如，用户可以欣赏电子设备播放的音乐。
3.通常，在电子设备播放歌曲(例如英文歌曲)的情况下，如果用户想要查看该歌曲对应的其它语种歌词(例如中文歌词)，那么用户可以触发电子设备开启歌词翻译功能，从而电子设备可以通过将该英文歌曲的歌词输入翻译模型，获取该英文歌曲对应的中文歌词，然后电子设备可以显示该中文歌词，如此用户可以查看该中文歌词。
4.然而，基于上述方式，由于翻译模型通常翻译的歌词比较生硬，不符合用户的语言习惯，因此使得翻译模型翻译得到的歌词仅能帮助用户理解歌曲的大概意思，从而导致电子设备处理多媒体文件的效果较差。

技术实现要素：

5.本技术实施例的目的是提供一种译文确定方法、装置及电子设备，能够解决电子设备处理多媒体文件的效果较差的问题。
6.第一方面，本技术实施例提供了一种译文确定方法，该方法包括：对多媒体文件中的第一文本进行翻译，得到n个候选译文，n为正整数；基于所述n个候选译文和目标韵脚信息，确定k个候选译文，k为正整数；其中，该k个候选译文的含义与该n个候选译文的含义相同。
7.第二方面，本技术实施例提供了一种译文确定装置，该装置包括：翻译模块和确定模块。翻译模块，用于对多媒体文件中的第一文本进行翻译，得到n个候选译文，n为正整数。确定模块，用于用于基于所述n个候选译文和目标韵脚信息，确定k个候选译文，k为正整数；其中，该k个候选译文的含义与该n个候选译文的含义相同。
8.第三方面，本技术实施例提供了一种电子设备，该电子设备包括处理器和存储器，所述存储器存储可在所述处理器上运行的程序或指令，所述程序或指令被所述处理器执行时实现如第一方面所述的方法的步骤。
9.第四方面，本技术实施例提供了一种可读存储介质，所述可读存储介质上存储程序或指令，所述程序或指令被处理器执行时实现如第一方面所述的方法的步骤。
10.第五方面，本技术实施例提供了一种芯片，所述芯片包括处理器和通信接口，所述通信接口和所述处理器耦合，所述处理器用于运行程序或指令，实现如第一方面所述的方法。
11.第六方面，本技术实施例提供一种计算机程序产品，该程序产品被存储在存储介质中，该程序产品被至少一个处理器执行以实现如第一方面所述的方法。
12.在本技术实施例中，对多媒体文件中的第一文本进行翻译，得到n个候选译文，n为
正整数；基于所述n个候选译文和目标韵脚信息，确定k个候选译文，k为正整数；其中，该k个候选译文的含义与该n个候选译文的含义相同。通过该方案，在对多媒体文件中的某个文本进行翻译，得到至少一个候选译文之后，由于可以基于该至少一个候选译文和目标韵脚信息，确定出待使用的候选译文，因此该待使用的候选译文更为符合押韵需求。如此，提高了电子设备处理多媒体文件的效果。
附图说明
13.图1为本技术实施例提供的一种译文确定方法的示意图；
14.图2为本技术实施例提供的一种韵撤示意图；
15.图3为本技术实施例提供的一种译文确定的界面示意图；
16.图4为本技术实施例提供的译文确定装置的结构示意图；
17.图5为本技术实施例提供的电子设备的结构示意图；
18.图6为本技术实施例提供的电子设备的硬件示意图。
具体实施方式
19.下面将结合本技术实施例中的附图，对本技术实施例中的技术方案进行清楚地描述，显然，所描述的实施例是本技术一部分实施例，而不是全部的实施例。基于本技术中的实施例，本领域普通技术人员获得的所有其他实施例，都属于本技术保护的范围。
20.本技术的说明书和权利要求书中的术语“第一”、“第二”等是用于区别类似的对象，而不用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换，以便本技术的实施例能够以除了在这里图示或描述的那些以外的顺序实施，且“第一”、“第二”等所区分的对象通常为一类，并不限定对象的个数，例如第一对象可以是一个，也可以是多个。此外，说明书以及权利要求中“和/或”表示所连接对象的至少其中之一，字符“/”，一般表示前后关联对象是一种“或”的关系。
21.韵辙：常见十三韵辙，具体包括：发花、坡梭、乜斜、一七、姑苏、怀来、灰堆、遥条、由求、言前、人辰、江阳和中东等十三辙。其中，不同的韵撤，决定了候选译文的不同韵脚。例如，通过韵辙可以评估歌词是否押韵。在本技术实施例中，用于判断第一候选译文的文本参数是否与目标文本参数匹配，即第一候选译文的韵脚是否与目标韵脚匹配。
22.下面结合附图，通过具体的实施例及其应用场景对本技术实施例提供的多译文确定方法进行详细地说明。
23.如图1所示，本技术实施例提供一种译文确定方法，该方法包括s101和s102。
24.s101、译文确定装置对多媒体文件对应的第一文本进行翻译，得到n个候选译文。
25.其中，n为正整数。
26.可选地，上述多媒体文件可以为以下任一项：文档文件、音频文件、视频文件。即本技术实施例的提供的译文确定方法可以用于文本翻译的场景，例如英中歌词翻译的场景；有韵律的音频生成配文的场景；视频翻译的场景，例如mv翻译、歌剧翻译等。
27.示例性的，以多媒体文件为文档文件为例。在电子设备显示一个word文档一个，即该多媒体文件为该一个word文档(例如，歌词)。
28.示例性的，以多媒体文件为音频文件为例。在电子设备播放一首歌曲的情况下，该
多媒体文件可以为该一首歌曲。
29.示例性的，以多媒体文件为视频文件为例。在电子设备播放一个音乐短片(music video，mv)的情况下，该多媒体文件为该音乐短片。
30.可选地，在多媒体文件为音频文件或视频文件的情况下，在上述s101之前，本技术实施例提供的译文确定方法还包括：对多媒体文件进行语音识别，得到该多媒体文件的目标文本。其中，该目标文件可以为该多媒体文件的所有音频对应的文本为该多媒体文件中当前播放的音频片段的文本。
31.示例性的，假设电子设备正播放至歌曲《囚鸟》的“如果离开你给我的小小城堡”，上述目标文本可以为整首歌曲的歌词，或者，目标文件为当前播放音频片段的歌词“如果离开你给我的小小城堡”。
32.进一步可选地，在多媒体文件为文档文件的情况下，第一文本为该文档文件中的任意一句文本；在多媒体文件为音频文件的情况下，第一文本为对该音频文件中的任意一个音频片段进行语音识别得到的文本；在多媒体文件为视频文件的情况下，第一文本为对该视频文件解析得到的音频文件中的任意一个音频片段进行语音识别得到的文本。如此，第一文本可以为多媒体文件中的首句文本或非首句文本，具体根据使用情况确定，本技术实施例对此不作限定。
33.s102、译文确定装置基于n个候选译文和目标韵脚信息，确定k个候选译文。
34.其中，上述k个候选译文的含义与n个候选译文的含义相同。k为正整数。
35.需要说明的是，本技术实施例中，上述k个候选译文中每个候选译文的韵脚信息与目标韵脚信息匹配。
36.可选地，目标韵脚信息与韵辙相关，不同的韵辙，目标韵脚信息不同。该韵辙可以为厂商出厂时设置的，或为用户自定义的。
37.可选地，上述第一文本为多媒体文件中的满足预设条件的非首句文本。在上述s102之前，本技术实施例提供的译文确定方法还包括下述s103和s104。
38.s103、译文确定装置对第二文本的候选译文进行分词处理，得到分词处理结果。
39.其中，上述第二文本为多媒体文件中第一文本的前一个文本。
40.可选地，上述预设条件可以包括以下任一项：在多媒体文件的偶数句文本的候选译文押韵的情况下，第一文本为多媒体文件中非第二句的偶数句文本；在多媒体文件的奇数句文本的候选译文押韵的情况下，第一文本为多媒体文件中非第三句的奇数句文本；在多媒体文件的每个文本的候选译文押韵的情况下，第一文本为多媒体文件中非首句的任意一个文本。
41.进一步地，上述第二文本根据候选译文押韵类型信息确定。在该候选译文押韵类型信息指示多媒体文件中的每个文本的候选译文押韵的情况下，第二文本为多媒体文件中与第一文本相邻的前一个文本；在该候选译文押韵类型信息指示多媒体文件中的偶数句文本的候选译文押韵的情况下，第二文本为多媒体文件中与第一文本间隔一个文本的前一个文本，即第二文本同样为多媒体文件中的偶数句文本；在该押韵类型信息指示多媒体文件中的奇数句文本的候选译文押韵的情况下，第二文本为多媒体文件中与第一文本间隔一个文本的前一个文本，即第二文本同样为多媒体文件中的奇数句文本。具体可以根据实际使用情况确定，本技术实施例对此不作限定。
42.可以理解的是，当多媒体文件的偶数句文本的候选译文的押韵时，如果第一文本为多媒体文件中为单数句文本或第二句文本时，对第一文本的候选译文没有押韵要求；当多媒体文件的奇数句文本的候选译文押韵时，如果第一文本为多媒体文件中为偶数句文本或第三句文本时，对第一文本的候选译文没有押韵要求。
43.可选地，上述对第二文本的候选译文进行分词处理，具体可以包括：将第二文本的候选译文的文本按照单个字或词组的方式进行分断，从而可以得到多个字和多个词组。具体可以参照相关技术中的描述，本技术实施例对此不予赘述。可以理解的是，得到的多个字和多个词组为分词处理结果。
44.s104、译文确定装置基于该分词处理结果，确定目标韵脚信息。
45.其中，上述目标韵脚信息包括以下至少一项：目标韵脚，目标韵脚的文本长度。该目标韵脚包括；第二文本的候选译文末尾的预设数量的字符。
46.可选地，上述目标韵脚具体是指：第二文本的候选译文末尾的预设数量的字符的韵部。例如，第二文本的候选译文末尾最后一个字的韵部。
47.示例性地，上述预设数量可以为1，候选文本的押韵类型为单押韵类型；上述预设数量可以为2，候选文本的押韵类型为双押韵类型。
48.需要说明的是，由于根据分词处理结果，可以得到第二文本的候选译文末尾的预设数量的字符，因此可以将该预设数量的字符作为目标韵脚，且该预设数量的字符的长度为目标韵脚的文本长度。
49.在本技术实施例中，由于可以对第二文本的候选译文进行分词处理，得到分词处理结果，并基于该分词处理结果，确定目标韵脚信息，因此可以根据giant目标韵脚信息和n个候选译文，确定k个候选译文。
50.可选地，上述s102具体可以通过下述s102a和s102b实现；或者，通过下述s102a、s102c和s102d实现。
51.s102a、译文确定装置确定n个候选译文中的第一候选译文的第一字符串与目标韵脚信息是否匹配。
52.其中，上述第一字符串包括第一候选译文末尾的预设数量的字符。
53.可选地，上述第一候选译文为n个候选译文中的任意一个候选译文。第一字符串为第一候选译文的韵脚。
54.示例性的，如果n个候选译文为中文候选译文，那么本技术实施例中所涉及的字符或字符串(例如第一字符串)可以包括以下任一项：单个汉字、词组。
55.可以理解是，通过判断第一候选译文的第一字符串与目标韵脚信息是否匹配，可以从该n个候选译文中选择出一部分候选译文，这部分候选译文的韵脚与目标韵脚信息匹配；进一步地，对n个候选译文中另一部分候选译文进行处理。
56.s102b、若该n个候选译文中的第一候选译文的第一字符串与目标韵脚信息匹配，则译文确定装置将该第一候选译文确定为k个候选译文中的候选译文。
57.可选地，对于第一字符串与目标韵脚匹配，可以包括如下两种可能的情况：
58.(1)第一字符串和目标韵脚属于同一韵撤。
59.(2)第一字符串的韵部和目标韵脚相同。
60.可以理解的是，如果第一候选译文的第一字符串与目标韵脚信息匹配，那么第一
候选译文的韵脚满足押韵需求，从而可以直接将该第一候选译文确定为k个候选译文中的候选译文。
61.s102c、若第一候选译文的第一字符串与目标韵脚信息不匹配，则译文确定装置替换该第一候选译文中的该第一字符串，得到第二候选译文。
62.可选地，对于第一字符串与目标韵脚信息不匹配，可以包括如下两种可能的情况：
63.(1)第一字符串和目标韵脚属于不同韵撤。
64.(2)第一字符串的韵部和目标韵脚不同。
65.可以理解的是，由于根据目标韵脚信息，替换第一候选译文中的第一字符串，因此得到的第二候选译文的韵脚与目标韵脚信息匹配。
66.如图2所示，当韵辙为发花辙(a、ua、ia)时，中文候选译文的尾字为傻(sha)，当韵辙为人辰辙(en、in、uen、un、
ü
n)时，中文候选译文的尾字为蠢(chun)。
67.示例性的，对于发花辙，其韵母包括a、ua、ia。假设翻译模型输出的第一候选译文为”我不想我不想不想长大，长大后世界就没童话，我不想我不想不想长大，我宁愿永远都笨又蠢”。当选择每句末尾押韵方式和单押韵的设置时，确定第一候选译文末尾字是单独的一个字“蠢”，但“蠢”不属于发花辙。通过同义词替换方法，并通过韵辙匹配，可以发现“傻”(sha)与目标韵脚信息匹配，因此使用”傻”替换”蠢”则可以提高译文的押韵程度，从而可以将第一候选译文调整为“我宁愿永远都笨又傻”(即第二候选译文)。
68.在本技术实施例中，一方面，由于在第一候选译文的第一字符串与目标韵脚信息匹配的情况下，可以直接将该第一候选译文确定为k个候选译文中的候选译文，因此可以从n个候选译文重选择满足用户押韵需求的候选译文；另一方面，由于在第一候选译文的第一字符串与目标韵脚信息不匹配的情况下，可以替换该第一候选译文中的第一字符串，得到第二候选译文，并将该第二候选译文确定为目标候选译文中的候选译文，因此可以不满足押韵需求的候选译文进行再次处理以得到满足用户押韵需求的候选译。如此，既提高对多媒体文件的能力，也提高了用户体验。
69.可选地，上述s102c中译文确定装置替换第一候选译文中的第一字符串，得到第二候选译文具体可以通过下述s102c1和s102c2实现。
70.s102c1、若第一差值小于第一预设阈值且大于或等于第二预设阈值，则译文确定装置替换第一候选译文中的q个字符串，得到第二候选译文。
71.其中，上述第一差值为第一候选译文的第一文本长度与第一文本的第二文本长度之间的差值的绝对值；上述第二候选译文的第三文本长度与第二文本长度相等，且该第二候选译文中的第二字符串与目标韵脚信息匹配，第二字符串包括第二候选译文末尾的预设数量的字符。q个字符串包括第一字符串，q为正整数。
72.可选地，上述第一预设阈值和第二预设阈值可以为厂商出厂设置的，或为用户自定义设置的，本技术实施例对此不作限定。可以理解的是，第二预设阈值小于或等于第一预设阈值，且两者均为正整数。
73.可选地，第一文本长度可以根据第一候选译文中所包含的字符的数量确定。
74.可选地，在本技术实施例中，可以根据第一文本的文本发音数量，确定第二文本长度。其中，文本发音数量通过第一文本的文本发音特征得到，该文本发音特征可以包括以下至少一项：音节、音素。
75.示例性的，假设第一文本为中文文本。由于中文以字为单位，每个字对应一个读音，因此第一文本中所包含的字的数量为第二文本长度。
76.示例性的，假设第一文本为英文文本。由于英文以词为单位，一个英文可能对应多个汉字，因此需要通过识别英文文本的音节、音素等发音特征，确定英文文本的发音数量，从而可以将该发音数量确定为第二文本长度。
77.可以理解的是，在多媒体文件为歌词情况下，第一文本的第二文本长度，可以决定多媒体文件中的第一文本的节奏。如此，当在第一候选译文的第一文本长度与第二文本长度不相等的情况下，根据该第二文本长度，对第一候选译文进行文本处理，得到第二候选译文，该第二候选文的音乐节奏与第一文本相当，从而便于用户使用第二候选译文(例如便于用户哼唱英文歌曲的中文译文，不易跑调)。
78.例如，当第一预设阈值为2，第二预设阈值为1时，若第一差值为1，则与第一文本的第二文本长度相比，第一候选译文的第一文本长度较长；或者，若第一差值为负1，则与第一文本的第二文本长度相比，第一候选译文的第一文本长度较短。
79.针对上述情况，具体地，对于s102c1中替换第一候选译文中的q个字符串，得到第二候选译文，可以包括如下两种可能的实现方式：
80.(1)在第一候选译文的第一文本长度较短的情况下，q个字符串为第一候选译文中字符长度较短的，且包括第一字符串在内的至少一个字符串，即可以通过同义词词典，将该至少一个字符串替换成字符长度较长的字符串。
81.(2)在第一候选译文的第一文本长度较长的情况下，q个字符串为第一候选译文中字符长度较长的，且包括第一字符串在内的至少一个字符串，即可以通过同义词词典，将该至少一个字符串替换成字符长度较短的字符串。
82.需要说明的是，在上述本技术实施例中，将第一字符串替换成与第一字符串的含义相同的目标字符串，且该目标字符串的韵脚信息与目标韵脚信息匹配。
83.s102b2、若第一差值大于或等于第一预设阈值，则译文确定装置将第一候选译文转换为第三候选译文，并替换该第三候选译文中的s个字符串，得到第二候选译文。
84.其中，上述第一差值为第一候选译文的第一文本长度与第一文本的第二文本长度之间的差值。第二候选译文的第三文本长度与第二文本长度相等，且第二候选译文中的第二字符串与目标韵脚信息匹配，该第二字符串包括该第二候选译文末尾的预设数量的字符。s为正整数。
85.示例性的，当第一预设阈值为3时，若第一差值为5，则说明第一候选译文的第一文本长度远大于第一文本的第二文本长度；或者，若第一差值为负4，则说明第一候选译文的第一文本长度远小于第一文本的第二文本长度。
86.可选地，对于将第一候选译文转换为第三候选译文，可以包括如下两种可能的实现方式：
87.(1)当第二候选译文的第三文本长度远大于第一文本长度时，通过文本摘要模型，将第一候选译文转换为摘要文本，即第三候选译文。
88.(2)当第二候选译文的第三文本长度远小于第一文本长度时，通过文本复述模型，将第一候选译文转换为复述文本，即第三候选译文。
89.在本技术实施例中，如果第一文本长度与第二文本长度之间的第一差值的绝对值
小于第一预设阈值且大于或等于第二预设阈值，那么替换第一候选译文中的q个字符串，得到第二候选译文；或者，在第一差值的绝对值大于或等于第一预设阈值，则将第一候选译文转换为第三候选译文，并替换该第三候选译文中的s个字符串，得到第二候选译文。如此，在保证第二候选译文的含义与第一候选译文的含义相同的基础上，不仅可以保证第二候选译文的第三文本长度与第一文本长度相等，也可以确保第二候选译文的韵脚信息和目标韵脚信息匹配。
90.进一步地，若第三候选译文的末尾字符串与目标韵脚信息匹配，则s个字符串不包括该末尾字符串；若第三候选译文的末尾字符串与目标韵脚信息不匹配，则s个字符串包括该末尾字符串。具体根据实际情况确定，本技术实施例对此不作限定。
91.此外，对于替换第三候选译文中的s个字符串，得到第二候选译文，可以参照上述实施例中对于替换第一候选译文中的q个字符串，得到第二候选译文的详细描述，本技术实施例在此不再赘述。
92.需要说明的是，上述图2中的内容，仅是用于展示对第一候选译文的具体处理过程，便于用户更好地理解。在实际实现过程中，上述图2中的内容可以做为内容实现的过程，不具体在界面中显示。
93.s102d、译文确定装置将第二候选译文确定为目标候选译文中的候选译文。
94.其中，上述第一字符串包括第一候选译文末尾的预设数量的字符。
95.示例性的，以译文确定装置为手机，n＝1为例。如图3中的(a)所示，手机正在播放一首英文歌曲。如果用户想要查看这首歌曲的中文歌词，那么用户可以点击翻译按钮，从而手机可以启动翻译功能，对该英文歌曲进行翻译。如图3中的(a)所示，手机对英文歌词(即多媒体文件)中的“on a balcony in summer air”(即第一文本)进行翻译，得到候选译文01“在一个阳台上乘凉”(即n个候选译文)。由于目标韵脚为“天”，目标韵脚的长度为末尾一个字符的长度，因此手机可以确定该候选译文01末尾字的韵部和目标韵脚的韵部“an”不匹配，从而得到如图3中的(b)所示的候选译文02“站在夏日阳台上遇见”。如此，该候选译文02的含义与该候选译文01的含义相同，且该候选译文02的韵脚信息与目标韵脚信息匹配。
96.本技术实施例提供一种译文确定方法，在对多媒体文件中的某个文本进行翻译，得到至少一个候选译文之后，由于可以基于该至少一个候选译文和目标韵脚信息，确定出待使用的候选译文，因此该待使用的候选译文更为符合押韵需求。如此，提高了电子设备处理多媒体文件的效果。
97.可选地，在上述s102之后，本技术实施例提供的译文确定方法还可以包括下述s105。
98.s104、译文确定装置显示该k个候选译文中的目标候选译文。
99.其中，上述目标候选译文根据候选译文评价信息确定。该候选译文评价信息可以包括以下至少一项：候选译文的流畅度、候选译文与第一文本的关联度、当前候选译文与其他候选译文的关联度、候选译文的押韵程度。
100.示例性的，以候选译文评价信息为候选译文的流畅度为例。通过语言模型(language model)中的文本通顺性检测的算法，计算候选译文的困惑度(perplexity)。其中，困惑度用于评估翻译得到的候选译文的流畅度。
101.需要说明的是，困惑度越高，说明流畅度越差；困惑度越低，说明流畅度越高。如
此，可以将困惑度作为候选译文的流畅度的判断依据。
102.示例性的，以候选译文评价信息为候选译文与第一文本的关联度为例。根据无参考答案自动评价的方法来评估候选译文的质量(即候选译文与第一文本的关联度)，例如通过学习模型从候选译文中提取单词、短语、句子等特征后，利用分类或回归算法预测翻译结果的质量，并输出候选译文质量好还是坏的结果。例如，通过回归算法可以输出候选译文的质量对应的概率，当概率的取值越接近1时，则候选译文的质量越好，即候选译文与第一文本的关联度越高；当概率的取值越接近0时，则候选译文的质量越差，即候选译文与第一文本的关联度越低。
103.示例性的，以候选译文评价信息为当前候选译文与其他候选译文的关联度为例。在对歌词进行翻译的场景中，基于预训练模型加入歌词语料进行训练，通过训练后的模型计算当前候选译文与其他候选译文的关联度。其中，关联度可以用概率表示，当概率的取值越接近1时，关联度越高；当概率的取值越接近0时，关联度越低。
104.需要说明的是，当候选译文为多媒体文件中的首句文本的候选译文时，无需计算该候选译文与其他候选译文的关联度。
105.示例性的，以候选译文评价信息为候选译文的押韵程度为例。通过算法策略，计算当前候选译文与前文已翻译好的候选译文的押韵程度。在多媒体文件为四句段落时，通常第二句的候选译文和第四句押韵的候选译文，此时可以判断第二句的候选译文末尾字的韵部，与第四句押韵的候选译文末尾字的韵部是否属于同一个韵辙。
106.例如，第二句的候选译文为“长大后世界就没童话”，第四句的候选译文为“我宁愿永远都笨又傻”，此时这两个句子的候选译文末尾字的韵部都属于同一个韵辙，因此押韵程度为1。
107.可选地，上述s105具体可以包括：译文确定装置在第一文本对应的目标区域显示k个候选译文中的目标候选译文。如此，便于用户同时查看原文和译文。
108.可选地，在上述s102之后，s105之前，本技术实施例提供的译文确定方法还可以包括：译文确定装置按照候选译文评价信息，计算k个候选译文中每个候选译文的得分；将得分最高的候选译文作为目标候选译文。
109.可选地，上述候选译文评价信息作为k个候选译文本中每个候选译文的评价指标。
110.具体地，一种可能的情况，当k个候选译文为多媒体文件中的首句文本的候选译文时，计算候选译文评价信息包括的候选译文的流畅度、候选译文与第一文本的关联度，这两个维度的评分，再计算这2个维度的评分的加权平均值；另一种可能的情况，当k个候选译文为多媒体文件中的非首句文本的候选译文时，计算候选译文评价信息包括的四个维度的评分，再计算这四个维度的评分的加权平均值。
111.可选地，上述候选译文评价信息中每个维度评价信息的权重可能相同或不同。在实际使用时，用户可以根据需要调整四个维度评价信息的权重。
112.可选地，上述实施例中是以根据候选译文评价信息，从k个候选译文中选择目标候选译文进行示例性说明的，当然，还可以选择将从k个候选译文中的任意一个候选译文作为目标候选译文，或者，将k个候选译文中的第一个候选译文作为目标候选译文。具体可以根据实际情况确定，本技术实施例对此不作限定。
113.本技术实施例中的译文确定方法，在确定k个候选译文之后，由于可以显示根据候
选译文评价信息确定的该k个候选译文中的目标候选译文，因此可以为用户提供更加优质的候选译文，从而更加便于用户使用和理解，例如在播放外文歌曲时，用户可以实时查看更加符合语言习惯且更加富有韵律的译文。
114.本技术实施例提供的译文确定方法，执行主体可以为译文确定装置(例如，该译文确定装置为电子设备)。本技术实施例中以译文确定装置执行译文确定的方法为例，说明本技术实施例提供的译文确定的装置。
115.图4示出了本技术实施例中涉及的译文确定装置200的一种可能的结构示意图。该译文确定装置200可以包括翻译模块201和确定模块202。翻译模块201，可以用于对多媒体文件中的第一文本进行翻译，得到n个候选译文，n为正整数。确定模块202，可以用于基于所述n个候选译文和目标韵脚信息，确定k个候选译文，k为正整数；其中，所述k个候选译文的含义与所述n个候选译文的含义相同。
116.可选地，第一文本为多媒体文件中的满足预设条件的非首句文本；译文确定装置还包括处理模块。处理模块，可以用于对第二文本的候选译文进行分词处理，得到分词处理结果，第二文本为多媒体文件中第一文本的前一个文本。确定模块，还可以用于基于分词处理结果，确定目标韵脚信息；其中，目标韵脚信息包括以下至少一项：目标韵脚，目标韵脚的文本长度，目标韵脚包括第二文本的候选译文末尾的预设数量的字符。
117.可选地，确定模块，可以具体用于若n个候选译文中的第一候选译文的第一字符串与目标韵脚信息匹配，则将第一候选译文确定为k个候选译文中的候选译文；或者，若第一候选译文的第一字符串与目标韵脚信息不匹配，则根据目标韵脚信息，替换第一候选译文中的第一字符串，得到第二候选译文；并将第二候选译文确定为目标候选译文中的候选译文。其中，第一字符串包括第一候选译文末尾的预设数量的字符。
118.可选地，确定模块，可以具体用于若第一差值小于第一预设阈值且大于或等于第二预设阈值，则替换第一候选译文中的q个字符串，得到第二候选译文，q个字符串包括第一字符串，q为正整数；或者，若第一差值大于或等于第一预设阈值，则将第一候选译文转换为第三候选译文，并替换第三候选译文中的s个字符串，得到第二候选译文，s为正整数。其中，第一差值为第一候选译文的第一文本长度与第一文本的第二文本长度之间的差值；第二候选译文的第三文本长度与第二文本长度相等，且第二候选译文中的第二字符串与目标韵脚信息匹配，第二字符串包括第二候选译文末尾的预设数量的字符。
119.可选地，译文确定装置还可以包括显示模块。显示模块，可以用于显示k个候选译文中的目标候选译文，目标候选译文根据候选译文评价信息确定。其中，候选译文评价信息包括以下至少一项：候选译文的流畅度、候选译文与第一文本的关联度、当前候选译文与其他候选译文的关联度、候选译文的押韵程度。
120.本技术实施例提供一种译文确定装置，在对多媒体文件中的某个文本进行翻译，得到至少一个候选译文之后，由于可以基于该至少一个候选译文和目标韵脚信息，确定出待使用的候选译文，因此该待使用的候选译文更为符合押韵需求。如此，提高了电子设备处理多媒体文件的效果。
121.本技术实施例中的译文确定装置可以是电子设备，也可以是电子设备中的部件，例如集成电路或芯片。该电子设备可以是终端，也可以为除终端之外的其他设备。示例性的，电子设备可以为手机、平板电脑、笔记本电脑、掌上电脑、车载电子设备、移动上网装置
(mobile internet device，mid)、增强现实(augmented reality，ar)/虚拟现实(virtual reality，vr)设备、机器人、可穿戴设备、超级移动个人计算机(ultra-mobile personal computer，umpc)、上网本或者个人数字助理(personal digital assistant，pda)等，还可以为服务器、网络附属存储器(network attached storage，nas)、个人计算机(personal computer，pc)、电视机(television，tv)、柜员机或者自助机等，本技术实施例不作具体限定。
122.本技术实施例中的译文确定装置可以为具有操作系统的装置。该操作系统可以为安卓(android)操作系统，可以为ios操作系统，还可以为其他可能的操作系统，本技术实施例不作具体限定。
123.本技术实施例提供的译文确定装置能够实现图1至图3的方法实施例实现的各个过程，为避免重复，这里不再赘述。
124.可选地，如图5所示，本技术实施例还提供一种电子设备300，包括处理器301和存储器302，存储器302上存储有可在处理器301上运行的程序或指令，该程序或指令被处理器301执行时实现上述译文确定方法实施例的各个步骤，且能达到相同的技术效果，为避免重复，这里不再赘述。
125.需要说明的是，本技术实施例中的电子设备包括上述所述的移动电子设备和非移动电子设备。
126.图6为实现本技术实施例的一种电子设备的硬件结构示意图。
127.该电子设备400包括但不限于：射频单元401、网络模块402、音频输出单元403、输入单元404、传感器405、显示单元406、用户输入单元407、接口单元408、存储器409、以及处理器410等部件。
128.本领域技术人员可以理解，电子设备400还可以包括给各个部件供电的电源(比如电池)，电源可以通过电源管理系统与处理器410逻辑相连，从而通过电源管理系统实现管理充电、放电、以及功耗管理等功能。图6中示出的电子设备结构并不构成对电子设备的限定，电子设备可以包括比图示更多或更少的部件，或者组合某些部件，或者不同的部件布置，在此不再赘述。
129.其中，处理器410，可以用于对多媒体文件中的第一文本进行翻译，得到n个候选译文，n为正整数；并基于该n个候选译文和目标韵脚信息，确定k个候选译文，k为正整数；其中，该k个候选译文的含义与所述n个候选译文的含义相同。
130.可选地，第一文本为多媒体文件中的满足预设条件的非首句文本；译文确定装置还包括处理模块。处理器410，可以用于对第二文本的候选译文进行分词处理，得到分词处理结果，第二文本为多媒体文件中第一文本的前一个文本；并基于分词处理结果，确定目标韵脚信息；其中，目标韵脚信息包括以下至少一项：目标韵脚，目标韵脚的文本长度，目标韵脚包括第二文本的候选译文末尾的预设数量的字符。
131.可选地，处理器410，可以具体用于若n个候选译文中的第一候选译文的第一字符串与目标韵脚信息匹配，则将第一候选译文确定为k个候选译文中的候选译文；或者，若第一候选译文的第一字符串与目标韵脚信息不匹配，则根据目标韵脚信息，替换第一候选译文中的第一字符串，得到第二候选译文；并将第二候选译文确定为目标候选译文中的候选译文。其中，第一字符串包括第一候选译文末尾的预设数量的字符。
132.可选地，处理器410，可以具体用于若第一差值小于第一预设阈值且大于或等于第二预设阈值，则替换第一候选译文中的q个字符串，得到第二候选译文，q个字符串包括第一字符串，q为正整数；或者，若第一差值大于或等于第一预设阈值，则将第一候选译文转换为第三候选译文，并替换第三候选译文中的s个字符串，得到第二候选译文，s为正整数。其中，第一差值为第一候选译文的第一文本长度与第一文本的第二文本长度之间的差值；第二候选译文的第三文本长度与第二文本长度相等，且第二候选译文中的第二字符串与目标韵脚信息匹配，第二字符串包括第二候选译文末尾的预设数量的字符。
133.可选地，显示单元406，可以用于显示k个候选译文中的目标候选译文，目标候选译文根据候选译文评价信息确定。其中，候选译文评价信息包括以下至少一项：候选译文的流畅度、候选译文与第一文本的关联度、当前候选译文与其他候选译文的关联度、候选译文的押韵程度。
134.本技术实施例提供一种电子设备，在对多媒体文件中的某个文本进行翻译，得到至少一个候选译文之后，由于可以基于该至少一个候选译文和目标韵脚信息，确定出待使用的候选译文，因此该待使用的候选译文更为符合押韵需求。如此，提高了电子设备处理多媒体文件的效果。
135.应理解的是，本技术实施例中，输入单元404可以包括图形处理器(graphics processing unit，gpu)4041和麦克风4042，图形处理器4041对在视频捕获模式或图像捕获模式中由图像捕获装置(如摄像头)获得的静态图片或视频的图像数据进行处理。显示单元406可包括显示面板4061，可以采用液晶显示器、有机发光二极管等形式来配置显示面板4061。用户输入单元407包括触控面板4071以及其他输入设备4072中的至少一种。触控面板4071，也称为触摸屏。触控面板4071可包括触摸检测装置和触摸控制器两个部分。其他输入设备4072可以包括但不限于物理键盘、功能键(比如音量控制按键、开关按键等)、轨迹球、鼠标、操作杆，在此不再赘述。
136.存储器409可用于存储软件程序以及各种数据。存储器409可主要包括存储程序或指令的第一存储区和存储数据的第二存储区，其中，第一存储区可存储操作系统、至少一个功能所需的应用程序或指令(比如声音播放功能、图像播放功能等)等。此外，存储器409可以包括易失性存储器或非易失性存储器，或者，存储器409可以包括易失性和非易失性存储器两者。其中，非易失性存储器可以是只读存储器(read-only memory，rom)、可编程只读存储器(programmable rom，prom)、可擦除可编程只读存储器(erasable prom，eprom)、电可擦除可编程只读存储器(electrically eprom，eeprom)或闪存。易失性存储器可以是随机存取存储器(random access memory，ram)，静态随机存取存储器(static ram，sram)、动态随机存取存储器(dynamic ram，dram)、同步动态随机存取存储器(synchronous dram，sdram)、双倍数据速率同步动态随机存取存储器(double data rate sdram，ddrsdram)、增强型同步动态随机存取存储器(enhanced sdram，esdram)、同步连接动态随机存取存储器(synch link dram，sldram)和直接内存总线随机存取存储器(direct rambus ram，drram)。本技术实施例中的存储器409包括但不限于这些和任意其它适合类型的存储器。
137.处理器410可包括一个或多个处理单元；可选的，处理器410集成应用处理器和调制解调处理器，其中，应用处理器主要处理涉及操作系统、用户界面和应用程序等的操作，调制解调处理器主要处理无线通信信号，如基带处理器。可以理解的是，上述调制解调处理
器也可以不集成到处理器410中。
138.本技术实施例还提供一种可读存储介质，所述可读存储介质上存储有程序或指令，该程序或指令被处理器执行时实现上述译文确定方法实施例的各个过程，且能达到相同的技术效果，为避免重复，这里不再赘述。
139.其中，所述处理器为上述实施例中所述的电子设备中的处理器。所述可读存储介质，包括计算机可读存储介质，如计算机只读存储器rom、随机存取存储器ram、磁碟或者光盘等。
140.本技术实施例另提供了一种芯片，所述芯片包括处理器和通信接口，所述通信接口和所述处理器耦合，所述处理器用于运行程序或指令，实现上述译文确定方法实施例的各个过程，且能达到相同的技术效果，为避免重复，这里不再赘述。
141.应理解，本技术实施例提到的芯片还可以称为系统级芯片、系统芯片、芯片系统或片上系统芯片等。
142.本技术实施例提供一种计算机程序产品，该程序产品被存储在存储介质中，该程序产品被至少一个处理器执行以实现如上述译文确定方法实施例的各个过程，且能达到相同的技术效果，为避免重复，这里不再赘述。
143.需要说明的是，在本文中，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下，由语句“包括一个
……”
限定的要素，并不排除在包括该要素的过程、方法、物品或者装置中还存在另外的相同要素。此外，需要指出的是，本技术实施方式中的方法和装置的范围不限按示出或讨论的顺序来执行功能，还可包括根据所涉及的功能按基本同时的方式或按相反的顺序来执行功能，例如，可以按不同于所描述的次序来执行所描述的方法，并且还可以添加、省去、或组合各种步骤。另外，参照某些示例所描述的特征可在其他示例中被组合。
144.通过以上的实施方式的描述，本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现，当然也可以通过硬件，但很多情况下前者是更佳的实施方式。基于这样的理解，本技术的技术方案本质上或者说对现有技术做出贡献的部分可以以计算机软件产品的形式体现出来，该计算机软件产品存储在一个存储介质(如rom/ram、磁碟、光盘)中，包括若干指令用以使得一台终端(可以是手机，计算机，服务器，或者网络设备等)执行本技术各个实施例所述的方法。
145.上面结合附图对本技术的实施例进行了描述，但是本技术并不局限于上述的具体实施方式，上述的具体实施方式仅仅是示意性的，而不是限制性的，本领域的普通技术人员在本技术的启示下，在不脱离本技术宗旨和权利要求所保护的范围情况下，还可做出很多形式，均属于本技术的保护之内。

再多了解一些

1/2 1 2 下一页尾页

本文用于企业家、创业者技术爱好者查询，结果仅供参考。

上一篇：返回列表
下一篇：一种面向中文领域大规模复杂关系数据集构建框架

译文确定方法、装置及电子设备与流程

相关文献

最热文献