一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

文本翻译方法、装置及计算机可读介质与流程

2022-07-02 05:25:09 来源:中国专利 TAG:


1.本发明涉及文本处理技术领域,特别涉及文本翻译方法、装置及计算机可读介质。


背景技术:

2.随着国际间频繁的合作往来,文本翻译也成为了国际交流、业务等场景所必须的步骤,并且由于目前对文本翻译的需求量与日俱增,对文本翻译的翻译效率提出了很高要求。
3.目前对于中文文本的翻译是根据文本中的语句逐句拷贝至翻译软件中翻译成目标语言,最终生成翻译后的文本。但这种翻译方式由于需要逐句复制粘贴进行翻译,导致翻译效率较低。
4.因此,需要一种效率更高的文本翻译方法。


技术实现要素:

5.本发明实施例提供了文本翻译方法、装置及计算机可读介质,能够提高文本翻译的效率。
6.根据本技术的一方面,提供了文本翻译方法,所述方法包括:获取待翻译文本及至少一个目标翻译语种;将所述待翻译文本划分为至少一个目标待翻译分词;确定每个所述目标待翻译分词在每个所述目标翻译语种中对应的目标翻译分词;根据所述目标翻译分词确定所述待翻译文本在每个所述目标翻译语种的翻译文本。
7.可选的,将所述待翻译文本划分为至少一个目标待翻译分词,包括:确定所述待翻译文本中的至少一个分句;对每个所述分句进行解析,得到至少一个语素;所述语素表示一个最小的具有意义的单位;根据每个所述语素划分将每个所述分句划分为至少一个所述目标待翻译分词。
8.可选的,确定每个所述目标待翻译分词在每个所述目标翻译语种中对应的目标翻译分词,包括:对每个所述目标翻译语种,执行:确定当前目标翻译语种的翻译规则,其中,所述翻译规则包括至少一个属性值与当前目标翻译语种的一个翻译分词的对应关系;确定每个所述目标待翻译分词的属性值;根据每个所述属性值对应的所述翻译分词确定所述目标待翻译分词的目标翻译分词。
9.可选的,方法还包括:当一属性值在所述翻译规则中未与任一翻译分词具有对应关系时,确定该属性值对应的待翻译分词;接收外部输入的该待翻译分词在至少一个所述目标翻译语种中对应的新建翻译分词;将该待翻译分词的属性值与所述新建翻译分词的对应关系保存到所述翻译规则中。
10.根据本技术的另一方面,提供了文本翻译装置,所述装置包括:获取单元,用于获取待翻译文本及至少一个目标翻译语种;划分单元,用于将所述待翻译文本划分为至少一个目标待翻译分词;分词确定单元,用于确定每个所述目标待翻译分词在每个所述目标翻译语种中对应的目标翻译分词;文本确定单元,用于根据所述目标翻译分词确定所述待翻
译文本在每个所述目标翻译语种的翻译文本。
11.可选的,所述划分单元,用于确定所述待翻译文本中的至少一个分句;对每个所述分句进行解析,得到至少一个语素;所述语素表示一个最小的具有意义的单位;根据每个所述语素划分将每个所述分句划分为至少一个所述目标待翻译分词。
12.可选的,所述分词确定单元,用于对每个所述目标翻译语种,执行:确定当前目标翻译语种的翻译规则,其中,所述翻译规则包括至少一个属性值与当前目标翻译语种的一个翻译分词的对应关系;确定每个所述目标待翻译分词的属性值;根据每个所述属性值对应的所述翻译分词确定所述目标待翻译分词的目标翻译分词。
13.可选的,装置还包括:新建单元;所述新建单元,用于当一属性值在所述翻译规则中未与任一翻译分词具有对应关系时,确定该属性值对应的待翻译分词;接收外部输入的该待翻译分词在至少一个所述目标翻译语种中对应的新建翻译分词;将该待翻译分词的属性值与所述新建翻译分词的对应关系保存到所述翻译规则中。
14.根据本技术的另一方面,提供了文本翻译装置,包括:至少一个存储器和至少一个处理器;
15.所述至少一个存储器,用于存储机器可读程序;
16.所述至少一个处理器,用于调用所述机器可读程序,执行上述实施例中任一所述的方法。
17.根据本技术的另一方面,提供了计算机可读介质,所述计算机可读介质上存储有计算机指令,所述计算机指令在被处理器执行时,使所述处理器执行上述实施例中任一所述的方法。
18.本发明实施例提供了文本翻译方法、装置及计算机可读介质,确定待翻译文本和作为翻译目标的至少一个目标翻译语种,将待翻译文本划分为至少一个目标待翻译分词,将目标待翻译分词翻译为每个目标翻译语种,并确定每个目标翻译语种下的翻译文本。本发明提供的方案能够自动对多语文件进行翻译,通过将待翻译文本进行划分为字段形式的待翻译分词,对每个待翻译分词进行翻译,得到翻译后的翻译分词,再根据翻译分词确定目标翻译语种的翻译文本,节省翻译时间,提高了文本翻译的效率。
附图说明
19.为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
20.图1是本发明一实施例提供的一种文本翻译方法的流程图;
21.图2是本发明一实施例提供的一种文本划分方法的流程图;
22.图3是本发明一实施例提供的一种翻译分词确定方法的流程图;
23.图4是本发明一实施例提供的一种文本翻译装置的示意图。
具体实施方式
24.为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例
中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例,基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本发明保护的范围。
25.目前在进行资源翻译时,需要根据中文的词条,根据一条一条的语句去翻译,然后将翻译后的文件填写到英文国际化资源文件中,这种复制粘贴形式的翻译,非常影响研发效率,耗时多,重复性高。
26.如图1所示,本发明实施例提供了一种文本翻译方法,该方法可以包括以下步骤:
27.步骤110:获取待翻译文本及至少一个目标翻译语种。
28.步骤120:将所述待翻译文本划分为至少一个目标待翻译分词。
29.步骤130:确定每个所述目标待翻译分词在每个所述目标翻译语种中对应的目标翻译分词。
30.步骤140:根据所述目标翻译分词确定所述待翻译文本在每个所述目标翻译语种的翻译文本。
31.本发明实施例中,确定待翻译文本和作为翻译目标的至少一个目标翻译语种,比如中译英、简体转繁体等;将待翻译文本划分为至少一个目标待翻译分词,将目标待翻译分词翻译为每个目标翻译语种,并确定每个目标翻译语种下的翻译文本。本发明提供的方案能够自动对多语文件进行翻译,通过将待翻译文本进行划分为字段形式的待翻译分词,对每个待翻译分词进行翻译,得到翻译后的翻译分词,再根据翻译分词确定目标翻译语种的翻译文本,节省翻译时间,提高了文本翻译的效率。
32.如图2所示,本发明实施例提供了还一种文本划分方法,该方法用于将所述待翻译文本划分为至少一个目标待翻译分词,该方法包括以下步骤:
33.步骤210:确定所述待翻译文本中的至少一个分句。
34.步骤220:对每个所述分句进行解析,得到至少一个语素;所述语素表示一个最小的具有意义的单位。
35.步骤230:根据每个所述语素划分将每个所述分句划分为至少一个所述目标待翻译分词。
36.在获取到待翻译文本后,确定待翻译文本中包括的分局,分句可以通过标点符号或空格来进行确定。根据每个分局中包括的语素对分局进行划分,将分局进一步拆分成一个个具有单独意义的词条,及目标待翻译分词。
37.如图3所示,本发明实施例还提供了一种翻译分词确定方法,该方法对每个所述所述翻译语种,执行以下步骤:
38.步骤310:确定当前目标翻译语种的翻译规则,其中,所述翻译规则包括至少一个属性值与当前目标翻译语种的一个翻译分词的对应关系。
39.步骤320:确定每个所述目标待翻译分词的属性值。
40.步骤330:根据每个所述属性值对应的所述翻译分词确定所述目标待翻译分词的目标翻译分词。
41.其中,每个待翻译分词对应一个属性值,属性值可以根据待翻译分词包括的文字来确定,每个待翻译分词的属性值都是唯一的。每个属性值对应一种翻译语种的一个翻译分词,翻译分词为已经翻译好的词条,可以根据属性值来替换待翻译文本中的待翻译分词,
比如,中文“你”的属性值为001,属性值001对应的英文的“you”,用对应的翻译分词来替换原有的待翻译分词,重复上述步骤之后完成对文本的翻译。
42.在本发明实施例中,所述方法进一步包括:当一属性值在所述翻译规则中未与任一翻译分词具有对应关系时,确定该属性值对应的待翻译分词;接收外部输入的该待翻译分词在至少一个所述目标翻译语种中对应的新建翻译分词;将该待翻译分词的属性值与所述新建翻译分词的对应关系保存到所述翻译规则中。
43.其中,由于有些属性值没有预先建立与翻译分词的对应关系,比如一些少用的单词或汉字,没有预先对属性值预先翻译。在得到待翻译文本中其他翻译完成的待翻译分词的翻译后,可以筛选出由于没有属性值对应的翻译分词而未进行翻译的待翻译分词,通过对这些待翻译分词进行翻译,得到新建翻译分词,建立新建翻译分词与待翻译分词的属性值的对应关系,并更新到翻译规则中,通过不断的更新能够覆盖更多的待翻译分词,提高翻译的精确性和可用性。
44.如图4所示,本发明实施例提供了一种文本翻译装置,该装置包括:
45.获取单元410,用于获取待翻译文本及至少一个目标翻译语种;
46.划分单元420,用于将所述待翻译文本划分为至少一个目标待翻译分词;
47.分词确定单元430,用于确定每个所述目标待翻译分词在每个所述目标翻译语种中对应的目标翻译分词;
48.文本确定单元440,用于根据所述目标翻译分词确定所述待翻译文本在每个所述目标翻译语种的翻译文本。
49.在本发明实施例中,所述划分单元420,用于确定所述待翻译文本中的至少一个分句;对每个所述分句进行解析,得到至少一个语素;所述语素表示一个最小的具有意义的单位;根据每个所述语素划分将每个所述分句划分为至少一个所述目标待翻译分词。
50.在本发明实施例中,所述分词确定单元430,用于对每个所述目标翻译语种,执行:确定当前目标翻译语种的翻译规则,其中,所述翻译规则包括至少一个属性值与当前目标翻译语种的一个翻译分词的对应关系;确定每个所述目标待翻译分词的属性值;根据每个所述属性值对应的所述翻译分词确定所述目标待翻译分词的目标翻译分词。
51.在本发明实施例中,所述装置还包括:新建单元;所述新建单元,用于当一属性值在所述翻译规则中未与任一翻译分词具有对应关系时,确定该属性值对应的待翻译分词;接收外部输入的该待翻译分词在至少一个所述目标翻译语种中对应的新建翻译分词;将该待翻译分词的属性值与所述新建翻译分词的对应关系保存到所述翻译规则中。
52.可以理解的是,本发明实施例示意的结构并不构成对文本翻译装置的具体限定。在本发明的另一些实施例中,文本翻译装置可以包括比图示更多或者更少的部件,或者组合某些部件,或者拆分某些部件,或者不同的部件布置。图示的部件可以以硬件、软件或者软件和硬件的组合来实现。
53.上述装置内的各单元之间的信息交互、执行过程等内容,由于与本发明方法实施例基于同一构思,具体内容可参见本发明方法实施例中的叙述,此处不再赘述。
54.本发明还提供了一种计算机可读介质,存储用于使一计算机执行如本文所述的文本翻译方法的指令。具体地,可以提供配有存储介质的系统或者装置,在该存储介质上存储着实现上述实施例中任一实施例的功能的软件程序代码,且使该系统或者装置的计算机
(或cpu或mpu)读出并执行存储在存储介质中的程序代码。
55.在这种情况下,从存储介质读取的程序代码本身可实现上述实施例中任何一项实施例的功能,因此程序代码和存储程序代码的存储介质构成了本发明的一部分。
56.用于提供程序代码的存储介质实施例包括软盘、硬盘、磁光盘、光盘(如cd-rom、cd-r、cd-rw、dvd-rom、dvd-ram、dvd-rw、dvd rw)、磁带、非易失性存储卡和rom。可选择地,可以由通信网络从服务器计算机上下载程序代码。
57.此外,应该清楚的是,不仅可以通过执行计算机所读出的程序代码,而且可以通过基于程序代码的指令使计算机上操作的操作系统等来完成部分或者全部的实际操作,从而实现上述实施例中任意一项实施例的功能。
58.此外,可以理解的是,将由存储介质读出的程序代码写到插入计算机内的扩展板中所设置的存储器中或者写到与计算机相连接的扩展单元中设置的存储器中,随后基于程序代码的指令使安装在扩展板或者扩展单元上的cpu等来执行部分和全部实际操作,从而实现上述实施例中任一实施例的功能。
59.需要说明的是,上述各流程和各系统结构图中不是所有的步骤和模块都是必须的,可以根据实际的需要忽略某些步骤或模块。各步骤的执行顺序不是固定的,可以根据需要进行调整。上述各实施例中描述的系统结构可以是物理结构,也可以是逻辑结构,即,有些模块可能由同一物理实体实现,或者,有些模块可能分由多个物理实体实现,或者,可以由多个独立设备中的某些部件共同实现。
60.以上各实施例中,硬件单元可以通过机械方式或电气方式实现。例如,一个硬件单元可以包括永久性专用的电路或逻辑(如专门的处理器,fpga或asic)来完成相应操作。硬件单元还可以包括可编程逻辑或电路(如通用处理器或其它可编程处理器),可以由软件进行临时的设置以完成相应操作。具体的实现方式(机械方式、或专用的永久性电路、或者临时设置的电路)可以基于成本和时间上的考虑来确定。
61.上文通过附图和优选实施例对本发明进行了详细展示和说明,然而本发明不限于这些已揭示的实施例,基于上述多个实施例本领域技术人员可以知晓,可以组合上述不同实施例中的代码审核手段得到本发明更多的实施例,这些实施例也在本发明的保护范围之内。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献