一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

用于数据分析和商业智能的模型本地化的制作方法

2022-10-26 23:35:00 来源:中国专利 TAG:


1.本公开涉及计算机程序中的内容的本地化的领域。


背景技术:

2.在计算机领域中,国际化和本地化是指计算机软件对目标地区的不同语言、区域特点和技术要求的适应。在过去,本地化要求以期望地区的语言对用户界面以及在合适的情况下底层编程变量的人工代码化。最近,计算机程序的表示层已经被抽象以包括占位符,这些占位符然后可以被映射到存储在表中的本地特定词项。以这种方式,仅需要指定计算机程序的表示层的单一抽象形式,同时针对相应不同地区的一系列不同表可以被提供以按需使表示层本地化。
3.尽管用于表示层的本地化的前述技术能够是相当高效的,但是使数据库本地化实质上更加复杂。用于使数据库本地化的一种技术是将以不同语言或不同地区习俗的存储数据的不同版本存储在每个记录的不同列中。在另一技术中,数据库的一个表仅包括地区无关数据,而地区特定数据被分离到不同表或一个表的不同行中。但是,在所有情况下,如此明显,就数据库大小而言具有成本。用于以数据库实现的数据模型的本地化还能够以与使数据库本身本地化的方式类似的方式来实现,伴随着类似的结果。
4.值得注意的是,在本地化的所有实例中,都难以逃脱为每个通用占位符选择相关翻译词项的要求。因此,翻译者的人工干预仍然是至关重要的。而且,在这么多实例中,词项可以具有取决于词项已经被使用在其中的上下文的不同翻译。而且,一旦模型已经使用一系列翻译词项以本地化方式被指定,就不存在随时间在其认识到在数据库模型中针对特定词项存在更好的翻译时校正不同翻译的简单方式。因此,模型本地化仍然不完美。


技术实现要素:

5.本公开的一个方面提供一种用于数据分析中的模型本地化的计算机实现的方法。用于模型本地化的计算机实现的方法当在数据处理硬件上执行时使数据处理硬件执行包括以下的操作:解析模型以识别可翻译词项;生成将可翻译词项中的每个可翻译词项与对应标签相关联并且用对应标签替换模型中的每个可翻译词项的种子文件;以及将可翻译词项中的每个可翻译词项提交到目标语言的机器翻译以产生将来自种子文件的每个标签与可翻译词项中的对应一个可翻译词项的以目标语言的翻译词项映射的不同翻译文件。操作还包括使用不同翻译文件来将模型部署在数据分析应用中以在对数据分析应用的用户界面内将每个可翻译词项动态地翻译成对应翻译词项。
6.本公开的各方面可以包括以下可选特征中的一个或多个。在一些实施方式中,操作还包括:将数据分析应用的终端用户指定为授权翻译者;以视觉上有区别的方式在用户界面中呈现每个对应翻译词项;以及从授权翻译者接收对应翻译词项的接受或拒绝。在这些实施方式中,针对由授权翻译者拒绝的每个对应翻译词项,操作还包括从授权翻译者接收替代翻译并且将替代翻译存储在不同翻译文件中。
7.在一些示例中,操作还包括:检测模型的变化;重新生成种子文件以考虑可翻译词项的变化;将可翻译词项中的每个变化的可翻译词项重新提交到目标语言的机器翻译以产生更新的翻译文件;以及使用更新的不同翻译文件将模型重新部署在数据分析应用中。种子文件可以包括预先存在的种子文件的副本。
8.在本公开的另一方面中,一种数据分析数据处理系统被配置用于模型本地化。该系统包括:主机计算平台,其包括具有存储器和至少一个处理器的至少一个计算机;以及其中存储了数据库模型的固定储存器。该系统还包括:数据分析应用,其在主机计算平台中执行;以及机器翻译器,其在主机计算平台中执行。最后,该系统包括:模型本地化模块,其包括在主机计算平台中执行期间启用以执行包括以下的操作的计算机程序指令:解析模型以识别可翻译词项;以及生成将可翻译词项中的每个可翻译词项与对应标签相关联并且用对应标签替换模型中的每个可翻译词项的种子文件。操作还包括:将可翻译词项中的每个可翻译词项提交到目标语言的机器翻译器以产生将来自种子文件的每个标签与可翻译词项中的对应一个可翻译词项的以目标语言的翻译词项映射的不同翻译文件。操作还包括使用不同翻译文件来将模型部署在数据分析应用中以在数据分析应用的用户界面内将每个可翻译词项动态地翻译成对应翻译词项。
9.本公开的这个方面可以包括以下可选特征中的一个或多个。在一些示例中,操作进一步包括:将数据分析应用的终端用户指定为授权翻译者;以视觉上有区别的方式在用户界面中呈现每个对应翻译词项;从授权翻译者接收对于对应翻译词项的接受或拒绝;以及针对由授权翻译者拒绝的每个对应翻译词项,从授权翻译者接收替代翻译并且将替代翻译存储在不同翻译文件中。
10.在一些实施方式中,操作进一步包括:检测模型的变化;重新生成种子文件以考虑可翻译词项的变化;将可翻译词项中的每个变化的可翻译词项重新提交到目标语言的机器翻译以产生更新的翻译文件;以及使用更新的不同的翻译文件将模型重新部署在数据分析应用中。在一个示例中,种子文件是预先存在的种子文件的副本。
11.本公开的另一方面提供一种用于模型本地化的计算机程序产品。该计算机程序产品包括具有随其体现的程序指令的计算机可读存储介质,程序指令能由设备执行以使设备执行操作。操作包括:解析模型以识别可翻译词项;生成将可翻译词项中的每个可翻译词项与对应标签相关联并且用对应标签替换模型中的每个可翻译词项的种子文件;将可翻译词项中的每个可翻译词项提交到目标语言的机器翻译以产生将来自种子文件的每个标签与可翻译词项中的对应一个可翻译词项的以目标语言的翻译词项映射的不同翻译文件;以及使用不同翻译文件来将模型部署在数据分析应用中以在数据分析应用的用户界面内将每个可翻译词项动态地翻译成对应翻译词项。
12.本公开的这个方面可以包括以下可选特征中的一个或多个。在一些示例中,操作进一步包括:将数据分析应用的终端用户指定为授权翻译者;以视觉上有区别的方式在用户界面中呈现每个对应翻译词项;从授权翻译者接收对于对应翻译词项的接受或拒绝;以及针对由授权翻译者拒绝的每个对应翻译词项,从授权翻译者接收替代翻译并且将替代翻译存储在不同翻译文件中。
13.在一些实施方式中,操作进一步包括:检测模型的变化;重新生成种子文件以考虑可翻译词项的变化;将可翻译词项中的每个变化的可翻译词项重新提交到目标语言的机器
翻译以产生更新的翻译文件;以及使用更新的不同翻译文件将模型重新部署在数据分析应用中。可选地,种子文件是预先存在的种子文件的副本。
14.在附图和下面的描述中阐述本公开的一个或多个实施方式的细节。其他方面、特征和优点将从说明书和附图以及从权利要求书显而易见。
附图说明
15.图1是用于模型本地化的图画图示;
16.图2是适于模型本地化的数据处理系统的示意性图示;以及
17.图3是图示用于模型本地化的过程的流程图。
18.各个附图中的相同附图标记指示相同的元件。
具体实施方式
19.本公开的示例提供用于模型本地化。根据本公开的示例,针对数据库生成数据模型并且将数据模型加载到存储器中以用于解析。在解析期间,识别不同可翻译词项并且每个可翻译词项用相关联的标签替换。然后将关联存储在将每个标签与对应可翻译词项映射的种子文件中。其后,将种子文件中的可翻译词项中的每个可翻译词项提交到目标语言的机器翻译器以便产生将来自种子文件的每个标签与可翻译词项中的对应一个可翻译词项的以目标语言的翻译词项映射的不同翻译文件。最后,可以使用不同翻译文件将针对数据库的模型部署在数据分析应用中,以便在数据分析应用的用户界面内将每个可翻译词项动态地翻译成对应翻译词项,而无需对数据模型或底层数据库的不期望膨胀,并且同时允许对翻译文件中的翻译的稍后的灵活的修改,而无需对底层数据库的修改。
20.在进一步图示中,图1是用于模型本地化的图画图示。如图1所示,数据分析应用100分析数据库110以产生数据库110的数据模型120。数据模型120包括不同词项,其中的一些可从一种语言翻译到另一种。数据模型120被提供到解析器130,解析器130解析数据模型120的词项并且用对应标签替换数据模型120中的每个可翻译词项。因此,通过将每个标签与从数据模型120移除的可翻译词项中的对应一个可翻译词项映射来生成种子文件140。可选地,种子文件140可以在先前针对数据模型120的先前版本被生成并且简单地修改以适应对数据模型120的更新。
21.种子文件140然后被提交到机器翻译器150,机器翻译器150将每个可翻译词项翻译成以目标语言的翻译词项。翻译文件160然后存储来自种子文件140的每个标签与对应机器翻译词项的映射。最后,当在数据分析应用100中处理数据模型120时,数据分析应用100用翻译文件160中映射到数据模型120中的每个标签的翻译词项替换该标签。
22.其后,被授权修改翻译文件160的数据分析应用100的终端用户可以在数据分析应用100的界面中提供与由机器翻译器150产生的翻译文件160中的翻译不同的针对数据模型120中的可翻译词项的推荐翻译。此外,针对标签的多个不同替代翻译词项可以连同由数据分析应用100的不同终端用户做出的评级一起被存储在翻译文件160中。替代翻译词项中最高评级的一个替代翻译词项因此由数据分析应用100在处理数据模型120中使用。
23.图1中示出的过程可以被实现在数据分析数据处理系统内。在进一步图示中,图2示意性示出适于模型本地化的数据处理系统201。系统201包括主机计算平台210,主机计算
平台210包括存储器260和至少一个处理器212。主机计算平台210通过计算机通信网络220通信地耦合到包括用户界面232的不同客户端计算设备230。数据分析应用270在主机计算平台210的存储器260中执行并且在通过在主机计算平台210的存储器260中针对数据库250生成的数据模型200对数据库250执行数据分析中通过相应不同的数据分析接口240从不同终端用户接收指示并且向不同终端用户提供输出。
24.值得注意的是,系统201包括模型本地化模块300。模型本地化模块300包括在主机计算平台210的存储器260中执行期间启用的计算机程序指令,以解析存储器260中的数据模型200以识别其中的可翻译词项以及用独特标签替换模型200中的每个可翻译词项以及将每个独特标签与种子文件290b中的对应可翻译词项映射。程序指令进一步在存储器260中执行期间启用,以将种子文件290b提交到在主机计算平台210中执行的机器翻译器280以在翻译文件290a中产生针对种子文件290b中的每个可翻译词项的以目标语言的翻译。最后,模块300的程序指令被启用以部署翻译文件290a用于在数据分析应用270中使用。
25.在模型本地化模块300的操作的更进一步图示中,图3是图示用于模型本地化的方法301的流程图。从框310开始,在数据分析应用270中针对指定数据库250选择模型200。在框320中,然后解析模型200以识别可翻译词项,例如,参考可翻译词项的数据词典,使得存在于词典和模型两者中的词项被认为是可翻译的。在框330中,用标签替换每一个数据模型中的可翻译词项,并且在框340中,生成将数据模型200中替换的每个可翻译词项与对应指派标签映射的种子文件290b。
26.在框350中,将种子文件290b提交到机器翻译以产生针对种子文件290b中的每个可翻译词项的以目标语言的翻译。在框360中,生成将种子文件290b的每个标签映射到由机器翻译产生的对应翻译词项的翻译文件290a。
27.其后,将翻译文件290a部署用于由数据分析应用在用以目标语言的对应翻译词项动态地替换数据模型200中的每个标签中使用。值得注意的是,在判定框380中,可以确定数据模型200是否已经改变,例如,由于底层数据库的改变。如果是,则过程能够利用数据模型200的新解析返回到框320,以生成可以从其可生成新翻译文件290a的新种子文件290b。
28.此外,在判定框390中,可以确定是否已经针对在数据分析应用的用户界面232中呈现的一个或多个翻译词项接收到更新的翻译。在这一点上,数据分析应用的一个或多个被授权终端用户可以在用户界面232中被呈现翻译词项的指示并且被提供接受或确认翻译词项的翻译、输入翻译词项的新翻译或对翻译词项的翻译进行评级的机会。在翻译词项由于输入而改变的程度上,在框400中更新翻译文件并且将翻译文件重新部署到数据分析应用。以这种方式,数据模型的本地化可以随时间动态地更新,而无需数据模型本身的侵入式人工修改。
29.本公开可以被体现在一种系统、方法、计算机程序产品或其任何组合中。计算机程序产品可以包括其上具有用于使处理器执行本公开的各方面的计算机可读程序指令的计算机可读存储介质或媒介。计算机可读存储介质能够是能够保持并存储用于由指令执行设备使用的指令的有形设备。计算机可读存储介质可以是例如但不限于电子存储设备、磁存储设备、光学存储设备、电磁存储设备、半导体存储设备、或前述的任何合适的组合。
30.本文中描述的计算机可读程序指令能够从计算机可读存储介质被下载到相应计算/处理设备或经由网络被下载到外部计算机或外部存储设备。计算机可读程序指令可以
完全在用户的计算机上、部分在用户的计算上、作为独立软件包、部分在用户的计算上并且部分在远程计算机上或完全在远程计算机或服务器上执行。本文中参考根据本公开的示例的方法、装置(系统)和计算机程序产品的流程图图示和/或框图来描述本公开的各方面。将理解,流程图图示和/或框图的每个框以及流程图图示和/或框图中的框的组合能够通过计算机可读程序指令来实现。
31.这些计算机可读程序指令可以被提供到通用计算机、专用计算机、或其他可编程数据处理装置的处理器以产生机器,使得经由计算机或其他可编程数据处理装置的处理器执行的指令创建用于实现流程图和/或框图框或多个框中指定的功能/动作的模块。这些计算机可读程序指令还可以被存储在能够指示计算机、可编程数据处理装置和/或其他设备以特定方式运转的计算机可读存储介质中,使得具有存储在其中的指令的计算机可读存储介质包括包含实现流程图和/或框图框或多个框中指定的功能/动作的各方面的指令的制品。
32.计算机可读程序指令还可以被加载到计算机、其他可编程数据处理装置、或其他设备上以使一系列操作步骤在计算机、其他可编程装置或其他设备上执行以产生计算机实现的过程,使得在计算机、其他可编程装置或其他设备上执行的指令实现流程图和/或框图框或多个框中指定的功能/动作。
33.附图中的流程图和框图图示根据本公开的各个示例的系统、方法和计算机程序产品的可能实现的架构、功能和操作。在这一点上,流程图或框图中的每个框可以表示指令的模块、片段、或部分,其包括用于实现指定逻辑功能的一个或多个可执行指令。在一些替代实现中,框中指出的功能可以不按图中指出的次序发生。例如,连续示出的两个框可以实际上基本上同时被执行,或者框可以有时以相反次序执行,取决于所涉及的功能。还将指出,框图和/或流程图图示的每个框以及框图和/或流程图图示的框的组合能够由执行指定功能或动作或者执行专用硬件和计算机指令的组合的基于专用硬件的系统来实现。
34.最后,本文中使用的术语仅出于描述特定示例的目的并且不旨在为本公开的限制。如本文中所使用的,单数形式“一”、“一个”和“该”旨在也包括复数形式,除非上下文另外清楚地指示。将进一步理解,术语“包括”和/或“包含”在本说明书中使用时指定所述特征、整数、步骤、操作、元件和/或组件的存在,但是不排除一个或多个其他特征、整数、步骤、操作、元件、组件和/或其组的存在或添加。
35.下面的权利要求中的所有模块或步骤加功能元件的对应结构、材料、动作和等价物旨在包括用于结合其他要求保护的元件执行如具体要求保护的功能的任何结构、材料或动作。本公开的描述已经出于说明和描述的目的而被呈现,但是不旨在为穷尽的或者将本公开限于所公开的形式。在不脱离本公开的范围和精神的情况下,许多修改和变型将对本领域普通技术人员显而易见。选择和描述示例以便最好地说明本公开的原理和实际应用,并且使得本领域其他普通技术人员能够理解具有适于预期到的特定用途的各种修改的各个示例的公开内容。
36.已经描述了许多实施方式。然而,将理解,可以在不脱离本公开的精神和范围的情况下进行各种修改。因此,其他实施方式在随附权利要求的范围内。
再多了解一些

本文用于创业者技术爱好者查询,仅供学习研究,如用于商业用途,请联系技术所有人。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献