一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种确定目标语言文本大小写的方法及装置与流程

2022-05-26 18:15:21 来源:中国专利 TAG:

技术特征:
1.一种确定目标语言文本大小写的方法,其特征在于,所述方法包括:获取待处理文本,所述待处理文本包括目标语言文本和其它语言的文本;将所述待处理文本输入机器学习模型,得到所述目标语言文本的格式,所述目标语言文本的格式,用于指示所述目标语言文本中各个字符的大小写,所述机器学习模型,用于确定目标语言文本的格式。2.根据权利要求1所述的方法,其特征在于,所述目标语言文本包括第一文本,所述第一文本的格式,包括以下任意一种:全小写、首字符大写、全大写以及其它,其中,所述其它表示除所述全小写、所述首字符大写以及所述全大写之外的格式。3.根据权利要求1所述的方法,其特征在于,所述机器学习模型,通过如下方式训练得到:获取训练文本和所述训练文本对应的标签,所述训练文本对应的标签,用于指示所述训练文本中目标语言文本的格式,所述训练文本包括目标语言文本和所述其它语言的文本;基于所述训练文本和所述训练文本对应的标签,训练得到所述机器学习模型。4.根据权利要求1所述的方法,其特征在于,所述获取训练文本,包括:获取语料,所述语料包括目标语言文本和其它语言的文本;将所述语料中的部分所述其它语言的文本翻译成目标语言文本,得到所述训练文本。5.根据权利要求1-4任意一项所述的方法,其特征在于,所述机器学习模型,包括特征提取模块和特征变换模块;所述特征提取模块,用于提取所述待处理文本中各个文本的特征;所述特征变换模块,用于根据所述各个文本的特征,确定所述待处理文本中的目标语言文本的格式。6.根据权利要求5所述的方法,其特征在于,所述特征提取模块为预训练语言模型。7.根据权利要求1所述的方法,其特征在于,所述方法还包括:根据所述目标语言文本的格式对所述待处理文本中的目标语言文本进行处理,得到目标文本,所述目标文本中目标语言文本的大小写与所述目标语言文本的格式相匹配。8.根据权利要求7所述的方法,其特征在于,所述目标语言文本包括第一文本,所述第一文本的格式为其它格式,所述方法还包括:根据预先存储的所述第一文本和第一标准文本之间的对应关系,确定所述第一标准文本,所述第一标准文本用于指示所述第一文本各个字符的大小写;所述根据所述目标语言文本的格式对所述待处理文本中的目标语言文本进行处理,得到目标文本,包括:将所述第一文本转换为所述第一标准文本。9.根据权利要求1所述的方法,其特征在于,所述获取待处理文本,包括:对语音进行识别,得到所述待处理文本。10.一种确定目标语言文本大小写的装置,其特征在于,所述装置包括:获取单元,用于获取待处理文本,所述待处理文本包括目标语言文本和其它语言的文本;
第一确定单元,用于将所述待处理文本输入机器学习模型,得到所述目标语言文本的格式,所述目标语言文本的格式,用于指示所述目标语言文本中各个字符的大小写,所述机器学习模型,用于确定目标语言文本的格式。11.一种设备,其特征在于,所述设备包括处理器和存储器;所述处理器用于执行所述存储器中存储的指令,以使得所述设备执行如权利要求1至9中任一项所述的方法。12.一种计算机可读存储介质,其特征在于,包括指令,所述指令指示设备执行如权利要求1至9中任一项所述的方法。

技术总结
本申请公开了一种确定目标语言文本大小写的方法,在一个示例中,该方法可以由客户端执行。客户端可以获取待处理文本,所述待处理文本包括目标语言文本和其它语言的文本。而后,将所述待处理文本输入机器学习模型,所述机器学习模型能够用于确定目标语言文本的格式。将所述待处理文本输入机器学习模型之后,可以得到所述目标语言文本的格式,其中,所述目标语言文本的格式,用于指示所述目标语言文本中各个字符的大小写。由此可见,利用本申请实施例的方案,无需利用预先制定的规则来确定目标语言文本的大小写,而是利用机器学习模型来确定目标语言文本中各个字符的大小写,从而能够提升确定目标语言文本中各个字符的大小写的准确度。写的准确度。写的准确度。


技术研发人员:程进 姚佳立 杨晶生 宋航
受保护的技术使用者:北京字跳网络技术有限公司
技术研发日:2022.02.21
技术公布日:2022/5/25
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献