一种英文案例训练方法、装置、设备及可读存储介质

2022-07-13 15:36:05 来源：中国专利 TAG：

1.本发明涉及自然语言处理技术领域，具体而言，涉及英文案例训练方法、装置、设备及可读存储介质。

背景技术：

2.在计算机自然语言处理领域，语言模型的训练需要依赖极大量的语料数据，局限性较大。
3.现有技术中一般采用将语音转换成文本，再将采用算法将文本信息与翻译库中的语句进行相似性匹配，将相似度最高的结果作为输出。采用信息检索技术对大规模翻译记忆库构建索引，采用粗选和精选策略，即首先从索引库中根据输入的待译句子得到匹配的子集，然后利用句子语义向量相似度和编辑距离线性组合的模糊匹配方法得到最终的翻译输出，最后将人工后编辑后的译文及其源语言句段返回翻译记忆库增量式更新。这样效率并不高，也影响了交流效率。

技术实现要素：

4.本发明的目的在于提供一种英文案例训练方法、装置、设备及可读存储介质，以改善上述问题。为了实现上述目的，本发明采取的技术方案如下：第一方面，本技术提供了一种英文案例训练方法，包括：获取目标案例文本语句中至少两个英文字符和所述字符之间的组合关系,每个所述字符均对应有第一向量集合,所述第一向量集合中包括至少一个字符;基于所述字符之间的组合关系和每个所述字符对应的所述第一向量集合,得到训练案例，将所有的所述训练案例进行集合,得到英文训练案例集合;对所述英文训练案例集合中的每个所述训练案例进行测试,得到每个所述训练案例对应的案例训练结果。
5.优选地，所述基于所述字符之间的组合关系和每个所述字符对应的所述第一向量集合,得到训练案例，包括：分析所述字符之间的组合关系，若所述字符之间的组合关系为且的关系，则在每个所述第一向量集合里各取一个所述字符，将取出来的所有所述字符与其对应的所述字符进行集合得到所述训练案例；分析所述字符之间的组合关系，若所述字符之间的组合关系为或的关系，则在每个所述字符所对应的所述第一向量集合中均加入一个代表空值的字符；将加入所述代表空值的字符后的所述第一向量集合定义为第二向量集合；在每个所述第二向量集合里各取一个字符，将取出来的所有数值与其对应的所述字符进行集合得到所述训练案例。
6.优选地，所述将所有的所述训练案例进行集合,得到英文训练案例集合，之后包括：
获取第一信息，所述第一信息包括英文训练案例集合中的英文语音信息；将所述第一信息转换为数字语音信号，检测到与所述数值语音信号相对应的匹配参数；根据所述匹配参数识别到相对应的图像信息，对图像信息进行顺序标注，并将标注好的所述图像信息输入至卷积神经网络中进行训练；根据时序分类算法，对所述卷积神经网络中的所述图像信息进行更新；基于遗传算法，将更新后的所述图像信息重新配置得到可编程器件的重配置数据流；根据所述重配置数据流，找到与所述重配置数据流相匹配的所述训练案例。
7.优选地，所述对所述英文训练案例集合中的每个所述训练案例进行测试，之后包括：获取第二信息，所述第二信息包括每个所述训练案例进行测试的结果；对所述测试的结果进行预处理后，得到英文训练文本；将所述英文训练文本输入至word2vec模型中；转换所述word2vec模型中的所述英文训练文本为向量集合；将所述向量集合和英文训练文本输入至卷积神经网络中训练，得到训练结果；根据训练结果和预置代价函数计算得出损失函数值；判断所述损失函数值是否低于预置阈值；若是，则保存损失函数的参数，并生成训练后的英文文本模型；若否，则继续进行计算。
8.第二方面，本技术还提供了一种英文案例训练装置，包括获取模块、集合模块和测试模块，其中：获取模块：用于获取目标案例文本语句中至少两个英文字符和所述字符之间的组合关系,每个所述字符均对应有第一向量集合,所述第一向量集合中包括至少一个字符;集合模块：用于基于所述字符之间的组合关系和每个所述字符对应的所述第一向量集合,得到训练案例，将所有的所述训练案例进行集合,得到英文训练案例集合;测试模块：用于对所述英文训练案例集合中的每个所述训练案例进行测试,得到每个所述训练案例对应的案例训练结果。
9.第三方面，本技术还提供了一种英文案例训练设备，包括：存储器，用于存储计算机程序；处理器，用于执行所述计算机程序时实现所述英文案例训练方法的步骤。
10.第四方面，本技术还提供了一种可读存储介质，所述可读存储介质上存储有计算机程序，所述计算机程序被处理器执行时实现上述基于英文案例训练方法的步骤。
11.本发明的有益效果为：通过利用word2vec模型，使得文本能够表示为类似图像和语音的连续、稠密的数据，利用卷积神经网络，通过卷积神经网络的卷积层、池化层和非线性转换成来训练网络参数，使得能够得到正确的分类，解决了传统的英文文本表示方法表示的特征项之间相互独立，数据稀疏，导致了计算量大的技术问题，并且测试准确率大于预设准确率时，进一步提高了英文案例训练的准确率。
12.本发明的其他特征和优点将在随后的说明书阐述，并且，部分地从说明书中变得显而易见，或者通过实施本发明实施例了解。本发明的目的和其他优点可通过在所写的说
明书、权利要求书、以及附图中所特别指出的结构来实现和获得。
附图说明
13.为了更清楚地说明本发明实施例的技术方案，下面将对实施例中所需要使用的附图作简单地介绍，应当理解，以下附图仅示出了本发明的某些实施例，因此不应被看作是对范围的限定，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他相关的附图。
14.图1为本发明实施例中所述的英文案例训练方法流程示意图;图2为本发明实施例中所述的英文案例训练装置结构示意图；图3为本发明实施例中所述的英文案例训练设备结构示意图。
15.图中:701、获取模块；702、集合模块；7021、第一分析单元；7022、第二分析单元；7023、定义单元；7024、取值单元；703、测试模块；7031、第一获取单元；7032、检测单元；7033、训练单元；7034、更新单元；7035、配置单元；7036、匹配单元；7037、第二获取单元；7038、预处理单元；7039、输入单元；7040、转换单元；7041、获得单元；7042、计算单元；7043、判断单元；800、英文案例训练设备；801、处理器；802、存储器；803、多媒体组件；804、输入/输出(i/o)接口；805、通信组件。
具体实施方式
16.为使本发明实施例的目的、技术方案和优点更加清楚，下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例。通常在此处附图中描述和示出的本发明实施例的组件可以以各种不同的配置来布置和设计。因此，以下对在附图中提供的本发明的实施例的详细描述并非旨在限制要求保护的本发明的范围，而是仅仅表示本发明的选定实施例。基于本发明中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。
17.应注意到：相似的标号和字母在下面的附图中表示类似项，因此，一旦某一项在一个附图中被定义，则在随后的附图中不需要对其进行进一步定义和解释。同时，在本发明的描述中，术语“第一”、“第二”等仅用于区分描述，而不能理解为指示或暗示相对重要性。
18.实施例1：本实施例提供了一种英文案例训练方法。
19.参见图1，图中示出了本方法包括步骤s100、步骤s200和步骤s300。
20.s100、获取目标案例文本语句中至少两个英文字符和字符之间的组合关系,每个字符均对应有第一向量集合,第一向量集合中包括至少一个字符。
21.s200、基于字符之间的组合关系和每个字符对应的第一向量集合,得到训练案例，将所有的训练案例进行集合,得到英文训练案例集合。
22.分析字符之间的组合关系，若字符之间的组合关系为且的关系，则在每个第一向量集合里各取一个字符，将取出来的所有字符与其对应的字符进行集合得到训练案例；分析字符之间的组合关系，若字符之间的组合关系为或的关系，则在每个字符所对应的第一向量集合中均加入一个代表空值的字符；
将加入代表空值的字符后的第一向量集合定义为第二向量集合；在每个第二向量集合里各取一个字符，将取出来的所有数值与其对应的字符进行集合得到训练案例。
23.将所有的训练案例进行集合,得到英文训练案例集合，之后包括：获取第一信息，第一信息包括英文训练案例集合中的英文语音信息；将第一信息转换为数字语音信号，检测到与数值语音信号相对应的匹配参数；根据匹配参数识别到相对应的图像信息，对图像信息进行顺序标注，并将标注好的图像信息输入至卷积神经网络中进行训练；卷积神经网络是局部连接网络，相对于全连接网络其最大的特点就是局部连接性和权值共享性。对于一副图像中的某个像素p来说，离像素p越近的像素对其影响也就越大，即局部连接性越大。
24.另外，根据自然图像的统计特性，某个区域的权值也可以用于另一个区域，即权值共享性。权值共享可以理解为卷积核共享，在卷积神经网络(cnn)中，将一个卷积核对给定的图像做卷积运算就可以提取一种中文图像特征，不同的卷积核可以提取不同的中文图像特征。
25.由于卷积神经网络的局部连接性，使得模型的复杂度降低，提高模型训练的效率；并且，由于卷积神经网络的权值共享性，因此卷积神经网络可以并行学习，进一步提高模型训练效率。
26.在卷积神经网络中对训练进行特征提取，获取图像特征。
27.采用卷积神经网络对训练进行特征提取，所获取到的图像对应的图像特征。卷积神经网络模型包括卷积层和池化层。
28.将图像信息输入卷积神经网络模型中进行训练，通过每一层卷积层的计算，获取每一层的卷积层的输出，卷积层的输出可以通过公式：aml＝σ(zml)＝σ(aml-1*wl bl)式中，aml表示l第l层卷积层的第m个顺序标签的输出，即图像信息特征；zm 表示未采用激活函数处理前的第m个顺序标签的输出，aml-1表示l-1层的第m个顺序标签输出，σ表示激活函数，对于卷积层采用的激活函数σ为relu。
29.相比其他激活函数的效果会更好)，*表示卷积l l运算，w 表示第l层的卷积核(权值)，b表示第l层的偏置。
30.若第l层是池化层,则在池化层采用最大池化的下样采样对卷积层的输出进行降维处理，具体降维公式为：aml＝pool(a ml-1)其中，pool是指下采样计算，该下采样计算可以选择最大池化的方法，最大池化实际上就是在m*m的样本中取最大值。可以理解地，该图像特征携带有顺序标签。
31.本实施例中，由于线性模型的表达能力不够，因此采tanh(双曲正切)函数作为输入门的激活函数(即第二激活函数)，可加入非线性因素使得训练出的目标手写字识别模型能够解决更复杂的问题。并且，激活函数tanh(双曲正切)具有收敛速度快的优点，可以节省训练时间，提高训练效率。
32.具体地，通过输入门的计算公式计算输入门的输出。其中，输入门中还包括输入门
限，输入门的计算公式为：it＝σ(wi
·
[ht-1,xt] bi)式中，wi为输入门的权值矩阵，it表示输入门限，bi表示输入门的偏置项，通过输入门的计算公式对中文图像特征进行计算会得到一个0-1区间的标量(即输入门限)，此标量控制了神经元根据当前状态和过去状态的综合判断所接收当前信息的比例，即接收新输入的信息的比例，以减少计算量，提高训练效率。
[0033]
根据时序分类算法，对卷积神经网络中的图像信息进行更新；时序分类算法(简称ctc)，用于解决输入特征和输出标签之间对齐关系不确定的时间序列问题，是一种可以端到端同时优化模型参数和对齐切分的边界的算法。
[0034]
基于遗传算法，将更新后的图像信息重新配置得到可编程器件的重配置数据流；根据重配置数据流，找到与重配置数据流相匹配的训练案例。
[0035]
需要说明的是，处理器和可编程器件分别与语音获取模块连接；处理器分别和存储器、可编程器件、在线语音接收模块、语音获取模块以及显示播放模块电性连接。
[0036]
在线语音接收模块、存储器与可编程器件连接；语音获取模块获取语音信息并转换成数字语音信号；处理器接收数字语音信号，并将数字语音信号采用模糊声像规则进行语音检测，得到对应的匹配参数，根据匹配参数采用遗传算法运算得到可编程器件的重配置数据流，并将重配置数据流存储至存储器，处理器控制存储器以及可编程器件对可编程器件进行重新配置。
[0037]
匹配参数还用于通过在线语音接收模块检索在线语音数据，在线语音接收模块可将匹配参数作为导引来检索在线语音数据，并将在线语音数据进行粗略排序；将检索到的在线语音数据输入可编程器件进行模糊匹配。
[0038]
可编程器件被配置成实现模糊匹配算法，将若干个匹配参数作为模糊规则r，数字化语音作为输入量x，当输入量x激活若干条模糊规则r时，输出u则由若干条模糊规则的输出决定。
[0039]
可编程器件以数字语音信号以及在线语音数据作为输入，经过模糊匹配算法的计算，最后找到最为匹配的在线语音数据输出到处理器再进行组合以及文本翻译送至显示播放模块播放与显示。
[0040]
作为一种优选的实施方式，可编程器件可采用fpga实现，而处理器在启动程序时即能控制存储在存储器中的配置数据流完成对fpga芯片的上电后配置；在处理器运行的过程中也能重新生成重配置数据流以实现对fpga的重配置，以便于对不同的英文语音进行个性化翻译。
[0041]
作为一种优选的实施方式，遗传算法可采用趋向型紧凑遗传算法；作为一种优选的实施方式，模糊声像规则包括梅尔倒谱系数分析、短时能量以及短时平均过零率统计方法、基于谱分析得到的共振峰提取方法等方法共同组成的规则实现的“声音画像”特征描述，将上述规则的输出如梅尔倒谱系数、短时能量、短时平均过零率、共振峰等作为匹配参数。
[0042]
可以理解的是，在本步骤中，还可以包括步骤s21、步骤s22和步骤s23。
[0043]
步骤s21、分析字符之间的组合关系，若字符之间的组合关系为或的关系，则在每个字符所对应的第一向量集合中均加入一个代表空值的数值；
步骤s22、将加入代表空值的向量后的第一向量集合定义为第二向量集合；步骤s23、在每个第二向量集合里各取一个数值，将取出来的所有向量与其对应的字符进行集合得到训练案例。
[0044]
s300、对英文训练案例集合中的每个训练案例进行测试,得到每个训练案例对应的案例训练结果。
[0045]
获取第二信息，第二信息包括每个训练案例进行测试的结果；对测试的结果进行预处理后，得到英文训练文本；将英文训练文本输入至word2vec模型中；转换word2vec模型中的英文训练文本为向量集合；需要说明的是，采用word2vec这种模型的文本分布式表示方法，它是深度学习方法的重要基础。文本的分布式表示的基本思想是将每个词表示为n维稠密，连续的实数向量，其最大优点在于它具有非常强大的表征能力，比如n维向量每维k个值，可以表征k的n次方个概念。文本的表示通过这种词向量的表示方法，把文本数据从高纬度稀疏的神经网络难处理的方式，变成了类似图像、语言的连续稠密数据。
[0046]
将向量集合和英文训练文本输入至卷积神经网络中训练，得到训练结果；根据训练结果和预置代价函数计算得出损失函数值；判断损失函数值是否低于预置阈值；若是，则保存损失函数的参数，并生成训练后的英文文本模型；若否，则继续进行计算。
[0047]
需要说明的是，每次得到训练后的卷积神经网络后，计算对应的loss值，并判断loss值是否低于预置阈值，若是，则代表卷积神经网络收敛，保存卷积神经网络的参数，即可生成中文文本分类模型，若否，则需要重新获取带标签的训练文本，重新进行训练。
[0048]
可以理解的是，在本步骤中，步骤s31、对训练案例进行测试，得到第一结果；步骤s32、获取人员输入的对训练案例的分析结果，将分析结果定义为第二结果；步骤s33、比较第一结果与第二结果之间是否一致，得到案例测试结果，其中，若第一结果与第二结果一致，则案例测试结果为测试成功，若第一结果与第二结果不一致，则案例测试结果为测试失败。
[0049]
实施例2：如图2所示，本实施例提供了一种英文案例训练装置，参见图2装置包括获取模块701、集合模块702和测试模块703，其中：获取模块701：用于获取目标案例文本语句中至少两个英文字符和字符之间的组合关系,每个字符均对应有第一向量集合,第一向量集合中包括至少一个字符;集合模块702：用于基于字符之间的组合关系和每个字符对应的第一向量集合,得到训练案例，将所有的训练案例进行集合,得到英文训练案例集合;优选地，集合模块702，包括第一分析单元7021、第二分析单元7022、定义单元7023和取值单元7024，其中：第一分析单元7021：用于分析字符之间的组合关系，若字符之间的组合关系为且的关系，则在每个第一向量集合里各取一个字符，将取出来的所有字符与其对应的字符进行集合得到训练案例；第二分析单元7022：用于分析字符之间的组合关系，若字符之间的组合关系为或
的关系，则在每个字符所对应的第一向量集合中均加入一个代表空值的字符；定义单元7023：用于将加入代表空值的字符后的第一向量集合定义为第二向量集合；取值单元7024：用于在每个第二向量集合里各取一个字符，将取出来的所有数值与其对应的字符进行集合得到训练案例。
[0050]
测试模块703：用于对英文训练案例集合中的每个训练案例进行测试,得到每个训练案例对应的案例训练结果。
[0051]
优选地，测试模块703，包括第一获取单元7031、检测单元7032、训练单元7033、更新单元7034、匹配单元7036和配置单元7035，其中：第一获取单元7031：用于获取第一信息，第一信息包括英文训练案例集合中的英文语音信息；检测单元7032：用于将第一信息转换为数字语音信号，检测到与数值语音信号相对应的匹配参数；训练单元7033：用于根据匹配参数识别到相对应的图像信息，对图像信息进行顺序标注，并将标注好的图像信息输入至卷积神经网络中进行训练；更新单元7034：用于根据时序分类算法，对卷积神经网络中的图像信息进行更新；配置单元7035：用于基于遗传算法，将更新后的图像信息重新配置得到可编程器件的重配置数据流；匹配单元7036：用于根据重配置数据流，找到与重配置数据流相匹配的训练案例。
[0052]
优选地，测试模块703，之后包括第二获取单元7037、预处理单元7038、输入单元7039、转换单元7040、获得单元7041、计算单元7042和判断单元7043，其中：第二获取单元7037：用于获取第二信息，第二信息包括每个训练案例进行测试的结果；预处理单元7038：用于对测试的结果进行预处理后，得到英文训练文本；输入单元7039：用于将英文训练文本输入至word2vec模型中；转换单元7040：用于转换word2vec模型中的英文训练文本为向量集合；获得单元7041：用于将向量集合和英文训练文本输入至卷积神经网络中训练，得到训练结果；计算单元7042：用于根据训练结果和预置代价函数计算得出损失函数值；判断单元7043：用于判断损失函数值是否低于预置阈值；若是，则保存损失函数的参数，并生成训练后的英文文本模型；若否，则继续进行计算。
[0053]
需要说明的是，关于上述实施例中的装置，其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述，此处将不做详细阐述说明。
[0054]
实施例3：相应于上面的方法实施例，本实施例中还提供了一种英文案例训练设备，下文描述的一种英文案例训练设备与上文描述的一种英文案例训练方法可相互对应参照。
[0055]
图3是根据示例性实施例示出的一种英文案例训练设备800的框图。如图3所示，该英文案例训练设备800可以包括：处理器801，存储器802。该英文案例训练设备800还可以包括多媒体组件803， i/o接口804，以及通信组件805中的一者或多者。
[0056]
其中，处理器801用于控制该英文案例训练设备800的整体操作，以完成上述的英文案例训练方法中的全部或部分步骤。存储器802用于存储各种类型的数据以支持在该英文案例训练设备800的操作，这些数据例如可以包括用于在该英文案例训练设备800上操作的任何应用程序或方法的指令，以及应用程序相关的数据，例如联系人数据、收发的消息、图片、音频、视频等等。该存储器802可以由任何类型的易失性或非易失性存储设备或者它们的组合实现，例如静态随机存取存储器(static random access memory，简称sram)，电可擦除可编程只读存储器(electrically erasable programmable read-only memory，简称eeprom)，可擦除可编程只读存储器(erasable programmable read-only memory，简称eprom)，可编程只读存储器(programmable read-only memory，简称prom)，只读存储器(read-only memory，简称rom)，磁存储器，快闪存储器，磁盘或光盘。多媒体组件803可以包括屏幕和音频组件。其中屏幕例如可以是触摸屏，音频组件用于输出和/或输入音频信号。例如，音频组件可以包括一个麦克风，麦克风用于接收外部音频信号。所接收的音频信号可以被进一步存储在存储器802或通过通信组件805发送。音频组件还包括至少一个扬声器，用于输出音频信号。i/o接口804为处理器801和其他接口模块之间提供接口，上述其他接口模块可以是键盘，鼠标，按钮等。这些按钮可以是虚拟按钮或者实体按钮。通信组件805用于该英文案例训练设备800与其他设备之间进行有线或无线通信。无线通信，例如wi-fi，蓝牙，近场通信(near fieldcommunication，简称nfc)，2g、3g或4g，或它们中的一种或几种的组合，因此相应的该通信组件805可以包括：wi-fi模块，蓝牙模块，nfc模块。
[0057]
在一示例性实施例中，英文案例训练设备800可以被一个或多个应用专用集成电路(application specific integrated circuit，简称asic)、数字信号处理器(digitalsignal processor，简称dsp)、数字信号处理设备(digital signal processing device，简称dspd)、可编程逻辑器件(programmable logic device，简称pld)、现场可编程门阵列(field programmable gate array，简称fpga)、控制器、微控制器、微处理器或其他电子元件实现，用于执行上述的英文案例训练方法。
[0058]
在另一示例性实施例中，还提供了一种包括程序指令的计算机可读存储介质，该程序指令被处理器执行时实现上述的英文案例训练方法的步骤。例如，该计算机可读存储介质可以为上述包括程序指令的存储器802，上述程序指令可由英文案例训练设备800的处理器801执行以完成上述的英文案例训练方法。
[0059]
实施例4：相应于上面的方法实施例，本实施例中还提供了一种可读存储介质，下文描述的一种可读存储介质与上文描述的一种英文案例训练方法可相互对应参照。
[0060]
一种可读存储介质，可读存储介质上存储有计算机程序，计算机程序被处理器执行时实现上述方法实施例的英文案例训练方法的步骤。
[0061]
该可读存储介质具体可以为u盘、移动硬盘、只读存储器(read-only memory，rom)、随机存取存储器(random access memory，ram)、磁碟或者光盘等各种可存储程序代码的可读存储介质。
[0062]
以上所述仅为本发明的优选实施例而已，并不用于限制本发明，对于本领域的技术人员来说，本发明可以有各种更改和变化。凡在本发明的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。
[0063]
以上所述，仅为本发明的具体实施方式，但本发明的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本发明揭露的技术范围内，可轻易想到变化或替换，都应涵盖在本发明的保护范围之内。因此，本发明的保护范围应以权利要求的保护范围为准。

再多了解一些

1/2 1 2 下一页尾页

本文用于企业家、创业者技术爱好者查询，结果仅供参考。

上一篇：返回列表
下一篇：基于VR的交互系统、方法、存储介质、设备及终端与流程

一种英文案例训练方法、装置、设备及可读存储介质

相关文献

最热文献