一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

同传延迟检测方法及相关装置、电子设备、存储介质与流程

2022-07-13 17:04:59 来源:中国专利 TAG:


1.本技术涉及同传技术领域,特别是涉及同传延迟检测方法及相关装置、电子设备、存储介质。


背景技术:

2.近些年来随着深度学习在语音、自然语言处理等领域的应用,语音识别的准确率在不断提高,机器翻译(如,中译英、英译中等方向)的翻译效果也在不断改善,其中机器翻译在大规模语料基本已达到人工翻译水平。
3.在此前人工同传的时代,可以直接采用人工主观评分的方式从核心信息译出率、翻译准确度、发音、语气和延迟等多个维度进行评分。但是随着机器同传的到来,在效果优化时无法每次采用高成本的人工评分来对比。有鉴于此,如何自动检测同传延迟成为亟需解决的问题。


技术实现要素:

4.本技术主要解决的技术问题是提供一种同传延迟检测方法及相关装置、电子设备、存储介质,能够自动检测同传延迟,相较于人工检测有助于大幅减少检测时间和检测成本。
5.为解决上述技术问题,本技术第一方面提供了同传延迟检测方法,包括:检测同传过程中各个语句对的语句同传延迟;其中,语句对包括源语种的第一语句和目标语种的第二语句,语句对的语句同传延迟包括语句对的帧级延迟;基于所述语句同传延迟,统计得到篇章同传延迟。
6.为了解决上述问题,本技术第二方面提供了同传延迟检测装置,包括检测模块和统计模块,检测模块用于检测同传过程中各个语句对的语句同传延迟,所述语句对包含源语种的第一语句和目标语种的第二语句,语句对的语句同传延迟包括语句对的帧级延迟;统计模块用于基于所述语句同传延迟,统计得到篇章同传延迟。
7.为了解决上述问题,本技术第三方面提供了电子设备,包括相互耦接的处理器和存储器;处理器用于执行存储器存储的程序指令,以实现上述第一方面中的同传延迟检测方法。
8.为了解决上述问题,本技术第四方面提供了计算机可读存储介质,计算机可读存储介质存储有能够被处理器运行的程序指令,程序指令用于实现上述第一方面中的同传延迟检测方法。
9.上述方案,检测同传过程中各个语句对的语句同传延迟,且语句对包括源语种的第一语句和目标语种的第二语句,语句对的语句同传延迟包括语句对的帧级延迟,再基于所述语句同传延迟,统计得到篇章同传延迟,一方面在同传过程中,对于篇章级的延迟检测,通过先检测语句级的同传延迟,能够细化同传延迟的检测粒度,且语句级的同传延迟又进一步包括帧级延迟,从而能够进一步细化检测粒度至帧级,进而能够有利于大大提升同
传延迟检测的精度,另一方面由于无需人工统计延迟,在同传过程中机器即可自动检测同传延迟,相较于人工检测有助于大幅减少检测时间和检测成本。
附图说明
10.图1是本技术同步延迟检测方法一实施方式的流程示意图;
11.图2是本技术同步延迟检测方法中语句同传延迟的示意图;
12.图3是获取帧级延迟一实施例的流程示意图;
13.图4是本技术同传延迟检测装置一实施例的框架示意图;
14.图5是本技术电子设备一实施例的框架示意图;
15.图6是本技术计算机可读存储介质一实施例的框架示意图。
具体实施方式
16.下面结合说明书附图,对本技术实施例的方案进行详细说明。
17.以下描述中,为了说明而不是为了限定,提出了诸如特定系统结构、接口、技术之类的具体细节,以便透彻理解本技术。
18.本文中术语“系统”和“网络”在本文中常被可互换使用。本文中术语“和/或”,仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,a和/或b,可以表示:单独存在a,同时存在a和b,单独存在b这三种情况。另外,本文中字符“/”,一般表示前后关联对象是一种“或”的关系。此外,本文中的“多”表示两个或者多于两个。
19.请参阅图1,图1是本技术同传延迟检测方法一实施例的流程示意图。具体而言,本实施例中的同传延迟检测方法可以包括如下步骤:
20.步骤s11:检测同传过程中各个语句对的语句同传延迟。
21.本实施例中,语句对包括源语种的第一语句和目标语种的第二语句。需要说明的是,语句对中的第一语句和第二语句应具有语义关联,如语句对中第一语句和第二语句可以表达相同含义。具体而言,源语种和目标语种可以根据具体的同传场景进行设置。例如,源语种可以为“英语”,目标语种可以为“汉语”;或者,源语种可以为“汉语”,目标语种可以为“英语”;或者,源语种可以为“英语”,目标语种可以为“法语”,在此不做限定。
22.在一个实施场景中,第二语句可以为第一语句由源语种翻译为目标语种后的翻译语句。示例性地,以源语种为汉语,目标语种为英语为例,第一语句可以为“你好,他问一下火车站在哪里呢?”,则第二语句可以为该第一语句翻译为英语后的翻译语句“hello,he asks the railway station,where is it?”。其他情况可以以此类推,在此不再一一举例。其他情况可以以此类推,在此不再一一举例。
23.在一个实施场景中,第一语句和第二语句可以均为语音,同样以源语种为汉语,目标语种为英语为例,此时第一语句可以为“你好,他问一下火车站在哪里呢?”的汉语语音,则第二语句可以为“hello,he asks the railway station,where is it?”的英语语音。其他情况可以以此类推,在此不再一一举例。
24.在另一个实施场景中,第一语句和第二语句也可以均为文本,同样以源语种为汉语,目标语种为英语为例,此时第一语句可以为“你好,他问一下火车站在哪里呢?”的汉语文本,则第二语句可以为“hello,he asks the railway station,where is it?”的英语文
本。其他情况可以以此类推,在此不再一一举例。
25.在又一个实施场景中,第一语句和第二语句也可以具有不同数据形式。例如,第一语句可以为语音,第二语句可以为文本;或者,第一语句可以为文本,第二语句可以为语音。类似地,可以参照前述实施例,此处不再举例赘述。
26.在一实施场景中,语句同传延迟可以包括帧级延迟,帧级延迟反映了同传过程中各个语句帧整体的延迟情况。具体而言,帧级延迟可以基于语句对中各个语句帧对的延迟时间得到,语句帧对包括第一语句中第一语句帧和第二语句中第二语句帧。需要说明的是,帧可以视为同传延迟检测的最小度量单位。示范性地,可以按照一定时间间隔划分语句帧,如1秒同传过程可以划分为100个帧同传,即一次帧同传的周期为10毫秒。
27.在一个具体的实施场景中,如前所述,语句对中的第一语句和第二语句可以均为语音,则在此情况下,同样以源语种为汉语,目标语种为英语为例,此时语句帧对中的第一语句帧可以是“你好,他问一下火车站在哪里呢?”中一段长度为10毫秒的汉语语音,语句帧对中的第二语句帧可以是“hello,he asks the railway station,where is it?”中对应的一段长度为10毫秒的英语语音。其他情况可以以此类推,在此不再一一举例。
28.在另一个具体的实施场景中,如前所述,语句对中的第一语句和第二语句也可以均为文本,在此情况下,同样以源语种为汉语,目标语种为英语为例,此时语句帧对中的第一语句帧可以是“你好,他问一下火车站在哪里呢?”中一段长度为10毫秒的汉语文本,语句帧对中的第二语句帧可以是“hello,he asks the railway station,where is it?”中对应的一段长度为10毫秒的英语文本。其他情况可以以此类推,在此不再一一举例。
29.在又一个具体的实施场景中,如前所述,语句对中的第一语句可以为语音,语句对中的第二语句可以为文本时,或者,语句对中的第一语句可以为文本,语句对中的第二语句可以为语音时则在上述两种情况下,语句帧对中的第一语句帧和第二语句帧,可以参照前述第一语句和第二语句具有相同数据形式的情况下,关于语句帧对中第一语句帧和第二语句帧的相关描述,此处不再举例赘述。
30.在一个实施场景中,语句帧对中的第一语句帧为第一语句中编号为第一序数的语句帧,第二语句帧为第二语句中编号为第二序数的语句帧,且第一序数和第二序数满足帧映射关系。
31.在一个具体的实施场景中,第一语句中第一语句帧的总数可以记为第一帧数,第二语句中第二语句帧的总数可以记为第二帧数。帧映射关系具体可以表示线性函数,线性函数的斜率可以为第二帧数和第一帧数的比值。此外,线性函数的截距可以设置为0,此时第二序数与第一序数的比值等于第二帧数与第一帧数的比值。当然,线性函数的截距也可以设置为其他数值,帧映射关系甚至还可以表示为其他函数,本实施例在此不做具体限制。需要说明的是,帧映射关系应设置为一一对应的映射关系为宜,即根据第一序数和帧映射关系,可以唯一确定第二序数,或者,根据第二序数和帧映射关系,可以唯一确定第一序数。特别地,在根据帧映射关系确定出第一序数(或第二序数)为小数时,可以进行上取整操作。例如,若帧映射关系为线性函数,斜率为2,截距为0,当第二序数为5的时候,此时可以推导出第一序数为2.5,这显然是不合理的。在此类情况下,应理解为第二序数为5和第二序数为6的第二语句的语句帧共同和第一序数为3的第一语句的语句帧组成语句帧对。其他情况可以以此类推,在此不再一一举例。
32.在一个具体的实施场景中,对于第二语句中编号为第二序数的第二语句帧,可以基于第二序数和已获取的帧映射关系,确定第一序数,进而可以将编号为第一序数的第一语句帧和编号为第二序数的第二语句帧组成语句帧对。在此基础上,可以进一步分别获取第一语句帧输入消耗的时间为第一时间和第二语句帧的输出消耗的时间为第二时间,并获取第二时间和第一时间的差值,即可将该差值作为语句帧对的延迟时间。示例性地,第二序数和第一序数的帧映射关系为第二序数和第一序数的比值为1且截距为0,第二序数为40,则第一序数为40;若第二语句中编号为40的第二语句帧输出消耗的时间为110毫秒,第一语句中编号为40的第一语句帧输入消耗的时间为100毫秒,则该语句帧对的延迟时间为10毫秒。其他情况可以以此类推,在此不再一一举例。
33.在一个实施场景中,语句同传延迟还可以包括累积延迟,累积延迟可以基于第二语句的第二帧数和第一语句的第一帧数两者的差值获得。如前所述,第二帧数指的是第二语句中第二语句帧的总数,第一帧数指的是第一语句中第一语句帧的总数。
34.在一个具体的实施场景中,如前所述,语句对中第一语句和第二语句可以均为语音,则可以将上述第一帧数和第二帧数的差值乘以语句帧的周期(如,前述10毫秒)的乘积,作为累积延迟。请参阅图2,图2是本技术同传延迟检测方法中语句同传延迟的示意图,该示意图以第一语句和第二语句均为语音,以源语种为汉语,目标语种为英语为例。如图2所示,如箭头所指分别为第一语句的频谱图、第一语句的识别结果、第一语句的翻译结果、第二语句的频谱图、第一语句的时间长度和第二语句的时间长度。累计延迟即为第二语句的时间长度和第一语句的时间长度的差值。
35.在另一个具体的实施场景中,如前所述,语句对中第一语句和第二语句可以均为文本,同样以源语种为汉语,目标语种为英语为例,此时可以将第二语句英文文本总词数乘以每个英文词的周期和第一语句汉语文本总词数乘以汉语词的周期的差值,作为累积延迟。需要注意的是,取决于帧的数据量的大小以及语言的差别,每一种语言的词可能需要若干个不同数量的帧组成,因此可以存在第二语句的总词数小于第一语句总词数的情况。
36.在又一个具体的实施场景中,如前所述,语句对中第一语句可以为语音,语句对中第二语句可以为文本时,或者,语句对中第一语句可以为文本,语句对中第二语句可以为语音,在此情况下,累积延迟的具体计算过程,可以参照前述语句对中第一语句和第二语句具有相同数据形式时累积延迟的相关描述,此处不再举例赘述。示例性地,第一语句为语音,第二语句为文本时,同样以源语种为汉语,目标语种为英语,此时累计延迟为第二语句英文文本输出的时间长度和第一语句汉语文本输入的时间长度的差值。
37.在一个实施场景中,在得到累积延迟之后,可以判断累积延迟是否大于第一阈值,并基于判断结果对语句同传过程进行速度调整。
38.在一个具体的实施场景中,第一阈值可以设置为0,则在判断累积延迟大于0时,可以确定第二语句的第二帧数过大,则可以进一步对同传过程中下一个语句对中的第二语句进行语句调整,语句调整方式的具体方式可以包括但不限于语句重组、语句压缩等,在此不做限定。当然,第一阈值也可以根据实际需要设置为其他数值,如1毫秒、5毫秒等,在此不做限定。示例性地,当第一语句和第二语句均为语音时,同样以源语种为汉语,目标语种为英语,以语句重组方式为例,可以在“hello,he asks the railway station,where is it?”的基础上调整为“hello,he asks where the railway station is?”;以语句压缩方式为
例,则需要快速发出“hello,he asks the railway station,where is it?”的语音。
39.在另一个具体的实施场景中,如前所述,第一阈值可以设置为0,则在判断累积延迟为小于0时,可以确定第二语句的第二帧数过小,则可以对同传过程中下一个语句对中的第二语句进行语句调整,语句调整的具体方式可以包括但不限于增加语气词、增加停顿等,本实施例不做具体限制。示例性地,当第一语句和第二语句均为语音时,同样以源语种为汉语,目标语种为英语,以增加停顿为例,可以在“hello,he asks the railway station,where is it?”的基础上调整为“hello~,he asks the railway station,where is it?”;以增加语气词为例,可以在“hello,he asks the railway station,where is it?”的基础上调整为“hey,hello,he asks the railway station,where is it?”。
40.在又一个具体的实施场景中,如前所述,第一阈值可以设置为0,则在判断累积延迟为等于0时,可以确定当前的语句同传过程速度合理无需进行调整。
41.在又一个具体的实施场景中,区别于前述设置第一阈值的方式,也可以预设一个闭合的数值范围。当累积延迟处于该数值范围中,则无需对同传过程中下一个语句对中的第二语句进行语句调整,即可以直接输出第二语句;当累积延迟大于闭合数值区间的右端点,需要减小第二语句的第二帧数;当累积延迟小于闭合数值区间的左端点,需要增大第二语句的第二帧数,调整方式可以参照上述实施例。闭合数值区间可以设置为[-10,10],[-5,5],[-5,10]等等,本实施例在此不做具体限制。
[0042]
在一个实施场景中,语句同传延迟还可以包括句首延迟。请继续结合参阅图2,句首延迟指的是第二语句首个帧输出和第一语句首个帧输入的时间差值。
[0043]
在一个具体的实施场景中,当第一语句和第二语句均为文本时,同样以源语种为汉语,目标语种为英语为例,此时句首延迟为第二语句首个英语文本输出和第一语句首个汉语文本输入的时间差值。
[0044]
在另一个具体的实施场景中,当第一语句为语音,第二语句为文本时;或者,第一语句和第二语句均为语音时。类似地,句首延迟的计算方法可以参照前述实施例,此处不再举例赘述。示例性地,第一语句为语音,第二语句为文本时,同样以源语种为汉语,目标语种为英语,此时句首延迟为第二语句首个英语文本输出和第一语句首个帧输入的时间差值。
[0045]
在一个实施场景中,语句同传延迟还可以包括句尾延迟,请继续结合参阅图2,句尾延迟指的是第二语句最后一个帧输出和第一语句最后一个帧输入的时间差值。
[0046]
在一个具体的实施场景中,当第一语句和第二语句均为文本时,同样以源语种为汉语,目标语种为英语为例,此时句尾延迟为第二语句最后一个英语文本输出和第一语句最后一个汉语文本输入的时间差值。
[0047]
在另一个具体的实施场景中,当第一语句为语音,第二语句为文本时;或者,第一语句和第二语句都为语音时。类似地,句尾延迟的计算方法可以参照前述实施例,此处不再举例赘述。示例性地,第一语句为语音,第二语句为文本时,同样以源语种为汉语,目标语种为英语,此时句尾延迟为第二语句最后一个英语文本输出和第一语句最后一个帧输入的时间差值。
[0048]
需要说明的是,以上语句同传延迟可以单独实施,例如仅检测同传过程中各个语句对的帧级延迟,或者,仅检测同传过程中各个语句对的累积延迟,或者,仅检测同传过程中各个语句对的句首延迟,或者,仅检测同传过程中各个语句对的句尾延迟。在一个实施场
景中,以上语句同传延迟还可以组合设置,例如,同时检测同传过程中各个语句对的帧级延迟、累积延迟和句首延迟,或者,同时检测同传过程中各个语句对的帧级延迟、累积延迟、句首延迟和句尾延迟,等等。本实施例在此不做具体限制。
[0049]
如前所述,篇章同传过程可以利用语义单元切分模块分解为各个语句对的同传过程。在现实场景中,同传过程一般分为两种,包括输出识别结果的同传过程和不输出识别结果的同传过程,可以参照图2,识别结果即为第一语句识别结果,两者的区别在于是否可以将识别出的源语种的文本信息进行输出,输出识别结果的同传过程具有输出识别的功能,不输出识别结果的同传过程不具有识别输出结果的功能。因此在切分篇章同传时需要针对两种不同的同传过程分别进行切分。
[0050]
在一个实施场景中,以第一语句和第二语句均为语音为例,在输出识别结果的同传过程中,可以直接利用识别结果的句末结尾符切分,之后的翻译和合成都基于此切分标识,这样便可以实现从第一语句语音到第二语句语音的句级的对齐信息;在不输出识别结果的同传过程中,可以利用第二语句译文的标点信息进行切分,在合成过程中自然容易获取从文字到合成语音的词级对齐信息,因此也可以获得从第一语句语音到第二语句语音的句级对齐信息。
[0051]
步骤s12:基于所述语句同传延迟,统计得到篇章同传延迟。
[0052]
在一个实施场景中,可以统计由篇章同传切分成的全部语句对同传的语句同传延迟,计算全部语句对的语句同传延迟的算数平均值即为篇章同传延迟。
[0053]
在另一个实施场景中,可以统计由篇章同传切分成的第一个语句对同传和最后一个语句对同传的语句同传延迟,这两个语句对的语句同传延迟的平均值即为篇章同传延迟。
[0054]
在又一个实施场景中,可以统计由篇章同传切分成的全部语句对同传的语句同传延迟,按照预设比例关系计算篇章延迟。具体地,一个篇章同传可以切分成六个语句对同传,假设第一语句对和最后一个语句对的比例为30%,则剩余四个语句对的比例为10%,则第一语句对语句同传延迟的30%、最后一个语句对语句同传延迟的30%以及剩余语句对语句同传延迟的10%的累加和,即为篇章同传延迟。
[0055]
在一个实施场景中,还可以根据篇章同传延迟数据对同传过程进行延迟评价。具体而言,可以赋予各种篇章延迟数据以一定的分值系数,计算篇章同传延迟的得分,与预设分数阈值进行比较,进而评价该篇章同传延迟。例如,篇章同传延迟中帧级延迟、累积延迟、句首延迟和句尾延迟数值均为5;帧级延迟的分值系数为5,累积延迟、句首延迟和句尾延迟的分值系数均为3;预设分数阈值为80;篇章同传延迟的得分为5*5 5*3*3=70,小于80,故该篇章同传延迟满足要求。
[0056]
在一个实施场景中,也可以根据语句对的语句同传延迟数据,进行是否继续语句同传过程的判定。可以设置帧级延迟的预设条件,当前语句对的帧级延迟满足预设条件,可以继续进行同传,否则终止此次同传。示范性地,设置帧级延迟的预设条件为帧级延迟小于10帧,对每一个语句对的帧级延迟进行判断,决定是否继续同传过程。若当前语句对的帧级延迟大于等于10帧,则终止此次同传过程;若当前语句对的帧级延迟小于10帧,则此次同传过程可以继续执行。
[0057]
上述方案,检测同传过程中各个语句对的语句同传延迟,且语句对包括源语种的
第一语句和目标语种的第二语句,语句对的语句同传延迟包括语句对的帧级延迟,再基于所述语句同传延迟,统计得到篇章同传延迟,一方面在同传过程中,对于篇章级的延迟检测,通过先检测语句级的同传延迟,能够细化同传延迟的检测粒度,且语句级的同传延迟又进一步包括帧级延迟,从而能够进一步细化检测粒度至帧级,进而能够有利于大大提升同传延迟检测的精度,另一方面由于无需人工统计延迟,在同传过程中机器即可自动检测同传延迟,相较于人工检测有助于大幅减少检测时间和检测成本。
[0058]
请参阅图3,图3是获取帧级延迟一实施例的流程示意图。关于帧级延迟的具体含义,可以参阅前述公开实施例中相关描述,在此不再赘述。本公开实施例具体可以包括如下步骤:
[0059]
步骤s31:获取语句对的语句判断结果。
[0060]
本公开实施例中,语句判断结果包括语句对是否为同传过程的首对同传语句。
[0061]
步骤s32:基于语句对的语句判断结果和语句对中各个语句帧对的延迟时间,得到语句对的帧级延迟。
[0062]
具体地,可以基于语句判断结果,获得语句对的影响因数。影响因数表示当前语句对的参考语句对给当前语句对造成同传延迟的影响程度。参考语句对可以设置为在当前语句对之前的紧接着当前语句对的一对已经完成同传过程的语句对。影响因数至少包括参考语句对给当前语句对造成同传延迟的影响时长,还可以包括参考语句对给当前语句对造成同传延迟的影响速率、影响准确率等等。
[0063]
在一个实施场景中,语句判断结果为语句对为同传过程的首对同传语句,设置影响因数为预设数值。在一个实施场景中,预设数值可以设置为0。
[0064]
在另一个实施场景中,语句判断结果为语句对不为同传过程的首对同传语句,影响因数可以根据上一个语句对的句尾延迟和当前语句对的句首延迟获得。句尾延迟和句首延迟的获得方法已在前述实施例介绍,在此不作赘述。
[0065]
在一个实施场景中,计算当前语句对的句首延迟和上一个语句的句尾延迟的差值,与0作比较,取较大值为影响因数。
[0066]
总体延迟为同传过程中全部语句帧对的延迟时间的累加和,计算总体延迟与当前语句对中帧的总数量的比值,再与影响因数求和,即为当前语句对的帧级延迟。语句帧对的延迟时间的获得方法已在前述实施例介绍,在此不作赘述。
[0067]
在一个实施场景中,在语句判断结果为语句对为同传过程的首对同传语句,帧级延迟可以表示为:
[0068][0069][0070]
上述公式(1)和公式(2)中,da为帧级延迟,n为第二语句每秒的帧数,|y|为第二语句的时间长度,|x|为第一语句的时间长度,di表示当输出第二语句第i帧时第一语句输入的帧数。需要说明的是,γ仅仅为帧映射关系的一种实施方式,并不因此而限定帧映射关系的实施方式,关于帧映射关系的具体含义,可以参阅前述公开实施例中相关描述。
[0071]
在一个实施场景中,在语句判断结果为语句对不为同传过程的首对同传语句的情
况下,帧级延迟也可以表示为:
[0072][0073][0074]
λ=max(0,β-α)
……
(5)
[0075]
上述公式(3)、公式(4)和公式(5)中,da为帧级延迟,n为第二语句每秒的帧数,|y|为第二语句的时间长度,|x|为第一语句的时间长度,di表示当输出第二语句第i帧时第一语句输入的帧数,α为上一个语句对的句末延迟,β当前语句对的句首延迟。其中,γ仅仅为帧映射关系的一种实施方式,λ仅仅为影响因数的一种实施方式,并不因此而限定帧映射关系和影响因数的实施方式,关于帧映射关系和影响因数的具体含义,可以参阅前述公开实施例中相关描述。
[0076]
上述方案,获取语句对的语句判断结果,基于语句对的语句判断结果和语句对中各个语句帧对的延迟时间,得到语句对的帧级延迟,一方面判断语句对是否为首个语句对,充分考虑了上一个语句对的同传过程对当前语句对同传过程的影响,另一方面检测同传过程的帧级延迟,进而能够有利于大大提升同传延迟检测的精度。
[0077]
请参阅图4,图4是本技术同传延迟检测装置40一实施例的框架示意图。具体而言,同传延迟检测装置40包括检测模块41和统计模块42,检测模块41用于检测同传过程中各个语句对的语句同传延迟,其中,语句对包含源语种的第一语句和目标语种的第二语句,语句对的语句同传延迟包括语句对的帧级延迟;统计模块42用于基于语句同传延迟,统计得到篇章同传延迟。
[0078]
上述方案,检测同传过程中各个语句对的语句同传延迟,且语句对包括源语种的第一语句和目标语种的第二语句,语句对的语句同传延迟包括语句对的帧级延迟,再基于所述语句同传延迟,统计得到篇章同传延迟,一方面在同传过程中,对于篇章级的延迟检测,通过先检测语句级的同传延迟,能够细化同传延迟的检测粒度,且语句级的同传延迟又进一步包括帧级延迟,从而能够进一步细化检测粒度至帧级,进而能够有利于大大提升同传延迟检测的精度,另一方面由于无需人工统计延迟,在同传过程中机器即可自动检测同传延迟,相较于人工检测有助于大幅减少检测时间和检测成本。
[0079]
在一些公开实施例中,帧级延迟基于语句对中各个语句帧对的延迟时间得到,语句帧对包括所述第一语句中第一语句帧和所述第二语句中第二语句帧。
[0080]
因此,上述方案公开了帧级延迟的获取方法和语句帧对的组成,能够从语句帧对的延迟情况获得帧级延迟,大大提升同传延迟监测的精度。
[0081]
在一些公开实施例中,检测模块41包括语句判断子模块,用于获取语句对的语句判断结果,其中,语句判断结果包括语句对是否为同传过程的首对同传语句;检测模块41包括延迟度量子模块,用于基于语句对的语句判断结果和语句对中各个语句帧对的延迟时间,得到语句对的帧级延迟。
[0082]
因此,上述方案在检测语句同传的基础上进一步引出帧级延迟的概念,通过检测同传过程的帧级延迟,进而能够有利于大大提升同传延迟检测的精度。
[0083]
在一些公开实施例中,延迟度量子模块包括影响因数获取单元,用于基于语句判
断结果,获取语句对的影响因数,其中,影响因数表示语句对的参考语句对给语句对造成同传延迟的影响程度。
[0084]
因此,上述方案基于语句判断结果引出影响因数的概念,体现了参考语句对给语句对同传造成的影响,使得同传延迟检测方法考虑的因素更加全面,检测也更加精准。
[0085]
在一些公开实施例中,影响因素获取单元具体用于响应于句判断结果包括语句对为首对同传语句,将影响因数设置为预设数值;和/或,影响因素获取单元具体用于响应于语句判断结果包括语句对不为首对同传语句,基于参考语句对的句尾延迟和语句对的句首延迟,得到影响因数。
[0086]
因此,上述方案揭示了在不同语句判断结果下影响因数的不同计算方法,有助于帧级延迟的准确计算。
[0087]
在一些公开实施例中,统计模块42包括延迟时间统计子模块,用于统计语句帧对的延迟时间的累加和,得到同传过程中的总体延迟;延迟度量子模块用于基于总体延迟和语句帧对数量的比值和影响因数,得到帧级延迟。
[0088]
因此,上述方案具体介绍了一种帧级延迟的获得方式,一方面判断语句对是否为首个语句对,充分考虑了上一个语句对的同传过程对当前语句对同传过程的影响,另一方面检测同传过程的帧级延迟,进而能够有利于大大提升同传延迟检测的精度。
[0089]
在一些公开实施例中,延迟度量子模块包括语句帧配对单元,用于基于帧映射关系和第一语句帧在第一语句中的第一序数,确定第二序数;将第一序数的第一语句帧和所述第二序数的第二语句帧,组成所述语句帧对。
[0090]
因此,上述方案指出了语句帧对的构成,语句帧对为同传延迟检测方法的最小分析单元,通过第一语句帧和第二语句帧配对分析能够进一步细化检测粒度至帧级,进而能够有利于大大提升同传延迟检测的精度。
[0091]
在一些公开实施例中,延迟度量子模块包括帧映射获取单元,用于获得第一语句的第一帧数和第二语句的第二帧数,进而基于第二帧数和第一帧数的比值,得到帧映射关系。
[0092]
因此,上述方案指出了语句帧对的配对方法,语句帧对为同传延迟检测方法的最小分析单元,通过第一语句帧和第二语句帧配对分析能够进一步细化检测粒度至帧级,进而能够有利于大大提升同传延迟检测的精度。
[0093]
在一些公开实施例中,同传延迟检测装置40检测累积延迟。其中检测模块41用于基于第二语句的第二帧数和第一语句的第一帧数两者的差值获得各个语句对的累积延迟。统计模块42用于基于各个语句对的累积延迟,统计得到篇章同传的累积延迟。
[0094]
在一些公开实施例中,同传延迟检测装置40用于检测句首延迟。类似地,检测模块41用于基于第二语句首个帧输出和第一语句首个帧输入的时间差值获得各个语句对的句首延迟。统计模块42用于基于各个语句对的句首延迟,统计得到篇章同传的句首延迟。
[0095]
在一些公开实施例中,同传延迟检测装置40用于检测句尾延迟。类似地,检测模块41用于基于第二语句最后一个帧输出和第一语句最后一个帧输入的时间差值获得各个语句对的句尾延迟。统计模块42用于基于各个语句对的句尾延迟,统计得到篇章同传的句尾延迟。
[0096]
因此,上述方案可以对同传过程中多种延迟进行检测,增加了同传延迟检测方法
的广度,使得检测方法更加全面,有助于对同传延迟进行更加细致的分析。此外,由于无需人工统计延迟,在同传过程中机器即可自动检测同传延迟,相较于人工检测有助于大幅减少检测时间和检测成本。
[0097]
请参阅图5,图5是本技术电子设备50一实施例的框架示意图。具体而言,电子设备50包括相互耦接的处理器51和存储器52,处理器51用于执行存储器52存储的程序指令,以实现上述任一实施例的同传延迟检测方法中的步骤。电子设备50具体可以包括但不限于:微型计算机、笔记本、平板电脑、智能手机、同传系统等,在此不做限定。
[0098]
具体而言,处理器51可以控制其自身以及存储器52执行上述任一实施例的同传延迟检测方法中的步骤。处理器51还可以称为cpu(central processing unit,中央处理单元)。处理器51可能是一种集成电路芯片,具有信号的处理能力。处理器51还可以是通用处理器、数字信号处理器(digital signal processor,dsp)、专用集成电路(application specific integrated circuit,asic)、现场可编程门阵列(field-programmable gate array,fpga)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。另外,处理器51可以由多个成电路芯片共同实现。
[0099]
上述方案,检测同传过程中各个语句对的语句同传延迟,且语句对包括源语种的第一语句和目标语种的第二语句,语句对的语句同传延迟包括语句对的帧级延迟,再基于所述语句同传延迟,统计得到篇章同传延迟,一方面在同传过程中,对于篇章级的延迟检测,通过先检测语句级的同传延迟,能够细化同传延迟的检测粒度,且语句级的同传延迟又进一步包括帧级延迟,从而能够进一步细化检测粒度至帧级,进而能够有利于大大提升同传延迟检测的精度,另一方面由于无需人工统计延迟,在同传过程中机器即可自动检测同传延迟,相较于人工检测有助于大幅减少检测时间和检测成本。
[0100]
请参阅图6,图6是本技术计算机可读存储介质60一实施例的框架示意图。本实施例中,该计算机可读存储介质60存储有处理器可运行的程序指令601,该程序指令601用于执行上述同传延迟检测方法实施例中的步骤。
[0101]
该计算机可读存储介质60具体可以为u盘、移动硬盘、只读存储器(rom,read-only memory)、随机存取存储器(ram,random access memory)、磁碟或者光盘等可以存储程序指令的介质,或者也可以为存储有该程序指令的服务器,该服务器可将存储的程序指令发送给其他设备运行,或者也可以自运行该存储的程序指令。
[0102]
上述方案,检测同传过程中各个语句对的语句同传延迟,且语句对包括源语种的第一语句和目标语种的第二语句,语句对的语句同传延迟包括语句对的帧级延迟,再基于所述语句同传延迟,统计得到篇章同传延迟,一方面在同传过程中,对于篇章级的延迟检测,通过先检测语句级的同传延迟,能够细化同传延迟的检测粒度,且语句级的同传延迟又进一步包括帧级延迟,从而能够进一步细化检测粒度至帧级,进而能够有利于大大提升同传延迟检测的精度,另一方面由于无需人工统计延迟,在同传过程中机器即可自动检测同传延迟,相较于人工检测有助于大幅减少检测时间和检测成本。
[0103]
在本技术所提供的几个实施例中,应该理解到,所揭露的方法和装置,可以通过其它的方式实现。例如,以上所描述的装置实施方式仅仅是示意性的,例如,模块或单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可
以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
[0104]
作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施方式方案的目的。
[0105]
另外,在本技术各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
[0106]
集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本技术的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)或处理器(processor)执行本技术各个实施方式方法的全部或部分步骤。而前述的存储介质包括:u盘、移动硬盘、只读存储器(rom,read-only memory)、随机存取存储器(ram,random access memory)、磁碟或者光盘等各种可以存储程序代码的介质。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献