一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

校验语义的方法和装置与流程

2022-09-02 20:50:03 来源:中国专利 TAG:
1.本技术涉及终端人工智能领域,具体涉及一种校验语义的方法和装置。
背景技术
::2.终端设备是面向用户的设备,由于不同用户具有不同的语言习惯,厂商需要在交付过程中生产不同语言版本的终端设备。厂商将终端设备交付给用户前,需要对不同语言版本的语义进行校验,确保不同语言版本的终端设备具有相同的操作体验,即,厂商需要确保不同的语言版本的语义相同。3.一种校验语义的方法是提取不同语言的句子中的反义词和否定词,根据不同语言的句子中的反义词和否定词的个数是否相同来校验不同语言的句子的含义是否相同。例如,当校验“pleasepressthescreenhard”和“请轻按屏幕”的含义是否相同时,可以先根据反义词词表从这两个句子中提取反义词“hard”和“轻”,再判断“hard”和“轻”周围是否存在否定词(如,“no”或者“不要”);当这两个反义词周围不存在否定词时,可以判定这两个句子的含义不同。4.然而,当反义词词表缺少“hard”和“轻”时,上述方法的校验结果是“pleasepressthescreenhard”和“请轻按屏幕”的含义相同,从而产生了错误的校验结果。如何提高语句校验的准确度是当前需要解决的问题。技术实现要素:5.本技术提供了一种校验语义的方法和装置,能够解决反义词词表不完整导致的校验结果不准确的问题。6.第一方面,提供了一种校验语义的方法,包括:获取第一语句和第二语句,第一语句为基准语句,第二语句为第一语句的翻译结果;通过翻译模块将第二语句翻译为第三语句,第三语句与第一语句的语言相同;通过语义分类神经网络处理第一语句和第三语句,确定第一语句和第三语句的语义是否相同。7.语义分类神经网络处理的语句通常是语言相同的语句,第二语句的语言与第一语句的语言不同,无法直接对第一语句和第二语句进行分类处理。通过翻译模块将第二语句翻译为与第一语句的语言相同的语句(即,第三语句)后,可以使用语义分类神经网络确定第一语句与第三语句的语义是否相同。若第一语句与第三语句的语义相同,说明第一语句与第二语句的语义相同;若第一语句与第三语句的语义不同,说明第一语句与第二语句的语义不同;从而无需依赖反义词词表即可确定第一语句与第二语句的语义是否相同,解决了因反义词词表不完整导致的校验结果不准确的问题。8.在一种实现方式中,通过语义分类神经网络处理第一语句和第三语句之前,校验语义的方法还包括:获取第四语句,第四语句的语言与第一语句的语言相同;确定第四语句中的目标短语的反义词;将目标短语替换为反义词,生成第五语句;使用第四语句和第五语句训练语义分类神经网络。9.第四语句和第五语句的语义可能相同,也可能不同。例如,在不考虑否定词的情况下,当第四语句和第五语句的反义词数量为偶数时,第四语句和第五语句的含义相同;当第四语句和第五语句的反义词数量为奇数时,第四语句和第五语句的含义不同。利用第四语句和第五语句作为训练样本能够使得语义分类神经网络具备语义分类功能。10.在一种实现方式中,确定第四语句中的目标短语的反义词,包括:当目标短语存在多个候选反义词时,通过高斯分布采样从多个候选反义词中确定反义词。11.相比于随机采样,高斯分布采样提高了常用反义词被采样的概率,使得反义词替换后的语句更符合常用语法。12.在一种实现方式中,确定第四语句中的目标短语的反义词之前,还包括:根据短语结构树确定第四语句中各个短语的词性;根据基于转移的依存句法分析和第四语句中各个短语的词性确定第四语句中各个短语的依存关系;根据第四语句中各个短语的依存关系确定目标短语,目标短语为各个短语中的从属词。13.在依存句法分析的理论中,句子中的词与词之间存在一种二元不等价关系,即,主从关系。在句子中,如果一个词修饰另一个词,则称修饰词为从属词(dependent),称被修饰词为支配词(head),从属词和支配词之间的语法关系就是依存关系(dependencyrelation)。确定依存关系后,可以根据依存关系从英文语句中确定目标短语,目标短语即各个短语中的修饰词。自然语言的翻译错误通常出现在修饰词部分,将修饰词替换为反义词,和/或,在修饰词前后添加否定词,能够生成更接近自然语言的训练样本,提高语义分类神经网络的训练效果。14.在一种实现方式中,在确定第四语句中各个短语的词性之后,并且,在生成第五语句之前,校验语义的方法还包括:在各个短语中的动词短语附近随机添加否定词。15.添加否定词与反义词替换一样能够改变句子的含义,在第四语句中添加否定词生成第五语句,再使用第四语句和第五语句训练语义分类神经网络,能够使语义分类神经网络具备更强的鲁棒性。16.在一种实现方式中,在使用第四语句和第五语句训练语义分类神经网络之前,校验语义的方法还包括:根据第四语句的反义词替换次数和否定词添加次数确定第四语句和第五语句的标签,其中,当反义词替换次数和否定词添加次数的和为奇数时,第四语句和第五语句的标签为反义语句;当反义词替换次数和否定词添加次数的和为偶数时,第四语句和第五语句的标签为同义语句。17.在一种实现方式中,获取第四语句,包括:从翻译模块的训练集中获取第六语句;对第六语句进行删除、替换和反向翻译中的一种或多种处理,生成第四语句。18.当翻译模块为神经网络时,并且,当翻译模块与语义分类神经网络使用相同的训练集时,通过删除、替换和反向翻译中的一种或多种处理生成第四语句,能够避免翻译模块与语义分类神经网络的训练数据发生交叉,提高语义分类神经网络的训练效果。19.在一种实现方式中,使用第四语句和第五语句训练语义分类神经网络之前,校验语义的方法还包括:通过multinli数据集对语义分类神经网络进行预训练,相关性数据集用于使语义分类神经网络获取同义和反义分类能力。20.multinli数据集能够使语义分类神经网络获取同义、反义和中性的分类能力,此外,预训练能够使得语义分类神经网络获得良好的初始化权重,提高正式训练的训练效果。21.第二方面,提供了一种校验语义的装置,包括用于执行第一方面中任一种方法的单元。该装置可以是终端设备,也可以是终端设备内的芯片。该装置可以包括输入单元和处理单元。22.当该装置是终端设备时,该处理单元可以是处理器,该输入单元可以是通信接口;该终端设备还可以包括存储器,该存储器用于存储计算机程序代码,当该处理器执行该存储器所存储的计算机程序代码时,使得该终端设备执行第一方面中的任一种方法。23.当该装置是终端设备内的芯片时,该处理单元可以是芯片内部的处理单元,该输入单元可以是输出接口、管脚或电路等;该芯片还可以包括存储器,该存储器可以是该芯片内的存储器(例如,寄存器、缓存等),也可以是位于该芯片外部的存储器(例如,只读存储器、随机存取存储器等);该存储器用于存储计算机程序代码,当该处理器执行该存储器所存储的计算机程序代码时,使得该芯片执行第一方面中的任一种方法。24.第三方面,提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序代码,当所述计算机程序代码被校验语义的装置运行时,使得该装置执行第一方面中的任一种方法。25.第四方面,提供了一种计算机程序产品,所述计算机程序产品包括:计算机程序代码,当所述计算机程序代码被校验语义的装置运行时,使得该装置执行第一方面中的任一种方法。附图说明26.图1是一种适用于本技术的装置的硬件系统的示意图;27.图2是一种适用于本技术的装置的软件系统的示意图;28.图3是本技术提供的两种锁屏界面的示意图;29.图4是本技术提供的一种校验语义的方法的示意图;30.图5是本技术提供的另一种校验语义的方法的示意图;31.图6是本技术提供的一种语义分类神经网络的示意图;32.图7是本技术提供的一种训练语义分类神经网络的方法的示意图;33.图8是本技术提供的一种英文短语结构树的示意图;34.图9是本技术提供的一种依存关系的示意图。具体实施方式35.下面将结合附图,对本技术实施例中的技术方案进行描述。36.图1示出了一种适用于本技术的装置的硬件系统。37.装置100可以是手机、智慧屏、平板电脑、可穿戴电子设备、车载电子设备、增强现实(augmentedreality,ar)设备、虚拟现实(virtualreality,vr)设备、笔记本电脑、超级移动个人计算机(ultra-mobilepersonalcomputer,umpc)、上网本、个人数字助理(personaldigitalassistant,pda)、投影仪等等,本技术实施例对装置100的具体类型不作任何限制。38.装置100可以包括处理器110,内部存储器121,传感器模块180,显示屏194等。其中传感器模块180可以包括触摸传感器180k等。emittingdiode,oled)、有源矩阵有机发光二极体(active-matrixorganiclight-emittingdiode,amoled)、柔性发光二极管(flexlight-emittingdiode,fled)、迷你发光二极管(minilight-emittingdiode,miniled)、微型发光二极管(microlight-emittingdiode,microled)、微型oled(microoled)或量子点发光二极管(quantumdotlightemittingdiodes,qled)。在一些实施例中,装置100可以包括1个或n个显示屏194,n为大于1的正整数。50.内部存储器121可以用于存储计算机可执行程序代码,所述可执行程序代码包括指令。内部存储器121可以包括存储程序区和存储数据区。其中,存储程序区可存储操作系统,至少一个功能(例如,声音播放功能和图像播放功能)所需的应用程序。存储数据区可存储装置100使用过程中所创建的数据(例如,音频数据和电话本)。此外,内部存储器121可以包括高速随机存取存储器,还可以包括非易失性存储器,例如:至少一个磁盘存储器件、闪存器件和通用闪存存储器(universalflashstorage,ufs)等。处理器110通过运行存储在内部存储器121的指令和/或存储在设置于处理器中的存储器的指令,执行装置100的各种处理方法。51.触摸传感器180k,也称为触控器件。触摸传感器180k可以设置于显示屏194,由触摸传感器180k与显示屏194组成触摸屏,触摸屏也称为触控屏。触摸传感器180k用于检测作用于其上或其附近的触摸操作。触摸传感器180k可以将检测到的触摸操作传递给应用处理器,以确定触摸事件类型。可以通过显示屏194提供与触摸操作相关的视觉输出。在另一些实施例中,触摸传感器180k也可以设置于装置100的表面,并且与显示屏194设置于不同的位置。52.上文详细描述了装置100的硬件系统,下面介绍装置100的软件系统。软件系统可以采用分层架构、事件驱动架构、微核架构、微服务架构或云架构,本技术实施例以分层架构为例,示例性地描述装置100的软件系统。53.如图2所示,采用分层架构的软件系统分成若干个层,每一层都有清晰的角色和分工。层与层之间通过软件接口通信。在一些实施例中,软件系统可以分为四层,从上至下分别为应用程序层、应用程序框架层、安卓运行时(androidruntime)和系统库、以及内核层。54.应用程序层可以包括相机、图库、日历、通话、地图、导航、wlan、蓝牙、音乐、视频、短信息等应用程序。55.应用程序框架层为应用程序层的应用程序提供应用程序编程接口(applicationprogramminginterface,api)和编程框架。应用程序框架层可以包括一些预定义的函数。56.例如,应用程序框架层包括窗口管理器、内容提供器、视图系统、电话管理器、资源管理器和通知管理器。57.窗口管理器用于管理窗口程序。窗口管理器可以获取显示屏大小,判断是否有状态栏、锁定屏幕和截取屏幕。58.内容提供器用来存放和获取数据,并使这些数据可以被应用程序访问。所述数据可以包括视频、图像、音频、拨打和接听的电话、浏览历史和书签、以及电话簿。59.视图系统包括可视控件,例如显示文字的控件和显示图片的控件。视图系统可用于构建应用程序。显示界面可以由一个或多个视图组成,例如,包括短信通知图标的显示界面,可以包括显示文字的视图以及显示图片的视图。60.电话管理器用于提供装置100的通信功能,例如通话状态(接通或挂断)的管理。61.资源管理器为应用程序提供各种资源,比如本地化字符串、图标、图片、布局文件和视频文件。62.通知管理器使应用程序可以在状态栏中显示通知信息,可以用于传达告知类型的消息,可以短暂停留后自动消失,无需用户交互。比如通知管理器被用于下载完成告知和消息提醒。通知管理器还可以管理以图表或者滚动条文本形式出现在系统顶部状态栏的通知,例如后台运行的应用程序的通知。通知管理器还可以管理以对话窗口形式出现在屏幕上的通知,例如在状态栏提示文本信息、发出提示音、电子设备振动以及指示灯闪烁。63.androidruntime包括核心库和虚拟机。androidruntime负责安卓系统的调度和管理。64.核心库包含两部分:一部分是java语言需要调用的功能函数,另一部分是安卓的核心库。65.应用程序层和应用程序框架层运行在虚拟机中。虚拟机将应用程序层和应用程序框架层的java文件执行为二进制文件。虚拟机用于执行对象生命周期的管理、堆栈管理、线程管理、安全和异常的管理、以及垃圾回收等功能。66.系统库可以包括多个功能模块,例如:表面管理器(surfacemanager),媒体库(medialibraries),三维图形处理库(例如:针对嵌入式系统的开放图形库(opengraphicslibraryforembeddedsystems,opengles)和2d图形引擎(例如:skia图形库(skiagraphicslibrary,sgl))。67.表面管理器用于对显示子系统进行管理,并且为多个应用程序提供了2d图层和3d图层的融合。68.媒体库支持多种音频格式的回放和录制、多种视频格式回放和录制以及静态图像文件。媒体库可以支持多种音视频编码格式,例如:mpeg4、h.264、动态图像专家组音频层面3(movingpictureexpertsgroupaudiolayeriii,mp3)、高级音频编码(advancedaudiocoding,aac)、自适应多码率(adaptivemulti-rate,amr)、联合图像专家组(jointphotographicexpertsgroup,jpg)和便携式网络图形(portablenetworkgraphics,png)。69.三维图形处理库可以用于实现三维图形绘图、图像渲染、合成和图层处理。70.二维图形引擎是2d绘图的绘图引擎。71.内核层是硬件和软件之间的层。内核层可以包括显示驱动、摄像头驱动、音频驱动和传感器驱动等驱动模块。72.下面结合显示界面场景,示例性说明装置100的软件系统和硬件系统的工作流程。73.当用户在触摸传感器180k上进行触摸操作时,相应的硬件中断被发送至内核层,内核层将触摸操作加工成原始输入事件,原始输入事件例如包括触摸坐标和触摸操作的时间戳等信息。原始输入事件被存储在内核层,应用程序框架层从内核层获取原始输入事件,识别出原始输入事件对应的控件,并通知该控件对应的应用程序(application,app)。例如,上述触摸操作为单击操作,上述控件对应的app为锁屏app,锁屏app被单击操作唤醒后,可以通过api调用内核层的显示驱动,通过显示驱动控制显示屏194显示锁屏app的锁屏界面。74.装置100在锁屏界面完成面部识别后,可以显示图3所示的用户界面。若装置100是中文版本的终端设备,用户界面显示的内容包括“上滑进入”;若装置100是英文版本的终端设备,用户界面显示的内容包括“slideuptoopen”。在翻译无误的情况下,无论装置100显示哪种用户界面,用户均可以根据用户界面显示的内容执行正确的解锁操作。75.终端设备是面向用户的设备,由于不同用户具有不同的语言习惯,厂商需要在交付过程中生产不同语言版本的终端设备。厂商将终端设备交付给用户前,需要对不同语言版本的语义进行校验,确保不同语言版本的终端设备具有相同的操作体验,即,厂商需要确保不同的语言版本的语义相同。76.下面以具备图1和图2所示结构的终端设备为例,介绍本技术提供的校验语义的方法。77.一种校验语义的方法如图4所示。终端设备首先获取两个不同语言的语句,该两个不同语言的语句例如是英文语句和中文语句。随后,终端设备利用翻译器的双向编码表示(bidirectionalencoderrepresentationfromtransformers,bert)模型处理英文语句和中文语句,得到英文语句和中文语句中具有关联关系的单词对。获取单词对后,终端设备基于反义词词表确定上述单词对是否为反义词,随后,终端设备基于否定词表确定上述单词对前后是否存在否定词,并基于反义词和否定词的处理结果确定英文语句和中文语句的语义是否相同。78.例如,待检测的语句为“请轻按屏幕”和“pleasedon'tpressthescreenhard”,其中,英文语句为基准语句,中文语句为机器翻译或者人工翻译的语句;终端设备利用bert模型检测出这两个语句中“hard”和“轻”是具有关联关系的单词对,随后,终端设备查找反义词词表,确定“hard”和“轻”为反义词;终端设备接下来检查“hard”和“轻”前后是否有额外的否定词,否定词的检查结果为“hard”之前存在否定词“don't”,终端设备确定“请轻按屏幕”无否定词缺失,即,“请轻按屏幕”和“pleasedon'tpressthescreenhard”的语义是相同的。79.上述方法的准确性依赖于反义词词表的完整度,若反义词词表不完整,则会导致判断结果出错。80.例如,当反义词词表缺少“hard”和“轻”时,终端设备确定“pleasedon'tpressthescreenhard”和“请轻按屏幕”不存在反义词匹配,随后判断这两个语句是否存在否定词;由于“pleasedon'tpressthescreenhard”包含否定词“don't”,终端设备需要确定两个语句的否定词的数量是否相同;“请轻按屏幕”不包含否定词,因此,终端设备确定“请轻按屏幕”存在否定词缺失,从而确定“pleasepressthescreenhard”和“请轻按屏幕”二者的语义不同,最终得到错误的判断结果。81.下面结合图5介绍本技术提供的校验语义的方法。82.图5所示的方法可以由终端设备执行,终端设备的存储器(如内部存储器121)存储有不同版本的交互界面的语句,如图5所示的英文语句1和中文语句。测试人员启动校验流程后,终端设备的处理器(如处理器110)从存储器读取英文语句1和中文语句,其中,英文语句1是基准语句,中文语句是英文语句1的翻译结果。83.终端设备的处理器读取并运行存储器中存储的翻译模型的代码,执行翻译处理,例如,终端设备的处理器运行翻译模型的代码,对中文语句进行翻译处理,得到英文语句2。该翻译模型例如是多语言模型鲁棒优化的bert方法(xlanguagemodelingrobustlyoptimizedbertapproach,xml-roberta),本技术对翻译模型的具体内容不做限定。84.随后,终端设备的处理器读取并运行存储器中存储的语义分类神经网络的代码,执行语义分类处理,例如,终端设备的处理器运行语义分类神经网络的代码,对英文语句1和英文语句2进行语义分类处理,得到语义分类结果。上述语义分类神经网络是经过训练的神经网络,例如是roberta。85.语义分类神经网络的一种可选的结构如图6所示,语义分类神经网络通过词向量嵌入处理将英文语句1和英文语句2转化为词向量,随后通过位置编码标记英文语句1和英文语句2中具有关联关系的单词;随后,语义分类神经网络通过12层网络结构处理英文语句1和英文语句2的词向量,输出英文语句1和英文语句2的语义相同的置信分数。若该置信分数大于或等于分数阈值,终端设备确定英文语句1和英文语句2的语义相同;若该置信分数小于分数阈值,终端设备确定英文语句1和英文语句2的语义不同。86.由此可见,图5所示的方法无需依赖反义词词表和否定词词表即可确定不同语言的语句的语义是否相同,从而提高了语义校验的准确度。87.图5所示的方法通常在终端设备出厂前实施,因此,图5所示的方法还可以由其他电子设备(如服务器)执行,本技术对执行图5所示的方法的设备不做限定。88.语义分类神经网络需要经过训练才能具备语义分类功能。当翻译模型为神经网络时,也需要经过训练才能具备翻译功能。下面介绍本技术提供的翻译模型和语义分类神经网络的训练方法。89.可以将各个语言版本的字符串作为训练集离线训练翻译模型。可以采用反向传播训练方法训练翻译模型,在此不再赘述。90.图7是本技术提供的一种训练语义分类神经网络的示意性流程图。91.在正式训练语义分类神经网络前,可以采用多类型自然语言推理(multi-genrenaturallanguageinference,multinli)数据集作为训练集进行预训练,multinli数据集能够使语义分类神经网络获取同义、反义和中性的分类能力,此外,预训练能够使得语义分类神经网络获得良好的初始化权重,提高正式训练的训练效果。92.在正式训练语义分类神经网络时,需要准备语义分类神经网络的训练集。可以基于翻译模型的训练集生成语义分类神经网络的训练集。93.例如,可以对“ihaveanapple”进行随机破坏处理,得到“iaveaapple”或者“ihaveanbanana”,即,将have和an中的部分字母删除,或者,将apple替换为banana。随机破坏不考虑语法的正确性,目的是为了避免翻译模块与语义分类神经网络的训练数据发生交叉,提高语义分类神经网络的鲁棒性。94.又例如,可以对“ihaveanapple”进行反向翻译处理,即,将“ihaveanapple”翻译为中文,再将翻译后的中文翻译为英文。经过反向翻译得到的语句通常会与原始语句在形式上有所差别,能够避免翻译模块与语义分类神经网络的训练数据发生交叉,提高语义分类神经网络的鲁棒性。95.对翻译模型的训练集进行随机破坏或反向翻译后,还需要对目标语句(经过随机破坏或反向翻译后的语句)进行进一步处理,生成反义语句或同义语句,包含目标语句和目标语句的同义语句(或反义语句)的语句集合可以作为语义分类神经网络的训练集。96.下面以目标语句为英文语句为例,介绍生成目标语句的同义语句或反义语句的方法。97.首先,训练设备可以根据英文短语结构树确定目标语句中各个短语(如,单词)的词性。图8是本技术提供的一种英文短语结构树,s表示主语(subject),np表示名词短语(nounphrase),vp表示动词短语(verbphrase),det表示限定词(determiner),verb表示动词,pp表示前置词短语(prepositionalphrase),advp表示副词短语(adverbphrase),noun表示名词,adp表示介词短语(adpositionalphrase),adv表示副词(adverb),pron表示代词(pronoun)。98.根据图8所示的英文短语结构树可以确定英文语句中各个短语的词性,例如,通过图8所示的英文短语结构树分析“theaboveinformationwillbestoredonhonorservers”,可以确定该句话中各个单词的词性如下:99.the(det)above(adj)information(noun)will(aux)be(aux)stored(verb)on(adp)honor(propn)servers(noun)。100.其中,aux表示助动词(auxiliary),propn表示专有名词(propernoun)。aux和propn是基于英文短语结构树添加额外词性,能够使词性分析结果更精确。例如,willbe是修饰动词stored的词,因此,按照英文语法,will和be是aux;honor是名词,并且是首字母大写的非句首单词,按照英文语法,可以进一步细分honor的词性,将honor划分为propn。101.随后,训练设备可以根据基于转移的依存句法分析(transition-baseddependencyparser)和上述语句中各个单词的词性确定各个单词的依存关系。在依存句法分析的理论中,句子中的词与词之间存在一种二元不等价关系,即,主从关系。在句子中,如果一个词修饰另一个词,则称修饰词为从属词(dependent),称被修饰词为支配词(head),从属词和支配词之间的语法关系就是依存关系(dependencyrelation)。102.根据基于转移的依存句法分析确定的依存关系如图9所示。图9中,箭头表示两个单词之间的依存关系,箭头由支配词指向从属词。例如,箭头从information指向the,information为支配词(head),the为从属词(dependent),其中,支配词也可以称为核心词,从属词也可称为修饰词。103.图9中,the是information的限定词(det),above是information的形容词修饰语(adjectivalmodifier,amod),information是stored的被动名词主语(passivenominalsubject,nsubjpass),will是stored的助动词(aux),be是stored的助动词(passiveauxiliary,auxpass),on是stored的介词(preposition,prep),servers是on的介词宾语(objectofapreposition,pobj),honor是servers的复合标识符(compound)。104.确定依存关系后,训练设备可以根据依存关系从英文语句中确定目标短语,目标短语即各个短语中的修饰词。自然语言的翻译错误通常出现在修饰词部分,将修饰词替换为反义词,和/或,在修饰词前后添加否定词,能够生成更接近自然语言的训练样本,提高语义分类神经网络的训练效果。105.训练设备可以根据反义词词表(如wordnet)对初始语句“theaboveinformationwillbestoredonhonorservers”进行处理。若反义词词表包含above和on的反义词,则可以得到反义词替换后的语句“thebelowinformationwillbestoredwithouthonorservers”。训练设备还可以继续对反义词替换后的语句添加否定词,根据英文语法,否定词通常添加在动词后面,可以得到最终语句“thebelowinformationwon'tbestoredwithouthonorservers”。106.上述初始语句有两个单词被替换为反义词,并且,有一个单词被添加了否定词,则上述初始语句的反义词替换次数和否定词添加次数的和为奇数,训练设备可以确定最终语句与初始语句的语义相反。训练设备将初始语句和最终语句添加上反义语句标签后,即可利用这两个语句训练语义分类神经网络。107.在一种可选的实现方式中,若初始语句的反义词替换次数和否定词添加次数的和为偶数,训练设备可以最终语句的含义与初始语句的语义相同。训练设备将初始语句和最终语句添加上同义语句标签后,即可利用这两个语句训练语义分类神经网络。108.在反义词替换过程中,若一个单词对应多个反义词,则训练设备可以从多个反义词中选择一个反义词替换初始语句中的单词。例如,训练设备可以通过高斯分布采样从多个反义词中随机选取一个反义词;相比于随机采样,高斯分布采样提高了常用反义词被采样的概率,使得反义词替换后的语句更符合常用语法。本技术对从多个反义词中选择反义词的规则不做限定。109.在添加否定词的过程中,训练设备可以根据均匀分布概率添加英文否定词,例如,可以在did后添加not,也可以在like前添加not,否定词的添加位置位于动词前或动词后的概率是均匀分布的。110.生成足够的训练样本后,训练设备可以对语义分类神经网络进行训练。预训练采用的是multinli数据集,multinli数据集能够使语义分类神经网络获取同义、反义和中性的分类能力,由于厂商最终需要的语义分类神经网络无需具备中性分类能力,可以在正式训练前删除三分类模型(经过预训练的语义分类神经网络)的最后一层分类器,将三分类模型修改为二分类模型。111.在正式训练过程中,可以先固定二分类模型的最后一层神经元外的全部神经元,训练5个周期;之后开放所有的变量神经元,训练10个周期,直到二分类模型收敛,得到最终的语义分类神经网络。112.上述训练方法是示例而非限定,本技术对语义分类神经网络的训练方法不做限定。此外,上述训练设备可以是图1所示的装置,也可以是服务器或其他电子设备,本技术对训练设备的具体类型不做限定。113.本技术还提供了一种计算机程序产品,该计算机程序产品被处理器执行时实现本技术中任一方法实施例所述的方法。114.该计算机程序产品可以存储在存储器中,经过预处理、编译、汇编和链接等处理过程最终被转换为能够被处理器执行的可执行目标文件。115.本技术还提供了一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被计算机执行时实现本技术中任一方法实施例所述的方法。该计算机程序可以是高级语言程序,也可以是可执行目标程序。116.该计算机可读存储介质可以是易失性存储器或非易失性存储器,或者,可以同时包括易失性存储器和非易失性存储器。其中,非易失性存储器可以是只读存储器(read-onlymemory,rom)、可编程只读存储器(programmablerom,prom)、可擦除可编程只读存储器(erasableprom,eprom)、电可擦除可编程只读存储器(electricallyeprom,eeprom)或闪存。易失性存储器可以是随机存取存储器(randomaccessmemory,ram),其用作外部高速缓存。通过示例性但不是限制性说明,许多形式的ram可用,例如静态随机存取存储器(staticram,sram)、动态随机存取存储器(dynamicram,dram)、同步动态随机存取存储器(synchronousdram,sdram)、双倍数据速率同步动态随机存取存储器(doubledataratesdram,ddrsdram)、增强型同步动态随机存取存储器(enhancedsdram,esdram)、同步连接动态随机存取存储器(synchlinkdram,sldram)和直接内存总线随机存取存储器(directrambusram,drram)。117.本领域的技术人员可以清楚地了解到,为了描述的方便和简洁,上述描述的装置和设备的具体工作过程以及产生的技术效果,可以参考前述方法实施例中对应的过程和技术效果,在此不再赘述。118.在本技术所提供的几个实施例中,所揭露的系统、装置和方法,可以通过其它的方式实现。例如,以上所描述的方法实施例的一些特征可以忽略,或不执行。以上所描述的装置实施例仅仅是示意性的,单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,多个单元或组件可以结合或者可以集成到另一个系统。另外,各单元之间的耦合或各个组件之间的耦合可以是直接耦合,也可以是间接耦合,上述耦合包括电的、机械的或其它形式的连接。119.应理解,在本技术的各种实施例中,各过程的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本技术的实施例的实施过程构成任何限定。120.另外,本文中术语“系统”和“网络”在本文中常被可互换使用。本文中的术语“和/或”,仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,a和/或b,可以表示:单独存在a,同时存在a和b,单独存在b这三种情况。另外,本文中字符“/”,一般表示前后关联对象是一种“或”的关系。121.总之,以上所述仅为本技术技术方案的较佳实施例而已,并非用于限定本技术的保护范围。凡在本技术的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本技术的保护范围之内。当前第1页12当前第1页12
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献