一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

语句转换方法、装置、电子设备及存储介质与流程

2022-06-25 09:06:43 来源:中国专利 TAG:
1.本公开涉及自然语言处理
技术领域
:,尤其涉及语句转换方法、装置、电子设备及存储介质。
背景技术
::2.随着互联网技术的不断发展,数据库中存储的数据越来越多,为了更好的利用数据库中存储数据,数据分析引擎变得至关重要。在通过数据分析引擎进行数据分析时,需要通过结构化查询语言与数据库进行交互,如此需要数据分析人员熟练掌握结构化查询语言,对数据分析人员的要求较高,且开发压力较大。目前,在利用数据分析人员开发出的结构化查询语言与数据库进行交互时,因开发出的结构化查询语音的数据结构复杂,可拓展性差,致使数据分析效率较低。技术实现要素:3.本公开提供一种语句转换方法、装置、电子设备及存储介质,以至少解决相关技术中数据分析效率较低的问题。本公开的技术方案如下:4.根据本公开实施例的第一方面,提供一种语句转换方法,包括:5.获取待转换的自然语句和转换参数;6.获取所述转换参数对应的目标配置数据;7.在预设转换模型中确定出与所述目标配置数据相适应的目标转换模型;8.将所述待转换的自然语句输入所述目标转换模型,获取所述待转换的自然语句对应的目标转换语句。9.可选地,所述获取所述转换参数对应的目标配置数据,包括:10.根据所述转换参数中的引擎参数,在配置引擎表中进行查询,获取含有所述引擎参数的引擎配置数据;11.根据所述引擎配置数据,在配置引擎函数表中进行查询,获取所述引擎配置数据对应的引擎函数数据;12.对所述引擎配置数据和所述引擎函数数据进行组合、目标格式转换,得到所述转换参数对应的目标配置数据。13.可选地,所述方法还包括:14.根据所述转换参数中的对象关联参数,在配置对象表中进行查询,获取含有所述对象关联参数的对象配置数据;15.所述对所述引擎配置数据和所述引擎函数数据进行组合、目标格式转换,得到所述转换参数对应的目标配置数据,包括:16.对所述引擎配置数据、所述引擎函数数据和所述对象配置数据进行组合、目标格式转换,得到所述转换参数对应的目标配置数据。17.可选地,所述对象关联参数包括语言类型参数、模型参数、业务类型参数和数据源参数中的至少一个。18.可选地,当所述对象关联参数包括所述语言类型参数时,所述配置对象表包括配置语言表,所述对象配置数据包括语言配置数据;19.当所述对象关联参数包括所述模型参数时,所述配置对象表包括配置模型表,所述对象配置数据包括模型配置数据;20.当所述对象关联参数包括所述业务类型参数时,所述配置对象表包括配置业务表,所述对象配置数据包括业务配置数据;21.当所述对象关联参数包括所述数据源参数时,所述配置对象表包括配置数据源表,所述对象配置数据包括数据源配置数据。22.可选地,所述对所述引擎配置数据、所述引擎函数数据和所述对象配置数据进行组合、目标格式转换,得到所述转换参数对应的目标配置数据,包括:23.对所述引擎配置数据、所述引擎函数数据和所述对象配置数据按预设数据结构进行组合,得到结构化数据;24.将所述结构化数据序列化为目标格式,得到所述转换参数对应的目标配置数据。25.根据本公开实施例的第二方面,提供一种语句转换装置,包括:26.输入数据获取模块,被配置为获取待转换的自然语句和转换参数;27.配置数据获取模块,被配置为获取所述转换参数对应的目标配置数据;28.转换模型确定模块,被配置为在预设转换模型中确定出与所述目标配置数据相适应的目标转换模型;29.转换语句获取模块,被配置将所述待转换的自然语句输入所述目标转换模型,获取所述待转换的自然语句对应的目标转换语句。30.可选地,所述配置数据获取模块,包括:31.引擎数据获取单元,被配置为根据所述转换参数中的引擎参数,在配置引擎表中进行查询,获取含有所述引擎参数的引擎配置数据;32.引擎函数获取单元,被配置为根据所述引擎配置数据,在配置引擎函数表中进行查询,获取所述引擎配置数据对应的引擎函数数据;33.配置数据获取单元,被配置为对所述引擎配置数据和所述引擎函数数据进行组合、目标格式转换,得到所述转换参数对应的目标配置数据。34.可选地,所述配置数据获取模块,还包括:35.对象数据获取单元,被配置为根据所述转换参数中的对象关联参数,在配置对象表中进行查询,获取含有所述对象关联参数的对象配置数据;36.所述配置数据获取单元,被配置对所述引擎配置数据、所述引擎函数数据和所述对象配置数据进行组合、目标格式转换,得到所述转换参数对应的目标配置数据。37.可选地,所述对象关联参数包括语言类型参数、模型参数、业务类型参数和数据源参数中的至少一个。38.可选地,当所述对象关联参数包括所述语言类型参数时,所述配置对象表包括配置语言表,所述对象配置数据包括语言配置数据;39.当所述对象关联参数包括所述模型参数时,所述配置对象表包括配置模型表,所述对象配置数据包括模型配置数据。40.当所述对象关联参数包括所述业务类型参数时,所述配置对象表包括配置业务表,所述对象配置数据包括业务配置数据。41.当所述对象关联参数包括所述数据源参数时,所述配置对象表包括配置数据源表,所述对象配置数据包括数据源配置数据。42.可选地,所述配置数据获取单元,包括:43.组成处理子单元,被配置为对所述引擎配置数据、所述引擎函数数据和所述对象配置数据按预设数据结构进行组合,得到结构化数据;44.转换处理子单元,被配置为将所述结构化数据序列化为目标格式,得到所述转换参数对应的目标配置数据。45.根据本公开实施例的第三方面,提供一种电子设备,包括:46.处理器;47.用于存储所述处理器可执行指令的存储器;48.其中,所述处理器被配置为执行所述指令,以实现如第一方面所述的语句转换方法。49.根据本公开实施例的第四方面,提供一种存储介质,当所述存储介质中的指令由处理器执行时,使得服务器能够执行如第一方面所述的语句转换方法。50.根据本公开实施例的第五方面,提供一种计算机程序产品,包括计算机程序或计算机指令,所述计算机程序或计算机指令被处理器执行时实现如第一方面所述的语句转换方法。51.本公开的实施例提供的技术方案至少带来以下有益效果:52.本公开获取待转换的自然语句和转换参数,转换参数为用户指定的对自然语句进行转换时使用的相关参数信息,也就是说在本公开为用户提供参数选择项,用户可以根据自身需求确定转换参数。转换参数的内容较为单一,因此对转换参数进行扩充处理,确定出与转换参数相关的目标配置数据,目标配置数据为包含有转换参数的增强数据。进一步获取与目标配置数据相适应的目标转换模型,进而将待转换的自然语句输入目标转换模型,对待转换的自然语句进行转换,确定出目标转换语句。在本公开提供的技术方案中,用户输入待转换的自然语句和转换参数,即可以获取到目标转换语句,用户利用目标转换语句可以直接对数据库进行数据查询,无需使用数据分析人员开发出的结构化查询语言,进而大大降低专业化门槛,减少开发成本,有效节约开发时间,提高数据分析效率;且通过提供参数选择项,提供多元化的转化途径,避免单一转换模式,提升语句转换的准确性,增加转换语句的拓展性,快速获取到更符合用户要求的目标转换语句,利用该目标转换语句准确的在数据库中进行查询,提升用户体验感。53.应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。附图说明54.此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例,并与说明书一起用于解释本公开的原理,并不构成对本公开的不当限定。55.图1是根据一示例性实施例示出的一种语句转换方法的应用环境示意图;56.图2是根据一示例性实施例示出的一种语句转换方法的流程图;57.图3是根据一示例性实施例示出的一种语句转换方法中客户端转换页面的示意图;58.图4是根据一示例性实施例示出的一种语句转换方法中sql任务解耦图;59.图5是根据一示例性实施例示出的一种语句转换装置的框图;60.图6是根据一示例性实施例示出的一种电子设备的框图。具体实施方式61.为了使本领域普通人员更好地理解本公开的技术方案,下面将结合附图,对本公开实施例中的技术方案进行清楚、完整地描述。62.需要说明的是,本公开的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本公开的实施例能够以除了在这里图示或描述的那些以外的顺序实施。以下示例性实施例中所描述的实施方式并不代表与本公开相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本公开的一些方面相一致的装置和方法的例子。63.请参阅图1,其所示为根据一示例性实施例示出的一种语句转换方法的应用环境示意图,该应用环境可以包括客户端11和服务器12,该客户端11与服务器12之间可以通过有线网络或者无线网络连接。64.客户端11可以包括但不限于智能手机、台式计算机、平板电脑、笔记本电脑、数字助理、增强现实(augmentedreality,ar)/虚拟现实(virtualreality,vr)设备等类型的电子设备。也可以为运行于上述电子设备的软件,例如应用程序、小程序等。可选的,电子设备上运行的操作系统可以包括但不限于安卓系统、ios系统、linux、windows等。65.服务器12可以为客户端11中的应用程序提供后台服务的服务器。具体的,服务器12可以是独立的物理服务器,也可以是多个物理服务器构成的服务器集群或者分布式系统,还可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、cdn(contentdeliverynetwork,内容分发网络)、以及大数据和人工智能平台等基础云计算服务的云服务器。66.图2是根据一示例性实施例示出的一种语句转换方法的流程图,该语句转换方法可以用于如图1所示服务器中,包括以下步骤。67.在步骤s21中,获取待转换的自然语句和转换参数。68.在一实施例中,待转换的自然语句为用户于客户端的转换界面输入的需要进行转换的内容,转换参数为用户在客户端的转换界面指定的对自然语句进行转换时使用的相关参数信息,相关参数的内容和数量可以根据实际应用场景进行确定,对此本实施例不作具体限定。69.举例来说,图3示出一种客户端转换页面,在该转换页面中存在参数选择项和内容输入项,其中参数选择项包括olap(on-lineanalyticprocessing,联机分析处理)引擎选择项、语言类型选择项、数据源选择项、业务类型选择项和bert模型(bidirectionalencoderrepresentationsfromtransformer,一种基于transformer的模型结构)选择项,内容输入项为nl(naturallanguage,自然语言)文本,即为待转换的自然语句,olap引擎、语言类型、数据源、业务类型和bert模型中用户的选择内容即为转换参数。用户点击开始转换按钮下达转换指令,响应于该转换指令,客户端将待转换的自然语句和转换参数发送至服务端,服务端接收该待转换的自然语句和转换参数。70.在步骤s22中,获取所述转换参数对应的目标配置数据。71.在一实施例中,因为转换参数的内容为用户的选择结果,因此转换参数的内容较为单一,若直接利用转换参数进行语句转换,转换效率较低,因此对转换参数进行扩充处理,获取到内容较为详实的目标配置数据,目标配置数据为包含有转换参数的增强数据,即目标配置数据不仅包括转换参数,还包含与转换参数相关的扩充数据。72.具体的,预先设置参数预处理引擎,在参数预处理引擎中存在参数对应的配置数据,配置数据不仅包括转换页面的参数选择项呈现的各个备选项的内容,还包括各个备选项对应的扩充数据,因此在获取到转换参数后,根据转换参数在参数预处理引擎存储的配置数据中进行查询,获取到含有转换参数的目标配置数据。73.在一实施例中,转换参数包括引擎参数,所述步骤22包括:74.步骤221,根据所述转换参数中的引擎参数,在配置引擎表中进行查询,获取含有所述引擎参数的引擎配置数据。75.在客户端的转换页面设置参数选择项时,设置引擎参数选择项,允许用户在引擎参数选择项的各个备选项中选择出引擎参数。并且预先配置引擎表,具体的可以在参数预处理引擎存储的配置数据中设置配置引擎表,根据转换参数中引擎参数即可定位到配置引擎表,并进一步在配置引擎表中进行查询,查询出与引擎参数对应的引擎配置数据,该引擎配置数据为包含有引擎参数的增强数据,即不仅还有引擎参数,还含有与引擎参数有关的扩充数据。76.步骤222,根据所述引擎配置数据,在配置引擎函数表中进行查询,获取所述引擎配置数据对应的引擎函数数据。77.不同的数据分析引擎对应不同的计算函数,因此在确定出引擎配置数据后,进一步根据该引擎配置数据在存储的引擎函数表中进行查询,确定出与引擎配置数据对应的引擎函数数据,为使用不同的数据分析引擎提供前提条件。78.步骤223,对所述引擎配置数据和所述引擎函数数据进行组合、目标格式转换,得到所述转换参数对应的目标配置数据。79.在确定出引擎配置数据和引擎函数数据后,为了进一步对引擎配置数据和引擎函数数据进行应用,对引擎配置数据和引擎函数数据进行处理,即组合处理和格式转换处理,以得到处理结果即转换参数对应的目标配置数据。具体的,对引擎配置数据和引擎函数数据按预设数据结构进行组合,得到由引擎配置数据和引擎函数数据组合拼装后的结构化数据,其中预设数据结构为预先确定的数据结构形式,并进一步将该结构化数据序列化为目标格式,得到转换参数对应的目标配置数据,其中目标格式为预设转换模型可以识别的数据格式,具体的可以为json格式。80.在一些实施例中,预设数据结构根据实际情况设置,本方案不做限定。例如,预设数据结构为按照一定顺序的拼接,比如按照引擎配置数据 引擎函数数据的顺序结构拼接,或按照引擎函数数据 引擎配置数据的顺序结构拼接。81.在一种可能的实现方式中,转换参数包括引擎参数和对象关联参数,所述步骤22还包括:82.步骤224,根据所述转换参数中的对象关联参数,在配置对象表中进行查询,获取含有所述对象关联参数的对象配置数据。83.所述步骤223包括:84.步骤223a,对所述引擎配置数据、所述引擎函数数据和所述对象配置数据进行组合、目标格式转换,得到所述转换参数对应的目标配置数据。85.对象关联参数与转换页面中设置的引擎参数选择项以外的其他参数选择项相对应,对象关联参数的个数可以是一个也可以是多个,对象关联参数的具体内容可以根据实际应用场景进行设置,通过引入对象关联参数用户可以对更多参数选择项进行指定,提供多元化的选择。具体的,对象关联参数可以为语言类型参数、模型参数、业务类型参数和数据源参数中的至少一个,从语言类型、模型、业务类型和数据源各个精细维度出发,满足用户对各种参数选择项的需求。86.预先设置配置对象表,配置对象表存储有其他参数选择项中各个备选项的内容。具体的,若对象关联参数的个数为一个,配置对象表中存储有该一个对象关联参数的各个备选项的内容;若对象关联参数的个数为多个,配置对象表的数量可以为一个,即一个配置对象表中存储有多个对象关联参数的各个备选项的内容,当然配置对象表的数量也可以为多个,与对象关联参数存在一一对应的关系。87.根据对象关联参数,在配置对象表中进行查询,获取到对象配置数据,对象配置数据不仅包含对象关联参数,还包括对象关联参数对应的扩充数据。88.在确定出引擎配置数据、引擎函数数据和对象配置数据后,为了进一步对引擎配置数据、引擎函数数据和对象配置数据进行应用,对引擎配置数据、引擎函数数据和对象配置数据进行组合处理和格式转换处理,以得到目标配置数据。具体的,对引擎配置数据、引擎函数数据和对象配置数据按预设数据结构进行组合,得到由引擎配置数据、引擎函数数据、对象配置数据组合拼装后的结构化数据,其中预设数据结构为预先确定的数据结构形式,并进一步将该结构化数据序列化为目标格式,得到转换参数对应的目标配置数据,其中目标格式为预设转换模型可以识别的数据格式,具体的可以为json格式。通过对引擎配置数据、引擎函数数据和对象配置数据进行组合处理和格式转换处理,获取到目标格式的目标配置数据,有利于后续目标转换模型对目标配置数据的快速识别。89.具体的,当所述对象关联参数包括所述语言类型参数时,所述配置对象表包括配置语言表,所述对象配置数据包括语言配置数据。当所述对象关联参数包括所述模型参数时,所述配置对象表包括配置模型表,所述对象配置数据包括模型配置数据。当所述对象关联参数包括所述业务类型参数时,所述配置对象表包括配置业务表,所述对象配置数据包括业务配置数据。当所述对象关联参数包括所述数据源参数时,所述配置对象表包括配置数据源表,所述对象配置数据包括数据源配置数据。分别为不同的对象关联参数设置不同的配置对象表,有利于获取到准确的对象配置数据。90.在一种可能实现方式中,对象关联参数为语言类型参数,所述配置对象表为配置语言表,所述对象配置数据为语言配置数据,则步骤224具体表现为:根据所述语言类型参数,在配置语言表中进行查询,获取含有所述语言类型参数的语言配置数据。91.在客户端的转换页面设置参数选择项时,设置语言类型选择项,允许用户在语言类型选择项的各个备选项中选择出语言类型参数。并且预先在参数预处理引擎存储的配置数据中设置配置语言表,根据转换参数中的语言类型参数即可定位到配置语言表,并进一步在配置语言表中进行查询,查询出与语言类型参数对应的语言配置数据,该语言配置数据为包含有语言类型参数的增强数据,即不仅还有语言类型参数,还含有与语言类型参数有关的扩充数据。92.步骤223a具体表现为对所述引擎配置数据、所述引擎函数数据和所述语言配置数据进行组合,目标格式转换,得到所述转换参数对应的目标配置数据。93.当对象关联参数为语言类型参数时,即转换参数包括引擎参数和语言类型参数,在确定出引擎配置数据、引擎函数数据和语言配置数据后,对引擎配置数据、引擎函数数据和语言配置数据按预设数据结构进行组合,获取由引擎配置数据、引擎函数数据和语言配置数据组成的结构化数据,将该结构化数据序列化为json格式,得到目标配置数据。94.在一种可能的实现方式中,对象关联参数为模型参数,所述配置对象表为配置模型表,所述对象配置数据为模型配置数据,则所述步骤224具体表现为:根据所述模型参数,在配置模型表中进行查询,获取含有所述模型参数的模型配置数据。95.在客户端的转换页面设置参数选择项时,设置模型选择项,允许用户在模型选择项的各个备选项中选择出模型参数。并且预先在参数预处理引擎存储的配置数据中设置配置模型表,根据转换参数中的模型参数即可定位到配置模型表,并进一步在配置模型表中进行查询,查询出与模型参数对应的模型配置数据,该模型配置数据为包含有模型参数的增强数据,即不仅还有模型参数,还含有与模型参数有关的扩充数据。96.步骤223a具体表现为对所述引擎配置数据、所述引擎函数数据和所述模型配置数据进行组合、目标格式转换,得到所述转换参数对应的目标配置数据。97.当对象关联参数为模型参数时,即转换参数包括引擎参数和模型参数,在确定出引擎配置数据、引擎函数数据和模型配置数据后,对引擎配置数据、引擎函数数据和模型配置数据按预设数据结构进行组合,得到由引擎配置数据、引擎函数数据和模型配置数据组成的结构化数据,将结构化数据序列化为json格式,得到目标配置数据。98.在一种可能的实现方式中,对象关联参数为语言类型参数和模型参数,转换参数包括引擎参数、语言类型参数和模型参数,在获取转换参数对应的目标配置数据时,对所述引擎配置数据、所述引擎函数数据、所述语言配置数据和所述模型配置数据进行组合、目标格式转换,得到所述转换参数对应的目标配置数据。99.在一种可能的实现方式中,对象关联参数为业务类型参数,所述配置对象表为配置业务表,所述对象配置数据为业务配置数据,则所述步骤224具体表现为:根据所述业务类型参数,在配置业务表中进行查询,获取含有所述业务类型参数的业务配置数据。100.在客户端的转换页面设置参数选择项时,设置业务类型选择项,允许用户在业务类型选择项的各个备选项中选择出业务类型参数。并且预先在参数预处理引擎存储的配置数据中设置配置业务表,根据转换参数中的业务类型参数即可定位到配置业务表,并进一步在配置业务表中进行查询,查询出与业务类型参数对应的业务配置数据,该业务配置数据为包含有业务类型参数的增强数据,即不仅还有业务类型参数,还含有与业务类型参数有关的扩充数据。101.步骤223a具体表现为对所述引擎配置数据、所述引擎函数数据和所述业务配置参数进行组合、目标格式转换,得到所述转换参数对应的目标配置数据。102.当对象关联参数为业务类型参数时,即转换参数包括引擎参数和业务类型参数,在确定出引擎配置数据、引擎函数数据和业务配置数据后,对引擎配置数据、引擎函数数据和业务配置数据按预设数据结构进行组合,得到由引擎配置数据、引擎函数数据和业务配置数据组成的结构化数据,将结构化数据序列化为json格式,得到目标配置数据。103.在一种可能的实现方式中,对象关联参数为语音类型参数和业务类型参数,转换参数包括引擎参数、语言类型参数和业务类型参数,在获取转换参数对应的目标配置数据时,对所述引擎配置数据、所述引擎函数数据、所述语言配置数据和所述业务配置数据进行组合、目标格式转换,得到所述转换参数对应的目标配置数据。104.在一种可能的实现方式中,当对象关联参数为模型参数和业务类型参数时,转换参数包括引擎参数、模型参数和业务类型参数,在获取转换参数对应的目标配置数据时,对所述引擎配置数据、所述引擎函数数据、所述模型配置数据和所述业务配置数据进行组合、目标格式转换,得到所述转换参数对应的目标配置数据。105.在一种可能的实现方式中,对象关联参数为语音类型参数、模型参数和业务类型参数,转换参数包括引擎参数、语言类型参数、模型参数和业务类型参数时,在获取转换参数对应的目标配置数据时,对所述引擎配置数据、所述引擎函数数据、所述语言配置数据、所述模型配置数据和所述业务配置数据进行组合、目标格式转换,得到所述转换参数对应的目标配置数据。106.在一种可能的实现方式中,所述对象关联参数为所述数据源参数时,所述配置对象表为配置数据源表,所述对象配置数据为数据源配置数据,则所述步骤224具体表现为:根据所述数据源参数,在配置数据源表中进行查询,获取含有所述数据源参数的数据源配置数据。107.在客户端的转换页面设置参数选择项时,设置数据源选择项,允许用户在数据源选择项的各个备选项中选择出数据源参数。并且预先在参数预处理引擎存储的配置数据中设置配置数据源表,根据转换参数中的数据源参数即可定位到配置数据源表,并进一步在配置数据源表中进行查询,查询出与数据源参数对应的数据源配置数据,该数据源配置数据为包含有数据源参数的增强数据,即不仅还有数据源参数,还含有与数据源参数有关的扩充数据。108.步骤223a具体表现为对所述引擎配置数据、所述引擎函数数据和所述数据源配置数据进行组合、目标格式转换,得到所述转换参数对应的目标配置数据。109.当对象关联参数为数据源参数时,即转换参数包括引擎参数和数据源参数时,在确定出引擎配置数据、引擎函数数据和数据源配置数据后,对引擎配置数据、引擎函数数据和数据源配置数据按预设数据结构进行组合,得到由引擎配置数据、引擎函数数据、数据源配置数据组成的结构化数据,将该结构化数据序列化为json格式,得到目标配置数据。110.在一种可能的实现方式中,对象关联参数为语音类型参数和数据源参数,转换参数包括引擎参数、语言类型参数和数据源参数,在获取转换参数对应的目标配置数据时,对所述引擎配置数据、所述引擎函数数据、所述语言配置数据和所述数据源配置数据进行组合、目标格式转换,得到所述转换参数对应的目标配置数据。111.在一种可能的实现方式中,对象关联参数为模型参数和数据源参数,转换参数包括引擎参数、模型参数和数据源参数时,在获取转换参数对应的目标配置数据时,对所述引擎配置数据、所述引擎函数数据、所述模型配置数据和所述数据源配置数据进行组合、目标格式转换,得到所述转换参数对应的目标配置数据。112.在一种可能的实现方式中,对象关联参数为业务类型参数和数据源参数,转换参数包括引擎参数、业务类型参数和数据源参数时,在获取转换参数对应的目标配置数据时,对所述引擎配置数据、所述引擎函数数据、所述业务类型配置数据和所述数据源配置数据进行处理、目标格式转换,得到所述转换参数对应的目标配置数据。113.在一种可能的实现方式中,对象关联参数为语言类型参数、模型参数和数据源参数,转换参数包括引擎参数、语言类型参数、模型参数和数据源参数时,在获取转换参数对应的目标配置数据时,对所述引擎配置数据、所述引擎函数数据、所述语言配置数据、所述模型配置数据和所述数据源配置数据进行组合、目标格式转换,得到所述转换参数对应的目标配置数据。114.在一种可能的实现方式中,对象关联参数为语言类型参数、业务类型参数和数据源参数,转换参数包括引擎参数、语言类型参数、业务类型参数和数据源参数时,在获取转换参数对应的目标配置数据时,对所述引擎配置数据、所述引擎函数数据、所述语言配置数据、所述业务类型配置数据和所述数据源配置数据进行组合、目标格式转换,得到所述转换参数对应的目标配置数据。115.在一种可能的实现方式中,对象关联参数为模型参数、业务类型参数和数据源参数,转换参数包括引擎参数、模型参数、业务类型参数和数据源参数时,在获取转换参数对应的目标配置数据时,对所述引擎配置数据、所述引擎函数数据、所述模型配置数据、所述业务类型配置数据和所述数据源配置数据进行组合、目标格式转换,得到所述转换参数对应的目标配置数据。116.在一种可能的实现方式中,对象关联参数为语言类型参数、模型参数、业务类型参数和数据源参数,转换参数包括引擎参数、语言类型参数、模型参数、业务类型参数和数据源参数时,在获取转换参数对应的目标配置数据时,对所述引擎配置数据、所述引擎函数数据、所述语言类型配置数据、所述模型配置数据、所述业务类型配置数据和所述数据源配置数据进行组合、目标格式转换,获取所述转换参数对应的目标配置数据。117.示例性的,设置参数预处理引擎,参数预处理引擎中存储的配置数据包括但不限于如下主表和维表。118.表1参数预处理引擎的主表119.[0120][0121]其中,数据分析引擎对应引擎参数:存储引擎code,可定位到数据分析引擎的配置引擎表,可以快速定位需要转换的数据分析引擎特定的sql语句schema(架构),如clickhouse、hive等;语言编码对应语言类型参数:存储语言code,对应自然语言的配置语言表,可快速识别需要转换的语言类型,使用不同的分词器,如中文、英文、法文、日语等;bert模型对应模型参数:存储bert模型code,可快速定位后续预设转换模型内部需要使用模型;数据源对应数据源参数:存储可用的bert模型训练数据源,可使bert模型定制化训练,使相关领域词汇转换更精准;业务定制数据对应业务类型参数:存储固定业务相关的定制转换数据词汇,提前获取对应的表和字段信息,例如金融类,建筑类、医疗类等。[0122]表2参数预处理引擎维度—配置引擎表[0123]字段描述字段名数据类型是否主键是否外键不可为空默认值ididvarchar(200)truefalsetrue引擎编码engine_codevarchar(200)falsefalsefalsenone引擎名称engine_namevarchar(200)falsefalsefalsenone引擎类型engine_typevarchar(200)falsefalsefalsenone引擎版本engine_versionvarchar(200)falsefalsefalsenone可用状态activevarchar(200)falsefalsefalsenone备注remarkvarchar(200)falsefalsetruenone[0124]其中,引擎编码为开发人员自定义的引擎代码标识信息,例如可以用ck表征clickhouse,用hive表征hive;引擎名称可以为引擎(中文/英文)名称;引擎类型可以为clickhouse、hive、spark;引擎版本可以为版本号;可用状态可以为是/否。[0125]表3参数预处理引擎维度—配置引擎函数表[0126]字段描述字段名数据类型是否主键是否外键不可为空默认值ididvarchar(200)truefalsetrue引擎编码engine_codevarchar(200)falsefalsefalsenone函数名称function_namevarchar(200)falsefalsefalsenone函数类型function_typevarchar(200)falsefalsefalsenone函数表达式function_exprocessionvarchar(200)falsefalsefalsenone函数异常function_exceptionvarchar(200)falsefalsefalsenone函数参数function_paramvarchar(200)falsefalsetruenone[0127]其中,引擎编码为开发人员自定义的引擎代码标识信息,例如可以用ck表征clickhouse,用hive表征hive,利用引擎编码将配置引擎表和配置引擎函数表进行关联,在根据配置引擎表确定出引擎编码后,将引擎编码作为查询配置引擎函数表的索引,获取到引擎函数数据,其中因为引擎编码的内容较短,在节约存储空间的同时,可以提高查询速度;函数名称可以为sum求和、max最大值;函数类型可以为聚合函数/算术函数/时间函数等;函数表达式可以为argmax(arg,val)、count(expr)等;函数异常即函数可能发生的异常或可忽略的异常;函数参数为函数可指定的参数,如:*。[0128]表4参数预处理引擎维度—配置语言表[0129]字段描述字段名数据类型是否主键是否外键不可为空默认值ididvarchar(200)truefalsetrue语言编码language_codevarchar(200)falsefalsefalsenone语言名称language_namevarchar(200)falsefalsefalsenone语言类型language_typevarchar(200)falsefalsefalsenone分词器word_analyzervarchar(200)falsefalsefalsenone备注remarkvarchar(200)falsefalsetruenone[0130]其中,语言编码为开发人员自定义的语言标识信息,例如可以为cn、en等;语言名称可以为简体中文、英文等;语言类型可以为汉语、西语等;分词器可以为中文的ik分词器、日语的mecab分词器等。[0131]表5参数预处理引擎维度—配置数据源表[0132]字段描述字段名数据类型是否主键是否外键不可为空默认值ididvarchar(200)truefalsetrue数据源编码source_codevarchar(200)falsefalsefalsenone数据源名称source_namevarchar(200)falsefalsefalsenone数据源类型source_typevarchar(200)falsefalsefalsenone连接urlsource_connect_urlvarchar(200)falsefalsefalsenone数据源驱动source_drivevarchar(200)falsefalsetruenone用户名source_usernamevarchar(200)falsefalsetruenone密码source_passwordvarchar(200)falsefalsetruenone[0133]其中,数据源编码为开发人员自定义的数据源标识信息,用于主表关系映射;数据源名称可以为数据库/大数据分析引擎的中/英文名称,如mysql、oracle、clickhouse、hive、elasticsearch等;数据源类型可以为数据库/大数据分析引擎类型;连接url可以为连接的url地址;数据源驱动可以为数据源的驱动程序及对应不同语言的驱动程序,如mysql的java语言的驱动程序、python语言驱动程序等;用户名可以为数据库/大数据分析引擎连接用户名;密码可以为数据库/大数据分析引擎连接密码。[0134]表6参数预处理引擎维度—配置模型表[0135]字段描述字段名数据类型是否主键是否外键不可为空默认值ididvarchar(200)truefalsetrue模型编码bert_model_codevarchar(200)falsefalsefalsenone模型名称bert_model_namevarchar(200)falsefalsefalsenone参数bert_model_paramvarchar(200)falsefalsefalsenone表达式expressionvarchar(200)falsefalsefalsenone[0136]其中,模型编码为开发人员自定义的bert模型标识信息,如哈工大讯飞联合实验室发布的bert-wwm模型及改进模型;模型名称可以为bert-xxx;参数可以为包括的模型参数;表达式为包括的模型表达式。[0137]表7参数预处理引擎维度—配置业务表[0138]字段描述字段名数据类型是否主键是否外键不可为空默认值ididvarchar(200)truefalsetrue业务编码business_codevarchar(200)falsefalsefalsenone业务名称business_namevarchar(200)falsefalsefalsenone业务表名business_table_namevarchar(200)falsefalsefalsenone字段名business_field_namevarchar(200)falsefalsefalsenone[0139]其中,业务编码为开发人员自定义业务场景标识信息,内容较短,不同业务编码用于代表不同业务场景;业务名称可以为定制业务场景的名称,如金融网站访问量数据分析;业务表名可以为bert模型可输入的业务数据表名;字段名可以为bert模型可输入的业务数据字段名。[0140]举例来说,用户在如图3所示的转换界面中,在olap引擎处选择了"clickhouse",在语言类型处选择了"cn",在数据源处选择了"hb-source1",在业务类型处选择了"medical",在bert模型处选择了"bert-wmm",转换参数为"language":"cn"、"engine":"clickhouse"、"bert":"bert-wmm"、"source":"hb-source1"、"business":"medical"。[0141]根据上述转换参数中的language字段定位到表4配置语言表,得到语言配置数据,其中语言配置数据包括:code(与表4中language_code相对应,表征语言编码)、name(与表4中language_name相对应,表征语言名称)、type(与表4中language_type相对应,表征语言类型)、word_analyzer(表征分词器,包括ik分词器)。具体的,该语言配置数据包括但不限于如下内容:[0142][0143][0144]根据上述转换参数中的engine字段定位到表2配置引擎表,得到引擎配置数据,其中引擎配置数据包括:code(与表2中engine_code相对应,表征引擎编码)、type(与表2中engine_type相对应,表征引擎类型)、version(与表2中engine_version相对应,表征引擎版本)、active(表征可用状态,true表征状态可用)。具体的,该引擎配置数据包括但不限于如下内容:[0145][0146]进一步定位到表3配置引擎函数表,得到引擎函数数据,其中引擎函数数据包括:name(与表3中function_name相对应,表征函数名称)、type(与表3中function_type相对应,表征函数类型)、exprocession(与表3中function_exprocession相对应,表征函数表达式)、param(与表3中function_param相对应,表征函数参数)。具体的,引擎函数数据包括但不限于如下内容:[0147][0148][0149]需要说明是,如上仅是对"function"内容的部分截取,实际会返回特定引擎的全部函数及分类。[0150]根据上述转换参数中的source字段定位到表5配置数据源表,得到数据源配置数据,其中数据源配置数据包括:code(与表5中source_code相对应,表征数据源编码)、name(与表5中source_name相对应,表征数据源名称)、type(与表5中source_type相对应,表征数据源类型)、url(与表5中source_connect_url相对应,表征连接url)、drive(与表5中source_drive相对应,表征数据源驱动)、username(与表5中source_username相对应,表征用户名)、password(与表5中source_password相对应,表征密码)。具体的,该数据源配置数据包括但不限于如下内容:[0151][0152][0153]根据上述转换参数中的bert_model字段定位到表6配置模型表,得到模型配置数据,其中模型配置数据包括:bert_model_code(表征模型编码)、bert_model_name(表征模型名称)、bert_model_param(表征参数)。具体的,该模型配置数据包括但不限于如下内容:[0154][0155]根据上述转换参数中的business字段定位到表7配置业务表,得到业务配置数据,其中业务配置数据包括:business_code(表征业务编码)、business_name(表征业务名称)、business_table(与表6中business_table_name相对应,表征业务表名)、business_field(与表6中business_field_name相对应,表征字段名)。具体的,该业务配置数据包括但不限于如下内容:[0156][0157]将获取到的引擎配置数据、引擎函数数据、语言配置数据、模型配置数据、业务配置数据、数据源配置数据进行组合,得到结构化数据,将该结构化数据序列化为目标格式,得到转换参数对应的目标配置数据。得到的目标配置数据为对内容单一的转换参数的扩充数据,在后续语句转换过程中可快速定位目标转换模型,提供转换效率。且在确定目标配置数据时,允许客户端对引擎进行选择,并进一步确定引擎对应的引擎函数,可以做到一种语言多引擎的执行,满足用户对数据分析引擎的多种需求,提供多元化的转换手段,提高用户的体验感。[0158]在步骤s23中,在预设转换模型中确定出与所述目标配置数据相适应的目标转换模型。[0159]在预设转换模型中存储着支撑各种转换参数的数据,具体的存储有各种引擎参数、语言类型参数、模型参数、业务类型参数和数据源参数对应的执行数据,例如各个引擎编码、引擎名称、引擎类型和引擎版本对应的执行数据,实现对应引擎功能。进而在确定出目标配置数据后,可在预设转换模型中快速确定出与目标配置数据相适应的目标转换模型,目标转换模型由目标配置数据对应的各个参数的详细信息确定。具体的,目标转换模型为目标配置数据对应的执行数据的组合,用于实现目标配置数据,如目标配置数据中对应bert-xxx,其中bert-xxx为名称层面的内容,目标转换模型对应bert-xxx,其中bert-xxx为模型具体实现层面内容。[0160]步骤23,将所述待转换的自然语句输入所述目标转换模型,获取所述待转换的自然语句对应的目标转换语句。[0161]在确定出目标转换模型后,将自然语句输入到目标转换模型中,目标转换模型自动将自然语句转换为对应的目标转换语句。具体的,目标转换语句为sql语句,目标转换模型为基于bert模型获取的模型,其中目标转换模型的模型数量为至少一个。[0162]在一种可能的实现方式中,在进行sql预测时,将sql预测任务解耦为6个子任务,包括:sel、agg、cond_conn_op、cond_col、cond_op和cond_val,具体如图4所示,其中,sel表征select选取的列;agg表征select语句所选取的各列做的聚合操作,例如max,min等,与sel一一对应;conds表征where子句中的各个条件,其中cond_col表征条件对应列,cond_op表征条件运算符,cond_val表征条件目标值;cond_conn_op表征条件之间的关系,例如and、or等。[0163]进一步地,目标转换模型可以包括model-1和model-2。model-1主要用于cond_con_op,agg和conds_op的预测;model-2主要用于对cond_val的预测,主要是根据model-1预测出的cond_col结果,将cond_op和cond_val的组合情况进行逐个枚举,进而生成一系列候选组合,再将这些候选组合与自然语言问句分别拼接起来,输入到bert模型,转化为多个二分类问题,将输出为1的全部组合作为模型的最终输出,并进一步将输出的sql语句返回至客户端,以使得用户利用得到的sql语句与数据库进行交互,其中返回至客户端的sql语句为至少一个可能的结果。[0164]在上述实施例中,获取待转换的自然语句和转换参数,转换参数为用户指定的对自然语句进行转换时使用的相关参数信息,也就是说在本公开为用户提供参数选择项,用户可以根据自身需求确定转换参数。转换参数的内容较为单一,因此对转换参数进行扩充处理,确定出与转换参数相关的目标配置数据,目标配置数据为包含有转换参数的增强数据。进一步获取与目标配置数据相适应的目标转换模型,进而将待转换的自然语句输入目标转换模型对自然语句进行转换,确定出目标转换语句。在本公开提供的技术方案中,用户输入待转换的自然语句和转换参数,即可以获取到目标转换语句,用户利用目标转换语句可以直接对数据库进行数据查询,无需使用数据分析人员开发出的结构化查询语言,进而大大降低专业化门槛,减少开发成本,有效节约开发时间,提高数据分析效率;且通过提供参数选择项,提供多元化的转化途径,避免单一转换模式,提高语句转换的准确性,增加转换语句的拓展性,快速获取到更符合用户要求的目标转换语句,利用该目标转换语句准确的在数据库中进行查询,提升用户体验感。[0165]图5是根据一示例性实施例示出的一种语句转换装置的框图,该装置设置于第一服务器。该装置包括输入数据获取模块51、配置数据获取模块52、转换模型确定模块53、转换语句获取模块54。[0166]输入数据获取模块51,被配置为获取待转换的自然语句和转换参数;[0167]配置数据获取模块52,被配置为获取所述转换参数对应的目标配置数据;[0168]转换模型确定模块53,被配置为在预设转换模型中确定出与所述目标配置数据相适应的目标转换模型;[0169]转换语句获取模块54,被配置将所述待转换的自然语句输入所述目标转换模型,获取所述待转换的自然语句对应的目标转换语句。[0170]在本公开一示例性实施例中,所述配置数据获取模块,包括:[0171]引擎数据获取单元,被配置为根据所述转换参数中的引擎参数,在配置引擎表中进行查询,获取含有所述引擎参数的引擎配置数据;[0172]引擎函数获取单元,被配置为根据所述引擎配置数据,在配置引擎函数表中进行查询,获取所述引擎配置数据对应的引擎函数数据;[0173]配置数据获取单元,被配置为对所述引擎配置数据和所述引擎函数数据进行组合、目标格式转换,得到所述转换参数对应的目标配置数据。[0174]在本公开一示例性实施例中,所述配置数据获取模块,还包括:[0175]对象数据获取单元,被配置为根据所述转换参数中的对象关联参数,在配置对象表中进行查询,获取含有所述对象关联参数的对象配置数据;[0176]所述配置数据获取单元,被配置对所述引擎配置数据、所述引擎函数数据和所述对象配置数据进行组合、目标格式转换,得到所述转换参数对应的目标配置数据。[0177]在本公开一示例性实施例中,所述对象关联参数包括语言类型参数、模型参数、业务类型参数和数据源参数中的至少一个。[0178]在本公开一示例性实施例中,当所述对象关联参数包括所述语言类型参数时,所述配置对象表包括配置语言表,所述对象配置数据包括语言配置数据;[0179]当所述对象关联参数包括所述模型参数时,所述配置对象表包括配置模型表,所述对象配置数据包括模型配置数据。[0180]当所述对象关联参数包括所述业务类型参数时,所述配置对象表包括配置业务表,所述对象配置数据包括业务配置数据。[0181]当所述对象关联参数包括所述数据源参数时,所述配置对象表包括配置数据源表,所述对象配置数据包括数据源配置数据。[0182]在本公开一示例性实施例中,所述配置数据获取单元,包括:[0183]组成处理子单元,被配置为对所述引擎配置数据、所述引擎函数数据和所述对象配置数据按预设数据结构进行组合,得到结构化数据;[0184]转换处理子单元,被配置为将所述结构化数据序列化为目标格式,得到所述转换参数对应的目标配置数据。[0185]关于上述实施例中的装置,其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述,此处将不做详细阐述说明。[0186]图6是根据一示例性实施例示出的一种电子设备的框图,该电子设备可以是服务器或者类似的运算装置。以电子设备600是服务器为例。参照图6,电子设备600包括处理组件622,其进一步包括一个或多个处理器,以及由存储器632所代表的存储器资源,用于存储可由处理组件622的执行的指令,例如应用程序。存储器632中存储的应用程序可以包括一个或一个以上的每一个对应于一组指令的模块。此外,处理组件622被配置为执行指令,以执行上述语句转换方法。[0187]电子设备600还可以包括一个电源组件626被配置为执行电子设备600的电源管理,一个有线或无线网络接口650被配置为将电子设备600连接到网络,和一个输入输出(i/o)接口658。电子设备600可以操作基于存储在存储器632的操作系统,例如windowsservertm,macosxtm,unixtm,linuxtm,freebsdtm或类似。[0188]在示例性实施例中,还提供了一种包括指令的计算机可读存储介质,例如包括指令的存储器632,上述指令可由电子设备600的处理组件622执行以完成上述关系链标签的实现方法。可选地,计算机可读存储介质可以是rom、随机存取存储器(ram)、cd-rom、磁带、软盘和光数据存储设备等。[0189]在示例性实施例中,还提供一种计算机程序产品,包括计算机程序或计算机指令,所述计算机程序或计算机指令被处理器执行时实现上述的语句转换方法。[0190]本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本公开的其它实施方案。本技术旨在涵盖本公开的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本
技术领域
:中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本公开的真正范围和精神由下面的权利要求指出。[0191]应当理解的是,本发明并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本发明的范围仅由所附的权利要求来限制。当前第1页12当前第1页12
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献