一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

文件解析方法、装置、可读存储介质及文件解析设备与流程

2022-12-31 15:39:04 来源:中国专利 TAG:


1.本技术涉及文件解析领域,具体而言,涉及一种文件解析方法、装置、可读存储介质及文件解析设备。


背景技术:

2.在数据解析处理时,往往需要对特定数据字段进行数据转换操作(如:字符串截取、ip地址转换、时间格式转换等),通常传统做法是需要对各种待处理数据编写其特定的解析程序,每种待处理数据都要编写一套与其对应的解析程序需要进行大量的重复编码工作,浪费大量的人力物力,耗时较长,造成不必要的资源浪费。


技术实现要素:

3.本技术的主要目的在于提供一种文件解析方法、装置、可读存储介质及文件解析设备,以解决现有技术中对每种待处理数据都要编写一套与其对应的解析程序的大量重复编码工作浪费人力物力的问题。
4.为了实现上述目的,根据本技术的一个方面,提供了一种文件解析方法,该方法包括:获取待解析文件的输入描述信息和所述待解析文件的输出描述信息,所述输入描述信息用于描述所述待解析文件的输入格式,所述输出描述信息用于描述所述待解析文件的欲输出格式;采用解析程序对所述待解析文件进行解析,且在解析的过程中,在读取到关键词的情况下,根据所述关键词之后的目标函数名,调用目标函数,以将所述待解析文件的格式从所述输入格式转换为输出格式,所述目标函数是由所述待解析文件的输入格式和所述待解析文件的欲输出格式决定的。
5.可选地,所述关键词有m个,采用解析程序对所述待解析文件进行解析,且在解析的过程中,在读到关键词的情况下,根据所述关键词之后的目标函数名,调用目标函数,以将所述待解析文件的格式从所述输入格式转换为输出格式,包括:步骤s1,采用解析程序对所述待解析文件进行解析,且在解析的过程中,在读到第i个关键词时,根据所述第i个关键词之后的第i个目标函数名,调用第i个目标函数,以将所述待解析文件的格式从所述输入格式转换为第i种输出格式,其中,i=1;步骤s2,继续读取第i 1个关键词,根据所述第i 1个关键词之后的第i 1个目标函数名,调用第i 1个目标函数,以将所述待解析文件的格式从所述第i种输出格式转换为第i 1种输出格式,其中,2≤i 1≤m;步骤s3,判断i 1是否等于m,如是,第i 1个输出格式为最终输出格式;如否,返回至步骤s2。
6.可选地,所述关键词有两个,采用解析程序对所述待解析文件进行解析,且在解析的过程中,在读到关键词的情况下,根据所述关键词之后的目标函数名,调用目标函数,以将所述待解析文件的格式从所述输入格式转换为输出格式,包括:采用解析程序对所述待解析文件进行解析,且在解析的过程中,在读到第一个关键词时,根据所述第一个关键词之后的第一个目标函数名,调用第一个目标函数,以将所述待解析文件的格式从所述输入格式转换为第一种输出格式,其中,所述第一个目标函数为将小写格式转换为大写格式的函
数;在读到第二个关键词时,根据所述第二个关键词之后的第二个目标函数名,调用第二个目标函数,以将所述待解析文件的格式从所述第一种输出格式转换为第二种输出格式,所述第二个目标函数为提取目标字符串的函数。
7.可选地,所述待解析文件的输入格式至少为以下之一:小写格式、大写格式、指数格式、对数格式。
8.可选地,所述待解析文件的输出格式至少为以下之一:小写格式、大写格式、指数格式、对数格式、截取某段字符串。
9.可选地,所述方法还包括:生成第一xml文件,所述第一xml文件用于表征输入描述信息;生成第二xml文件,所述第二xml文件用于表征输入描述信息。
10.根据本技术的另一方面,提供了一种文件解析装置,该装置包括获取模块与解析模块,所述获取模块用于获取待解析文件的输入描述信息和所述待解析文件的输出描述信息,所述输入描述信息用于描述所述待解析文件的输入格式,所述输出描述信息用于描述所述待解析文件的欲输出格式;所述解析模块用于采用解析程序对所述待解析文件进行解析,且在解析的过程中,在读到关键词的情况下,根据所述关键词之后的目标函数名,调用目标函数,以将所述待解析文件的格式从所述输入格式转换为输出格式,所述目标函数是由所述待解析文件的输入格式和所述待解析文件的欲输出格式决定的。
11.可选地,所述获取模块还包括第一生成模块与第二生成模块,其中,所述第一生成模块用于生成第一xml文件,所述第一xml文件用于表示输入描述信息;所述第二生成模块用于生成第二xml文件,所诉第二xml文件用于表述输入描述信息。
12.根据本发明实施例的又一方面,还提供了一种计算机可读存储介质,所述计算机可读存储介质包括存储的程序,其中,在所述程序运行时控制所述计算机可读存储介质所在设备执行上述任意一种所述方法。
13.根据本发明实施例的又一方面,还提供了一种文件解析设备,包括:一个或多个存储器,以及一个或多个程序,其中,所述一个或多个程序被存储在所述存储器中,所述一个或多个程序包括用于执行上述任意一种所述的文件解析方法。
14.应用本技术的技术方案,上述文件解析方法,首先获取待解析文件的输入描述信息和待解析文件的输出描述信息,输入描述信息用于描述待解析文件的输入格式,输出描述信息用于描述待解析文件的欲输出格式;之后采用解析程序对待解析文件进行解析,且在解析的过程中,在读取到关键词的情况下,根据关键词之后的目标函数名,调用目标函数,以将待解析文件的格式从输入格式转换为输出格式,目标函数是由待解析文件的输入格式和待解析文件的欲输出格式决定的。上述方法通过在解析程序中设置关键词,在解析过程中提取与输出描述对应的目标函数,可以不对每种待处理数据都编写一套与其对应的解析程序,仅需设置一种解析程序即可,更易于维护扩展且更加灵活,解决了现有技术中对每种待处理数据都要编写一套与其对应的解析程序的大量重复编码工作浪费人力物力的问题。
附图说明
15.构成本技术的一部分的说明书附图用来提供对本技术的进一步理解,本技术的示意性实施例及其说明用于解释本技术,并不构成对本技术的不当限定。在附图中:
16.图1示出了根据本技术的实施例的文件解析方法的流程示意图;
17.图2示出了根据本技术的实施例的文件解析方法的另一种方法流程示意图;
18.图3示出了根据本技术的实施例的文件解析方法的又一种方法流程示意图;
19.图4示出了根据本技术的实施例的文件解析装置的示意图。
具体实施方式
20.需要说明的是,在不冲突的情况下,本技术中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本技术。
21.为了使本技术领域的人员更好地理解本技术方案,下面将结合本技术实施例中的附图,对本技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本技术一部分的实施例,而不是全部的实施例。基于本技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本技术保护的范围。
22.需要说明的是,本技术的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本技术的实施例。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
23.应该理解的是,当元件(诸如层、膜、区域、或衬底)描述为在另一元件“上”时,该元件可直接在该另一元件上,或者也可存在中间元件。而且,在说明书以及权利要求书中,当描述有元件“连接”至另一元件时,该元件可“直接连接”至该另一元件,或者通过第三元件“连接”至该另一元件。
24.正如背景技术中所说的,现有技术中对每种待处理数据都要编写一套与其对应的解析程序的大量重复编码工作浪费人力物力,为了解决上述问题,本技术的一种典型的实施方式中,提供了一种文件解析方法、装置、可读存储介质及文件解析设备。
25.根据本技术的实施例,提供了一种文件解析方法,该方法可以应用于解析多种格式的文本文件或者数据流,例如:cap文件、map文件、xml文件、json格式、csv格式、kv格式、固定分隔符固定列格式等,但不限于上述格式,只要可被描述定义即可。
26.图1是根据本技术实施例的文件解析方法的流程图。如图1所示,该方法包括以下步骤:
27.步骤s101,获取待解析文件的输入描述信息和上述待解析文件的输出描述信息,上述输入描述信息用于描述上述待解析文件的输入格式,上述输出描述信息用于描述上述待解析文件的欲输出格式。
28.在一个可选地实施例中,上述方法还包括:生成第一xml文件,上述第一xml文件用于表征输入描述信息;生成第二xml文件,上述第二xml文件用于表征输入描述信息。xml格式保存的数据具有自我描述性,并且有统一的格式和语法,便于读取且提高效率。
29.具体地,上述待解析文件的输入格式至少为以下之一:小写格式、大写格式、指数格式、对数格式;上述待解析文件的输出格式至少为以下之一:小写格式、大写格式、指数格
式、对数格式、截取某段字符串。其中,上述待解析文件的输出格式还可以是:截取前几段字符串、截取后几段字符串、截取中间几段字符串、截取符合某一要求的字符串。
30.需要注意的是,上述输入格式与上述输出格式需为对应关系,例如:上述输入格式为小写格式时,上述输出格式可以为大写格式;上述输入格式为指数格式时,上述输出格式可以为对数格式。具体地,本实施例是一个对特定数据字段进行数据转换操作的过程,例如:字符串截取、ip地址转换、时间格式转换等。
31.步骤s102,采用解析程序对上述待解析文件进行解析,且在解析的过程中,在读取到关键词的情况下,根据上述关键词之后的目标函数名,调用目标函数,以将上述待解析文件的格式从上述输入格式转换为输出格式,上述目标函数是由上述待解析文件的输入格式和上述待解析文件的欲输出格式决定的。通过在解析程序中设置关键词,在解析过程中提取与输出描述对应的目标函数,可以不对每种待处理数据都编写一套与其对应的解析程序,仅需设置一种解析程序即可,解放了人力。
32.具体地,上述关键词可以设置为“execute”,还可以设置为其他关键词。
33.其中,在上述关键词有m个的情况下,如图2所示,步骤s102具体实施步骤如下:
34.步骤s1,采用解析程序对上述待解析文件进行解析,且在解析的过程中,在读到第i个关键词时,根据上述第i个关键词之后的第i个目标函数名,调用第i个目标函数,以将上述待解析文件的格式从上述输入格式转换为第i种输出格式,其中,i=1;
35.步骤s2,继续读取第i 1个关键词,根据上述第i 1个关键词之后的第i 1个目标函数名,调用第i 1个目标函数,以将上述待解析文件的格式从上述第i种输出格式转换为第i 1种输出格式,其中,2≤i 1≤m;
36.步骤s3,判断i 1是否等于m,如是,第i 1个输出格式为最终输出格式;如否,返回至步骤s2。
37.在其他实施例中,上述关键词有两个,如图3所示,采用解析程序对上述待解析文件进行解析,且在解析的过程中,在读到关键词的情况下,根据上述关键词之后的目标函数名,调用目标函数,以将上述待解析文件的格式从上述输入格式转换为输出格式的实施步骤可以如下:
38.步骤s201,采用解析程序对上述待解析文件进行解析,且在解析的过程中,在读到第一个关键词时,根据上述第一个关键词之后的第一个目标函数名,调用第一个目标函数,以将上述待解析文件的格式从上述输入格式转换为第一种输出格式,其中,上述第一个目标函数为将小写格式转换为大写格式的函数;
39.步骤s202,在读到第二个关键词时,根据上述第二个关键词之后的第二个目标函数名,调用第二个目标函数,以将上述待解析文件的格式从上述第一种输出格式转换为第二种输出格式,上述第二个目标函数为提取目标字符串的函数。
40.本技术的上述文件解析方法中,首先获取待解析文件的输入描述信息和待解析文件的输出描述信息,输入描述信息用于描述待解析文件的输入格式,输出描述信息用于描述待解析文件的欲输出格式;之后采用解析程序对待解析文件进行解析,且在解析的过程中,在读取到关键词的情况下,根据关键词之后的目标函数名,调用目标函数,以将待解析文件的格式从输入格式转换为输出格式,目标函数是由待解析文件的输入格式和待解析文件的欲输出格式决定的。上述方法通过在解析程序中设置关键词,在解析过程中提取与输
出描述对应的目标函数,可以不对每种待处理数据都编写一套与其对应的解析程序,仅需设置一种解析程序即可,更易于维护扩展且更加灵活,解决了现有技术中对每种待处理数据都要编写一套与其对应的解析程序的大量重复编码工作浪费人力物力的问题。
41.需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
42.本技术实施例还提供了一种文件解析装置,需要说明的是,本技术实施例的文件解析装置可以用于执行本技术实施例所提供的文件解析方法。以下对本技术实施例提供的文件解析装置进行介绍。
43.图4是根据本技术实施例的文件解析装置的示意图。如图4所示,该装置包括获取模块10与解析模块20,上述获取模块10用于获取待解析文件的输入描述信息和上述待解析文件的输出描述信息,上述输入描述信息用于描述上述待解析文件的输入格式,上述输出描述信息用于描述上述待解析文件的欲输出格式;上述解析模块20用于采用解析程序对上述待解析文件进行解析,且在解析的过程中,在读到关键词的情况下,根据上述关键词之后的目标函数名,调用目标函数,以将上述待解析文件的格式从上述输入格式转换为输出格式,上述目标函数是由上述待解析文件的输入格式和上述待解析文件的欲输出格式决定的。
44.获取上述输入描述信息与上述输出描述信息的方法有多种,本实例中,上述获取模块还包括第一生成模块与第二生成模块,其中,上述第一生成模块用于生成第一xml文件,上述第一xml文件用于表示输入描述信息;上述第二生成模块用于生成第二xml文件,所诉第二xml文件用于表述输入描述信息。
45.示例性的,上述解析模块还包括第一读取模块、第二读取模块与判断模块,上述第一读取模块用于采用解析程序对上述待解析文件进行解析,且在解析的过程中,在读到第i个关键词时,根据上述第i个关键词之后的第i个目标函数名,调用第i个目标函数,以将上述待解析文件的格式从上述输入格式转换为第i种输出格式,其中,i=1;上述第二读取模块用于继续读取第i 1个关键词,根据上述第i 1个关键词之后的第i 1个目标函数名,调用第i 1个目标函数,以将上述待解析文件的格式从上述第i种输出格式转换为第i 1种输出格式,其中,2≤i 1≤m;上述判断模块用于判断i 1是否等于m,如是,第i 1个输出格式为最终输出格式;如否,返回至上述第二读取模块。
46.本技术的上述文件解析装置,通过上述获取模块获取待解析文件的输入描述信息和上述待解析文件的输出描述信息,上述输入描述信息用于描述上述待解析文件的输入格式,上述输出描述信息用于描述上述待解析文件的欲输出格式;上述解析模块上述解析模块用于采用解析程序对上述待解析文件进行解析,且在解析的过程中,在读到关键词的情况下,根据上述关键词之后的目标函数名,调用目标函数,以将上述待解析文件的格式从上述输入格式转换为输出格式,上述目标函数是由上述待解析文件的输入格式和上述待解析文件的欲输出格式决定的。上述装置通过在解析程序中设置关键词,在解析过程中提取与输出描述对应的目标函数,可以不对每种待处理数据都编写一套与其对应的解析程序,仅需设置一种解析程序即可,更易于维护扩展且更加灵活,解决了现有技术中对每种待处理数据都要编写一套与其对应的解析程序的大量重复编码工作浪费人力物力的问题。
47.存储器可能包括计算机可读介质中的非永久性存储器,随机存取存储器(ram)和/或非易失性内存等形式,如只读存储器(rom)或闪存(flash ram),存储器包括至少一个存储芯片。
48.本发明实施例提供了一种计算机可读存储介质,上述计算机可读存储介质包括存储的程序,其中,在上述程序运行时控制上述计算机可读存储介质所在设备执行上述文件解析方法。
49.本发明实施例提供了一种文件解析设备,设备包括一个或多个存储器,以及一个或多个程序,其中,上述一个或多个程序被存储在上述存储器中,上述一个或多个程序包括用于执行上述任意一种上述的文件解析方法。本文中的设备可以是服务器、pc、pad、手机等。
50.本领域内的技术人员应明白,本技术的实施例可提供为方法、系统、或计算机程序产品。因此,本技术可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本技术可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、cd-rom、光学存储器等)上实施的计算机程序产品的形式。
51.本技术是参照根据本技术实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
52.这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
53.这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
54.在一个典型的配置中,计算设备包括一个或多个处理器(cpu)、输入/输出接口、网络接口和内存。
55.存储器可能包括计算机可读介质中的非永久性存储器,随机存取存储器(ram)和/或非易失性内存等形式,如只读存储器(rom)或闪存(flash ram)。存储器是计算机可读介质的示例。
56.计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(pram)、静态随机存取存储器(sram)、动态随机存取存储器(dram)、其他类型的随机存取存储器(ram)、只读存储器(rom)、电可擦除可编程只读存储器(eeprom)、快闪记忆体或其他内存技术、只读光盘只读存储器(cd-rom)、
数字多功能光盘(dvd)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
57.还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个
……”
限定的要素,并不排除在包括要素的过程、方法、商品或者设备中还存在另外的相同要素。
58.从以上的描述中,可以看出,本技术上述的实施例实现了如下技术效果:
59.1)、本技术的上述文件解析方法中,首先获取待解析文件的输入描述信息和待解析文件的输出描述信息,输入描述信息用于描述待解析文件的输入格式,输出描述信息用于描述待解析文件的欲输出格式;之后采用解析程序对待解析文件进行解析,且在解析的过程中,在读取到关键词的情况下,根据关键词之后的目标函数名,调用目标函数,以将待解析文件的格式从输入格式转换为输出格式,目标函数是由待解析文件的输入格式和待解析文件的欲输出格式决定的。上述方法通过在解析程序中设置关键词,在解析过程中提取与输出描述对应的目标函数,可以不对每种待处理数据都编写一套与其对应的解析程序,仅需设置一种解析程序即可,更易于维护扩展且更加灵活,解决了现有技术中对每种待处理数据都要编写一套与其对应的解析程序的大量重复编码工作浪费人力物力的问题。
60.2)、本技术的上述文件解析装置,通过上述获取模块获取待解析文件的输入描述信息和上述待解析文件的输出描述信息,上述输入描述信息用于描述上述待解析文件的输入格式,上述输出描述信息用于描述上述待解析文件的欲输出格式;上述解析模块上述解析模块用于采用解析程序对上述待解析文件进行解析,且在解析的过程中,在读到关键词的情况下,根据上述关键词之后的目标函数名,调用目标函数,以将上述待解析文件的格式从上述输入格式转换为输出格式,上述目标函数是由上述待解析文件的输入格式和上述待解析文件的欲输出格式决定的。上述装置通过在解析程序中设置关键词,在解析过程中提取与输出描述对应的目标函数,可以不对每种待处理数据都编写一套与其对应的解析程序,仅需设置一种解析程序即可,更易于维护扩展且更加灵活,解决了现有技术中对每种待处理数据都要编写一套与其对应的解析程序的大量重复编码工作浪费人力物力的问题。
61.以上所述仅为本技术的优选实施例而已,并不用于限制本技术,对于本领域的技术人员来说,本技术可以有各种更改和变化。凡在本技术的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本技术的保护范围之内。
再多了解一些

本文用于创业者技术爱好者查询,仅供学习研究,如用于商业用途,请联系技术所有人。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献