一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

文本识别方法、设备、存储介质及装置与流程

2022-09-02 19:35:37 来源:中国专利 TAG:


1.本发明涉及文本处理领域,尤其涉及文本识别方法、设备、存储介质及装置。


背景技术:

2.传统的js对象简谱(javascript object notation,json)是一种轻量级的数据交换格式,在对json类型的文本进行匹配时,往往使用“正则表达式”或者“字符串匹配”的方式进行文本识别。
3.但是,通过“正则表达式”或者“字符串匹配”的方式需要对json类型的文本的每个文本信息进行匹配,因此,其匹配效率较低。


技术实现要素:

4.本发明的主要目的在于提供文本识别方法、设备、存储介质及装置,旨在解决如何提高json类型文本的识别效率的技术问题。
5.为实现上述目的,本发明提供一种文本识别方法,所述文本识别方法包括以下步骤:
6.获取json文本的日志信息;
7.对所述日志信息中的程序语句进行事件解析,得到所述程序语句之间的逻辑关系;
8.根据所述逻辑关系对所述程序语句补充语义标识,以得到日志事件信息;
9.对所述日志事件信息进行事件分析,以实现对所述日志信息的识别。
10.可选地,所述根据所述逻辑关系对所述程序语句补充语义标识,以得到日志事件信息,包括:
11.根据所述逻辑关系确定补充区域;
12.根据所述补充区域对所述程序语句补充语义标识,以得到日志事件信息。
13.可选地,所述逻辑关系包括预设事件关系;
14.所述根据所述逻辑关系对所述程序语句补充语义标识,以得到日志事件信息,包括:
15.在所述预设事件关系为逻辑与关系或者逻辑或关系或者逻辑非关系时,获取所述逻辑与关系或者逻辑或关系或者逻辑非关系对应的关键词;
16.将所述关键词作为语义标识补充所述程序语句,以得到日志事件信息。
17.可选地,所述逻辑关系包括参数状态关系;
18.所述根据所述逻辑关系对所述程序语句补充语义标识,以得到日志事件信息,包括:
19.在所述参数状态关系为优先级关系或者函数调用关系或者数组关系时,获取所述优先级关系或者函数调用关系或者数组关系对应的与关键词;
20.将所述关键词作为语义标识补充所述程序语句,以得到日志事件信息。
21.可选地,所述逻辑关系包括比对字符串关系;
22.所述根据所述逻辑关系对所述程序语句补充语义标识,以得到日志事件信息,包括:
23.在所述比对字符串关系为相等关系或者大小写不敏感关系时,获取所述相等或者大小写不敏感关系对应的与关键词;
24.将所述关键词作为语义标识补充所述程序语句,以得到日志事件信息。
25.可选地,所述逻辑关系包括字符串开始或者结尾;
26.所述根据所述逻辑关系对所述程序语句补充语义标识,以得到日志事件信息,包括:
27.在所述逻辑关系为字符串开始或者结尾时,获取所述字符串开始或者结尾对应的与关键词;
28.将所述关键词作为语义标识补充所述程序语句,以得到日志事件信息。
29.可选地,所述逻辑关系包括正则表达式匹配关系或者字符串包含关系;
30.所述根据所述逻辑关系对所述程序语句补充语义标识,以得到日志事件信息,包括:
31.在所述逻辑关系为正则表达式匹配关系或者字符串包含关系时,获取所述正则表达式匹配关系或者字符串包含关系对应的与关键词;
32.将所述关键词作为语义标识补充所述程序语句,以得到日志事件信息。
33.可选地,所述逻辑关系包括字符匹配关系;
34.所述根据所述逻辑关系对所述程序语句补充语义标识,以得到日志事件信息,包括:
35.在所述逻辑关系为字符匹配关系时,获取所述字符匹配关系对应的与关键词;
36.将所述关键词作为语义标识补充所述程序语句,以得到日志事件信息。
37.可选地,所述逻辑关系包括字符串与数组关系;
38.所述根据所述逻辑关系对所述程序语句补充语义标识,以得到日志事件信息,包括:
39.在所述逻辑关系为字符串与数组关系时,获取所述字符串与数组关系对应的与关键词;
40.将所述关键词作为语义标识补充所述程序语句,以得到日志事件信息。
41.可选地,所述根据所述逻辑关系对所述程序语句补充语义标识,以得到日志事件信息之前,还包括:
42.获取所述程序语句的数据类型;
43.根据所述数据类型确定标识补充策略;
44.所述根据所述逻辑关系对所述程序语句补充语义标识,以得到日志事件信息,包括:
45.根据所述逻辑关系和所述标识补充策略对所述程序语句补充语义标识,以得到日志事件信息。
46.可选地,所述数据类型包括文本格式或json格式。
47.可选地,所述对所述日志事件信息进行事件分析之后,还包括:
48.获取分析结果;
49.在所述分析结果为所述日志事件信息中存在敏感事件时,生成警示信息;
50.根据所述警示信息进行事件提醒。
51.可选地,所述对所述日志事件信息进行事件分析之后,还包括:
52.获取标识更新指令;
53.根据所述标识更新指令对所述语义标识进行更新。
54.此外,为实现上述目的,本发明还提出一种文本识别装置,所述文本识别装置包括:
55.获取模块,用于获取json文本的日志信息;
56.解析模块,用于对所述日志信息中的程序语句进行事件解析,得到所述程序语句之间的逻辑关系;
57.补充模块,用于根据所述逻辑关系对所述程序语句补充语义标识,以得到日志事件信息;
58.分析模块,用于对所述日志事件信息进行事件分析,以实现对所述日志信息的识别。
59.可选地,所述补充模块,还用于根据所述逻辑关系确定补充区域;
60.根据所述补充区域对所述程序语句补充语义标识,以得到日志事件信息。
61.可选地,所述逻辑关系包括预设事件关系;
62.所述补充模块,还用于在所述预设事件关系为逻辑与关系或者逻辑或关系或者逻辑非关系时,获取所述逻辑与关系或者逻辑或关系或者逻辑非关系对应的关键词;
63.将所述关键词作为语义标识补充所述程序语句,以得到日志事件信息。
64.可选地,所述逻辑关系包括参数状态关系;
65.所述补充模块,还用于在所述参数状态关系为优先级关系或者函数调用关系或者数组关系时,获取所述优先级关系或者函数调用关系或者数组关系对应的与关键词;
66.将所述关键词作为语义标识补充所述程序语句,以得到日志事件信息。
67.可选地,所述逻辑关系包括比对字符串关系;
68.所述补充模块,还用于在所述比对字符串关系为相等关系或者大小写不敏感关系时,获取所述相等或者大小写不敏感关系对应的与关键词;
69.将所述关键词作为语义标识补充所述程序语句,以得到日志事件信息。
70.此外,为实现上述目的,本发明还提出一种文本识别设备,所述文本识别设备包括:存储器、处理器及存储在所述存储器上并在所述处理器上运行文本识别程序,所述文本识别程序被所述处理器执行时实现如上文所述的文本识别方法的步骤。
71.此外,为实现上述目的,本发明还提出一种存储介质,所述存储介质上存储有文本识别程序,所述文本识别程序被处理器执行时实现如上文所述的文本识别方法的步骤。
72.本发明提供的技术方案,通过获取json文本的日志信息;对所述日志信息中的程序语句进行事件解析,得到所述程序语句之间的逻辑关系;根据所述逻辑关系对所述程序语句补充语义标识,以得到日志事件信息;对所述日志事件信息进行事件分析,以实现对所述日志信息的识别。本发明通过预先对json文本的日志信息进行语义分析,根据分析结果打上语义标签,在获取到进行语义分析后的日志事件信息,可直接根据语义标签进行相应
的语义识别,相比较于通过“正则表达式”或者“字符串匹配”的方式对json类型的文本的每个文本信息进行匹配,识别效率更高。
附图说明
73.图1是本发明实施例方案涉及的硬件运行环境的文本识别设备结构示意图;
74.图2为本发明文本识别方法第一实施例的流程示意图;
75.图3为本发明文本识别方法一实施例的文本语法表示示意图;
76.图4为本发明文本识别方法一实施例的json格式表示示意图;
77.图5为本发明文本识别方法第二实施例的流程示意图;
78.图6为本发明文本识别方法第三实施例的流程示意图;
79.图7为本发明文本识别装置第一实施例的结构框图。
80.本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
81.应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
82.参照图1,图1为本发明实施例方案涉及的硬件运行环境的文本识别设备结构示意图。
83.如图1所示,该文本识别设备可以包括:处理器1001,例如中央处理器(central processing unit,cpu),通信总线1002、用户接口1003,网络接口1004,存储器1005。其中,通信总线1002用于实现这些组件之间的连接通信。用户接口1003可以包括显示屏(display),可选用户接口1003还可以包括标准的有线接口以及无线接口,而用户接口1003的有线接口在本发明中可为通用串行总线(universal serial bus,usb)接口。网络接口1004可选的可以包括标准的有线接口以及无线接口(如wi-fi接口)。存储器1005可以是高速随机存取存储器(random access memory,ram);也可以是稳定的存储器,比如,非易失存储器(non-volatile memory),具体可为,磁盘存储器。存储器1005可选的还可以是独立于前述处理器1001的存储装置。
84.本领域技术人员可以理解,图1中示出的结构并不构成对文本识别设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
85.如图1所示,作为一种计算机存储介质的存储器1005中可以包括操作系统、网络通信模块、用户接口模块以及文本识别程序。
86.在图1所示的文本识别设备中,网络接口1004主要用于连接后台服务器,与所述后台服务器进行数据通信;用户接口1003主要用于连接外设;所述文本识别设备通过处理器1001调用存储器1005中存储的文本识别程序,并执行本发明实施例提供的文本识别方法。
87.基于上述硬件结构,提出本发明文本识别方法的实施例。
88.参照图2,图2为本发明文本识别方法第一实施例的流程示意图。
89.在第一实施例中,所述文本识别方法包括以下步骤:
90.步骤s10:获取json文本的日志信息。
91.需要说明的是,本实施例的执行主体可为文本识别设备,例如设有文本识别程序的终端设备,还可为设有文本识别程序的服务器,还可为其他可实现相同或相似功能的设
备,本实施例对此不作限制,在本实施例中,以文本识别设备为例进行说明。
92.在本实施例中,基于json文本进行语义规则定义为例进行说明,其中,为了获取json文本的日志信息,可通过调用预设数据采集接口,通过预设数据采集接口获取json文本的日志信息,还可通过其他方式得到日志信息,本实施例对此不做限制,日志信息为记录用户的操作行为数据或者设备的使用数据,例如log日志,通过日志信息可实现对网络安全的分析以及用户访问行为的分析。
93.步骤s20:对所述日志信息中的程序语句进行事件解析,得到所述程序语句之间的逻辑关系。
94.可以理解的是,在获取到日志信息时,可根据日志信息中程序语句之间的关系,按照预测规则进行定义,从而实现对日志信息的语义分析,例如,日志信息中记录了用户访问网站,则通过语义识别得到用户进行了网站访问的这个操作,从而对日志信息进行语义识别,生成相应的事件信息,以实现对日志信息的识别。
95.在本实施例中,逻辑关系包括逻辑计算关系,例如大于等于或者小于等于以及不等级,还包括字符串与数组之间的关系,例如字符串是否在一个数组中,字符串与数组中任意元素的关系或者字符串以数组中任意元素开始或者结尾等,还可包括其他形式的逻辑关系。
96.步骤s30:根据所述逻辑关系对所述程序语句补充语义标识,以得到日志事件信息。
97.可以理解的是,语义标识可为关键词形式,还可为其他形式的标识,本实施例对此不做限制,例如表示逻辑and关系用“and”表示,表示逻辑or关系用“or”表示,表示逻辑关系进行非运算用“not”表示,从而通过语义标识的补充,将无语义的日志信息转换为带有语义信息的日志事件信息。
98.在本实施例中,可将对json类型的文本进行匹配的语法规则进行定义,称为节点规则,节点规则是针对json格式的日志内容的一系列约束,通过输入终端日志为json格式,得到通过节点规则定义的带有语义的日志事件信息。
99.需要说明的是,节点规则有两种表示方式,分别为本文语法表示和json格式表示,其中文本语法表示的语法关键词列表如以下表1所示:
100.101.102.103.104.[0105][0106]
表1
[0107]
如图3所示的经过节点规则进行语义定义的文本语法表示,以及图4所示的经过节点规则进行语义定义的json格式表示。
[0108]
步骤s40:对所述日志事件信息进行事件分析,以实现对所述日志信息的识别。
[0109]
在本实施例中,在获取到经过语义转换的日志事件信息时,可直接根据日志事件信息进行分析,得到当前事件信息是否含有敏感信息,或者是否符合网络安全,以提高网络安全判断的效率。
[0110]
在本实施例中,通过获取json文本的日志信息;对所述日志信息中的程序语句进行事件解析,得到所述程序语句之间的逻辑关系;根据所述逻辑关系对所述程序语句补充语义标识,以得到日志事件信息;对所述日志事件信息进行事件分析,以实现对所述日志信息的识别。本发明通过预先对json文本的日志信息进行语义分析,根据分析结果打上语义标签,在获取到进行语义分析后的日志事件信息,可直接根据语义标签进行相应的语义识别,相比较于通过“正则表达式”或者“字符串匹配”的方式对json类型的文本的每个文本信息进行匹配,识别效率更高。
[0111]
参照图5,图5为本发明文本识别方法第二实施例的流程示意图,基于上述图2所示的第一实施例,提出本发明文本识别方法的第二实施例。
[0112]
第二实施例中,所述步骤s30,包括:
[0113]
步骤s301,根据所述逻辑关系确定补充区域。
[0114]
在本实施例中,补充区域为语义标识添加的位置,根据逻辑关系确定语义标识添加的位置,例如获取程序代码的补充区域/data/process_name equal\"cmd.exe\"/data/parent_process_path endswith\"erl.exe\",在补充区域添加语义表示,得到/data/process_name equal\"cmd.exe\"and/data/parent_process_path endswith\"erl.exe\",从而实现对日志信息按照节点规则进行语义定义。
[0115]
步骤s302,根据所述补充区域对所述程序语句补充语义标识,以得到日志事件信息。
[0116]
在一实施例中,所述逻辑关系包括预设事件关系;所述步骤s30,包括:
[0117]
在所述预设事件关系为逻辑与关系或者逻辑或关系或者逻辑非关系时,获取所述逻辑与关系或者逻辑或关系或者逻辑非关系对应的关键词;将所述关键词作为语义标识补充所述程序语句,以得到日志事件信息。
[0118]
在本实施例中,预设事件关系为表示逻辑与关系或者逻辑或关系或者逻辑非关系,对日志信息进行分析,得到日志中程序语句的逻辑关系,在逻辑关系为逻辑与关系或者逻辑或关系或者逻辑非关系时,添加对应的关键词,其中,逻辑与关系用“and”表示,逻辑或关系用“or”表示,逻辑或关系用“not”表示,还可通过其他字符作为关键词表示,本实施例
大小写不敏感、以字符串开始以及以字符串结束等,通过对日志信息进行分析,得到日志中程序语句的逻辑关系,在逻辑关系为正则表达式匹配关系或者字符串包含关系时,添加对应的关键词,其中,模糊匹配函数用“match”表示,全字符串匹配用“match f”表示,全字符串匹配-大小写不敏感用“match i”表示等,还可通过其他字符作为关键词表示,本实施例对此不做限制。
[0133]
在一实施例中,所述逻辑关系包括字符串与数组关系;所述步骤s30,包括:
[0134]
在所述逻辑关系为字符串与数组关系时,获取所述字符串与数组关系对应的与关键词;将所述关键词作为语义标识补充所述程序语句,以得到日志事件信息。
[0135]
在本实施例中,字符串与数组关系包括字符串是否在一个数组中、字符串与数组中任意元素相等、字符串与数组中任意元素模糊匹配、字符串与数组中任意元素无视大小写相等等,通过对日志信息进行分析,得到日志中程序语句的逻辑关系,在逻辑关系为字符串是否在一个数组中、字符串与数组中任意元素相等、字符串与数组中任意元素模糊匹配、字符串与数组中任意元素无视大小写相等关系时,添加对应的关键词,其中,字符串是否在一个数组中用“in”表示,字符串与数组中任意元素相等用“equalsany”表示,字符串与数组中任意元素模糊匹配用“matchany”表示等,还可通过其他字符作为关键词表示,本实施例对此不做限制。
[0136]
在本实施例中,通过预设规则语法定义对json格式的日志进行重新语法定义,使定义后的程序语句含有语义的事件信息,在进行日志匹配时,可直接根据进行语义定义后的日志得到当前事件,从而提高日志匹配的效率。
[0137]
参照图6,图6为本发明文本识别方法第三实施例的流程示意图,基于上述图2所示的第一实施例,提出本发明文本识别方法的第三实施例,所述步骤s30之前,还包括:
[0138]
步骤s303,获取所述程序语句的数据类型。
[0139]
在本实施例中,所述数据类型包括文本格式或json格式,可根据数据类型进行相应的语义定义,例如文本采用文本格式进行语义标识,json格式则进行语义标识得到json格式,如图3所示的经过节点规则进行语义定义的文本语法表示,以及图4所示的经过节点规则进行语义定义的json格式表示,从而可根据数据类型进行相应的语义定义,提高语义定义的灵活性。
[0140]
步骤s304,根据所述数据类型确定标识补充策略。
[0141]
在本实施例中,标识补充策略可为根据文本类型进行标识补充,具体为:根据所述逻辑关系和所述标识补充策略对所述程序语句补充语义标识,以得到日志事件信息。
[0142]
在一实施例中,所述步骤s40之后,还包括:
[0143]
获取分析结果;在所述分析结果为所述日志事件信息中存在敏感事件时,生成警示信息;根据所述警示信息进行事件提醒。
[0144]
为了提高规则语法定义的灵活性,在获取标识更新指令,根据所述标识更新指令对所述语义标识进行更新,从而可根据需求对语义标识进行实时更新,实时更新规则,实现易编写、易测试以及易维护的目的。
[0145]
此外,本发明实施例还提出一种存储介质,所述存储介质上存储有文本识别程序,所述文本识别程序被处理器执行时实现如上文所述的终端入网方法的步骤。
[0146]
由于本存储介质采用了上述所有实施例的全部技术方案,因此至少具有上述实施
例的技术方案所带来的所有有益效果,在此不再一一赘述。
[0147]
此外,参照图7,本发明实施例还提出一种文本识别装置,所述文本识别装置包括:
[0148]
获取模块10,用于获取json文本的日志信息。
[0149]
需要说明的是,本实施例的执行主体可为文本识别设备,例如设有文本识别程序的终端设备,还可为设有文本识别程序的服务器,还可为其他可实现相同或相似功能的设备,本实施例对此不作限制,在本实施例中,以文本识别设备为例进行说明。
[0150]
在本实施例中,基于json文本进行语义规则定义为例进行说明,其中,为了获取json文本的日志信息,可通过调用预设数据采集接口,通过预设数据采集接口获取json文本的日志信息,还可通过其他方式得到日志信息,本实施例对此不做限制,日志信息为记录用户的操作行为数据或者设备的使用数据,例如log日志,通过日志信息可实现对网络安全的分析以及用户访问行为的分析。
[0151]
解析模块20,用于对所述日志信息中的程序语句进行事件解析,得到所述程序语句之间的逻辑关系。
[0152]
可以理解的是,在获取到日志信息时,可根据日志信息中程序语句之间的关系,按照预测规则进行定义,从而实现对日志信息的语义分析,例如,日志信息中记录了用户访问网站,则通过语义识别得到用户进行了网站访问的这个操作,从而对日志信息进行语义识别,生成相应的事件信息,以实现对日志信息的识别。
[0153]
在本实施例中,逻辑关系包括逻辑计算关系,例如大于等于或者小于等于以及不等级,还包括字符串与数组之间的关系,例如字符串是否在一个数组中,字符串与数组中任意元素的关系或者字符串以数组中任意元素开始或者结尾等,还可包括其他形式的逻辑关系。
[0154]
补充模块30,用于根据所述逻辑关系对所述程序语句补充语义标识,以得到日志事件信息。
[0155]
可以理解的是,语义标识可为关键词形式,还可为其他形式的标识,本实施例对此不做限制,例如表示逻辑and关系用“and”表示,表示逻辑or关系用“or”表示,表示逻辑关系进行非运算用“not”表示,从而通过语义标识的补充,将无语义的日志信息转换为带有语义信息的日志事件信息。
[0156]
在本实施例中,可将对json类型的文本进行匹配的语法规则进行定义,称为节点规则,节点规则是针对json格式的日志内容的一系列约束,通过输入终端日志为json格式,得到通过节点规则定义的带有语义的日志事件信息。
[0157]
需要说明的是,节点规则有两种表示方式,分别为本文语法表示和json格式表示,其中文本语法表示的语法关键词列表如表1所示。
[0158]
如图3所示的经过节点规则进行语义定义的文本语法表示,以及图4所示的经过节点规则进行语义定义的json格式表示。
[0159]
分析模块40,用于对所述日志事件信息进行事件分析,以实现对所述日志信息的识别。
[0160]
在本实施例中,在获取到经过语义转换的日志事件信息时,可直接根据日志事件信息进行分析,得到当前事件信息是否含有敏感信息,或者是否符合网络安全,以提高网络安全判断的效率。
[0161]
在本实施例中,通过获取json文本的日志信息;对所述日志信息中的程序语句进行事件解析,得到所述程序语句之间的逻辑关系;根据所述逻辑关系对所述程序语句补充语义标识,以得到日志事件信息;对所述日志事件信息进行事件分析,以实现对所述日志信息的识别。本发明通过预先对json文本的日志信息进行语义分析,根据分析结果打上语义标签,在获取到进行语义分析后的日志事件信息,可直接根据语义标签进行相应的语义识别,相比较于通过“正则表达式”或者“字符串匹配”的方式对json类型的文本的每个文本信息进行匹配,识别效率更高。
[0162]
在一实施例中,所述补充模块30,还用于根据所述逻辑关系确定补充区域;
[0163]
根据所述补充区域对所述程序语句补充语义标识,以得到日志事件信息。
[0164]
在一实施例中,所述逻辑关系包括预设事件关系;
[0165]
所述补充模块30,还用于在所述预设事件关系为逻辑与关系或者逻辑或关系或者逻辑非关系时,获取所述逻辑与关系或者逻辑或关系或者逻辑非关系对应的关键词;
[0166]
将所述关键词作为语义标识补充所述程序语句,以得到日志事件信息。
[0167]
在一实施例中,所述逻辑关系包括参数状态关系;
[0168]
所述补充模块30,还用于在所述参数状态关系为优先级关系或者函数调用关系或者数组关系时,获取所述优先级关系或者函数调用关系或者数组关系对应的与关键词;
[0169]
将所述关键词作为语义标识补充所述程序语句,以得到日志事件信息。
[0170]
在一实施例中,所述逻辑关系包括比对字符串关系;
[0171]
所述补充模块30,还用于在所述比对字符串关系为相等关系或者大小写不敏感关系时,获取所述相等或者大小写不敏感关系对应的与关键词;
[0172]
将所述关键词作为语义标识补充所述程序语句,以得到日志事件信息。
[0173]
在一实施例中,所述逻辑关系包括字符串开始或者结尾;
[0174]
所述补充模块30,还用于在所述逻辑关系为字符串开始或者结尾时,获取所述字符串开始或者结尾对应的与关键词;
[0175]
将所述关键词作为语义标识补充所述程序语句,以得到日志事件信息。
[0176]
在一实施例中,所述逻辑关系包括正则表达式匹配关系或者字符串包含关系;
[0177]
所述补充模块30,还用于在所述逻辑关系为正则表达式匹配关系或者字符串包含关系时,获取所述正则表达式匹配关系或者字符串包含关系对应的与关键词;
[0178]
将所述关键词作为语义标识补充所述程序语句,以得到日志事件信息。
[0179]
在一实施例中,所述逻辑关系包括字符匹配关系;
[0180]
所述补充模块30,还用于在所述逻辑关系为字符匹配关系时,获取所述字符匹配关系对应的与关键词;
[0181]
将所述关键词作为语义标识补充所述程序语句,以得到日志事件信息。
[0182]
在一实施例中,所述逻辑关系包括字符串与数组关系;
[0183]
所述补充模块30,还用于在所述逻辑关系为字符串与数组关系时,获取所述字符串与数组关系对应的与关键词;
[0184]
将所述关键词作为语义标识补充所述程序语句,以得到日志事件信息。
[0185]
在一实施例中,所述获取模块10,还用于获取所述程序语句的数据类型;根据所述数据类型确定标识补充策略;
[0186]
在一实施例中,所述数据类型包括文本格式或json格式。
[0187]
在一实施例中,所述获取模块10,还用于获取分析结果;
[0188]
在所述分析结果为所述日志事件信息中存在敏感事件时,生成警示信息;
[0189]
根据所述警示信息进行事件提醒。
[0190]
在一实施例中,所述获取模块10,还用于获取标识更新指令;
[0191]
根据所述标识更新指令对所述语义标识进行更新。
[0192]
本发明所述文本识别装置采用了上述所有实施例的全部技术方案,因此至少具有上述实施例的技术方案所带来的所有有益效果,在此不再一一赘述。
[0193]
以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。
[0194]
本发明公开了a1、一种文本识别方法,所述文本识别方法包括:
[0195]
获取json文本的日志信息;
[0196]
对所述日志信息中的程序语句进行事件解析,得到所述程序语句之间的逻辑关系;
[0197]
根据所述逻辑关系对所述程序语句补充语义标识,以得到日志事件信息;
[0198]
对所述日志事件信息进行事件分析,以实现对所述日志信息的识别。
[0199]
a2、如权利要求a1所述的文本识别方法,所述根据所述逻辑关系对所述程序语句补充语义标识,以得到日志事件信息,包括:
[0200]
根据所述逻辑关系确定补充区域;
[0201]
根据所述补充区域对所述程序语句补充语义标识,以得到日志事件信息。
[0202]
a3、如权利要求a1所述的文本识别方法,所述逻辑关系包括预设事件关系;
[0203]
所述根据所述逻辑关系对所述程序语句补充语义标识,以得到日志事件信息,包括:
[0204]
在所述预设事件关系为逻辑与关系或者逻辑或关系或者逻辑非关系时,获取所述逻辑与关系或者逻辑或关系或者逻辑非关系对应的关键词;
[0205]
将所述关键词作为语义标识补充所述程序语句,以得到日志事件信息。
[0206]
a4、如权利要求a1所述的文本识别方法,所述逻辑关系包括参数状态关系;
[0207]
所述根据所述逻辑关系对所述程序语句补充语义标识,以得到日志事件信息,包括:
[0208]
在所述参数状态关系为优先级关系或者函数调用关系或者数组关系时,获取所述优先级关系或者函数调用关系或者数组关系对应的与关键词;
[0209]
将所述关键词作为语义标识补充所述程序语句,以得到日志事件信息。
[0210]
a5、如权利要求a1所述的文本识别方法,所述逻辑关系包括比对字符串关系;
[0211]
所述根据所述逻辑关系对所述程序语句补充语义标识,以得到日志事件信息,包括:
[0212]
在所述比对字符串关系为相等关系或者大小写不敏感关系时,获取所述相等或者大小写不敏感关系对应的与关键词;
[0213]
将所述关键词作为语义标识补充所述程序语句,以得到日志事件信息。
[0214]
a6、如权利要求a1所述的文本识别方法,所述逻辑关系包括字符串开始或者结尾;
[0215]
所述根据所述逻辑关系对所述程序语句补充语义标识,以得到日志事件信息,包括:
[0216]
在所述逻辑关系为字符串开始或者结尾时,获取所述字符串开始或者结尾对应的与关键词;
[0217]
将所述关键词作为语义标识补充所述程序语句,以得到日志事件信息。
[0218]
a7、如权利要求a1所述的文本识别方法,所述逻辑关系包括正则表达式匹配关系或者字符串包含关系;
[0219]
所述根据所述逻辑关系对所述程序语句补充语义标识,以得到日志事件信息,包括:
[0220]
在所述逻辑关系为正则表达式匹配关系或者字符串包含关系时,获取所述正则表达式匹配关系或者字符串包含关系对应的与关键词;
[0221]
将所述关键词作为语义标识补充所述程序语句,以得到日志事件信息。
[0222]
a8、如权利要求a1所述的文本识别方法,所述逻辑关系包括字符匹配关系;
[0223]
所述根据所述逻辑关系对所述程序语句补充语义标识,以得到日志事件信息,包括:
[0224]
在所述逻辑关系为字符匹配关系时,获取所述字符匹配关系对应的与关键词;
[0225]
将所述关键词作为语义标识补充所述程序语句,以得到日志事件信息。
[0226]
a9、如权利要求a1所述的文本识别方法,所述逻辑关系包括字符串与数组关系;
[0227]
所述根据所述逻辑关系对所述程序语句补充语义标识,以得到日志事件信息,包括:
[0228]
在所述逻辑关系为字符串与数组关系时,获取所述字符串与数组关系对应的与关键词;
[0229]
将所述关键词作为语义标识补充所述程序语句,以得到日志事件信息。
[0230]
a10、如权利要求a1至a9中任一项所述的文本识别方法,所述根据所述逻辑关系对所述程序语句补充语义标识,以得到日志事件信息之前,还包括:
[0231]
获取所述程序语句的数据类型;
[0232]
根据所述数据类型确定标识补充策略;
[0233]
所述根据所述逻辑关系对所述程序语句补充语义标识,以得到日志事件信息,包括:
[0234]
根据所述逻辑关系和所述标识补充策略对所述程序语句补充语义标识,以得到日志事件信息。
[0235]
a11、如权利要求a10所述的文本识别方法,所述数据类型包括文本格式或json格式。
[0236]
a12、如权利要求a1至a9中任一项所述的文本识别方法,所述对所述日志事件信息进行事件分析之后,还包括:
[0237]
获取分析结果;
[0238]
在所述分析结果为所述日志事件信息中存在敏感事件时,生成警示信息;
[0239]
根据所述警示信息进行事件提醒。
[0240]
a13、如权利要求a1至a9中任一项所述的文本识别方法,所述对所述日志事件信息进行事件分析之后,还包括:
[0241]
获取标识更新指令;
[0242]
根据所述标识更新指令对所述语义标识进行更新。
[0243]
本发明还公开了b14、一种文本识别装置,所述文本识别装置包括:
[0244]
获取模块,用于获取json文本的日志信息;
[0245]
解析模块,用于对所述日志信息中的程序语句进行事件解析,得到所述程序语句之间的逻辑关系;
[0246]
补充模块,用于根据所述逻辑关系对所述程序语句补充语义标识,以得到日志事件信息;
[0247]
分析模块,用于对所述日志事件信息进行事件分析,以实现对所述日志信息的识别。
[0248]
b15、如权利要求b14所述的文本识别装置,所述补充模块,还用于根据所述逻辑关系确定补充区域;
[0249]
根据所述补充区域对所述程序语句补充语义标识,以得到日志事件信息。
[0250]
b16、如权利要求b14所述的文本识别装置,所述逻辑关系包括预设事件关系;
[0251]
所述补充模块,还用于在所述预设事件关系为逻辑与关系或者逻辑或关系或者逻辑非关系时,获取所述逻辑与关系或者逻辑或关系或者逻辑非关系对应的关键词;
[0252]
将所述关键词作为语义标识补充所述程序语句,以得到日志事件信息。
[0253]
b17、如权利要求b14所述的文本识别装置,所述逻辑关系包括参数状态关系;
[0254]
所述补充模块,还用于在所述参数状态关系为优先级关系或者函数调用关系或者数组关系时,获取所述优先级关系或者函数调用关系或者数组关系对应的与关键词;
[0255]
将所述关键词作为语义标识补充所述程序语句,以得到日志事件信息。
[0256]
b18、如权利要求b14所述的文本识别装置,所述逻辑关系包括比对字符串关系;
[0257]
所述补充模块,还用于在所述比对字符串关系为相等关系或者大小写不敏感关系时,获取所述相等或者大小写不敏感关系对应的与关键词;
[0258]
将所述关键词作为语义标识补充所述程序语句,以得到日志事件信息。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献