一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种数据处理方法、系统、存储介质及电子设备与流程

2021-12-04 01:13:00 来源:中国专利 TAG:

技术特征:
1.一种数据处理方法,其特征在于,所述方法包括:获取待处理文本数据;所述待处理文本数据根据用户需求进行采集得到;对所述待处理文本数据进行数据类型识别,得到数据类型结果,并基于所述数据类型结果,确定对应的特征配置列表;根据所述数据类型结果获取对应的提取规则,并基于所述提取规则从所述特征配置列表中提取特征数据;当所述特征数据符合预设条件时,基于预设摘要规则和符合预设条件的特征数据,生成文本摘要数据;所述预设摘要规则由所述特征配置列表的摘要规则字段确定。2.根据权利要求1所述的方法,其特征在于,所述对所述待处理文本数据进行数据类型识别,得到数据类型结果,并基于所述数据类型结果,确定对应的特征配置列表,包括:对所述待处理文本数据进行数据类型识别;当所述待处理文本数据的数据类型为string类型时,生成string类型结果,并基于所述string类型结果对所述待处理文本数据进行解析,得到string类型特征配置列表;当所述待处理文本数据的数据类型为xml类型时,生成xml类型结果,并基于所述xml类型结果对所述待处理文本数据进行解析,得到xml类型特征配置列表;当所述待处理文本数据的数据类型为json类型时,生成json类型结果,并基于所述json类型结果对所述待处理文本数据进行解析,得到json类型特征配置列表。3.根据权利要求2所述的方法,其特征在于,所述根据所述数据类型结果获取对应的提取规则,并基于所述提取规则从所述特征配置列表中提取特征数据,包括:对所述数据类型结果进行判定;当所述数据类型结果为所述string类型结果时,通过预设正则表达式和预设特征字段,对所述string类型特征配置列表的信息进行正则匹配,并提取符合正则匹配的第一特征数据;当所述数据类型结果为所述xml类型结果时,通过预设属性表达式对所述xml类型特征配置列表的信息进行计算,得到第一计算结果,并基于所述第一计算结果和所述预设特征字段,确定第二特征数据;当所述数据类型结果为所述json类型结果时,通过所述预设属性表达式对所述json类型特征配置列表的信息进行计算,得到第二计算结果,并基于所述第二计算结果和所述预设特征字段,确定第三特征数据。4.根据权利要求3所述的方法,其特征在于,所述当所述特征数据符合预设条件时,基于预设摘要规则和符合预设条件特征数据,生成文本摘要数据,包括:当所述第一特征数据不为空值时,从所述string类型特征配置列表中获取第一摘要规则字段,并基于所述第一摘要规则字段和所述第一特征数据,生成第一文本摘要数据;当所述第二特征数据不为空值时,从所述xml类型特征配置列表中获取第二摘要规则字段,并基于所述第二摘要规则字段和所述第二特征数据,生成第二文本摘要数据;当所述第三特征数据不为空值时,从所述json类型特征配置列表中获取第三摘要规则字段,并基于所述第三摘要规则字段和所述第三特征数据,生成第三文本摘要数据。5.根据权利要求1所述的方法,其特征在于,还包括:若所述特征数据为空值,则返回所述获取待处理文本数据这一步骤。
6.一种数据处理系统,其特征在于,所述系统包括:获取单元,用于获取待处理文本数据;所述待处理文本数据根据用户需求进行采集得到;确定单元,用于对所述待处理文本数据进行数据类型识别,得到数据类型结果,并基于所述数据类型结果,确定对应的特征配置列表;提取单元,用于根据所述数据类型结果获取对应的提取规则,并基于所述提取规则从所述特征配置列表中提取特征数据;生成单元,用于当所述特征数据符合预设条件时,基于预设摘要规则和符合预设条件特征数据,生成文本摘要数据;所述预设摘要规则由所述特征配置列表的摘要规则字段确定。7.根据权利要求6所述的系统,其特征在于,所述确定单元,包括:识别模块,用于对所述待处理文本数据进行数据类型识别;第一获取模块,用于当所述待处理文本数据的数据类型为string类型时,生成string类型结果,并基于所述string类型结果对所述待处理文本数据进行解析,得到string类型特征配置列表;第二获取模块,用于当所述待处理文本数据的数据类型为xml类型时,生成xml类型结果,并基于所述xml类型结果对所述待处理文本数据进行解析,得到xml类型特征配置列表;第三获取模块,用于当所述待处理文本数据的数据类型为json类型时,生成json类型结果,并基于所述json类型结果对所述待处理文本数据进行解析,得到json类型特征配置列表。8.根据权利要求7所述的系统,其特征在于,所述提取单元,包括:判定模块,用于对所述数据类型结果进行判定;第一提取模块,用于当所述数据类型结果为所述string类型结果时,通过预设正则表达式对所述string类型特征配置列表的信息进行正则匹配,并提取符合正则匹配的第一特征数据;第二提取模块,用于当所述数据类型结果为所述xml类型结果,通过预设属性表达式对所述xml类型特征配置列表的信息进行计算,得到第二特征数据;第三提取模块,用于当所述数据类型结果为所述json类型结果时,通过所述预设属性表达式对所述json类型特征配置列表的信息进行计算,得到第三特征数据。9.一种存储介质,其特征在于,所述存储介质包括存储的指令,其中,在所述指令运行时控制所述存储介质所在的设备执行如权利要求1至5任意一项所述的数据处理方法。10.一种电子设备,其特征在于,包括存储器,以及一个或者一个以上的指令,其中一个或者一个以上指令存储于存储器中,且经配置以由一个或者一个以上处理器执行如权利要求1至5任意一项所述的数据处理方法。

技术总结
本申请公开了一种数据处理方法、系统、存储介质及电子设备,获取待处理文本数据,对待处理文本数据进行数据类型识别得到数据类型结果,基于数据类型结果确定对应的特征配置列表,根据数据类型结果获取对应的提取规则,基于提取规则从特征配置列表中提取特征数据,当特征数据符合预设条件时,基于预设摘要规则和特征数据生成文本摘要数据。通过上述方案,在包含非特殊字符等复杂数据结构下,对不同的数据类型进行特征提取处理,得到各自对应的特征数据,满足了在复杂数据结构下的类型自动识别、特征自动提取、文本摘要自动生成等需求,提高了获取文本摘要数据的准确性。此外,将文本摘要数据进行相似度算法识别,提高了相似度计算结果的准确性。算结果的准确性。算结果的准确性。


技术研发人员:吴东
受保护的技术使用者:京东科技信息技术有限公司
技术研发日:2021.09.16
技术公布日:2021/12/3
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献