一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

数据入库方法、装置、电子装置、程序产品及存储介质与流程

2021-10-24 14:36:00 来源:中国专利 TAG:

技术特征:
1.一种数据入库方法,其特征在于,包括以下步骤:获取待入库数据表,将所述待入库数据表中的每行特征数据转换为对应的特征标识,其中,所述特征数据用于表示每一目标行号对应的记录行数据;分别比对每一所述特征标识与预置的每一标识模板的匹配度,基于所述匹配度为满足匹配条件的所述标识模板创建入库表;根据所述标识模板对应的表头字段生成所述入库表中的插入列,将从所述待入库数据表中提取到的所述特征数据对应插入每一所述插入列中。2.根据权利要求1所述的数据入库方法,其特征在于,所述匹配条件包括:在所述特征标识与每一所述标识模板进行遍历匹配的情况下,选择所述匹配度最高且高于匹配阈值的所述标识模板;或者在所述特征标识与当前的所述标识模板的匹配度高于匹配阈值的情况下,选择当前的所述标识模板。3.根据权利要求1所述的数据入库方法,其特征在于,“将从所述待入库数据表中提取到的所述特征数据对应插入每一所述插入列中”包括:将所述入库数据表中所述匹配度满足所述匹配条件的所述特征标识的所在行确定为标题行;从所述标题行后一行的所述特征数据开始提取,将提取到的所述特征数据对应插入所述入库表中每一所述插入列中。4.根据权利要求1所述的数据入库方法,其特征在于,获取模板表,通过预设转换方式将所述模板表的表头数据转换成标识模板,其中,所述预设转换方式还用于将每行所述特征数据转换为对应的特征标识。5.根据权利要求4所述的数据入库方法,其特征在于,所述预设转换方式包括:对所述模板表中的表头字段进行拼接,得到第一字符串;将所述第一字符串转换为预设长度的第一数字摘要,将所述第一数字摘要确定为所述表头字段的所述标识模板;或者对所述待入库数据表中的每行所述特征数据进行拼接,得到第二字符串;将所述第二字符串转换为所述预设长度的第二数字摘要,将所述第二数字摘要确定为所述待入库数据表中的特征数据的特征标识。6.根据权利要求5所述的数据入库方法,其特征在于,依据字符串模板生成规则对所述表头字段或者每行所述特征数据进行标准化处理得到每个标准字符串数据,其中,相邻两个所述标准字符串数据以连接符拼接得到所述第一字符串或者所述第二字符串。7.根据权利要求1所述的数据入库方法,其特征在于,在“获取待入库数据表”之前,所述方法包括:获取当前数据表,比对所述当前数据表的第一文件信息与已入库数据表的第二文件信息的文件重复度,在所述文件重复度低于阈值的情况下,将所述当前数据表确定为待入库数据表。8.根据权利要求1所述的数据入库方法,其特征在于,所述方法还包括:在所述匹配度不满足匹配条件的情况下,将所述特征数据输入至已训练的文本分类模型,得到所述已训练的文本分类模型输出的文本分类结果,其中,所述文本分类结果用于表
征分类后的所述特征数据与每一所述表头字段的相似度;基于所述相似度满足相似条件的所述标识模板创建所述入库表;根据所述标识模板对应的所述表头字段生成所述插入列,将所述待入库数据表中提取到的所述特征数据对应插入所述入库表中的每一所述插入列中。9.根据权利要求8所述的数据入库方法,其特征在于,所述相似条件包括:在分类后的所述特征数据与每一所述表头字段遍历比对的情况下,选择所述相似度最高且高于相似度阈值的所述标识模板。10.根据权利要求8所述的数据入库方法,其特征在于,“基于所述匹配度为满足匹配条件的所述标识模板创建入库表”包括:在所述匹配度满足匹配条件的情况下,基于所述标识模板的模板表名称生成入库表名称,根据所述入库表名称创建入库表。11.一种数据入库装置,其特征在于,包括:特征标识转换模块,获取待入库数据表,将所述待入库数据表中的每行特征数据转换为对应的特征标识,其中,所述特征数据用于表示每一目标行号对应的记录行数据;匹配模块,用于分别比对每一所述特征标识与预置的每一标识模板的匹配度,基于所述匹配度为满足匹配条件的所述标识模板创建入库表;入库模块,用于根据所述标识模板对应的表头字段生成所述入库表中的插入列,将从所述待入库数据表中提取到的所述特征数据对应插入每一所述插入列中。12.一种电子装置,包括存储器和处理器,其特征在于,所述存储器中存储有计算机程序,所述处理器被设置为运行所述计算机程序以执行权利要求1至10任一项所述的数据入库方法。13.一种计算机程序产品,其特征在于,包括软件代码部分,当所述计算机程序产品在计算机上被运行时,所述代码软件部分用于执行根据权利要求1至10任一项所述的数据入库方法。14.一种可读存储介质,其特征在于,所述可读存储介质中存储有计算机程序,所述计算机程序包括用于控制过程以执行过程的程序代码,所述过程包括根据权利要求1至10任一项所述的数据入库方法。

技术总结
本申请提出了一种数据入库方法、装置、电子装置、程序产品及存储介质,包括以下步骤:获取待入库数据表,将所述待入库数据表中的每行特征数据转换为对应的特征标识,其中,所述特征数据用于表示每一目标行号对应的记录行数据;分别比对每一所述特征标识与预置的每一标识模板的匹配度,基于所述匹配度为满足匹配条件的所述标识模板创建入库表;根据所述标识模板对应的表头字段生成所述入库表的插入列,将从所述待入库数据表中提取到的所述特征数据对应插入每一所述插入列中。针对目前结构多变、复杂、相似的表格数据能够实现自动模板匹配、自动建表、自动入库的目的,实现流调数据的快速、及时、准确的入库。准确的入库。准确的入库。


技术研发人员:徐剑炯 马浩 陈红贵
受保护的技术使用者:城云科技(中国)有限公司
技术研发日:2021.08.04
技术公布日:2021/10/23
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献

  • 日榜
  • 周榜
  • 月榜