一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

数据库的数据处理方法、装置、电子设备与流程

2021-10-29 20:37:00 来源:中国专利 TAG:

技术特征:
1.一种数据库的数据处理方法,其特征在于,包括:查询数据库中缺失业务领域的数据表,并获取所述数据表的特征信息;获取与所述特征信息对应的特征向量,将所述特征向量映射为对应多个候选的业务领域的概率;将满足概率取值条件的概率对应的业务领域确定为所述数据表所属的业务领域;在所述数据库的所述数据表中,写入所述数据表所属的业务领域。2.根据权利要求1所述的方法,其特征在于,所述获取与所述特征信息对应的特征向量,包括:确定所述特征信息中每个词对应的索引值;基于所述索引值进行转换,得到每个词对应的词向量;对每个词对应的词向量进行加和平均处理,得到平均词向量;将所述平均词向量作为所述特征信息对应的特征向量。3.根据权利要求2所述的方法,其特征在于,所述确定所述特征信息中每个词对应的索引值,包括:对所述特征信息包括的所述数据表的表名称和表描述信息进行分词处理,得到多个词;确定每个词在索引表中对应的索引值;其中,所述索引表包括不同的词与对应的索引值。4.根据权利要求2所述的方法,其特征在于,所述基于所述索引值进行转换,得到每个词对应的词向量,包括:基于每个词对应的索引值进行转换处理,得到对应的独热向量;将每个词对应的独热向量与权重矩阵相乘,得到每个词对应的词向量。5.根据权利要求1所述的方法,其特征在于,所述将所述特征向量映射为对应多个候选的业务领域的概率,包括:对所述特征向量进行编码处理,得到编码处理结果;对所述编码处理进行激活处理,得到对应多个候选的业务领域的概率。6.根据权利要求1所述的方法,其特征在于,所述将满足概率取值条件的概率对应的业务领域确定为所述数据表所属的业务领域,包括:将概率最大的业务领域作为所述数据表所属的业务领域;或对超过概率阈值的概率所对应的业务领域按照概率降序排序,选取排序在前的多个业务领域作为所述数据表所属的业务领域。7.根据权利要求1所述的方法,其特征在于,所述查询数据库中缺失业务领域的数据表,包括:从所述数据库的日志中筛选出多个候选数据表,所述候选数据表满足以下条件至少之一:使用频率低于频率阈值、最后一次使用时间在预设时间之前;从所述多个候选数据表中确定缺失业务领域的数据表。8.根据权利要求1所述的方法,其特征在于,当所述数据库为分布式数据库时,所述查询数据库中缺失业务领域的数据表,包括:确定所述分布式数据库对应的多个节点中互不重合的数据表;
遍历各个节点中分别存储的互不重合的数据表,以确定缺失业务领域的数据表。9.根据权利要求1所述的方法,其特征在于,所述方法还包括:周期性遍历所述数据库中的数据表以确定发生数据变化的数据表,所述数据变化的类型包括以下至少之一:增加数据、删除数据、改变数据;获取所述发生数据变化的数据表的特征信息,并基于所述发生数据变化的数据表的特征信息确定新业务领域;将所述发生数据变化的数据表所属的业务领域替换为所述新业务领域。10.根据权利要求1所述的方法,其特征在于,在所述查询数据库中缺失业务领域的数据表之后,所述方法还包括:确定缺失业务领域的多个数据表中相似度超过相似度阈值的多组数据表,其中,每组数据表包括至少两个数据表;在每组数据表中选取一个数据表作为代表数据表,获取每个所述代表数据表的特征信息,并基于所述特征信息确定所述代表数据表所属的业务领域;将所述代表数据表所属的业务领域作为同组数据表中其他数据表所属的业务领域。11.根据权利要求1所述的方法,其特征在于,在所述数据库的所述数据表中,写入所述数据表所属的业务领域之后,所述方法还包括:响应于检索请求,基于所述数据库中数据表所属的业务领域进行筛选,得到第一范围内的数据表;基于所述第一范围内的数据表的表描述信息进行筛选,得到第二范围内的数据表;基于所述第二范围内的数据表的表名称进行筛选,将得到的目标范围内的数据表作为检索结果返回。12.根据权利要求1所述的方法,其特征在于,所述业务领域是通过机器学习模型确定的,在所述查询数据库中缺失业务领域的数据表之前,所述方法还包括:通过所述机器学习模型执行以下处理:获取数据表样本的特征信息,基于所述数据表样本的特征信息确定所述数据表样本所属的预测业务领域;基于所述数据表样本的预测业务领域与所述数据表样本的标注业务领域确定误差;在所述机器学习模型中反向传播所述误差,以更新所述机器学习模型的参数。13.一种数据库的数据处理装置,其特征在于,包括:查询模块,用于查询数据库中缺失业务领域的数据表;获取模块,用于获取所述数据表的特征信息,以及用于获取与所述特征信息对应的特征向量,将所述特征向量映射为多个候选的业务领域的概率;确定模块,用于将满足概率取值条件的概率对应的业务领域确定为所述数据表所属的业务领域;写入模块,用于在所述数据库的所述数据表中,写入所述数据表所属的业务领域。14.一种电子设备,其特征在于,包括:存储器,用于存储可执行指令;处理器,用于执行所述存储器中存储的可执行指令时,实现权利要求1至12任一项所述的数据库的数据处理方法。15.一种计算机可读存储介质,其特征在于,存储有可执行指令,用于引起处理器执行
如权利要求1至12任一项所述的数据库的数据处理方法。

技术总结
本申请提供了一种数据库的数据处理方法、装置、电子设备及计算机可读存储介质;涉及数据库技术和人工智能技术;方法包括:查询数据库中缺失业务领域的数据表,并获取数据表的特征信息;获取与特征信息对应的特征向量,将特征向量映射为多个候选的业务领域的概率;将满足概率取值条件的概率对应的业务领域确定为数据表所属的业务领域;在数据库的数据表中,写入数据表所属的业务领域。通过本申请能够对数据库实现智能化的数据管理,从而提高数据管理的效率。理的效率。理的效率。


技术研发人员:赵文 林岳 刘妍 陈守志
受保护的技术使用者:腾讯科技(深圳)有限公司
技术研发日:2021.02.01
技术公布日:2021/10/28
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献

  • 日榜
  • 周榜
  • 月榜