一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

基于内容识别的标准数据构建方法、系统、设备及介质与流程

2021-10-24 05:24:00 来源:中国专利 TAG:数据处理 介质 识别 构建 特别

技术特征:
1.一种基于内容识别的标准数据构建方法,其特征在于,包括:数据源预处理步骤:对数据源的元数据及数据内容进行预处理获得数据的数据特征;匹配指数获得步骤:根据所述数据的数据特征、元数据及/或字典码表通过数据标准化元模型算法进行关联获得标准数据,并计算所述标准数据的元数据与数据特征的匹配指数;标准数据推荐步骤:根据所述匹配指数选择至少一所述标准数据后,对所述标准数据进行验证后输出标准化程度评估结果,根据所述标准化程度评估结果推荐所述标准数据。2.如权利要求1所述的标准数据构建方法,其特征在于,所述匹配指数获得步骤包括:标准数据获取步骤:根据所述数据的数据特征及所述元数据通过所述数据标准化元模型算法进行关联获得所述标准数据;初始匹配指数获得步骤:通过所述数据标准化元模型算法根据数据特征及所述元数据获得多个初始匹配指数;第一匹配指数获得步骤:根据多个所述初始匹配指数通过加权计算获得第一匹配指数;其中,所述标准数据推荐步骤中根据所述第一匹配指数选择至少一所述标准数据。3.如权利要求1所述的标准数据构建方法,其特征在于,所述匹配指数获得步骤包括:标准数据获取步骤:根据所述数据的数据特征、所述元数据及字典码表通过数据标准化元模型算法进行关联获得所述标准数据及字典码表标识;初始匹配指数获得步骤:通过所述数据标准化元模型算法根据数据特征及所述元数据获得多个初始匹配指数;第一匹配指数获得步骤:根据多个所述初始匹配指数通过加权计算获得第一匹配指数;字典码表标识判断步骤:对每一所述标准数据的所述字典码表标识进行判断;第二匹配指数获得步骤:当所述字典码表标识为1时,所述标准数据通过字典码表匹配度算法获得第二匹配指数;其中,所述标准数据推荐步骤中根据所述第二匹配指数选择至少一所述标准数据。4.如权利要求3所述的标准数据构建方法,其特征在于,还包括:新增推荐步骤:将所述标准数据推荐步骤中未匹配的数据特征及/或字典码表标识推荐到前端,进行新增数据元及/或字典码表的操作。5.一种基于内容识别的标准数据构建系统,其特征在于,包括:数据源预处理单元,对数据源的元数据及数据内容进行预处理获得数据的数据特征;匹配指数获得单元,根据所述数据的数据特征、元数据及/或字典码表通过数据标准化元模型算法进行关联获得标准数据,并计算所述标准数据的元数据与数据特征的匹配指数;标准数据推荐单元,根据所述匹配指数选择至少一所述标准数据后,对所述标准数据进行验证后输出标准化程度评估结果,根据所述标准化程度评估结果推荐所述标准数据。6.如权利要求5所述的标准数据构建系统,其特征在于,所述匹配指数获得单元包括:标准数据获取模块,根据所述数据的数据特征及所述元数据通过所述数据标准化元模型算法进行关联获得所述标准数据;
初始匹配指数获得模块,通过所述数据标准化元模型算法根据数据特征及所述元数据获得多个初始匹配指数;第一匹配指数获得模块,根据多个所述初始匹配指数通过加权计算获得第一匹配指数;其中,所述标准数据推荐单元根据所述第一匹配指数选择至少一所述标准数据。7.如权利要求5所述的标准数据构建系统,其特征在于,所述匹配指数获得单元包括:标准数据获取模块,根据所述数据的数据特征、所述元数据及字典码表通过数据标准化元模型算法进行关联获得所述标准数据及字典码表标识;初始匹配指数获得模块,通过所述数据标准化元模型算法根据数据特征及所述元数据获得多个初始匹配指数;第一匹配指数获得模块,根据多个所述初始匹配指数通过加权计算获得第一匹配指数;字典码表标识判断模块,对每一所述标准数据的所述字典码表标识进行判断;第二匹配指数获得模块,当所述字典码表标识为1时,所述标准数据通过字典码表匹配度算法获得第二匹配指数;其中,所述标准数据推荐单元根据所述第二匹配指数选择至少一所述标准数据。8.如权利要求7所述的标准数据构建系统,其特征在于,还包括:新增推荐单元,将所述标准数据推荐步骤中未匹配的数据特征及/或字典码表标识推荐到前端,进行新增数据元及/或字典码表的操作。9.一种设备,包括存储器、处理器以及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至4中任一项所述的标准数据构建方法。10.一种介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1至4中任一项所述的标准数据构建方法。

技术总结
本发明公开了一种基于内容识别的标准数据构建方法、系统、设备及介质,标准数据构建方法包括:数据源预处理步骤:对数据源的元数据及数据内容进行预处理获得数据的数据特征;匹配指数获得步骤:根据数据的数据特征、元数据及/或字典码表通过数据标准化元模型算法进行关联获得标准数据,并计算标准数据的元数据与数据特征的匹配指数;标准数据推荐步骤:根据匹配指数选择至少一所述标准数据后,对标准数据进行验证后输出标准化程度评估结果,根据标准化程度评估结果推荐标准数据。通过本发明实现了数据元、元数据、数据内容、字典码表的自动标准化,结合人机互操作,构建标准数据层,提高数据质量和治理效率。数据质量和治理效率。数据质量和治理效率。


技术研发人员:白格日乐图
受保护的技术使用者:北京明略软件系统有限公司
技术研发日:2021.07.22
技术公布日:2021/10/23
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献

  • 日榜
  • 周榜
  • 月榜