一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

数据字典的生成方法与流程

2021-11-06 06:04:00 来源:中国专利 TAG:

技术特征:
1.数据字典的生成方法,其特征在于包括:a、对输入的样本数据s,从一个方向确定一个起点位置i;b、判断位置i是否为输入数据s的尾部,如果是,输出失败信息,结束;否则转步骤c;c、使用位置i到数据s尾部的数据生成待处理数据串si,ck=si的前k位,1≤k≤[j/2],令j等于si的长度;其中,[]为取小数点前面整数部分的取整计算符号;d、使用ck从si的k 1位起扫描剩余位,记录ck,与ck相同的数据段的起点位置lm,以及数据长度、重复次数;令k=k 1,ck=si的前k位,其中,m为大于1的整数;e、判断k是否小于[j/2],如果是,则转步骤f;否则转步骤g;f、使用ck从si大于k位的lm位置起扫描k位数据,记录ck,与ck相同的数据段的起点位置lm,以及数据长度、重复次数;令k=k 1,ck=si的前k位,转步骤e;g、根据扫描得到的结果,将数据长度和/或重复次数最佳的ck、数据长度、重复次数,以及为其分配的标签存储到标签数据库。2.如权利要求1所述的数据字典的生成方法,其特征在于:如果标签数据库中已经存在一个与ck相同的数据段,则将该数据段对应的重复次数计数器加1。3.如权利要求2所述的数据字典的生成方法,其特征在于:利用重复次数计数器的值和/或数据段的长度值优化标签数据库。4.数据字典的生成方法,其特征在于包括:a、对输入的样本数据s,从一个方向确定一个起点位置i;b、判断位置i是否为输入数据s的尾部,如果是,转步骤h;否则转步骤c;c、使用位置i到数据s尾部的数据生成待处理数据串si,ck=si的前k位,1≤k≤[j/2],令j等于si的长度;其中,[]为取小数点前面整数部分的取整计算符号;d、使用ck从si的k 1位起扫描剩余位,记录ck,以及与ck相同的数据段的起点位置lm,以及数据长度、重复次数;令k=k 1,ck=si的前k位,其中,m为大于1的整数;e、判断k是否小于[j/2],如果是,则转步骤f;否则转步骤g;f、使用ck从si大于k位的lm位置起扫描k位数据,记录ck,以及与ck相同数据段的起点位置lm,以及数据长度、重复次数;令k=k 1,ck=si的前k位,转步骤e;g、根据扫描得到的结果,将数据长度和/或重复次数最佳的ck,以及数据长度、重复次数存储到临时数据库,令i=i 1,转步骤b;h、利用临时数据库中保存的ck,及其对应的数据长度、重复次数,找到最优值的ck,及其对应的数据长度、重复次数,将其以及为其分配的标签存储到标签数据库。5.如权利要求4所述的数据字典的生成方法,其特征在于:如果标签数据库中已经存在一个与ck相同的数据段,则将该数据段对应的重复次数计数器加1。6.如权利要求5所述的数据字典的生成方法,其特征在于:利用重复次数计数器的值和/或数据段的长度值优化标签数据库。7.如权利要求4、5或6所述的数据字典的生成方法,其特征在于还包括:在步骤c中,对于数据s,取其首部到ck尾部的数据形成一个子串s’,循环判断si的前k位数据是否为s’的前位子串,如果是,令k=k 1;否则,继续后操作。

技术总结
本发明提供了一种数据字典的生成方法,该方法从输入的样本数据S的一个起点位置按序增量取得索引数据串Ck,使用该索引数据串Ck扫描输入数据S的剩余位,记录Ck以及数据长度、重复次数等参数,最后得到重复数据段的集合,从所述集合中的数据段中找到最佳数据段,用所述最佳数据段及其标签生成标签数据库。佳数据段及其标签生成标签数据库。佳数据段及其标签生成标签数据库。


技术研发人员:白杰
受保护的技术使用者:白杰
技术研发日:2021.08.19
技术公布日:2021/11/5
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献