一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种基于类别扩展的数据建模方法与流程

2022-12-19 22:39:28 来源:中国专利 TAG:


1.本发明涉及数据建模技术领域,尤其涉及一种基于类别扩展的数据建模方法。


背景技术:

2.类别模型是指在模型设计时表示类别的模型,即以树形结构来表示的模型,比如物料类别模型、供应商类别模型。以物料类别模型为例,化工用品和办工用品具有公共属性,如类别编码、类别名称、规格型号和材质等;同时,化工用品和办工用品亦有特有属性,如化工用品有理化性质、健康危害等,办公用品则没有这些属性。通常的建模方式会建立物料类别实体,物料类别实体中建立公用属性,而针对于该实体下具体的类别数据则难以建立其特有的属性。


技术实现要素:

3.本发明提供一种基于类别扩展的数据建模方法,以解决现有技术中存在的分类模型是指在模型设计时表示类别的模型,即以树形结构来表示的模型,比如物料类别模型、供应商类别模型。以物料类别模型为例,化工用品和办工用品具有公共属性,如类别编码、类别名称、规格型号和材质等;同时,化工用品和办工用品亦有特有属性,如化工用品有理化性质、健康危害等,办公用品则没有这些属性。通常的建模方式会建立物料类别实体,物料类别实体中建立公用属性,而针对于该实体下具体的类别数据则难以建立其特有属性的上述问题。
4.为了达到上述目的,本发明提供如下技术方案:
5.一种基于类别扩展的数据建模方法,包括:
6.s101:基于数据建模的方式建立数据模型,对数据模型进行基本配置;
7.s102:基于对数据模型中的数据进行类别层次划分,创建类别数据;
8.s103:基于类别数据创建类别扩展属性,获取类别的特有属性;
9.s104:基于类别的特有属性,模型引擎创建每个类别对应的业务功能及页面。
10.其中,所述s101步骤包括:
11.s1011:基于类别数据的建模方式建立类别模型;
12.s1012:配置类别模型的基本信息,创建类别模型的实体以及通用属性,其中,通用属性包括公共属性。
13.其中,所述s102步骤包括:
14.s1021:按照不同的业务特性划定类别层次;
15.s1022:根据划定的类别层次,对类别模型中的数据进行层次分类处理,获取类别数据。
16.其中,所述s103步骤包括:
17.s1031:根据不同分类的业务特性,在分类数据下维护对应的特有属性和公共属性;
18.s1032:基于分类数据的特有属性配置子类继承父类,对子类继承父类的配置进行维护,其中,通过业务特性定义共有属性的一般类,根据一般类定义具有特殊属性的子类,子类继承父类的属性,同时,子类根据自己的需求增加新的属性。
19.其中,所述s104包括:模型引擎根据类别模型的通用字段和每个类别的扩展字段,创建每个类别对应的业务功能及页面;
20.所述扩展字段设置继承策略,若在大类别上配置每个扩展字段,可选择是否继承到下一个子类,若继承到下一个子类,则表示该配置中所有子类具备相应的扩展字段。
21.其中,所述s1012步骤包括:类别模型中类别数据的通常展示方式包括以树形结构层级展示,基于业务特性划定类别层次,根据类别的公共属性配置父类,子类继承父类属性的同时根据自己的需求增加新的属性;
22.在类别层次中的类别数据,基于类别的通用属性获取特有字段,其中,通常企业所涉及的类别包括千种以上,若干种类别通过扩展算法配置对应的若干种特有字段。
23.其中,所述s1022步骤包括:
24.对类别模型中待处理的数据进行预处理操作,预处理操作包括数据清洗、特征处理和文本表示,其中,数据清洗过程包括分词、去除符号和停用词;
25.对预处理后的数据进行分类算法处理,输出类别模型评估结果。
26.其中,对待处理数据进行文本表示包括:该文本表示采用tf-idf词向量表示(词频-逆文档频率表示),若当前字段出现次数越多则越代表当前字段的重要性,基于字段的重要性,作为父子类型间共有属性信息抽取词,若当前字段出现次数越少则越代表当前字段的代表性,作为父子类型间特有属性信息抽取词。
27.其中,对待处理数据进行特征处理包括:
28.基于卷积线性运算从待处理的数据中获取特征信息,基于数据的特征信息进行特征处理;
29.卷积线性运算过程包括:将数据表示为词向量矩阵,使用卷积核对词向量矩阵进行卷积,通过对数据进行卷积提取信息降低维度;将经过卷积后的数据进行池化,抽取到词向量矩阵的主要特征信息;经过卷积和池化后的数据,生成大量的特征图谱,通过全连接层对类别模型进行数据属性判断,根据判断获取分类结果。
30.其中,在对数据进行特征信息处理过程中包括:对数据进行特征提取;
31.计算类别模型中每个类别的平均特征,对平均特征进行归一化处理,计算类别模型中的分类特征信息;
32.通过实例平衡采样方式对数据进行联合训练,通过联合训练获取分类的权重范数、类别基数之间的关联性,将所有的权重范数进行标准化修改,对可学习权重进行缩放处理,基于机器学习方法中的网格搜索法,将超特征数据参数转化为可学习特征数据参数。
33.与现有技术相比,本发明具有以下优点:
34.一种基于类别扩展的数据建模方法,包括:基于数据建模的方式建立数据模型,对数据模型进行基本配置;基于对数据模型中的数据进行类别层次划分,创建类别数据;基于类别数据创建类别扩展属性,获取类别的特有属性;基于类别的特有属性,模型引擎创建每个类别对应的业务功能及页面。基于智能化的扩展算法,实现了不同分类下的数据可建立其特有属性,该技术具有智能化、高效化等特点。
35.本发明的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本发明而了解。本发明的目的和其他优点可通过在所写的说明书、权利要求书、以及附图中所特别指出的结构来实现和获得。
36.下面通过附图和实施例,对本发明的技术方案做进一步的详细描述。
附图说明
37.附图用来提供对本发明的进一步理解,并且构成说明书的一部分,与本发明的实施例一起用于解释本发明,并不构成对本发明的限制。在附图中:
38.图1为本发明实施例中一种基于类别扩展的数据建模方法的流程图;
39.图2为本发明实施例中一种基于类别扩展的数据建模方法中建立数据模型的流程图;
40.图3为本发明实施例中一种基于类别扩展的数据建模方法中创建类别数据的流程图。
具体实施方式
41.以下结合附图对本发明的优选实施例进行说明,应当理解,此处所描述的优选实施例仅用于说明和解释本发明,并不用于限定本发明。
42.本发明实施例提供了一种基于类别扩展的数据建模方法,包括:
43.s101:基于数据建模的方式建立数据模型,对数据模型进行基本配置;
44.s102:基于对数据模型中的数据进行类别层次划分,创建类别数据;
45.s103:基于类别数据创建类别扩展属性,获取类别的特有属性;
46.s104:基于类别的特有属性,模型引擎创建每个类别对应的业务功能及页面。
47.上述技术方案的工作原理为:基于数据建模的方式建立数据模型,对数据模型进行基本配置;基于对数据模型中的数据进行类别层次划分,创建类别数据;基于类别数据创建类别扩展属性,获取类别的特有属性;基于类别的特有属性,模型引擎创建每个类别对应的业务功能及页面。分类模型下已建立分类数据后,根据不同分类的业务特性,在其分类数据下维护其特有属性,特有属性还可以配置是否继承到子类、继承到子类是否可维护。通过以上算法来实现不同的分类可维护不同的属性信息,父子类型间共有属性信息的维护、特有属性信息的维护。基于智能化的扩展算法,实现了不同分类下的数据可建立其特有属性,该技术具有智能化、高效化等特点。
48.上述技术方案的有益效果为:基于数据建模的方式建立数据模型,对数据模型进行基本配置;基于对数据模型中的数据进行类别层次划分,创建类别数据;基于类别数据创建类别扩展属性,获取类别的特有属性;基于类别的特有属性,模型引擎创建每个类别对应的业务功能及页面。基于智能化的扩展算法,实现了不同分类下的数据可建立其特有属性,该技术具有智能化、高效化等特点。
49.在另一实施例中,所述s101步骤包括:
50.s1011:基于类别数据的建模方式建立类别模型;
51.s1012:配置类别模型的基本信息,创建类别模型的实体以及通用属性,其中,通用属性包括公共属性。
52.上述技术方案的工作原理为:基于类别数据的建模方式建立类别模型;配置类别模型的基本信息,创建类别模型的实体以及通用属性,其中,通用属性包括公共属性。
53.类别模型中数据的通常展现方式是以树形结构层级展示。以高压电器和低压电器为例,规格和材质是高压电器和低压电器的通用属性,2个类别中都包含这2个字段。高压电器的特有字段:绝缘级别、防护级别;低压电器的特有字段:频率、功耗。以物料类别模型为例,通常一个企业的物料类别会有7、8千种以上,而其中有3、4千种类别需要配置其特有字段是非常正常的一件事情。
54.上述技术方案的有益效果为:基于类别数据的建模方式建立类别模型;配置类别模型的基本信息,创建类别模型的实体以及通用属性,其中,通用属性包括公共属性。基于智能化的扩展算法,实现了不同分类下的数据可建立其特有属性,该技术具有智能化、高效化等特点。
55.在另一实施例中,所述s102步骤包括:
56.s1021:按照不同的业务特性划定类别层次;
57.s1022:根据划定的类别层次,对类别模型中的数据进行层次分类处理,获取类别数据。
58.上述技术方案的工作原理为:按照不同的业务特性划定类别层次;根据划定的类别层次,对类别模型中的数据进行层次分类处理,获取类别数据。基于智能化的扩展算法,实现了不同分类下的数据可建立其特有属性,该技术具有智能化、高效化等特点。
59.上述技术方案的有益效果为:按照不同的业务特性划定类别层次;根据划定的类别层次,对类别模型中的数据进行层次分类处理,获取类别数据。基于智能化的扩展算法,实现了不同分类下的数据可建立其特有属性,该技术具有智能化、高效化等特点。
60.在另一实施例中,所述s103步骤包括:
61.s1031:根据不同分类的业务特性,在分类数据下维护对应的特有属性;
62.s1032:基于分类数据的特有属性配置子类继承父类,对子类继承父类的配置进行维护,其中,通过业务特性定义共有属性的一般类,根据一般类定义具有特殊属性的子类,子类继承父类的属性,同时,子类根据自己的需求增加新的属性。
63.上述技术方案的工作原理为:根据不同分类的业务特性,在分类数据下维护对应的特有属性;基于分类数据的特有属性配置子类继承父类,对子类继承父类的配置进行维护,其中,通过业务特性定义共有属性的一般类,根据一般类定义具有特殊属性的子类,子类继承父类的属性,同时,子类根据自己的需求增加新的属性。基于智能化的扩展算法,实现了不同分类下的数据可建立其特有属性,该技术具有智能化、高效化等特点。
64.上述技术方案的有益效果为:根据不同分类的业务特性,在分类数据下维护对应的特有属性;基于分类数据的特有属性配置子类继承父类,对子类继承父类的配置进行维护,其中,通过业务特性定义共有属性的一般类,根据一般类定义具有特殊属性的子类,子类继承父类的属性,同时,子类根据自己的需求增加新的属性。基于智能化的扩展算法,实现了不同分类下的数据可建立其特有属性,该技术具有智能化、高效化等特点。
65.在另一实施例中,所述s104包括:模型引擎根据类别模型的通用字段和每个类别的扩展字段,创建每个类别对应的业务功能及页面;
66.基于所述扩展字段设置对应的继承策略,若在大类别上配置具有特有属性的扩展
字段,可选择当前字段是否继承父类,若继承父类,则表示该配置中所有子类具备相应的扩展字段。
67.上述技术方案的工作原理为:模型引擎根据类别模型的通用字段和每个类别的扩展字段,创建每个类别对应的业务功能及页面;基于所述扩展字段设置对应的继承策略,若在大类别上配置具有特有属性的扩展字段,可选择当前字段是否继承父类,若继承父类,则表示该配置中所有子类具备相应的扩展字段。
68.基于智能化的扩展算法,实现了不同分类下的数据可建立其特有属性,该技术具有智能化、高效化等特点。
69.上述技术方案的有益效果为:模型引擎根据类别模型的通用字段和每个类别的扩展字段,创建每个类别对应的业务功能及页面;基于所述扩展字段设置对应的继承策略,若在大类别上配置具有特有属性的扩展字段,可选择当前字段是否继承父类,若继承父类,则表示该配置中所有子类具备相应的扩展字段。基于智能化的扩展算法,实现了不同分类下的数据可建立其特有属性,该技术具有智能化、高效化等特点。
70.在另一实施例中,所述s104包括:模型引擎根据类别模型的通用字段和每个类别的扩展字段,创建每个类别对应的业务功能及页面;
71.基于所述扩展字段设置对应的继承策略,若在大类别上配置具有特有属性的扩展字段,可选择当前字段是否继承父类,若继承父类,则表示该配置中所有子类具备相应的扩展字段。
72.上述技术方案的工作原理为:模型引擎根据类别模型的通用字段和每个类别的扩展字段,创建每个类别对应的业务功能及页面;基于所述扩展字段设置对应的继承策略,若在大类别上配置具有特有属性的扩展字段,可选择当前字段是否继承父类,若继承父类,则表示该配置中所有子类具备相应的扩展字段。
73.基于智能化的扩展算法,实现了不同分类下的数据可建立其特有属性,该技术具有智能化、高效化等特点。
74.上述技术方案的有益效果为:模型引擎根据类别模型的通用字段和每个类别的扩展字段,创建每个类别对应的业务功能及页面;基于所述扩展字段设置对应的继承策略,若在大类别上配置具有特有属性的扩展字段,可选择当前字段是否继承父类,若继承父类,则表示该配置中所有子类具备相应的扩展字段。基于智能化的扩展算法,实现了不同分类下的数据可建立其特有属性,该技术具有智能化、高效化等特点。
75.在另一实施例中,所述s1022步骤包括:
76.类别模型中类别数据的通常展示方式包括以树形结构层级展示,基于业务特性划定类别层次,根据类别的公共属性配置父类,子类继承父类属性的同时根据自己的需求增加新的属性;在类别层次中的类别数据,基于类别的通用属性获取特有字段,其中,通常企业所涉及的类别包括千种以上,若干种类别通过扩展算法配置对应的若干种特有字段。
77.上述技术方案的工作原理为:类别模型中数据的通常展现方式为以树形结构层级展示。以高压电器和低压电器为例,规格和材质是高压电器和低压电器的通用属性,2个类别中都包含这2个字段。高压电器的特有字段:绝缘级别、防护级别;低压电器的特有字段:频率、功耗。以物料类别模型为例,通常一个企业的物料类别会有7、8千种以上,而其中有3、4千种类别需要配置其特有字段是非常正常的一件事情。
78.上述技术方案的有益效果为:类别模型中类别数据的通常展示方式包括以树形结构层级展示,基于业务特性划定类别层次,根据类别的公共属性配置父类,子类继承父类属性的同时根据自己的需求增加新的属性;在类别层次中的类别数据,基于类别的通用属性获取特有字段,其中,通常企业所涉及的类别包括千种以上,若干种类别通过扩展算法配置对应的若干种特有字段。
79.在另一实施例中,所述s1022步骤包括:
80.对类别模型中待处理的数据进行预处理操作,预处理操作包括数据清洗、特征处理和文本表示,其中,数据清洗过程包括分词、去除符号和停用词;
81.对预处理后的数据进行分类算法处理,输出类别模型评估结果。
82.上述技术方案的工作原理为:对类别模型中待处理的数据进行预处理操作,预处理操作包括数据清洗、特征处理和文本表示,其中,数据清洗过程包括分词、去除符号和停用词;对预处理后的数据进行分类算法处理,输出类别模型评估结果。从而有效的对数据进行优化。
83.上述技术方案的有益效果为:对类别模型中待处理的数据进行预处理操作,预处理操作包括数据清洗、特征处理和文本表示,其中,数据清洗过程包括分词、去除符号和停用词;对预处理后的数据进行分类算法处理,输出类别模型评估结果。从而有效的对数据进行优化。
84.在另一实施例中,对待处理数据进行特征处理包括:
85.基于卷积线性运算从待处理的数据中获取特征信息,基于数据的特征信息进行特征处理;
86.卷积线性运算过程包括:将数据表示为词向量矩阵,使用卷积核对词向量矩阵进行卷积,通过对数据进行卷积提取信息降低维度;将经过卷积后的数据进行池化,抽取到词向量矩阵的主要特征信息;经过卷积和池化后的数据,生成大量的特征图谱,通过全连接层对类别模型进行数据属性判断,根据判断获取分类结果。
87.上述技术方案的工作原理为:基于卷积线性运算从待处理的数据中获取特征信息,基于数据的特征信息进行特征处理;卷积线性运算过程包括:将数据表示为词向量矩阵,使用卷积核对词向量矩阵进行卷积,通过对数据进行卷积提取信息降低维度;将经过卷积后的数据进行池化,抽取到词向量矩阵的主要特征信息;经过卷积和池化后的数据,生成大量的特征图谱,通过全连接层对类别模型进行数据属性判断,根据判断获取分类结果。
88.上述技术方案的有益效果为:基于卷积线性运算从待处理的数据中获取特征信息,基于数据的特征信息进行特征处理;卷积线性运算过程包括:将数据表示为词向量矩阵,使用卷积核对词向量矩阵进行卷积,通过对数据进行卷积提取信息降低维度;将经过卷积后的数据进行池化,抽取到词向量矩阵的主要特征信息;经过卷积和池化后的数据,生成大量的特征图谱,通过全连接层对类别模型进行数据属性判断,根据判断获取分类结果。
89.在另一实施例中,在对数据进行特征信息处理过程中包括:对数据进行特征提取;
90.计算类别模型中每个类别的平均特征,对平均特征进行归一化处理,计算类别模型中的分类特征信息;
91.通过实例平衡采样方式对数据进行联合训练,通过联合训练获取分类的权重范数、类别基数之间的关联性,将所有的权重范数进行标准化修改,对可学习权重进行缩放处
理,,基于机器学习方法中的网格搜索法,将超特征数据参数转化为可学习特征数据参数。
92.上述技术方案的工作原理为:对数据进行特征提取;计算类别模型中每个类别的平均特征,对平均特征进行归一化处理,计算类别模型中的分类特征信息;通过实例平衡采样方式对数据进行联合训练,通过联合训练获取分类的权重范数、类别基数之间的关联性,将所有的权重范数进行标准化修改,对可学习权重进行缩放处理,基于机器学习方法中的网格搜索法,将超特征数据参数转化为可学习特征数据参数。
93.为保证文本表示的数据进行特征提取的过程有效性和可行性,将文本表示的词向量通过线性变换映射到隐藏层,然后取词向量平均值,也就是平均池化,与word2vec中的词向量结构类似,通过fasttext将其输入文本表示的词向量矩阵然后再加入一个归一化的softmax层,softmax层根据每一种类别的权重构建哈夫曼树并且直接输出预测的类别数据结果。其优化函数公式为:
[0094][0095]
其中,β表示优化函数;n表示文本表示的数量;yi和xi分别表示第i个词的标签和特征;s表示权重矩阵;w表示f的权重系数;i表示分类的数量;f表示权重数。
[0096]
通过优化函数算法公式将一个整体任务为多分类的数据集问题转化为n个二分类问题,进而降低了计算机复杂度。
[0097]
上述技术方案的有益效果为:对数据进行特征提取;计算类别模型中每个类别的平均特征,对平均特征进行归一化处理,计算类别模型中的分类特征信息;通过实例平衡采样方式对数据进行联合训练,通过联合训练获取分类的权重范数、类别基数之间的关联性,将所有的权重范数进行标准化修改,对可学习权重进行缩放处理,基于机器学习方法中的网格搜索法,将超特征数据参数转化为可学习特征数据参数。
[0098]
显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。
再多了解一些

本文用于创业者技术爱好者查询,仅供学习研究,如用于商业用途,请联系技术所有人。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献