一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种基于区块链的IDC数据协同方法及系统与流程

2022-08-24 03:28:15 来源:中国专利 TAG:

一种基于区块链的idc数据协同方法及系统
技术领域
1.本发明涉及数据协同技术领域,具体涉及一种基于区块链的idc数据协同方法及系统。


背景技术:

2.互联网数据中心(internet data center,idc)用于为用户提供数据存储、备份、托管等数据增值业务,为用户节省服务器、系统的搭建和维护成本,其内存储有大量用户的数据。
3.数据协同基于多方用户共享数据,以提升数据维度,解决多方用户共同存在或单独存在的问题,广泛应用于数据交易、业务协作、风险管控等领域。
4.现有技术中数据协同工作中存在着多方之间的信任问题,且各方无法在数据协同中根据付出准确地得到对应程度的回报,存在着数据协同效果较差的技术问题。


技术实现要素:

5.本技术提供了一种基于区块链的idc数据协同方法及系统,用于针对解决现有技术中数据协同工作中存在信任问题,以及各方无法在数据协同中根据付出准确地得到对应程度的回报,存在的数据协同效果较差的技术问题。
6.鉴于上述问题,本技术提供了一种基于区块链的idc数据协同方法及系统。
7.本技术的第一个方面,提供了一种基于区块链的idc数据协同方法,所述方法包括:采集获取参与数据协同的多个企业主体的规模信息,其中,多个所述企业主体均通过至少一个互联网数据中心进行数据增值业务;采集获取多个所述企业主体用于进行数据协同的贡献数据,获得多个贡献数据集合;提取获得多个所述贡献数据集合的贡献数据特征,在至少一个所述互联网数据中心内,根据所述贡献数据特征采集辅助数据,获得多个辅助数据集合;在多个所述企业主体内构建区块链节点,基于多个所述贡献数据集合和多个所述辅助数据集合构建数据区块,基于多个所述区块链节点和多个所述数据区块,构建获得协同区块链;根据所述协同区块链,基于集成学习,构建总数据协同分析模型,其中,所述总数据协同分析模型内包括多个子模型;根据多个所述贡献数据集合和多个所述辅助数据集合内的数据量大小以及多个所述规模信息,通过所述协同区块链向各所述企业主体分发不同的数据协同分析模型,其中,不同的所述数据协同分析模型内包括不同数量的所述子模型;各所述企业主体基于分发的所述数据协同分析模型,进行数据协同工作。
8.本技术的第二个方面,提供了一种基于区块链的idc数据协同系统,所述系统包括:规模采集模块,用于采集获取参与数据协同的多个企业主体的规模信息,其中,多个所述企业主体均通过至少一个互联网数据中心进行数据增值业务;贡献数据采集模块,用于采集获取多个所述企业主体用于进行数据协同的贡献数据,获得多个贡献数据集合;辅助数据采集模块,用于提取获得多个所述贡献数据集合的贡献数据特征,在至少一个所述互联网数据中心内,根据所述贡献数据特征采集辅助数据,获得多个辅助数据集合;区块链构
建模块,用于在多个所述企业主体内构建区块链节点,基于多个所述贡献数据集合和多个所述辅助数据集合构建数据区块,基于多个所述区块链节点和多个所述数据区块,构建获得协同区块链;协同模型构建模块,用于根据所述协同区块链,基于集成学习,构建总数据协同分析模型,其中,所述总数据协同分析模型内包括多个子模型;协同模型分发模块,用于根据多个所述贡献数据集合和多个所述辅助数据集合内的数据量大小以及多个所述规模信息,通过所述协同区块链向各所述企业主体分发不同的数据协同分析模型,其中,不同的所述数据协同分析模型内包括不同数量的所述子模型;协同工作模块,用于各所述企业主体基于分发的所述数据协同分析模型,进行数据协同工作。
9.本技术中提供的一个或多个技术方案,至少具有如下技术效果或优点:本技术实施例通过采集获取参与数据协同的多个企业主体的规模信息,然后获取各企业主体用于进行数据协同工作的贡献数据,并基于互联网数据中心,根据贡献数据的数据特征,在互联网数据中心内采集获取对应的辅助数据,然后在多个企业主体内构建区块链节点,以贡献数据和辅助数据构建数据区块,构建区块链,然后在区块链内以各企业主体的贡献数据和辅助数据构建包含多个子模型的总数据协同分析模型,然后,根据各企业主体的贡献数据集合、辅助数据集合内的数据量大小以及对应的规模信息,向各企业主体分发包含不同数量子模型的数据协同分析模型,进行数据协同工作。本技术实施例基于互联网数据中心,根据各参与数据协同的企业主体的贡献数据的数据特征,提取辅助数据,以提升数据维度,进而提升数据协同的数据规模,提升数据协同工作的效果,还通过区块链技术,构建协同区块链,保证数据协同工作中的可信度,避免出现数据篡改等问题,且数据可溯源查询,还基于集成学习,构建包括多个子模型的总数据协同分析模型,然后根据各企业主体的贡献数据和辅助数据的数据量以及规模信息,确定各企业主体在当前数据协同中的付出规模,进而分发包括对应数量子模型的数据协同模型,作为数据协同的回报,本技术实施例解决了数据协同中的信任问题,并基于idc,提升数据协同的数据规模,以及根据各企业主体在数据协同的付出,分发对应的数据协同分析模型,达到提升数据协同效果的技术效果。
附图说明
10.图1为本技术提供的一种基于区块链的idc数据协同方法流程示意图;图2为本技术提供的一种基于区块链的idc数据协同方法中获得多个数据区块的流程示意图;图3为本技术提供的一种基于区块链的idc数据协同方法中构建总数据协同分析模型的流程示意图;图4为本技术提供的一种基于区块链的idc数据协同方法中获得分发的数据协同模型的流程示意图;图5为本技术提供了一种基于区块链的idc数据协同系统结构示意图。
11.附图标记说明:规模采集模块11,贡献数据采集模块12,辅助数据采集模块13,区块链构建模块14,协同模型构建模块15,协同模型分发模块16,协同工作模块17。
具体实施方式
12.本技术通过提供了一种基于区块链的idc数据协同方法及系统,用于针对解决现有技术中数据协同工作中存在信任问题,以及各方无法在数据协同中根据付出准确地得到对应程度的回报,存在的数据协同效果较差的技术问题。
13.实施例一如图1所示,本技术提供了一种基于区块链的idc数据协同方法,所述方法包括:s100:采集获取参与数据协同的多个企业主体的规模信息,其中,多个所述企业主体均通过至少一个互联网数据中心进行数据增值业务;本技术实施例中,多个企业主体可为具有一定合作或竞争关系的任意的多个企业,例如,可为在同一产业内多个企业,示例性地,可为广告行业内的多个企业。多个企业主体也可为具有供应关系的上下游企业。
14.互联网数据中心为提供网络和数据服务的一类互联网服务,其以网络资源、服务器、机房等为基础的网络平台,为企业用户提供服务器租用、数据备份、分析、托管等增值服务。本技术实施例中,多个企业主体均共同通过至少一个idc进行相关的数据增值服务,以提升数据备份和处理效率,并降低数据和服务器的管理、维护成本。
15.s200:采集获取多个所述企业主体用于进行数据协同的贡献数据,获得多个贡献数据集合;本技术实施例中,多个企业主体需要进行数据协同工作,以自身数据作为贡献,结合其他企业主体的数据,进行数据分析、风险管控、产业调整等业务,通过数据协同提升数据维度和规模,进而提升业务效果。
16.采集获取多个企业主体用于进行数据协同的贡献数据,获得多个贡献数据集合。示例性地,多个企业主体需要进行广告精准投放的业务改进,通过数据协同工作进行改进方案的设计和优化,则各企业主体的贡献数据可包括此前进行广告投放的方案、投放对象以及投放效果等数据。
17.s300:提取获得多个所述贡献数据集合的贡献数据特征,在至少一个所述互联网数据中心内,根据所述贡献数据特征采集辅助数据,获得多个辅助数据集合;本技术实施例中,对各个企业主体用于进行数据协同工作的贡献数据进行数据特征提取,获得多个贡献数据特征。在多个企业主体进行数据增值服务的互联网数据中心中,存储有多个企业主体的业务数据,在该至少一个互联网数据中心中,按照上述的多个贡献数据特征,进行数据采集,以获得与贡献数据集合具有相似或相同数据特征的数据,作为辅助数据,获得多个辅助数据集合,与多个贡献数据集合一同进行数据协同,以提升贡献数据的数据规模,进而提升数据协同工作的效果。
18.示例性地,提取获得贡献数据的数据特征的过程中,可基于现有技术中的主成分分析法或其他现有的数据特征提取方法进行。
19.优选地,本技术实施例提供的方法中的步骤s300中的提取获得多个所述贡献数据集合的贡献数据特征,包括:s310:根据多个所述贡献数据集合,进行主因素提取,获得多个主因素提取结果;s320:基于多个所述主因素提取结果,进行次因素提取,获得多个次因素提取结果,其中,每个所述主因素包括多个次因素;
s330:将多个所述主因素提取结果和多个所述次因素提取结果作为所述贡献数据特征。
20.首先,对多个贡献数据集合进行主因素提取,其中,主因素为多个贡献数据集合中比较主要的、成一大类的数据特征。示例性地,贡献数据集合内包括此前各企业主体进行广告投放的投放方案、目标用户及投放效果等数据,对应的主因素包括目标用户、投放方案、投放效果等重要数据特征,对各贡献数据集合内的数据进行主因素提取,获得多个主因素提取结果。
21.进一步地,基于多个主因素提取结果,进一步进行次因素提取。每个主因素包括多个次因素,示例性地,主因素包括广告投放的目标用户和投放方案部,则对应的次因素可包括广告投放的用户类型、用户年龄、广告投放频率、广告投放时间等细化的数据,如此,得到多个次因素提取结果。并且,一主因素提取结果对应多个次因素提取结果。
22.将多个主因素提取结果和多个次因素提取结果分别作为上述多个贡献数据集合的贡献数据特征,基于贡献数据特征,可在多个企业主体进行数据增值业务的至少一个互联网数据中心中,基于各用户主体进行数据增值服务的业务数据,提取获得具有相似或相同贡献数据特征的数据,可选的,可基于主因素提取结果和次因素提取结果进行数据提取,作为辅助数据,提升数据协同的数据规模。
23.本技术实施例通过对多个贡献数据集合进行主因素和次因素的逐级数据特征提取,能够准确获得多个贡献数据集合内的数据特征,进而提取获得具有相似或相同数据特征的辅助数据集合,提升数据规模,进而提升数据协同的效果。
24.s400:在多个所述企业主体内构建区块链节点,基于多个所述贡献数据集合和多个所述辅助数据集合构建数据区块,基于多个所述区块链节点和多个所述数据区块,构建获得协同区块链;本技术实施例中,基于区块链技术,在多个企业主体内分别构建多个区块链节点,将上述内容中的多个贡献数据集合和多个辅助数据集合,分别通过各企业主体的区块链节点进行上传,形成多个区块,上传的过程中,可对上传的贡献数据集合和辅助数据集合进行非对称加密,以实现数据协同中其他企业主体可进行数据的使用,而不可进行数据的读取和下载,进行数据保护。
25.如图2所示,本技术实施例提供的方法中的步骤s400包括:s410:将多个所述贡献数据集合和多个所述辅助数据集合进行哈希算法处理,获得多个数据哈希值;s420:将多个所述贡献数据集合和多个所述辅助数据集合,根据多个所述企业主体,进行分布式存储,获得多个存储地址;s430:对多个存储地址进行映射处理,获得多个索引信息;s440:对多个所述索引信息进行哈希算法处理,获得多个索引哈希值;s450:根据多个所述索引信息、多个所述索引哈希值和多个所述数据哈希值,分别构建获得多个所述数据区块。
26.具体地,在对多个贡献数据集合和多个辅助数据集合构建数据区块的过程中,首先对多个贡献数据集合和多个辅助数据集合进行哈希算法处理,对多个贡献数据集合和多个辅助数据集合分别映射处理获得多个对应的哈希值,作为多个数据哈希值。
27.进一步地,由于数据协同中,多个贡献数据集合和多个辅助数据集合内的数据量较大,本技术实施例中,基于索引的方式进行数据存储和调用,保证数据信任的同时,降低区块链中数据存储所需的内存。
28.具体地,在多个企业主体处,基于分布式存储,将多个贡献数据集合和多个辅助数据集合进行存储,并获得在多个企业主体处存储的存储地址,得到多个存储地址。其中,该存储地址可包括物理地址和/或网络地址。
29.对多个存储地址进行一对一的映射处理,获得多个索引信息,其中,通过索引信息即可获得对应的存储地址,进而可调用该存储地址内存储的贡献数据集合和辅助数据集合。
30.对多个索引信息继续进行哈希算法处理,获得多个索引哈希值。最终,基于多个索引信息、多个索引哈希值和多个数据哈希值,构建获得多个数据区块。其中,一个数据区块内包括区块id、索引信息、索引哈希值、数据哈希值、构建该数据区块的时间戳以及上一个数据区块的区块id。如此,基于多个数据区块,可形成区块链条,进而构建获得上述的协同区块链。其中,上述的时间戳和区块id可基于现有技术中的区块链技术进行设置获得。
31.本技术实施例通过对贡献数据集合和辅助数据集合进行分布式存储,对存储地址进行映射获得索引信息,在数据区块内存储索引信息、索引哈希值和数据哈希值,如此,若存在企业主体篡改存储数据时,可基于数据哈希值进行判断是否出现篡改,解决数据信任问题,也可基于索引哈希值判断是否为贡献数据以及是否篡改存储地址,且无需直接在区块链内存储数据,降低协同区块链所需内存,提升数据协同的处理效率。
32.s500:根据所述协同区块链,基于集成学习,构建总数据协同分析模型,其中,所述总数据协同分析模型内包括多个子模型;本技术实施例中,基于该协同区块链,可获取各企业主体用于进行数据协同的贡献数据集合和辅助数据集合,进而进行数据协同,解决各企业主体所需解决的业务问题。
33.优选地,本技术实施例中,各企业主体基于数据协同,进行数据分析工作。
34.如图3所示,本技术实施例提供的方法中的步骤s500包括:s510:根据所述协同区块链,获得多个所述贡献数据集合和多个所述辅助数据集合;s520:从多个所述贡献数据集合和多个所述辅助数据集合内有放回地随机抽取m个所述贡献数据集合和m个辅助数据集合,作为第一构建数据集,m为正整数;s530:根据所述第一构建数据集,构建第一子模型;s540:再次从多个所述贡献数据集合和多个所述辅助数据集合内有放回地随机抽取m个所述贡献数据集合和m个辅助数据集合,作为第二构建数据集;s550:根据所述第二构建数据集,构建第二子模型;s560:继续构建子模型,直至所述子模型的数量满足预设要求;s570:将多个所述子模型进行集成,获得所述总数据协同分析模型。
35.具体地,根据该协同区块链,可提取获得当前需要进行数据协同工作的多个贡献数据集合和多个辅助数据集合。可选的,可基于时间范围,例如按照近一年内的时间范围,从协同区块链内获得近一年内的多个贡献数据集合和多个辅助数据集合进行数据协同。
36.从多个贡献数据集合和多个辅助数据集合内有放回地随机选取m个贡献数据集合
和m个辅助数据集合,作为第一构建数据集,其中,m为正整数,且小于所有贡献数据集合和辅助数据集合的数量。
37.以该第一构建数据集,构建第一子模型,其中,构建的过程中,基于机器学习中的决策树,有监督的构建第一子模型。
38.具体地,本技术实施例提供的方法中的步骤s530包括:s531:基于所述第一节点构建特征数据,构建所述第一子模型的第一划分节点;s532:再次对所述第一构建数据集进行特征数据提取,获得第二节点构建特征数据;s533:基于所述第二节点构建特征数据,构建所述第一子模型的第二划分节点;s534:继续构建所述第一子模型的多级划分节点,直到所述第一子模型的划分节点层数达到预设层数;s535:对所述第一子模型进行后剪枝,获得所述第一子模型。
39.具体地,对上述的第一构建数据集进行特征数据提取,具体地,上述的第一构建数据集内包括多个贡献数据集合和辅助数据集合,对其进行特征数据提取,获得用于构建第一划分节点的第一节点构建特征数据。示例性地,第一构建数据集内的贡献数据集合和辅助数据集合均包括广告投放方式、目标用户和效果等数据,例如提取其中的目标用户特征数据,作为第一节点构建特征数据。
40.基于该第一节点构建特征数据,构建第一子模型的第一划分节点,具体地,根据该第一节点构建特征数据内的数据,设置一划分阈值,基于决策树,将输入数据中大于该划分阈值的数据归为一类,小于该划分阈值的数据归为另一类,该划分阈值可为目标用户的年龄、收入等数据,完成第一划分节点的构建。
41.进一步对该第一构建数据集进行特征数据提取,得到用于构建第二划分节点的第二节点构建特征数据。示例性地,第二节点构建特征数据可包括广告投放方式,可将不同的投放方式进行数值化处理,进行划分。根据该第二节点构建特征数据构建第二划分节点,具体同为设置一划分阈值,可对第一划分节点划分的得到的二分类结果进行进一步地划分。
42.其中,第二划分节点的构建数据也可同样为目标用户的数据,对第一划分节点划分的得到的二分类结果进行进一步地划分,得到更为细致的划分结果。
43.如此,继续构建第一子模型的多级划分节点,直到第一子模型的划分节点层数达到预设的层数,完成多层划分节点的构建。进一步地,经过多层划分节点的多次二分类划分,可得到多个最终的分类结果,基于当前业务的经验,对多个最终的分类结果设置对应的决策结果。示例性地,若当前业务为广告投放业务的改进,则根据对应的分类结果,例如若某一分类结果中反映大学生目标用户的投放方式中的投放频率较大,收益较低,设置对应的决策结果为降低广告投放的频率。该决策结果的设置仅为示例,实际上可根据需求进行设置。在对全部的分类结果设置决策结果后,初步完成基于决策树的第一子模型的构建。
44.进一步地,对第一子模型内的多层划分节点进行后剪枝,提升第一子模型的性能,具体地,基于决策树原理,分析多个划分节点对于模型准确度的影响,对多层划分节点进行剪枝处理,提升模型性能,得到最终的第一子模型。
45.继续从多个贡献数据集合和多个辅助数据集合内有放回地随机抽取m个贡献数据集合和m个辅助数据集合,作为第二构建数据集,进行第二子模型的构建。第二子模型的构
建于第一子模型的构建过程类似,但用于构建第二子模型的构建数据集与第一子模型不同。
46.继续从多个贡献数据集合和多个辅助数据集合内有放回地随机抽取m个贡献数据集合和m个辅助数据集合,构建子模型,直到子模型的数量满足预设要求,该预设要求可自行设置。如此,构建的多个子模型基于不同的构建数据构建获得,由于每个子模型的构建数据较少,每个子模型的性能一般,但结合多个子模型,获得一个总模型,该总模型的输出结果集合多个子模型的输出结果,性能较好,准确率较高。
47.将构建获得的多个子模型通过输入层和输出层进行集成连接,获得上述的总数据协同分析模型,其内包括多个子模型,性能较好,在进行数据协同时,可将输入数据输入多个子模型中,结合多个子模型的输出结果,获得出现频率最大的一输出结果,作为总模型的输出结果进行输出,准确率较高。
48.本技术实施例通过基于集成学习,基于多个企业主体的贡献数据集合和辅助数据集合,构建总数据协同分析模型,能够进行准确率较高的数据协同工作。且由于基于集成学习构建的总数据协同分析模型内包括多个子模型,后续可根据各企业主体在数据协同中的贡献,分发包含不同数量子模型的模型,达到提升数据协同效果的技术效果。
49.s600:根据多个所述贡献数据集合和多个所述辅助数据集合内的数据量大小以及多个所述规模信息,通过所述协同区块链向各所述企业主体分发不同的数据协同分析模型,其中,不同的所述数据协同分析模型内包括不同数量的所述子模型;如图4所示,本技术实施例提供的方法中的步骤s600包括:s610:根据多个所述贡献数据集合和多个所述辅助数据集合内的数据大小以及多个所述规模信息的大小,对各所述企业主体进行权重分配,获得权重分配结果;s620:根据所述权重分配结果内各所述企业主体的权重值大小,在多个所述子模型内随机选取对应数量的所述子模型,获得多个子模型集合;s630:将多个子模型集合内的子模型进行集成,获得多个不同的所述数据协同分析模型。
50.其中,步骤s610包括:s611:根据多个所述规模信息的大小,获得对应的数据规模信息;s612:计算多个所述贡献数据集合和多个所述辅助数据集合内的数据量大小和多个所述数据规模信息的数据大小的比值,获得多个贡献参数;s613:根据多个所述贡献参数的大小,进行多次权重分配,获得多个子权重分配结果;s614:基于多个所述子权重分配结果,计算获得所述权重分配结果。
51.具体地,根据多个贡献数据集合和所述辅助数据集合内的数据大小,可获知各企业主体贡献的数据以及提取获得的辅助数据在当前的数据协同中贡献的数量规模,进而根据各企业主体的规模信息,可获知各企业主体在当前数据协同中所贡献数据占自身规模的占比,进而可获知各企业主体的付出程度。
52.具体地,根据多个企业主体的规模信息的大小,获得对应的各企业主体的数据规模信息,其中,若规模信息越大,企业主体规模越大,则数据规模信息越大,且可根据行业业务经验,根据企业主体规模获知对应的数据规模信息。
53.计算各企业主体贡献的贡献数据集合和采集获得的辅助数据集合内数据量大小和多个数据规模信息对应的数据量大小的比值,获得多个贡献参数。若贡献参数越大,则企业主体在当前数据协同中的辅助占自身数据贡献能力的占比越大。
54.进一步地,根据多个该贡献参数的大小,进行多次的权重分配,权重分配可采用现有技术中任意适用的权重分配方法进行分配,例如专家赋权法,基于多个专家进行多次分配,获得多个子权重分配结果,且多个子权重分配结果内的权重值不尽相同。可选的,也可基于不同的权重分配方法,进行多次权重分配,获得多个子权重分配结果。
55.基于该多个子权重分配结果,计算获得最终各贡献参数对应的权重值,具体地,计算各贡献参数在各子权重分配结果中的权重均值,获得最终的权重分配结果。如此,能够获得更为准确的权重分配结果,进而提升数据协同的效果。
56.根据该权重分配结果内各企业主体的贡献系数的权重值大小,在多个子模型内随机选取对应数量的子模型,获得多个子模型集合。对各企业主体对应的子模型集合内的多个子模型进行集成,获得多个不同的数据协同分析模型,分发给各企业主体。
57.具体地,权重分配结果中的权重值越大,则对应的子模型集合内的子模型的数量越大,则获得的对应的数据协同分析模型的模型性能越好,能够进行更为准确的业务工作。
58.本技术实施例基于企业主体在数据协同中付出的贡献数据集合以及辅助数据集合的数据量与自身数据规模的占比,进行权重分配,进一步进行模型的分发,能够根据企业主体的付出程度进行不同性能的模型的分发,进而能够使参与数据协同的各企业主体根据自身的付出程度进行不同效果的数据协同,能够提升数据协同的效果。
59.s700:各所述企业主体基于分发的所述数据协同分析模型,进行数据协同工作。
60.最终,各企业主体可基于对应的区块链节点获得分发的对应的数据协同分析模型,进行各自业务问题的分析解决,完成当前的数据协同工作。
61.综上所述,本技术实施例至少具有如下技术效果:本技术实施例基于互联网数据中心,根据各参与数据协同的企业主体的贡献数据的数据特征,提取辅助数据,以提升进行数据协同的数据维度和数据规模,提升数据协同工作的效果,还通过区块链技术,构建协同区块链,保证数据协同工作中的可信度,避免出现数据篡改等问题,且数据可溯源查询,并基于数据分布式存储,通过索引的方式调用数据,降低方法运行所需内存,还基于集成学习,构建包括多个子模型的总数据协同分析模型,然后根据各企业主体的贡献数据和辅助数据的数据量以及规模信息,确定各企业主体在当前数据协同中的付出规模,进而分发包括对应数量子模型的数据协同模型,作为数据协同的回报,本技术实施例解决了数据协同中的信任问题,并基于idc,提升数据协同的数据规模,以及根据各企业主体在数据协同的付出,分发对应的数据协同分析模型,达到提升数据协同效果的技术效果。
62.实施例二基于与前述实施例中一种基于区块链的idc数据协同方法相同的发明构思,如图5所示,本技术提供了一种基于区块链的idc数据协同系统,其中,所述系统包括:规模采集模块11,用于采集获取参与数据协同的多个企业主体的规模信息,其中,多个所述企业主体均通过至少一个互联网数据中心进行数据增值业务;贡献数据采集模块12,用于采集获取多个所述企业主体用于进行数据协同的贡献
数据,获得多个贡献数据集合;辅助数据采集模块13,用于提取获得多个所述贡献数据集合的贡献数据特征,在至少一个所述互联网数据中心内,根据所述贡献数据特征采集辅助数据,获得多个辅助数据集合;区块链构建模块14,用于在多个所述企业主体内构建区块链节点,基于多个所述贡献数据集合和多个所述辅助数据集合构建数据区块,基于多个所述区块链节点和多个所述数据区块,构建获得协同区块链;协同模型构建模块15,用于根据所述协同区块链,基于集成学习,构建总数据协同分析模型,其中,所述总数据协同分析模型内包括多个子模型;协同模型分发模块16,用于根据多个所述贡献数据集合和多个所述辅助数据集合内的数据量大小以及多个所述规模信息,通过所述协同区块链向各所述企业主体分发不同的数据协同分析模型,其中,不同的所述数据协同分析模型内包括不同数量的所述子模型;协同工作模块17,用于各所述企业主体基于分发的所述数据协同分析模型,进行数据协同工作。
63.进一步地,所述辅助数据采集模块用于实现以下功能:根据多个所述贡献数据集合,进行主因素提取,获得多个主因素提取结果;基于多个所述主因素提取结果,进行次因素提取,获得多个次因素提取结果,其中,每个所述主因素包括多个次因素;将多个所述主因素提取结果和多个所述次因素提取结果作为所述贡献数据特征。
64.进一步地,所述区块链构建模块用于实现如下功能:将多个所述贡献数据集合和多个所述辅助数据集合进行哈希算法处理,获得多个数据哈希值;将多个所述贡献数据集合和多个所述辅助数据集合,根据多个所述企业主体,进行分布式存储,获得多个存储地址;对多个存储地址进行映射处理,获得多个索引信息;对多个所述索引信息进行哈希算法处理,获得多个索引哈希值;根据多个所述索引信息、多个所述索引哈希值和多个所述数据哈希值,分别构建获得多个所述数据区块。
65.进一步地,所述协同模型构建模块用于实现如下功能:根据所述协同区块链,获得多个所述贡献数据集合和多个所述辅助数据集合;从多个所述贡献数据集合和多个所述辅助数据集合内有放回地随机抽取m个所述贡献数据集合和m个辅助数据集合,作为第一构建数据集,m为正整数;根据所述第一构建数据集,构建第一子模型;再次从多个所述贡献数据集合和多个所述辅助数据集合内有放回地随机抽取m个所述贡献数据集合和m个辅助数据集合,作为第二构建数据集;根据所述第二构建数据集,构建第二子模型;继续构建子模型,直至所述子模型的数量满足预设要求;将多个所述子模型进行集成,获得所述总数据协同分析模型。
66.其中,所述根据所述第一构建数据集,构建第一子模型,包括:
对所述第一构建数据集进行特征数据提取,获得第一节点构建特征数据;基于所述第一节点构建特征数据,构建所述第一子模型的第一划分节点;再次对所述第一构建数据集进行特征数据提取,获得第二节点构建特征数据;基于所述第二节点构建特征数据,构建所述第一子模型的第二划分节点;继续构建所述第一子模型的多级划分节点,直到所述第一子模型的划分节点层数达到预设层数;对所述第一子模型进行后剪枝,获得所述第一子模型。
67.进一步地,所述协同模型分发模块用于实现如下功能:根据多个所述贡献数据集合和多个所述辅助数据集合内的数据大小以及多个所述规模信息的大小,对各所述企业主体进行权重分配,获得权重分配结果;根据所述权重分配结果内各所述企业主体的权重值大小,在多个所述子模型内随机选取对应数量的所述子模型,获得多个子模型集合;将多个子模型集合内的子模型进行集成,获得多个不同的所述数据协同分析模型。
68.其中,权重分配,包括:根据多个所述规模信息的大小,获得对应的数据规模信息;计算多个所述贡献数据集合和多个所述辅助数据集合内的数据量大小和多个所述数据规模信息的数据大小的比值,获得多个贡献参数;根据多个所述贡献参数的大小,进行多次权重分配,获得多个子权重分配结果;基于多个所述子权重分配结果,计算获得所述权重分配结果。
69.本说明书和附图仅仅是本技术的示例性说明,且视为已覆盖本技术范围内的任意和所有修改、变化、组合或等同物。显然,本领域的技术人员可以对本技术进行各种改动和变型而不脱离本技术的范围。这样,倘若本技术的这些修改和变型属于本技术及其等同技术的范围之内,则本技术意图包括这些改动和变型在内。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献