一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

基于网络大数据的用户数据分布式云存储方法及系统与流程

2022-04-06 19:43:39 来源:中国专利 TAG:


1.本发明涉及云存储技术领域,具体为一种基于网络大数据的用户数据分布式云存储方法及系统。


背景技术:

2.云存储是指通过集群应用、网格技术或分布式文件系统等功能,网络中大量各种不同类型的存储设备通过应用软件集合起来协同工作,共同对外提供数据存储和业务访问功能的一个系统,保证数据的安全性,并节约存储空间。使用者可以在任何时间、任何地方,透过任何可连网的装置连接到云存储上,从而方便地存取数据。
3.随着科技技术的发展,云存储空间的种类越来越多,有的用户会同时使用好几个云存储空间,如何实现用户数据的合理化存储是急需解决的问题。


技术实现要素:

4.本发明的目的在于提供一种基于网络大数据的用户数据分布式云存储方法及系统,以解决上述背景技术中提出的问题。
5.为了解决上述技术问题,本发明提供如下技术方案:一种基于网络大数据的用户数据分布式云存储方法,所述云存储方法包括以下步骤:
6.预先对用户所用的各个云存储空间进行分类,其中,云存储空间的类型包括第一空间和第二空间,
7.获取用户当前所用应用的类型,所述应用的类型包括第一类型和第二类型,
8.如果当前所用应用的类型为第一类型,将用户使用当前应用所产生的数据存入第一空间,
9.如果当前所用应用的类型为第二类型,将用户使用当前应用所产生的数据存入第二空间。
10.进一步的,所述预先对用户所用的各个云存储空间进行分类包括:
11.获取历史中用户主动将数据信息上传各个云存储空间的上传次数e,对某个云存储空间的上传次数进行归一化处理得到该个云存储空间的第一指数x,
12.采集所有云存储空间中的活跃信息个数fy,其中,活跃信息为云存储空间中最近第一时间段内用户访问过的信息,那么某个云存储空间的第二指数y=ly/fy,其中,ly为该个云存储空间中的活跃信息个数;
13.设存在两个云存储空间分别为迁出空间和迁入空间,当用户将某个数据信息从迁出空间迁移到迁入空间,那么该次迁移为迁入空间的候选迁移,该个数据信息为候选信息,如果在候选信息从迁出空间迁移到迁入空间后的第二时间段内检测到用户在迁入空间上访问候选信息,则该次候选迁移为迁入空间的有效迁移;
14.那么某个云存储空间的第三指数z=rz/gz,其中,rz为该个云存储空间的有效迁移次数,gz为该个云存储空间的候选迁移次数,
15.计算某个云存储空间的标签指数q=0.42*x 0.38*y 0.2*z;
16.将各个云存储空间的标签指数与标签阈值进行比较,如果某个云存储空间的标签指数大于标签阈值,那么该云存储空间为第一空间,否则,该云存储空间为第二空间。
17.进一步的,所述获取用户当前所用应用的类型包括以下:
18.设当前所用应用为待分析应用,获取用户最近预设时间段内的应用使用信息,
19.计算待分析应用的地点指数其中,m为最近预设时间段内用户使用过应用的地点的个数,d为最近预设时间段内用户在不同的地点使用应用的总次数,di为最近预设时间段内用户在第i个地点使用应用的总次数,hi为最近预设时间段内用户在第i个地点使用待分析应用的总时长,hi为最近预设时间段内用户在第i个地点使用应用时的总时长,
20.如果待分析应用的地点指数大于地点阈值,那么该应用的类型为第一类型,否则,该应用的类型为第二类型。
21.进一步的,所述该个云存储空间的第一指数x=(e-emin)/(emax-emin),其中,emin为各个云存储空间的上传次数的最小值,emax为各个云存储空间的上传次数的最大值。
22.一种基于网络大数据的用户数据分布式云存储系统,所述云存储系统包括云存储空间分类模块、应用类型获取模块、第一存储控制模块和第二存储控制模块,所述云存储空间分类模块预先对用户所用的各个云存储空间进行分类,其中,云存储空间的类型包括第一空间和第二空间,所述应用类型获取模块获取用户当前所用应用的类型,所述应用的类型包括第一类型和第二类型,在当前所用应用的类型为第一类型,所述第一存储控制模块将用户使用当前应用所产生的数据存入第一空间,在当前所用应用的类型为第二类型,所述第二存储控制模块将用户使用当前应用所产生的数据存入第一空间。
23.进一步的,所述云存储空间分类模块包括第一指数获取模块、第二指数获取模块、第三指数获取模块、标签指数计算模块和标签指数比较模块,所述第一指数获取模块获取历史中用户主动将数据信息上传各个云存储空间的上传次数e,对某个云存储空间的上传次数进行归一化处理得到该个云存储空间的第一指数x=(e-emin)/(emax-emin),其中,emin为各个云存储空间的上传次数的最小值,emax为各个云存储空间的上传次数的最大值,所述第二指数获取模块采集所有云存储空间中的活跃信息个数fy,其中,活跃信息为云存储空间中最近第一时间段内用户访问过的信息,那么某个云存储空间的第二指数y=ly/fy,其中,ly为该个云存储空间中的活跃信息个数,所述第三指数获取模块根据某个云存储空间的信息迁移情况计算该个云存储空间的第三指数,所述标签指数计算模块计算某个云存储空间的标签指数q=0.42*x 0.38*y 0.2*z,所述标签指数比较模块将各个云存储空间的标签指数与标签阈值进行比较,如果某个云存储空间的标签指数大于标签阈值,那么该云存储空间为第一空间,否则,该云存储空间为第二空间。
24.进一步的,所述应用类型获取模块包括应用使用信息获取模块、地点指数计算模块和地点指数比较模块,所述应用使用信息获取模块设当前所用应用为待分析应用,获取用户最近预设时间段内的应用使用信息,所述地点指数计算模块计算待分析应用的地点指数数其中,m为最近预设时间段内用户使用过应用的地点的个数,d为最近预
设时间段内用户在不同的地点使用应用的总次数,di为最近预设时间段内用户在第i个地点使用应用的总次数,hi为最近预设时间段内用户在第i个地点使用待分析应用的总时长,hi为最近预设时间段内用户在第i个地点使用应用时的总时长,所述地点指数比较模块将待分析应用的地点指数与地点阈值进行比较,如果待分析应用的地点指数大于地点阈值,那么该应用的类型为第一类型,否则,该应用的类型为第二类型。
25.进一步的,所述第三指数获取模块包括候选迁移判断模块、有效迁移判断模块和第三指数计算模块,所述候选迁移判断模块设存在两个云存储空间分别为迁出空间和迁入空间,当用户将某个数据信息从迁出空间迁移到迁入空间,那么该次迁移为迁入空间的候选迁移,该个数据信息为候选信息,所述有效迁移判断模块在检测到在候选信息从迁出空间迁移到迁入空间后的第二时间段内检测到用户在迁入空间上访问候选信息,则判断该次候选迁移为迁入空间的有效迁移,所述第三指数计算模块计算某个云存储空间的第三指数z=rz/gz,其中,rz为该个云存储空间的有效迁移次数,gz为该个云存储空间的候选迁移次数。
26.与现有技术相比,本发明所达到的有益效果是:本发明预先通过用户使用各个云存储空间的情况对云存储空间进行分类,通过用户对各个应用软件的使用情况对应用软件进行分类,从而实现用户数据的智能云存储,便于用户后续从云存储空间访问相应的用户数据,提高用户的使用体验。
附图说明
27.附图用来提供对本发明的进一步理解,并且构成说明书的一部分,与本发明的实施例一起用于解释本发明,并不构成对本发明的限制。在附图中:
28.图1是本发明基于网络大数据的用户数据分布式云存储系统的模块示意图。
具体实施方式
29.下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
30.请参阅图1,本发明提供技术方案:一种基于网络大数据的用户数据分布式云存储方法,所述云存储方法包括以下步骤:
31.预先对用户所用的各个云存储空间进行分类,其中,云存储空间的类型包括第一空间和第二空间,
32.所述预先对用户所用的各个云存储空间进行分类包括:
33.获取历史中用户主动将数据信息上传各个云存储空间的上传次数e,对某个云存储空间的上传次数进行归一化处理得到该个云存储空间的第一指数x=(e-emin)/(emax-emin),其中,emin为各个云存储空间的上传次数的最小值,emax为各个云存储空间的上传次数的最大值,当用户主动上传数据信息道某个云存储空间的次数越多,说明用户越习惯于使用该云存储空间,那么该云存储空间的使用频率相对较高;
34.采集所有云存储空间中的活跃信息个数fy,其中,活跃信息为云存储空间中最近
第一时间段内用户访问过的信息,那么某个云存储空间的第二指数y=ly/fy,其中,ly为该个云存储空间中的活跃信息个数;某个云存储空间的活跃信息个数越多,说明用户使用该云存储空间的频率相对较高;
35.设存在两个云存储空间分别为迁出空间和迁入空间,当用户将某个数据信息从迁出空间迁移到迁入空间,那么该次迁移为迁入空间的候选迁移,该个数据信息为候选信息,如果在候选信息从迁出空间迁移到迁入空间后的第二时间段内检测到用户在迁入空间上访问候选信息,则该次候选迁移为迁入空间的有效迁移;
36.那么某个云存储空间的第三指数z=rz/gz,其中,rz为该个云存储空间的有效迁移次数,gz为该个云存储空间的候选迁移次数,当某个云存储空间的第三指数越大,说明用户喜欢在该存储空间上访问信息;
37.计算某个云存储空间的标签指数q=0.42*x 0.38*y 0.2*z;
38.将各个云存储空间的标签指数与标签阈值进行比较,如果某个云存储空间的标签指数大于标签阈值,那么该云存储空间为第一空间,否则,该云存储空间为第二空间;当标签指数越高,说明用户使用的几率越高,将使用几率较高的云存储空间作为第一空间;
39.获取用户当前所用应用的类型,所述应用的类型包括第一类型和第二类型,
40.所述获取用户当前所用应用的类型包括以下:
41.设当前所用应用为待分析应用,获取用户最近预设时间段内的应用使用信息,
42.计算待分析应用的地点指数其中,m为最近预设时间段内用户使用过应用的地点的个数,d为最近预设时间段内用户在不同的地点使用应用的总次数,di为最近预设时间段内用户在第i个地点使用应用的总次数,hi为最近预设时间段内用户在第i个地点使用待分析应用的总时长,hi为最近预设时间段内用户在第i个地点使用应用时的总时长,本技术考虑到用户在异地的情况下出现需要访问下载相关用户数据的几率较高,基于此来获取各个待分析应用的地点指数,进一步的,在实际中还可以将其限制为在不同的地点通过非常用终端时使用应用的情况;当某个待分析应用的地点指数比较高的时候,用户待分析应用的使用分布地点相对较广,待分析应用的使用时间相对较长,那么用户在异地需要获取待分析应用的相关数据的几率较大,所以将地点指数较大的应用的用户数据存入第一空间;比如最近预设时间段内用户的应用使用情况依次如下:
43.1、地点1:使用各应用软件及使用时长情况如下:应用a10分钟,应用b30分钟,应用c1分钟;
44.2、地点2:使用各应用软件及使用时长情况如下:应用a5分钟,应用b60分钟,应用d10分钟;
45.3、地点1:使用各应用软件及使用时长情况如下:应用a15分钟,应用b40分钟,应用c1分钟,d6分钟;
46.如果待分析应用为应用b,那么最近预设时间段内用户使用过应用的地点1和地点2,m=2,最近预设时间段内用户在不同的地点使用应用的总次数d=3,在地点1使用过两次应用软件,所以第1个地点所对应的d1=2,在地点2使用过1次应用软件,所以第2个地点所对应的d2=1,h1=30 40=70,h2=60,h1=10 30 1 15 40 1 6=103,h2=5 60 10=75;
47.如果待分析应用为应用c,那么最近预设时间段内用户使用过应用的地点1和地点
2,m=2,最近预设时间段内用户在不同的地点使用应用的总次数d=3,在地点1使用过两次应用软件,所以第1个地点所对应的d1=2,在地点2使用过1次应用软件,所以第2个地点所对应的d2=1,h1=1 1=2,h2=0,h1=10 30 1 15 40 1 6=103,h2=5 60 10=75;
48.如果待分析应用的地点指数大于地点阈值,那么该应用的类型为第一类型,否则,该应用的类型为第二类型。
49.如果当前所用应用的类型为第一类型,将用户使用当前应用所产生的数据存入第一空间;
50.如果当前所用应用的类型为第二类型,将用户使用当前应用所产生的数据存入第二空间。
51.一种基于网络大数据的用户数据分布式云存储系统,所述云存储系统包括云存储空间分类模块、应用类型获取模块、第一存储控制模块和第二存储控制模块,所述云存储空间分类模块预先对用户所用的各个云存储空间进行分类,其中,云存储空间的类型包括第一空间和第二空间,所述应用类型获取模块获取用户当前所用应用的类型,所述应用的类型包括第一类型和第二类型,在当前所用应用的类型为第一类型,所述第一存储控制模块将用户使用当前应用所产生的数据存入第一空间,在当前所用应用的类型为第二类型,所述第二存储控制模块将用户使用当前应用所产生的数据存入第一空间。
52.所述云存储空间分类模块包括第一指数获取模块、第二指数获取模块、第三指数获取模块、标签指数计算模块和标签指数比较模块,所述第一指数获取模块获取历史中用户主动将数据信息上传各个云存储空间的上传次数e,对某个云存储空间的上传次数进行归一化处理得到该个云存储空间的第一指数x=(e-emin)/(emax-emin),其中,emin为各个云存储空间的上传次数的最小值,emax为各个云存储空间的上传次数的最大值,所述第二指数获取模块采集所有云存储空间中的活跃信息个数fy,其中,活跃信息为云存储空间中最近第一时间段内用户访问过的信息,那么某个云存储空间的第二指数y=ly/fy,其中,ly为该个云存储空间中的活跃信息个数,所述第三指数获取模块根据某个云存储空间的信息迁移情况计算该个云存储空间的第三指数,所述标签指数计算模块计算某个云存储空间的标签指数q=0.42*x 0.38*y 0.2*z,所述标签指数比较模块将各个云存储空间的标签指数与标签阈值进行比较,如果某个云存储空间的标签指数大于标签阈值,那么该云存储空间为第一空间,否则,该云存储空间为第二空间。
53.所述应用类型获取模块包括应用使用信息获取模块、地点指数计算模块和地点指数比较模块,所述应用使用信息获取模块设当前所用应用为待分析应用,获取用户最近预设时间段内的应用使用信息,所述地点指数计算模块计算待分析应用的地点指数其中,m为最近预设时间段内用户使用过应用的地点的个数,d为最近预设时间段内用户在不同的地点使用应用的总次数,di为最近预设时间段内用户在第i个地点使用应用的总次数,hi为最近预设时间段内用户在第i个地点使用待分析应用的总时长,hi为最近预设时间段内用户在第i个地点使用应用时的总时长,所述地点指数比较模块将待分析应用的地点指数与地点阈值进行比较,如果待分析应用的地点指数大于地点阈值,那么该应用的类型为第一类型,否则,该应用的类型为第二类型。
54.所述第三指数获取模块包括候选迁移判断模块、有效迁移判断模块和第三指数计
算模块,所述候选迁移判断模块设存在两个云存储空间分别为迁出空间和迁入空间,当用户将某个数据信息从迁出空间迁移到迁入空间,那么该次迁移为迁入空间的候选迁移,该个数据信息为候选信息,所述有效迁移判断模块在检测到在候选信息从迁出空间迁移到迁入空间后的第二时间段内检测到用户在迁入空间上访问候选信息,则判断该次候选迁移为迁入空间的有效迁移,所述第三指数计算模块计算某个云存储空间的第三指数z=rz/gz,其中,rz为该个云存储空间的有效迁移次数,gz为该个云存储空间的候选迁移次数。
55.需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。
56.最后应说明的是:以上所述仅为本发明的优选实施例而已,并不用于限制本发明,尽管参照前述实施例对本发明进行了详细的说明,对于本领域的技术人员来说,其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献