一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种基于区域价值的边缘数据放置方法

2022-09-07 13:14:51 来源:中国专利 TAG:


1.本发明涉及边缘计算领域中的数据放置方法,特别是涉及一种基于区域价值的边缘数据放置方法。


背景技术:

2.云计算已经普遍应用,但是随着新兴的计算模式和需求,现有的云计算模型也开始暴露出它的不足。一直以来,大家都习惯于将资源集中存放于中心化的数据中心,每个数据中心里面的计算和存储资源也相对的集中和富足。然而与日益增长的计算和存储能力相比,基础网络带宽的发展几乎停滞不前。面对由用户产生的海量数据,网络带宽成为了制约云计算应用的最大瓶颈。而边缘计算的目标是在靠近数据输入或用户的地方提供计算、存储和网络带宽,在一定程度上缓解上述问题。
3.另外,现实世界中大部分的数据本身具有时间维度和空间维度的属性,并且数据的另外一些重要属性也具有时空同步性,这些特性对数据存储具有非常大的影响。大多数研究主要考虑单一方面,例如仅仅考虑用户访问频率随时间的变化,或仅仅对空间属性进行一定的考量,缺乏与数据时空特性上的结合。另外,数据的访问热度不仅仅是受单个区域的影响,区域间往往存在相互影响的情况。


技术实现要素:

4.本发明所要解决的技术问题是提供一种基于区域价值的边缘数据放置方法,能够结合数据区域价值特性进行导向放置。
5.本发明解决其技术问题所采用的技术方案是:提供一种基于区域价值的边缘数据放置方法,包括以下步骤:
6.(1)建立同一数据块在不同区域下的数据温度计算模型,得到数据温度值;
7.(2)基于所述数据温度值,结合pagerank思想计算同一数据块在不同区域的数据区域价值;
8.(3)根据所述数据区域价值对数据进行副本选择放置,获得在当前问题场景下最优的数据放置方案。
9.所述步骤(1)具体包括:
10.(11)根据点击观看次数、评论量、下载量和收藏量计算每个数据块的重要程度;
11.(12)根据所述每个数据块的重要程度计算每个数据块的相对权重;
12.(13)根据所述每个数据块的相对权重和数据温度的变化特征定义建立数据温度计算模型,并根据所述数据温度计算模型计算当前数据的温度值。
13.所述步骤(11)中通过xi=0.8*(dc d
t
dd) 0.2*df计算每个数据块的重要程度,其中,xi为第i个数据块的重要程度,dc为第i个数据块的点击观看次数,d
t
为第i个数据块的评论量,dd为第i个数据块的下载量,df为第i个数据块的收藏量。
14.所述步骤(12)中通过计算每个数据块的相对权重,其中,wi为第i个数据块的相对权重,xi为第i个数据块的重要程度,m表示数据块总数。
15.所述步骤(13)中数据温度计算模型为h=w*h0*e-kt
,其中,h表示当前数据的温度值,w表示当前数据块的相对权重,h0表示当前数据的初始温度,k表示衰减系数,t表示时间周期。
16.所述步骤(2)具体包括:
17.(21)针对目标区域计算其他区域到目标区域的距离;
18.(22)通过计算同一数据块在不同区域的数据区域价值,其中,v
in
为数据di在区域gn下的数据区域价值,h
ij
表示数据di在其他区域j的热度,分别表示数据di在其他区域j的经纬度和数据di在区域n下的经纬度,h
in
(n-1)表示区域n热度与除本身所在区域的个数的乘积。
19.所述步骤(3)具体包括:
20.(31)按照区域温度高低对计算得到的每个数据块在不同区域的数据区域价值进行排序;
21.(32)选择数据区域价值高的区域,并计算平均访问延迟是否满足要求;
22.(33)计算满足要求的放置成本,并选择成本最小的区域进行放置,得到在当前问题场景下最优的数据放置方案。
23.有益效果
24.由于采用了上述的技术方案,本发明与现有技术相比,具有以下的优点和积极效果:本发明首先提供了结合数据温度的数据区域价值的模型计算方法。根据数据区域价值有效筛选适合的区域数据减少不必要的资源消耗,同时进行延迟计算,得到满足延迟的数据副本。给出的数据放置方案既能够满足用户的服务质量要求,又能够有效降低成本。
附图说明
25.图1是本发明实施方式的流程图;
26.图2是本发明实施方式中目标区域r1的区域价值影响图;
27.图3是本发明实施方式在不同数据块块数下于一实施例中的成本对比图;
28.图4是本发明实施方式在不同数据块块数下于一实施例中的负载率对比图。
具体实施方式
29.下面结合具体实施例,进一步阐述本发明。应理解,这些实施例仅用于说明本发明而不用于限制本发明的范围。此外应理解,在阅读了本发明讲授的内容之后,本领域技术人员可以对本发明作各种改动或修改,这些等价形式同样落于本技术所附权利要求书所限定的范围。
30.本发明的实施方式涉及一种基于区域价值的边缘数据放置方法,如图1所示,包括以下步骤:
31.步骤a,建立并计算同一数据块在不同区域下的数据温度计算模型,具体包括以下步骤:
32.步骤a1、每个数据块di的重要程度xi由点击观看次数,评论量,下载量,收藏量进行评估计算,其中点击观看次数,评论量和下载量占0.8,收藏量占0.2比重,如下所示:
33.xi=0.8*(dc d
t
dd) 0.2*df34.上式中,dc是用户访问视频数据的点击次数;d
t
是用户对视频数据的评论量;dd表示用户对视频的下载量;df是用户对视频的收藏;
35.步骤a2、计算每个数据块di的相对权重wi,其是由步骤a1得到的该数据的重要程度xi相对其他数据所有重要程度的比值所决定,如下所示:
[0036][0037]
上式中,是由该数据的重要程度相对其他数据所有重要程度的比值所决定,其中,m表示数据块总数;
[0038]
步骤a3、根据步骤a2计算得到的数据的相对权重wi和数据温度的变化特征定义当前数据温度值,如下所示:
[0039]
h=w*h0*e-kt
[0040]
上式中,h为当前数据的温度值,w表示当前数据块的相对权重,h0表示初始温度,k为衰减系数,t表示时间周期。
[0041]
步骤b,基于所述数据温度值,结合pagerank思想计算同一数据块在不同区域的数据区域价值,具体包括:
[0042]
步骤b1,针对目标区域计算其他区域到目标区域的距离;
[0043]
步骤b2,根据步骤a3计算得到的数据温度值和步骤b1得到的区域见的距离,计算得到同一数据块在不同区域的数据区域价值,如下所示:
[0044][0045]
上式中,h
ij
表示数据di在其他区域j的热度,分别表示数据di在其他区域j的经纬度和数据di在区域n下的经纬度,h
in
(n-1)表示区域n热度与除本身所在区域的个数的乘积,v
in
为数据di在区域gn下的数据区域价值,即该数据di在其他区域对这个区域下的数据di产生的贡献总和,距离远的贡献比较小,距离近的贡献比较大。图2是目标区域r1的区域价值影响图。
[0046]
步骤c,根据所述数据区域价值对数据进行副本选择放置,获得在当前问题场景下最优的数据放置方案,具体包括:
[0047]
步骤c1,按照区域温度高低对步骤b2计算得到的每个数据块在不同区域的数据区域价值进行排序;
[0048]
步骤c2,选择数据区域价值高的区域,并计算平均访问延迟是否满足要求;
[0049]
步骤c3,计算满足要求的放置成本,并选择成本最小的区域进行放置,得到在当前问题场景下最优的数据放置方案。
[0050]
图3是本发明实施方式在不同数据块块数下于一实施例中的成本对比图;图4是本发明实施方式在不同数据块块数下于一实施例中的负载率对比图。通过图3和图4可以发现本发明能够满足用户延迟要求的同时,能够有效的降低成本。
[0051]
不难发现,本发明提供了温度概念及其计算模型,在此基础上受pagerank思想的激发提出两个规则:规则1)数据本身温度越高,产生的价值越大,这个区域给其他区域的贡献就越大;规则2)区域距离目标区域越远,对它产生的目标价值就越小。根据上述两个规则计算数据区域价值。同时,本发明提出一种基于区域价值的数据放置算法,可以得到满足用户延迟响应下成本最低的数据放置方案,该数据放置方案既能够满足用户的服务质量要求,又能够有效降低成本。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献