一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

基于云端存储的档案的热度评估和更新方法与流程

2023-01-17 12:33:50 来源:中国专利 TAG:


1.本发明属于数据处理技术领域,具体涉及基于云端存储的档案的热度评估和更新方法。


背景技术:

2.随着云端存储以及通信技术的进一步发展,使得通过云端存储实现对电子档案的管理的方式成为可能,不仅解决了纸质档案占用大量房间、不宜保存的难题,而且解决了以往调阅纸质文档不宜查找的难题。“云存储”免费提供多区域多数据副本功能服务,实现了灾备安全存储,进一步降低了档案永久保存存储成本。
3.为了解决采用远端存储的方式实现对电子档案的管理,在授权发明专利授权公告号cn113192586b《一种基于云档案库的档案管理系统》中通过云档案库存储用户需要存储的档案资料,用户管理模块对用户进行认证以及获取用户的操作指令,档案管理模块根据用户的操作指令对档案进行管理,派发管理模块根据用户的操作指令对档案资料进行唯一派发,从而解决了现有的基于云档案库的档案管理的系统中所存在档案资料大量重复、占用大量的存储空间不利于工作人员的准确查找的问题,但是却存在以下技术问题:1、忽视了电子档案的热度的动态管理,不同的电子档案的点击次数、借阅次数、存储时间等反应电子档案的热度,若不能对电子档案的热度进行动态管理,从而会导致错误已经变为冷门的电子档案识别为热门档案,使得热门档案的查询和借阅效率都会受到影响,同时冷门档案的副本的过多存储也会导致存储资源的浪费。
4.2、在电子档案的备案的副本数量的确定过程中,忽视了同时将电子档案的热度与电子档案的类型同时作为电子档案的备份数量的考虑因素,仅仅考虑电子档案的热度或者电子档案的类型,都会导致电子档案的查询效率和存储资源的浪费。
5.基于上述技术问题,需要设计一种基于云端存储的档案的热度评估和更新方法。


技术实现要素:

6.本发明的目的是提供一种基于云端存储的档案的热度评估和更新方法为了解决上述技术问题,本发明第一方面提供了一种基于云端存储的档案的热度评估和更新方法,其特征在于,具体包括:s11基于电子档案的近三年的借阅次数、点击次数,以及所述电子档案的存储时间,采用基于gso算法优化的bp神经网络算法的基础热度预测模型,得到所述电子档案的基础热度;s12判断所述电子档案的基础热度是否大于第一热度阈值,若是,则将所述基础热度大于第一热度阈值的电子档案作为潜在热门档案,并进入步骤s13,若否,则将所述电子方案作为冷门电子档案,并将所述冷门电子档案的基础热度作为所述冷门电子档案的热度,基于所述冷门电子档案的热度、冷门电子档案的档案类型确定所述冷门电子档案的备份的副本数量;
s13基于所述潜在热门档案的近一月的借阅次数、点击次数,对所述潜在热门档案的基础热度进行修正,得到所述潜在热门档案的热度,并判断所述潜在热门档案的热度是否大于第二热度阈值,若是,则将热度大于第二热度阈值的潜在热门档案作为热门档案,并进入步骤s14,若否,则将所述潜在热门档案作为冷门电子档案,并基于所述冷门电子档案的热度、冷门电子档案的档案类型确定所述冷门电子档案的备份的副本数量;s14基于所述热门档案的热度、热门档案的档案类型确定所述热门档案的备份的副本数量。
7.通过基于电子档案的近三年的借阅次数、点击次数,以及所述电子档案的存储时间进行电子档案的基础热度的构建,从而充分集合了电子档案的受欢迎情况以及电子档案的存储时间,实现了从多角度对电子档案的基础热度的评价,也为进行电子档案的副本数量的确定奠定了基础。
8.通过第一热度阈值的设置,从而将基础热度较低的电子档案排除在外,进一步降低了进行进一步的热度的构建中系统处理的数量,进一步提升了处理的效率,保证了系统运行的可靠性和稳定性。
9.通过进一步结合近一月的借阅次数、点击次数,对所述潜在热门档案的基础热度进行修正,得到所述潜在热门档案的热度,从而实现了对潜在热门档案的实时更新,采用最近的数据保证了潜在热门档案的热度评价的可靠性以及识别的准确性。
10.通过基于所述热门档案的热度、热门档案的档案类型确定所述热门档案的备份的副本数量,从而使得副本数量的确定能够充分的考虑两方面的因素,在保证重要的档案类型的储存可靠性的同时,也促进了热度较高的档案的副本数量的需求,提升了档案检索借阅的效率。
11.进一步的技术方案在于,所述电子档案的基础热度的构建的具体步骤为:s21基于所述电子档案的近三年的借阅次数与所有电子档案的近三年的平均借阅次数的比值构建所述电子档案的借阅比、基于所述电子档案的近三年的点击次数与所有电子档案的近三年的平均点击次数得到所述电子档案的点击比;s22基于所述电子档案的借阅比与所述电子档案的点击比,得到所述电子档案的热度比,并判断所述电子档案的热度比是否第一阈值,若是,则进入步骤s23,若否,则将所述电子档案作为冷门电子档案,并将所述电子档案的基础热度设置为0,其中电子档案的基础热度的取值范围在0到1之间,基础热度的值越大,则所述电子档案的基础热度越高;s23基于所述电子档案的热度比、所述电子档案的存储时间构建输入集,采用基于gso算法优化的bp神经网络算法的基础热度优化预测模型,得到所述电子档案的基础热度。
12.通过借阅比、点击比、热度比的确定,从而使得在基础热度的构建中不仅仅考虑单一的档案的借阅数量、点击数量,而是充分考虑整体的点击数量和借阅数量,从而使得最终的基础热度的评估结果能够更加准确的反应电子档案的实际的基础热度。
13.通过第一阈值的设置,从而将热度较低的电子档案给排除在外,进一步降低了需要进行基础热度构建的电子档案的数量,提升了处理的效率。
14.通过热度比的构建,从而将借阅比以及点击比这两者结合起来,从而避免了从单一角度考虑借阅比或者点击比导致的准确度不高的技术问题,同时也降低了基础热度预测模型需要处理的数据的维度,进一步提升了效率。
15.进一步的技术方案在于,基于所述电子档案的借阅比与所述电子档案的点击比,采用基于层次分析法的模型,实现对所述电子档案的热度比的构建。
16.进一步的技术方案在于,第一热度阈值根据所有电子档案的基础热值的平均值、电子档案的数量进行确定,其中所述所有电子档案的基础热值的平均值越大,电子档案的数量越多,则所述第一热度阈值越大。
17.进一步的技术方案在于,所述档案类型至少包括国家机构档案、党派团体档案、企业单位档案、事业单位档案、名人档案;进一步的技术方案在于,确定所述冷门电子档案的备份的副本数量的具体步骤为:s31判断所述冷门电子档案的档案类型是否属于国家机构档案或者党派团体档案,若是,则按照所述热门档案的备份的副本数量的平均值确定所述冷门档案的备份的副本数量,若否,则进入步骤s32;s32基于所述冷门电子档案的档案类型,采用专家打分的形式,确定所述冷门电子档案的可靠度要求评分;s33基于所述冷门电子档案的可靠度要求评分、冷门电子档案的热度,构建所述冷门电子档案的备份重要性评分,并基于所述备份重要性评分的大小确定所述冷门电子档案的备份的副本数量。
18.通过可靠度要求评分的构建,从而实现了从数据角度对冷门电子档案的档案类型的解释,也使得最终的副本数量的确定变得更加的准确。
19.进一步的技术方案在于,潜在热门档案的热度构建的具体步骤为:s41基于潜在热门档案的近一月的借阅次数与所有电子档案的近一月的平均借阅次数的比值构建所述潜在热门档案的近期借阅比、基于所述潜在热门档案的近一月的点击次数与所有电子档案的近一月的平均点击次数得到所述潜在热门档案的近期点击比;s42基于所述潜在热门档案的近期借阅比与所述潜在热门档案的近期点击比,得到所述潜在热门档案的近期热度比,并判断所述潜在热门档案的近期热度比是否第二阈值,若是,则将所述潜在热门电子档案作为热门档案,并将所述潜在电子档案的热度设置为1,其中所述热度的取值范围在0到1之间,热度的值越大,则所述热度越高,若否,则进入步骤s43;s43基于所述潜在热门档案的近期热度比,潜在热门档案的基础热度,采用基于gso算法优化的bp神经网络算法的热度预测模型,得到所述潜在热门档案的热度进一步的技术方案在于,当所述热门档案的热度大于第三阈值或者所述热门档案的档案类型属于国家机构档案或者党派团体档案,则将所述热门档案的备份的副本数量设置为备份数量上限值。
20.另一方面,本发明提供了一种终端设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的程序,所述处理器执行所述程序时,实现上述的一种基于云端存储的档案的热度评估和更新方法。
21.另一方面,本发明提供了一种计算机存储介质,其上存储有计算机程序,当所述计算机程序在计算机中执行时,令计算机执行上述的一种基于云端存储的档案的热度评估和更新方法。
22.其他特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本发明而了解。本发明的目的和其他优点在说明书以及附图中所特别指出的结构来实现和获得。
23.为使本发明的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附附图,作详细说明如下。
附图说明
24.通过参照附图详细描述其示例实施方式,本发明的上述和其它特征及优点将变得更加明显。
25.图1是根据实施例1的一种基于云端存储的档案的热度评估和更新方法的流程图;图2是实施例2中的一种计算机存储介质的框架图。
具体实施方式
26.现在将参考附图更全面地描述示例实施方式。然而,示例实施方式能够以多种形式实施,且不应被理解为限于在此阐述的实施方式;相反,提供这些实施方式使得本发明将全面和完整,并将示例实施方式的构思全面地传达给本领域的技术人员。图中相同的附图标记表示相同或类似的结构,因而将省略它们的详细描述。
27.用语“一个”、“一”、“该”、“所述”用以表示存在一个或多个要素/组成部分/等;用语“包括”和“具有”用以表示开放式的包括在内的意思并且是指除了列出的要素/组成部分/等之外还可存在另外的要素/组成部分/等。
28.实施例1为解决上述问题,根据本发明的一个方面,如图1所示,提供了一种基于云端存储的档案的热度评估和更新方法,其特征在于,具体包括:s11基于电子档案的近三年的借阅次数、点击次数,以及所述电子档案的存储时间,采用基于gso算法优化的bp神经网络算法的基础热度预测模型,得到所述电子档案的基础热度;需要另外说明的是,当电子档案的存档时间不大于1年时,则直接将潜在热门档案的基础热度的平均值作为电子档案的平均值,不再进行电子档案的基础热度的构建。
29.需要另外说明的是,在实际的操作过程中可以采用基于神经网络算法或者层次分析法的方式,实现对电子档案的基础热度的构建。
30.需要另外说明的是,电子档案的基础热度的取值范围在0到1之间,电子档案的基础热度越高,则所述电子档案越受欢迎。
31.s12判断所述电子档案的基础热度是否大于第一热度阈值,若是,则将所述基础热度大于第一热度阈值的电子档案作为潜在热门档案,并进入步骤s13,若否,则将所述电子方案作为冷门电子档案,并将所述冷门电子档案的基础热度作为所述冷门电子档案的热度,基于所述冷门电子档案的热度、冷门电子档案的档案类型确定所述冷门电子档案的备份的副本数量;需要另外说明的是,若电子档案的基础热度为1时,则直接将所述电子档案的热度设置为1,不再进入步骤s13,并且将所述电子档案的备份的副本数量设置为备份数量上限
值,备份数量上限值至少为3。
32.需要另外说明的是,在实际操作时,可以首先冷门电子档案的档案类型,构建映射模型,得到档案类型所对应的最少的备份的副本数量,在此基础上,若冷门电子档案的热度小于一定的阈值,则采用最少的备份的副本数量,若大于或者等于一定的阈值,则再最少的备份的副本数量的基础上再加1。
33.s13基于所述潜在热门档案的近一月的借阅次数、点击次数,对所述潜在热门档案的基础热度进行修正,得到所述潜在热门档案的热度,并判断所述潜在热门档案的热度是否大于第二热度阈值,若是,则将热度大于第二热度阈值的潜在热门档案作为热门档案,并进入步骤s14,若否,则将所述潜在热门档案作为冷门电子档案,并基于所述冷门电子档案的热度、冷门电子档案的档案类型确定所述冷门电子档案的备份的副本数量;需要另外说明的是,在实际操作时,可以采用基于神经网络算法的方式,基于潜在热门档案的近一月的借阅次数、点击次数,构建输入集,得到修正因子,对电子档案的基础热度进行修正。
34.需要另外说明的是,当潜在热门档案的近一月的借阅次数或者点击次数超过一定的阈值,则不再对基础热度进行修正,直接将潜在人们档案的热度设置为1。
35.需要另外说明的是,第二热度阈值根据电子档案的数量、电子档案的平均热度进行构建,具体的可以采用专家打分或者经验模型的方式进行构建。
36.s14基于所述热门档案的热度、热门档案的档案类型确定所述热门档案的备份的副本数量。
37.需要另外说明的是,在实际的操作过程中,根据热门档案的档案类型确定一个最低的备份的副本数量,在此基础上,通过热门档案的热度的大小,分为至少两个以上的等级,在不同的等级下面,在最低的备份的副本数量的基础上再进行数量的增加。
38.通过基于电子档案的近三年的借阅次数、点击次数,以及所述电子档案的存储时间进行电子档案的基础热度的构建,从而充分集合了电子档案的受欢迎情况以及电子档案的存储时间,实现了从多角度对电子档案的基础热度的评价,也为进行电子档案的副本数量的确定奠定了基础。
39.通过第一热度阈值的设置,从而将基础热度较低的电子档案排除在外,进一步降低了进行进一步的热度的构建中系统处理的数量,进一步提升了处理的效率,保证了系统运行的可靠性和稳定性。
40.通过进一步结合近一月的借阅次数、点击次数,对所述潜在热门档案的基础热度进行修正,得到所述潜在热门档案的热度,从而实现了对潜在热门档案的实时更新,采用最近的数据保证了潜在热门档案的热度评价的可靠性以及识别的准确性。
41.通过基于所述热门档案的热度、热门档案的档案类型确定所述热门档案的备份的副本数量,从而使得副本数量的确定能够充分的考虑两方面的因素,在保证重要的档案类型的储存可靠性的同时,也促进了热度较高的档案的副本数量的需求,提升了档案检索借阅的效率。
42.在另外一种可能的实施例中,所述电子档案的基础热度的构建的具体步骤为:s21基于所述电子档案的近三年的借阅次数与所有电子档案的近三年的平均借阅次数的比值构建所述电子档案的借阅比、基于所述电子档案的近三年的点击次数与所有电
子档案的近三年的平均点击次数得到所述电子档案的点击比;需要另外说明的是,若电子档案的近三年的借阅次数为100次,所有电子档案的近三年的平均借阅次数为50次,则借阅比为2。
43.s22基于所述电子档案的借阅比与所述电子档案的点击比,得到所述电子档案的热度比,并判断所述电子档案的热度比是否第一阈值,若是,则进入步骤s23,若否,则将所述电子档案作为冷门电子档案,并将所述电子档案的基础热度设置为0,其中电子档案的基础热度的取值范围在0到1之间,基础热度的值越大,则所述电子档案的基础热度越高;需要另外说明的是,电子档案的热度比的计算公式为:其中b2为电子档案的借阅比,b3为电子档案的点击比,k1、k2、k3为常数。
44.s23基于所述电子档案的热度比、所述电子档案的存储时间构建输入集,采用基于gso算法优化的bp神经网络算法的基础热度优化预测模型,得到所述电子档案的基础热度。
45.需要另外说明的是,为提高gso算法的收敛性,设计步长随迭代次数动态衰减,动态步长的计算公式为:式中:s(t)是第t代的步长;s0是初始步长;t是当前迭代次数;iter_max是最大迭代次数,rand(10-3
,10-2
)为取值在10-2
到10-3
之间的随机函数,k4、k5为常数。
46.gso算法中选择移动的位置更新的计算公式为:gso算法中选择移动的位置更新的计算公式为:为萤火虫i与萤火虫j在第t代的欧氏距离,xi(t)第t代第i只萤火虫所处位置。
47.通过借阅比、点击比、热度比的确定,从而使得在基础热度的构建中不仅仅考虑单一的档案的借阅数量、点击数量,而是充分考虑整体的点击数量和借阅数量,从而使得最终的基础热度的评估结果能够更加准确的反应电子档案的实际的基础热度。
48.通过第一阈值的设置,从而将热度较低的电子档案给排除在外,进一步降低了需要进行基础热度构建的电子档案的数量,提升了处理的效率。
49.通过热度比的构建,从而将借阅比以及点击比这两者结合起来,从而避免了从单一角度考虑借阅比或者点击比导致的准确度不高的技术问题,同时也降低了基础热度预测模型需要处理的数据的维度,进一步提升了效率。
50.在另外一种可能的实施例中,基于所述电子档案的借阅比与所述电子档案的点击比,采用基于层次分析法的模型,实现对所述电子档案的热度比的构建。
51.在另外一种可能的实施例中,第一热度阈值根据所有电子档案的基础热值的平均
值、电子档案的数量进行确定,其中所述所有电子档案的基础热值的平均值越大,电子档案的数量越多,则所述第一热度阈值越大。
52.在另外一种可能的实施例中,所述档案类型至少包括国家机构档案、党派团体档案、企业单位档案、事业单位档案、名人档案;在另外一种可能的实施例中,确定所述冷门电子档案的备份的副本数量的具体步骤为:s31判断所述冷门电子档案的档案类型是否属于国家机构档案或者党派团体档案,若是,则按照所述热门档案的备份的副本数量的平均值确定所述冷门档案的备份的副本数量,若否,则进入步骤s32;需要另外说明的是,还可以根据设定好的国家机构档案或者党派团体档案备份的副本数量的要求,进行备份的副本数量的设置。
53.s32基于所述冷门电子档案的档案类型,采用专家打分的形式,确定所述冷门电子档案的可靠度要求评分;需要另外说明的是,可靠度要求评分的取值范围在0到1之间,可靠性要求评分越大,说明该档案类型对可靠性要求的更高。
54.s33基于所述冷门电子档案的可靠度要求评分、冷门电子档案的热度,构建所述冷门电子档案的备份重要性评分,并基于所述备份重要性评分的大小确定所述冷门电子档案的备份的副本数量。
55.需要另外说明的是,备案重要性评分可以采用基于神经网络算法的方式也可以通过基于层次分析法模型,或者采用基于经验公式的方式实现对备案重要性评分的构建。
56.需要另外说明的是,根据冷门点在档案的备份重要性评分,构建至少二个以上的等级,对于不同的等级,对应其相对应的备份的副本数量的具体要求。
57.通过可靠度要求评分的构建,从而实现了从数据角度对冷门电子档案的档案类型的解释,也使得最终的副本数量的确定变得更加的准确。
58.在另外一种可能的实施例中,潜在热门档案的热度构建的具体步骤为:s41基于潜在热门档案的近一月的借阅次数与所有电子档案的近一月的平均借阅次数的比值构建所述潜在热门档案的近期借阅比、基于所述潜在热门档案的近一月的点击次数与所有电子档案的近一月的平均点击次数得到所述潜在热门档案的近期点击比;s42基于所述潜在热门档案的近期借阅比与所述潜在热门档案的近期点击比,得到所述潜在热门档案的近期热度比,并判断所述潜在热门档案的近期热度比是否第二阈值,若是,则将所述潜在热门电子档案作为热门档案,并将所述潜在电子档案的热度设置为1,其中所述热度的取值范围在0到1之间,热度的值越大,则所述热度越高,若否,则进入步骤s43;s43基于所述潜在热门档案的近期热度比,潜在热门档案的基础热度,采用基于gso算法优化的bp神经网络算法的热度预测模型,得到所述潜在热门档案的热度在另外一种可能的实施例中,当所述热门档案的热度大于第三阈值或者所述热门档案的档案类型属于国家机构档案或者党派团体档案,则将所述热门档案的备份的副本数量设置为备份数量上限值。
59.实施例2
如图2所示,本发明提供了一种计算机存储介质,其上存储有计算机程序,当所述计算机程序在计算机中执行时,令计算机执行上述的一种基于云端存储的档案的热度评估和更新方法。
60.实施例3本发明提供了一种终端设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的程序,所述处理器执行所述程序时,实现上述的一种基于云端存储的档案的热度评估和更新方法。
61.在本技术所提供的几个实施例中,应该理解到,所揭露的系统和方法,也可以通过其它的方式实现。以上所描述的系统实施例仅仅是示意性的,例如,附图中的流程图和框图显示了根据本发明的多个实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或代码的一部分,模块、程序段或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现方式中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或动作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
62.另外,在本发明各个实施例中的各功能模块可以集成在一起形成一个独立的部分,也可以是各个模块单独存在,也可以两个或两个以上模块集成形成一个独立的部分。
63.功能如果以软件功能模块的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例方法的全部或部分步骤。而前述的存储介质包括:u盘、移动硬盘、只读存储器(rom,read-only memory)、随机存取存储器(ram,random access memory)、磁碟或者光盘等各种可以存储程序代码的介质。
64.以上述依据本发明的理想实施例为启示,通过上述的说明内容,相关工作人员完全可以在不偏离本项发明技术思想的范围内,进行多样的变更以及修改。本项发明的技术性范围并不局限于说明书上的内容,必须要根据权利要求范围来确定其技术性范围。
再多了解一些

本文用于创业者技术爱好者查询,仅供学习研究,如用于商业用途,请联系技术所有人。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献