一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种基于分布式文件系统的文件布局更新系统及方法与流程

2022-07-23 08:16:51 来源:中国专利 TAG:


1.本发明涉及文件布局更新系统技术领域,具体为一种基于分布式文件系统的文件布局更新系统及方法。


背景技术:

2.文件的保存是指将文件数据映射到存储设备的存储位置上,随着信息技术的发展,线上办工已经成为了常态,通常来说线上办工会有大量的文件资料产生,而办工过程中所产生的新的文件资料都是极为重要的,因此需要对新文件进行及时的保存和更新;
3.现有的文件保存方式多数需要手动找到所需文件路径位置保存或修改文件路径保存,由于是手动保存,导致容易出现文件保存耗时耗力、文件保存路径错误、并且由于系统中文件数量庞大,使得文件归类整理极易出现混乱,同时使得查找所需文件耗费时间过大;
4.因此,需要一种基于分布式文件系统的文件布局更新系统及方法来解决上述问题。


技术实现要素:

5.本发明的目的在于提供一种基于分布式文件系统的文件布局更新系统及方法,以解决上述背景技术中提出的问题。
6.为实现上述目的,本发明提供如下技术方案:一种基于分布式文件系统的文件布局更新系统,该文件布局更新系统包括存储文件输入模块、关键词提取模块、关键词对比模块、位置搜寻模块、保存选择模块;
7.使得将用户需要更新的文件内容能够快速保存到系统中相对应的位置,进行文件的更新保存;
8.所述存储文件输入模块用于将用户需要更新的文件内容输入文件布局更新系统;
9.所述关键词提取模块用于将用户更新的文件内容和原系统所含有的内容进行关键词的选择并提取;所述原系统指的是用户没有输入需要更新的文件内容前的系统;
10.所述关键词对比模块用于将用户更新文件内容的关键词与原系统所含有的内容关键词进行比对;
11.所述位置搜寻模块用于将用户需要更新的文件在系统中进行最优保存位置查找;
12.所述保存选择模块用于在找到最优保存位置后,将用户更新的文件内容选择储存到对应的位置,进行文件的保存和更新;
13.所述关键词提取模块的输出端连接关键词比对模块的输入端,所述关键词比对模块的输出端连接位置搜寻模块的输入端,所述位置搜索模块的输出端连接保存选择模块的输入端。
14.根据上述技术方案,所述存储文件输入模块采用键盘输入、鼠标拖曳输入、语音输入、文字识别输入、图片识别输入、账户同步输入、局域网输入其中的至少一种,使得文件输
入方式具有多元化,方便用户输入所需文件更加便捷、快速、准确。
15.根据上述技术方案,所述关键词提取模块是基于统计特征的关键词提取,利用print函数将更新文件中的关键词和原系统中的关键词以总数量的方式提取出来,使得关键词可以快速、准确的提取出来。
16.根据上述技术方案,所述关键词对比模块包括坐标系建立单元、关键词赋予单元、向量提取单元、相似度比较单元;
17.所述坐标系建立单元用于将提取出来的两组关键词放入相同的参考系中;
18.使得提取出来的两组关键词处理计算比较起来更加的方便、直观;
19.所述关键词赋予单元用于将两组关键词依据关键词的数量分别放在所建坐标系中对应的位置;
20.所述向量提取单元用于分别将坐标系中两组关键词的位置以坐标的形式得出,并对同一坐标系中两两关键词做向量计算;
21.使得提取出来的两组关键词组能够快速进行相似度计算;
22.所述相似度比较单元,用于将两坐标系中相同两两关键词向量进行计算;
23.使得提取出来的两组关键词进行快速的相似度比较;
24.关键词赋予单元的输出端连接向量提取单元的输入端,向量提取单元的输出端连接相似度比较单元的输入端。
25.根据上述技术方案,所述位置搜寻模块用于将所得到的相似度进行匹配,需要更新的文件在系统中进行最优保存位置查找,使得将需要保存更新的文件能够在原系统内快速找到最合适的保存位置。
26.根据上述技术方案,所述保存选择模块用于在找到最优保存位置后,将用户更新的文件内容选择储存到对应的位置,进行文件的保存和更新,使得可以实现文件的快速保存,同时可以根据实际情况进行文件选择储存,方便用户选择,满足用户多样化要求。
27.基于分布式文件系统的文件布局更新方法,其特征在于:所述文件布局更新方法执行如下步骤:
28.z01:print函数对新文件内容和系统中的文件内容进行关键词的提取,并得到关键词的数量;
29.z02:以坐标系作为参考系,将所提取出的两份关键词分别在坐标系中进行定位并赋予坐标值,分别求出两两关键词的坐标向量,将新文件内容的关键词向量与系统中文件关键词向量进行相似度比对,找出相似度高的文件;
30.z03:将新的文件内容存储进搜寻到的文件中并保存。
31.根据上述技术方案,在步骤z02中所述分别求出的两两关键词的坐标向量,若更新后文件内容关键词用坐标(xi,yi)表示,则所有更新后文件内容关键词坐标可用集合p={(x1,y1),(x2,y2),......(xn,yn)}表示,两两关键词之间的向量系统中文件内容关键词用坐标(xk,yk)表示,则所有系统中文件内容关键词坐标可用集合q={(x1,y1),(x2,y2),......(xn,yn)}表示,两两关键词之间的向量
32.更新后关键词和系统中关键词的相似度为:
[0033][0034]
当cos(θ)≥α时,表示用户输入新文件的内容的关键词组和新文件未输入前系统中所含有的内容中的关键词的相似度很高,可以查找到输入文件保存的最优位置;
[0035]
当cos(θ)<α时,表示用户输入新文件的内容的关键词组和新文件未输入前系统中所含有的内容中的关键词的相似度很低,查找不到输入文件保存的最优位置。
[0036]
根据上述技术方案,在步骤z03中利用save函数进行覆盖和保存;
[0037]
使得用户输入的文件可以在系统中实现自动更新保存。
[0038]
通过上述技术方案,可以在系统中通过多种方法输入需要保存的文件,系统通过关键词提取对比等算法找到关键词相似度高的文件的位置即最优文件保存位置,通过弹出弹窗请求是否自动保存到该位置或者选择保存到其他文件位置下,节省了手动保存文件的时间,同时防止文件布局出现混乱。
[0039]
与现有技术相比,本发明所达到的有益效果是:
[0040]
1.本次发明设置坐标系建立单元、关键词赋予单元、向量提取单元、相似度比较单元,使得可以将用户新文件内容的关键词与原系统所含有的内容关键词进行快速比对,通过算法计算出关键词相似度,根据关键词相似度的程度,可以快速得到用户更新文件内容在原系统中最适合保存的位置。
[0041]
2.本次发明设置保存选择模块,利用弹窗提醒用户文件保存的位置以及提供给用户保存到其他文件下的选择,根据用户需要保存更新文件位置意愿,选择保存文件位置,不仅避免了文件归类整理出现混乱,可以更加满足用户的需求。
附图说明
[0042]
附图用来提供对本发明的进一步理解,并且构成说明书的一部分,与本发明的实施例一起用于解释本发明,并不构成对本发明的限制。在附图中:
[0043]
图1是本发明一种基于分布式文件系统的文件布局更新系统的模块组成结构示意图;
[0044]
图2是本发明一种基于分布式文件系统的文件布局更新方法的步骤流程示意图;
[0045]
图3是本发明一种基于分布式文件系统的文件布局更新系统的连接结构示意图。
具体实施方式
[0046]
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
[0047]
如图1~图3所示,本发明提供以下技术方案,一种基于分布式文件系统的文件布局更新系统,该文件布局更新系统包括存储文件输入模块、关键词提取模块、关键词对比模块、位置搜寻模块、保存选择模块;
[0048]
使得将用户需要更新的文件内容能够快速保存到系统中相对应的位置,进行文件的更新保存;
[0049]
所述存储文件输入模块用于将用户需要更新的文件内容输入文件布局更新系统;
[0050]
所述关键词提取模块用于将用户更新的文件内容和原系统所含有的内容进行关键词的选择并提取;
[0051]
所述关键词对比模块用于将用户更新文件内容的关键词与原系统所含有的内容关键词进行比对;
[0052]
所述位置搜寻模块用于将用户需要更新的文件在系统中进行最优保存位置查找;
[0053]
所述保存选择模块用于在找到最优保存位置后,将用户更新的文件内容选择储存到对应的位置,进行文件的保存和更新;
[0054]
所述关键词提取模块的输出端连接关键词比对模块的输入端,所述关键词比对模块的输出端连接位置搜寻模块的输入端,所述位置搜索模块的输出端连接保存选择模块的输入端。
[0055]
所述存储文件输入模块采用键盘输入、鼠标拖曳输入、语音输入、文字识别输入、图片识别输入、账户同步输入、局域网输入其中的至少一种,例如用户在上传文件的时候可以通过局域网输入文件,在同一个局域网内,也就是两台电脑的ip地址在同一个网段内实现一台电脑上的文件传输到另一台电脑上,实现文件在系统内的输入。
[0056]
所述关键词提取模块是基于统计特征的关键词提取,利用print函数对用户输入的新文件内容和新文件未输入前系统中的文件内容的关键词以总数量的方式提取出来,使得提取出来的关键词数量多且快速准确,例如提取出用户输入的文件内容和新文件未输入前系统所含有的所有内容的所有关键词及其数量。
[0057]
根据上述技术方案,所述关键词对比模块包括坐标系建立单元、关键词赋予单元、向量提取单元、相似度比较单元;
[0058]
所述坐标系建立单元用于将提取出来的两组关键词放入相同的参考系中;
[0059]
使得提取出来的两组关键词处理计算比较起来更加的方便、直观;
[0060]
所述关键词赋予单元用于将两组关键词依据关键词的数量分别放在所建坐标系中对应的位置;
[0061]
所述向量提取单元用于分别将坐标系中两组关键词的位置以坐标的形式得出,并对同一坐标系中两两关键词做向量计算;
[0062]
使得提取出来的两组关键词组能够快速进行相似度计算;
[0063]
所述相似度比较单元,用于将两坐标系中相同两两关键词向量进行计算;
[0064]
使得提取出来的两组关键词进行快速的相似度比较;
[0065]
关键词赋予单元的输出端连接向量提取单元的输入端,向量提取单元的输出端连接相似度比较单元的输入端。
[0066]
所述位置搜寻模块用于将所得到的相似度进行匹配,需要更新的文件在系统中进行最优保存位置查找,使得将需要保存更新的文件能够在原系统内快速找到最合适的保存位置。
[0067]
所述保存选择模块用于在找到最优保存位置后,将用户更新的文件内容选择储存到对应的位置,进行文件的保存和更新,使得可以实现文件的快速保存,同时可以根据实际情况进行文件选择储存,方便用户选择,满足用户多样化要求,例如用户输入文件内容,系统通过关键词提取、对比等算法找出关键词相似度最高的文件位置即最优文件保存位置并
弹出弹窗提醒用户文件保存的位置以及供用户选择是否保存在最优文件保存位置下,或选择保存在其他关键词相似度较高的文件位置下或另存为一个新文件,以便满足用户多样性的要求。
[0068]
基于分布式文件系统的文件布局更新方法,其特征在于:所述文件布局更新方法执行如下步骤:
[0069]
z01:print函数对新文件内容和系统中的文件内容进行关键词的提取,并得到关键词的数量;
[0070]
z02:以坐标系作为参考系,将所提取出的两份关键词分别在坐标系中进行定位并赋予坐标值,分别求出两两关键词的坐标向量,将新文件内容的关键词向量与系统中文件关键词向量进行相似度比对,找出相似度高的文件;所述的两两关键词坐标指的是根据新文件内容的关键词的数量和原系统中文件关键词数量赋予坐标,例如,新文件内容的提取的关键词为薪资,数量为5,则赋予x为5,y为2,新文件内容的提取的关键词坐标为(5,2),原系统中文件中提取的关键词为收入,数量为8,则赋予x为8,y为5,原系统中文件中提取的关键词坐标为(8,5);
[0071]
z03:将新的文件内容存储进搜寻到的文件中并保存。
[0072]
在步骤z02中所述分别求出的两两关键词的坐标向量,若更新后文件内容关键词用坐标(xi,yi)表示,则所有更新后文件内容关键词坐标可用集合p={(x1,y1),(x2,y2),......(xn,yn)}表示,两两关键词之间的向量系统中文件内容关键词用坐标(xk,yk)表示,则所有系统中文件内容关键词坐标可用集合q={(x1,y1),(x2,y2),......(xn,yn)}表示,两两关键词之间的向量
[0073]
更新后关键词和系统中关键词的相似度为:
[0074][0075]
当cos(θ)≥α时,表示用户输入新文件的内容的关键词组和新文件未输入前系统中所含有的内容中的关键词的相似度很高,可以查找到输入文件保存的最优位置;
[0076]
当cos(θ)<α时,表示用户输入新文件的内容的关键词组和新文件未输入前系统中所含有的内容中的关键词的相似度很低,查找不到输入文件保存的最优位置。
[0077]
在步骤z03中利用save函数进行覆盖和保存。
[0078]
通过上述技术方案,可以在系统中通过多种方法输入需要保存的文件,系统通过关键词提取对比等算法找到关键词相似度高的文件的位置即最优文件保存位置,通过弹出弹窗请求是否自动保存到该位置或者选择保存到其他文件位置下,节省了手动保存文件的时间,同时防止文件布局出现混乱。
[0079]
实施例:
[0080]
所述文件输入通过鼠标拖曳输入将5月份公司收入支出情况的文件输入到基于分布式文件系统的文件布局更新的文件系统,显然还可以采取其他的文件输入方法如:用键盘输入、语音输入、文字识别输入、图片识别输入、账户同步输入、局域网输入等。
[0081]
所述5月份公司收入支出情况的文件和5月份公司收入支出情况的文件未输入前系统所含有的内容进行基于统计特征的关键词提取,利用print函数将输入文件中的关键
词和输入文件前系统中的关键词以总数量的方式提取出来,5月份公司收入支出情况的文件提取出的关键词,5月份公司收入支出情况的文件未输入前系统所含有的内容中提取出的关键词,并得到两组关键词,其中print函数使已知技术,所以在此不在做具体说明。
[0082]
所述关键词对比模块包括坐标系建立单元、关键词赋予单元、向量提取单元、相似度比较单元;所述坐标系建立单元用于将5月份公司收入支出情况的文件提取出来的关键词组和5月份公司收入支出情况的文件未输入前系统所含有的内容提取出来的关键词组放入相同的参考系中;
[0083]
所述关键词赋予单元用于将5月份公司收入支出情况的文件和5月份公司收入支出情况的文件未输入前系统所含有的内容提取出的两组关键词依据关键词的数量分别放在所建坐标系中对应的位置;
[0084]
所述分别求出5月份公司收入支出情况的文件和5月份公司收入支出情况的文件未输入前系统所含有的内容提取出的两组关键词的坐标向量,更新后文件内容关键词用坐标(xi,yi)表示,则所有更新后文件内容关键词坐标可用集合p={(x1,y1),(x2,y2),......(xn,yn)}={(6,4),(2,3)}表示,两两关键词之间的向量)}={(6,4),(2,3)}表示,两两关键词之间的向量系统中文件内容关键词用坐标(xk,yk)表示,则所有系统中文件内容关键词坐标可用集合q={(x1,y1),(x2,y2),......(xn,yn)}={(2,4),(-1,1)}表示,两两关键词之间的向量
[0085]
更新后关键词和系统中关键词的相似度为:
[0086][0087][0088][0089][0090][0091]
当cos(θ)=0.514<α=0.8时,表示5月份公司收入支出情况的文件内容与5月份公司收入支出情况的文件未输入前系统中原有文件的内容不匹配,此时,系统会弹出弹窗,向用用户申请是否需要重新建立文件存储位置或者在其他文件储存位置下进行保存,利用save函数进行覆盖和保存,其中save函数使已知技术,所以在此不在做具体说明。
[0092]
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。
[0093]
最后应说明的是:以上所述仅为本发明的优选实施例而已,并不用于限制本发明,尽管参照前述实施例对本发明进行了详细的说明,对于本领域的技术人员来说,其依然可
以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献