一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

文件上传方法、用户终端、网盘服务器、设备及介质与流程

2022-11-19 07:51:44 来源:中国专利 TAG:


1.本发明涉及信息技术领域,尤其涉及一种文件上传方法、一种用户终端、一种网盘服务器、一种计算机设备以及一种计算机可读存储介质。


背景技术:

2.网盘,又称网络硬盘,是由一些互联网公司推出的在线存储服务。网盘服务器为用户划分一定的磁盘空间,为用户免费或收费提供文件的存储、访问、备份、共享等文件管理等功能,并且拥有高级的世界各地的容灾备份。用户可以把网盘看成一个放在网络上的硬盘或u盘,不管是在家中、单位或其它任何地方,只要连接到因特网,就可以管理、编辑网盘里的文件,不需要随身携带,更不怕丢失。
3.目前的网盘,为了增加文件上传速度、减少磁盘占用率,往往采用先校验上传文件以查看服务器端是否已存储有该文件的方法,如果服务器端已存储有该文件,就无需重复上传了。例如,网盘服务器将其中已存储的大文件逐一生成校验码,如采用md5(message-digest algorithm,信息摘要算法)或sha(secure hash algorithm,安全散列算法)等算法,从而形成一个校验码库。例如,如果用户a准备上传一个大文件,则网盘服务器会先计算该文件的校验码,然后检查该校验码是否已经存在于自身的校验码库中,若是,则说明网盘服务器中已存储了该文件,无需上传。
4.然而,现有方案仅能识别出网盘服务器中是否存储有与待上传视频文件内容相同且清晰度也相同的视频文件,对于视频内容相同仅清晰度不同的视频文件则无法识别(二者校验码不同),而很多用户对视频文件的清晰度要求并不高,对于这些用户而言,采用现有方案会导致相同内容的视频文件重复上传,造成存储资源浪费。


技术实现要素:

5.为了至少部分解决现有技术中存在的用户向网盘服务器上传视频文件时,由于无法识别出内容相同但清晰度不同的视频文件而导致相同内容的视频文件重复上传的技术问题而完成了本发明。
6.根据本发明的一方面,提供一种文件上传方法,应用于用户终端,所述方法包括:
7.获取待上传文件;
8.判断待上传文件是否为视频文件,若是,则提取其文件名和字幕;
9.将待上传文件的文件名和字幕发送给网盘服务器,以使网盘服务器在其内检索与待上传文件的文件名和字幕均匹配的视频文件以得到检索结果,并将检索结果发送给用户终端;
10.接收网盘服务器发送的检索结果并推送给用户;以及,
11.基于用户指示确定是否将待上传文件上传至网盘服务器。
12.可选地,所述将待上传文件的文件名和字幕发送给网盘服务器,包括:
13.将待上传文件的文件名发送给网盘服务器,以使网盘服务器对待上传文件的文件
名进行预处理得到文件名关键信息,并在预存的视频文件信息表中检索所述文件名关键信息,响应于检索到至少一条与所述文件名关键信息匹配的视频文件信息,向用户终端返回文件名匹配成功消息;以及,
14.响应于接收到网盘服务器发送的文件名匹配成功消息,再将待上传文件的字幕发送给网盘服务器,以使网盘服务器使用各条与所述文件名关键信息匹配的视频文件信息对应的视频文件字幕分别在待上传文件的字幕中进行检索以得到检索结果,并将检索结果发送给用户终端。
15.可选地,在获取待上传文件之后,还包括:
16.判断待上传文件的大小是否低于预设阈值;
17.若否,则执行判断待上传文件是否为视频文件的步骤。
18.可选地,在判断待上传文件的大小不低于预设阈值之后,还包括:
19.获取待上传文件的校验码;以及,
20.将待上传文件的校验码发送给网盘服务器,以使网盘服务器在其内的校验码库中检索待上传文件的校验码,响应于未检索到待上传文件的校验码,向用户终端返回无相同校验码信息;
21.所述判断待上传文件是否为视频文件,具体为:
22.响应于接收到网盘服务器发送的无相同校验码信息,执行判断待上传文件是否为视频文件的步骤。
23.根据本发明的另一方面,提供一种文件上传方法,应用于网盘服务器,所述方法包括:
24.接收用户终端发送的待上传文件的文件名和字幕,其中用户终端在获取待上传文件后,判断待上传文件为视频文件时提取其文件名和字幕并发送给网盘服务器;
25.在网盘服务器内检索与待上传文件的文件名和字幕均匹配的视频文件以得到检索结果;以及,
26.将检索结果发送给用户终端,以使用户终端将检索结果推送给用户,并基于用户指示确定是否将待上传文件上传至网盘服务器。
27.可选地,在接收到用户终端发送的待上传文件的文件名之后,还包括:
28.对待上传文件的文件名进行预处理得到文件名关键信息;
29.所述在网盘服务器内检索与待上传文件的文件名和字幕均匹配的视频文件以得到检索结果,包括:
30.在预存的视频文件信息表中检索所述文件名关键信息,响应于检索到至少一条与所述文件名关键信息匹配的视频文件信息,向用户终端返回文件名匹配成功消息,以使得用户终端基于文件名匹配成功消息将待上传文件的字幕发送给网盘服务器;以及,
31.使用各条与所述文件名关键信息匹配的视频文件信息对应的视频文件字幕分别在待上传文件的字幕中进行检索以得到检索结果。
32.可选地,所述使用各条与所述文件名关键信息匹配的视频文件信息对应的视频文件字幕分别在待上传文件的字幕中进行检索以得到检索结果,包括:
33.针对每条与所述文件名关键信息匹配的视频文件信息所对应的视频文件字幕,在其中随机抽取预设长度的第一字幕段,并使用第一字幕段在待上传文件的字幕中进行检
索;
34.响应于在待上传文件的字幕中检索到第一字幕段,再随机抽取预设长度的第二字幕段,并使用第二字幕段在待上传文件的字幕中进行检索,重复执行前述字幕段抽取与检索步骤,直至在待上传文件的字幕中检索到第n字幕段,n≥2,将该视频文件的预设基础信息加入相同文件集合并生成检索结果。
35.可选地,还包括:
36.响应于在待上传文件的字幕中未检索到从该视频文件字幕中抽取的第i字幕段,1≤i≤n,跳出从该视频文件字幕中继续抽取下一字幕段及检索的步骤,并在待上传文件的字幕中继续检索下一条视频文件信息对应的视频文件字幕,直至与所述文件名关键信息匹配的全部视频文件信息对应的视频文件字幕均检索完。
37.根据本发明的又一方面,提供一种用户终端,包括:
38.获取模块,其设置为获取待上传文件;
39.判断模块,其设置为判断待上传文件是否为视频文件;
40.提取模块,其设置为在所述判断模块的判断结果为是时,提取待上传文件的文件名和字幕;
41.第一发送模块,其设置为将待上传文件的文件名和字幕发送给网盘服务器,以使网盘服务器在其内检索与待上传文件的文件名和字幕均匹配的视频文件以得到检索结果,并将检索结果发送给用户终端;
42.第一接收模块,其设置为接收网盘服务器发送的检索结果;
43.所述第一发送模块还设置为,将检索结果推送给用户;以及,
44.上传模块,其设置为基于用户指示确定是否将待上传文件上传至网盘服务器。
45.根据本发明的还一方面,提供一种网盘服务器,包括:
46.第二接收模块,其设置为接收用户终端发送的待上传文件的文件名和字幕,其中用户终端在获取待上传文件后,判断待上传文件为视频文件时提取其文件名和字幕并发送给网盘服务器;
47.检索模块,其设置为在网盘服务器中检索与待上传文件的文件名和字幕均匹配的视频文件以得到检索结果;以及,
48.第二发送模块,其设置为将检索结果发送给用户终端,以使用户终端将检索结果推送给用户,并基于用户指示确定是否将待上传文件上传至网盘服务器。
49.根据本发明的再一方面,提供一种计算机设备,包括存储器和处理器,所述存储器中存储有计算机程序,当所述处理器运行所述存储器存储的计算机程序时,所述处理器执行前述文件上传方法。
50.根据本发明的再一方面,提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时,所述处理器执行前述文件上传方法。
51.本发明提供的技术方案可以包括以下有益效果:
52.本发明提供的文件上传方法,通过将用户待上传文件与服务器端已存储的视频文件进行文件名与字幕双匹配,能够准确识别出与待上传文件的内容相同的视频文件,并将识别结果推送给用户,以便用户根据识别结果做出是否将待上传文件上传至服务器端的指示,可有效避免相同内容的视频文件重复上传,节省了服务器端的存储资源。
53.本发明的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本发明而了解。本发明的目的和其他优点可通过在说明书、权利要求书以及附图中所特别指出的结构来实现和获得。
附图说明
54.附图用来提供对本发明技术方案的进一步理解,并且构成说明书的一部分,与本发明的实施例一起用于解释本发明的技术方案,并不构成对本发明技术方案的限制。
55.图1为本发明实施例提供的一种文件上传方法的流程示意图;
56.图2为本发明实施例提供的另一种文件上传方法的流程示意图;
57.图3为本发明实施例提供的用户终端的结构示意图;
58.图4为本发明实施例提供的网盘服务器的结构示意图;
59.图5为本发明实施例提供的文件上传系统的结构示意图;
60.图6为本发明实施例提供的计算机设备的结构示意图。
具体实施方式
61.为使本发明实施例的目的、技术方案和优点更加清楚,以下结合附图对本发明的具体实施方式进行详细说明。应当理解的是,此处所描述的具体实施方式仅用于说明和解释本发明,并不用于限制本发明。
62.需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序;并且,在不冲突的情况下,本发明中的实施例及实施例中的特征可以相互任意组合。
63.在后续的描述中,使用用于表示元件的诸如“模块”、“部件”或“单元”的后缀仅为了有利于本发明的说明,其本身没有特定的意义。因此,“模块”、“部件”或“单元”可以混合地使用。
64.图1为本发明实施例提供的一种文件上传方法的流程示意图。所述方法应用于用户终端,其内安装有网盘客户端,用于与网盘服务器建立通信。如图1所示,所述方法包括如下步骤s101至s106。
65.s101.获取待上传文件。
66.本步骤中,用户终端可通过多种方式获取待上传文件,例如,通过各种途径下载文件、接收其他终端发送的文件,或者终端用户自己制作文件等。
67.s102.判断待上传文件是否为视频文件,若是,则执行步骤s103,若否,则结束当前流程。
68.本步骤中,可通过文件后缀名(也称为文件扩展名)来判断待上传文件是否为视频文件,例如常见的视频文件后缀名包括:“.mkv”、“.avi”、“.wmv”、“.mpg”、“.mpeg”、“.mov”、“.rmvb”、“.rm”、“.ram”、“.flv”、“.mp4”等。若待上传文件为视频文件,则执行下面的步骤,否则跳出本发明的技术方案,可由用户自行决定是否将待上传文件上传至网盘服务器。
69.s103.提取待上传文件的文件名和字幕。
70.本步骤中,对于视频与字幕分开存储的视频文件,例如后缀名为“.mkv”的视频文件,可直接读取其字幕。对于视频与字幕未分开存储的视频文件,需要通过现有的视频字幕
自动提取工具进行字幕提取。当然,如果待上传文件的文件名和字幕之一提取失败,则结束当前流程,不再进行后续步骤。
71.s104.将待上传文件的文件名和字幕发送给网盘服务器,以使网盘服务器在其内检索与待上传文件的文件名和字幕均匹配的视频文件以得到检索结果,并将检索结果发送给用户终端。
72.本步骤中,检索结果分为两种情况,第一种情况是在网盘服务器内检索到至少一个与待上传文件的文件名和字幕均匹配的视频文件,说明服务器端存储有至少一个与待上传文件内容相同的视频文件,这些视频文件与待上传文件的内容相同,清晰度可能相同,也可能不同,此时检索结果中可包括这些相匹配的视频文件的名称、版本和文件大小等信息,其中文件大小决定了视频清晰度;第二种情况是在网盘服务器内没有检索到与待上传文件的文件名和字幕均匹配的视频文件,如文件名与字幕中至少一者匹配失败,说明服务器端并没有存储与待上传文件内容相同的视频文件,此时检索结果中可包含无相匹配文件的提示信息。
73.s105.接收网盘服务器发送的检索结果并推送给用户。
74.本步骤中,用户终端在接收到网盘服务器发送的检索结果后,直接推送给用户,即与用户互动,以提示用户服务器端是否已存储有内容相同文件。
75.s106.基于用户指示确定是否将待上传文件上传至网盘服务器。
76.本步骤中,用户在接收到用户终端推送的检索结果之后,对于第一种情况,为节约存储资源,可采用服务器端已有文件而无需将待上传文件上传至网盘服务器,此时用户一般指示“不上传”,则用户终端基于用户指示不再将待上传文件上传至网盘服务器,当然,用户也可视情况仍指示上传,则用户终端基于用户指示直接将待上传文件上传至网盘服务器;对于第二种情况,由于服务器端没有存储与待上传文件的文件名和字幕均匹配的视频文件,此时用户指示“上传”,则用户终端基于用户指示直接将待上传文件上传至网盘服务器。
77.在一种具体实施方式中,步骤s104具体包括如下步骤s104a和s104b。
78.s104a.将待上传文件的文件名发送给网盘服务器,以使网盘服务器对待上传文件的文件名进行预处理得到文件名关键信息,并在预存的视频文件信息表中检索所述文件名关键信息,响应于检索到至少一条与所述文件名关键信息匹配的视频文件信息,向用户终端返回文件名匹配成功消息;
79.s104b.响应于接收到网盘服务器发送的文件名匹配成功消息,再将待上传文件的字幕发送给网盘服务器,以使网盘服务器使用各条与所述文件名关键信息匹配的视频文件信息对应的视频文件字幕分别在待上传文件的字幕中进行检索以得到检索结果,并将检索结果发送给用户终端。
80.本实施例中,网盘服务器中预存有视频文件信息表,视频文件信息表存储有网盘服务器中部分或全部视频文件的基本信息,例如视频id、视频名、字幕等信息。视频文件信息表中记录了多条视频文件信息,每条视频文件信息占用表格中的一行,对应存储于服务器端的一个视频文件,该条视频文件信息包含该视频文件的视频id、视频名和字幕等字段。
81.其中,“视频id”字段记录了该视频文件在服务器端的唯一标识。
[0082]“视频名”字段记录的可以是对应视频文件的官方名称,而不是文件名,例如某视
频文件的文件名是“96.哈利波特与密室(加长版)harry potter and the chamber of secrets(2002)”,其官方中文名为“哈利波特与密室”,官方英文名为“harry potter and the chamber of secrets”;官方名称可以为任何语种的名字,如中文名、英文名、日文名、法文名等,既可以是单语名,也可以是双语名。本字段的作用是与用户待上传文件的文件名做名字的模糊匹配,所以不需要非常准确,因此也可以是官方名称的节选,例如前面的例子,英文名也可以简化为“harry potter”,但相应地可能会匹配出更多的视频文件,增加了后续字幕匹配的工作量。本字段并不包含集数信息(如“第几集”、“第几季”等),以美剧《friends》为例,包含很多季、很多集,所以不论第几集,英文名均为“friends”,至于中文名,与前述英文名的规则类似,此处不再赘述。
[0083]
需要说明的是,“视频名”字段的具体语种是根据目标用户群的使用习惯设置的,并且可以动态调整,例如在国内,该字段可以为“中文名”和“英文名”,在法国,该字段可能就要修改为“法文名”和“英文名”。“视频名”字段可以包含两个子字段(即双语名:中文名和外文名),也可仅包含一个子字段(即单语名:任意一个语种名字),但不可为空。当然,网盘服务器中预存的视频文件信息表需要每隔一定周期就基于服务器端现存的视频文件情况进行更新。
[0084]“字幕”字段可以记录该视频文件的部分或全部字幕内容,也可以记录该视频文件的字幕存储地址,访问该字幕存储地址就可以获取对应视频文件的字幕。
[0085]
下面以表1为例予以说明。
[0086]
表1
[0087][0088]
如表1所示,其中一条视频文件信息记录的视频id为011,视频名包含英文名“harry potter and the chamber of secrets”,字幕记载了该视频文件的所有字幕内容。
[0089]
网盘服务器在接收到用户终端发送的待上传文件的文件名后,先进行预处理,例如,去除文件名中的数字信息,包含编号、年份、集数、季数等信息,去除文件名中的版本信息,如加长版、高清版等,以及在文件名含有多语种名时将不同语种的名字分开,从而得到文件名关键信息。然后在预存的视频文件信息表中检索文件名关键信息,以检索待上传文件的文件名关键信息是否存在于视频文件信息表中(即视频名模糊匹配),检索方式为逐行检索,即逐行查看待上传文件的文件名关键信息是否包含在视频文件信息表中一条或多条视频文件信息的“视频名”字段中,如果检索到一条或多条相匹配的视频文件信息,则记录下对应视频文件信息的视频id,并向用户终端返回文件名匹配成功消息,需要说明的是,如果服务器端存储了两个相同视频名的视频文件,例如一个是720p版本,另一个是1020p版本,那么就会检索出两条视频文件信息;如果未检索到相匹配的视频文件信息,则向用户终端返回文件名匹配失败消息。用户终端接收到网盘服务器发送的文件名匹配成功消息后,
再将待上传文件的字幕发送给网盘服务器,然后网盘服务器使用之前记录的视频id对应的视频文件字幕在待上传文件的字幕中进行检索,并向用户终端返回相应的检索结果;用户终端接收到文件名匹配失败消息后,不再执行后续字幕匹配的步骤,而直接得到无相匹配文件的检索结果。
[0090]
以上述表1为例,待上传文件的文件名为“96.哈利波特与密室(加长版)harry potter and the chamber of secrets(2002)”,先去除文件名中的数字信息和版本信息,得到“哈利波特与密室harry potter and the chamber of secrets”,再将文件名中不同语种的名字分开,得到文件名关键信息“哈利波特与密室”与“harry potter and the chamber of secrets”,然后在预存的视频文件信息表中逐行检索“哈利波特与密室”和“harry potter and the chamber of secrets”,成功检索到一条视频id为“011”、视频名字段包含“harry potter and the chamber of secrets”的视频文件信息,最后使用视频id为“011”对应的视频文件信息中字幕字段所记录的视频文件字幕在待上传文件的字幕中进行检索,并且得到相应的检索结果。
[0091]
在一种具体实施方式中,在步骤s101之后,还包括如下步骤s107。
[0092]
s107.判断待上传文件的大小是否低于预设阈值,若是,则结束当前流程,若否,则执行步骤s102,判断待上传文件是否为视频文件的步骤。
[0093]
本实施例中,可先判断待上传文件的大小,低于预设阈值的小微文件由于占用空间较小,可不用执行后续步骤而直接上传至网盘服务器。而大于或等于预设阈值的较大文件则需执行后续步骤以确定是否将其上传至网盘服务器。至于预设阈值的具体数值,可由本领域技术人员根据实际需求进行设定与调整。
[0094]
在一种具体实施方式中,在步骤s107判断待上传文件的大小不低于预设阈值之后,还包括如下步骤s108至s109。
[0095]
s108.获取待上传文件的校验码;
[0096]
s109.将待上传文件的校验码发送给网盘服务器,以使网盘服务器在其内的校验码库中检索待上传文件的校验码,响应于未检索到待上传文件的校验码,向用户终端返回无相同校验码信息。
[0097]
相应地,步骤s102具体为:
[0098]
响应于接收到网盘服务器发送的无相同校验码信息,执行判断待上传文件是否为视频文件的步骤。
[0099]
本实施例中,对于大于或等于预设阈值的待上传文件,可先判断待上传文件的校验码是否在网盘服务器预存的校验码库中,如果不在,说明网盘服务器中并未存储与待上传文件内容完全相同的文件,并向用户终端返回无相同校验码信息,而用户终端在接收到无相同校验码信息后再执行后续步骤以确定是否将其上传至网盘服务器;如果在,说明网盘服务器中已经存储了与待上传文件内容完全相同的文件,并向用户终端返回相同校验码信息,而用户终端在接收到相同校验码信息后为避免完全相同文件的重复上传,可直接确定不再将待上传文件上传至网盘服务器。
[0100]
当然,网盘服务器中预存的校验码库需要每隔一定周期就基于服务器端现存的文件情况进行更新。
[0101]
需要说明的是,上述步骤的顺序只是为了说明本发明实施例而提出的一个具体实
例,本发明对上述步骤的顺序不做限定,本领域技术人员在实际应用中可按需对其进行调整;而且上述步骤的序号大小也不限制其执行顺序。
[0102]
图2为本发明实施例提供的另一种文件上传方法的流程示意图。所述方法应用于网盘服务器,其能够与用户终端内安装的网盘客户端建立通信。如图2所示,所述方法包括如下步骤s201至s203。
[0103]
s201.接收用户终端发送的待上传文件的文件名和字幕,其中用户终端在获取待上传文件后,判断待上传文件为视频文件时提取其文件名和字幕并发送给网盘服务器。
[0104]
本步骤中,用户终端可通过文件后缀名(也称为文件扩展名)来判断待上传文件是否为视频文件,而且对于视频与字幕分开存储的视频文件可直接读取其字幕,对于视频与字幕未分开存储的视频文件则通过现有的视频字幕自动提取工具进行字幕提取。
[0105]
s202.在网盘服务器内检索与待上传文件的文件名和字幕均匹配的视频文件以得到检索结果。
[0106]
本步骤中,检索结果分为两种情况,第一种情况是在网盘服务器内检索到至少一个与待上传文件的文件名和字幕均匹配的视频文件,此时检索结果中可包括这些相匹配的视频文件的名称、版本和文件大小等信息;第二种情况是在网盘服务器内没有检索到与待上传文件的文件名和字幕均匹配的视频文件,如文件名与字幕中至少一者匹配失败,此时检索结果中可包含无相匹配文件的提示信息。
[0107]
s203.将检索结果发送给用户终端,以使用户终端将检索结果推送给用户,并基于用户指示确定是否将待上传文件上传至网盘服务器。
[0108]
本步骤中,用户终端在接收到网盘服务器发送的检索结果后,直接推送给用户,而用户在接收到用户终端推送的检索结果之后,对于第一种情况,为节约存储资源,可采用服务器端已有文件而无需将待上传文件上传至网盘服务器,此时用户指示“不上传”,则用户终端基于用户指示不再将待上传文件上传至网盘服务器;对于第二种情况,由于服务器端没有存储与待上传文件的文件名和字幕均匹配的视频文件,此时用户指示“上传”,则用户终端基于用户指示直接将待上传文件上传至网盘服务器。
[0109]
在一种具体实施方式中,在步骤s201接收到用户终端发送的待上传文件的文件名之后,还包括如下步骤s204。
[0110]
s204.对待上传文件的文件名进行预处理得到文件名关键信息。
[0111]
相应地,步骤s202具体包括如下步骤s202a和s202b。
[0112]
s202a.在预存的视频文件信息表中检索所述文件名关键信息,响应于检索到至少一条与所述文件名关键信息匹配的视频文件信息,向用户终端返回文件名匹配成功消息,以使得用户终端基于文件名匹配成功消息将待上传文件的字幕发送给网盘服务器;
[0113]
s202b.使用各条与所述文件名关键信息匹配的视频文件信息对应的视频文件字幕分别在待上传文件的字幕中进行检索以得到检索结果。
[0114]
本实施例中,网盘服务器中预存有视频文件信息表,视频文件信息表存储有网盘服务器中部分或全部视频文件的基本信息,例如视频id、视频名、字幕等信息。视频文件信息表中记录了多条视频文件信息,每条视频文件信息占用表格中的一行,对应存储于服务器端的一个视频文件,该条视频文件信息包含该视频文件的视频id、视频名和字幕等字段。
[0115]
网盘服务器对于待上传文件的文件名,先进行预处理,例如,去除文件名中的数字
信息,包含编号、年份、集数、季数等信息,去除文件名中的版本信息,如加长版、高清版等,以及在文件名含有多语种名时将不同语种的名字分开,从而得到文件名关键信息。然后在预存的视频文件信息表中检索文件名关键信息,以检索待上传文件的文件名关键信息是否存在于视频文件信息表中(即视频名模糊匹配),检索方式为逐行检索,即逐行查看待上传文件的文件名关键信息是否包含在视频文件信息表中一条或多条视频文件信息的“视频名”字段中,如果检索到一条或多条相匹配的视频文件信息,则记录下对应视频文件信息的视频id,并向用户终端返回文件名匹配成功消息;如果未检索到相匹配的视频文件信息,则向用户终端返回文件名匹配失败消息。用户终端接收到网盘服务器发送的文件名匹配成功消息后,再将待上传文件的字幕发送给网盘服务器,然后网盘服务器使用之前记录的视频id对应的视频文件字幕在待上传文件的字幕中进行检索,并向用户终端返回相应的检索结果;用户终端接收到文件名匹配失败消息后,不再执行后续字幕匹配的步骤,而直接得到无相匹配文件的检索结果。
[0116]
在一种具体实施方式中,步骤s202b具体包括如下步骤b1至b3。
[0117]
b1.针对每条与所述文件名关键信息匹配的视频文件信息所对应的视频文件字幕,在其中随机抽取预设长度的第一字幕段,并使用第一字幕段在待上传文件的字幕中进行检索;
[0118]
b2.响应于在待上传文件的字幕中检索到第一字幕段,再随机抽取预设长度的第二字幕段,并使用第二字幕段在待上传文件的字幕中进行检索,重复执行前述字幕段抽取与检索步骤,直至在待上传文件的字幕中检索第n字幕段,n≥2;
[0119]
b3.响应于步骤b2的执行结果为在待上传文件的字幕中检索到第n字幕段,将该视频文件的预设基础信息加入相同文件集合并生成检索结果。
[0120]
本实施例中,对于服务器端存储的各个与待上传文件的文件名匹配的视频文件,先选择第一个文件名匹配的视频文件的字幕,在其中随机抽取一段长度为l字节的字幕,去待上传文件的字幕中进行检索,若能检索到完全一样的字幕,则继续下一步,再随机抽取一段长度为l字节的字幕,去待上传文件的字幕中进行检索,重复执行前述字幕段抽取与检索步骤,直至从第一个文件名匹配的视频文件的字幕中连续抽取n次l字节的字幕都能在待上传文件的字幕中检索到,则说明第一个文件名匹配的视频文件与待上传文件为内容相同文件,并将其预设基础信息加入相同文件集合,至于l的具体取值可由本领域技术人员根据实际需求进行设定与调整。再选择第二个文件名匹配的视频文件的字幕,重复执行从第二个文件名匹配的视频文件的字幕中连续抽取n次l字节的字幕并分别在待上传文件的字幕中进行检索的步骤,直至文件名匹配的所有视频文件的字幕都检索完毕。然后根据最终得到的相同文件集合生成检索结果并发送给用户终端。可见,在相同文件集合中记录了所有与待上传文件的文件名和字幕均匹配的视频文件的预设基础信息,如名称、版本和大小等信息,通常越大的视频文件清晰度越高,以便用户能够通过比较得知待上传文件与服务器端已存的具有相同内容的视频文件哪个清晰度更高,哪个空间占用更小,哪个清晰度与占用空间整体最贴合用户需求,从而便于用户做出“上传”或“不上传”待上传文件的指示。
[0121]
在一种具体实施方式中,在步骤b2的执行过程中,还包括:
[0122]
响应于在待上传文件的字幕中未检索到从该视频文件字幕中抽取的第i字幕段,1≤i≤n,跳出从该视频文件字幕中继续抽取下一字幕段及检索的步骤,并在待上传文件的
字幕中继续检索下一条视频文件信息对应的视频文件字幕,直至与所述文件名关键信息匹配的全部视频文件信息对应的视频文件字幕均检索完。
[0123]
本实施例中,对于任意一个文件名匹配的视频文件的字幕,在连续抽取n次l字节字幕的过程中,只有上一次抽取的l字节字幕能够在待上传文件的字幕中检索到的情况下,才执行下一次字幕抽取,而一旦某一次抽取的l字节字幕未能在待上传文件的字幕中检索到,则说明该文件名匹配的视频文件与待上传文件为内容不同文件,不再对该文件名匹配的视频文件的字幕执行后续的字幕段抽取与检索步骤,而是直接在待上传文件的字幕中检索下一个文件名匹配的视频文件的字幕,直至所有文件名匹配的视频文件的字幕都检索完毕。
[0124]
需要说明的是,上述步骤的顺序只是为了说明本发明实施例而提出的一个具体实例,本发明对上述步骤的顺序不做限定,本领域技术人员在实际应用中可按需对其进行调整;而且上述步骤的序号大小也不限制其执行顺序。
[0125]
本发明实施例提供的文件上传方法,通过将用户待上传文件与服务器端已存储的视频文件进行文件名与字幕双匹配,能够准确识别出与待上传文件的内容相同的视频文件,并将识别结果推送给用户,以便用户根据识别结果做出是否将待上传文件上传至服务器端的指示,可有效避免相同内容的视频文件重复上传,节省了服务器端的存储资源。
[0126]
图3为本发明实施例提供的用户终端的结构示意图。如图3所示,用户终端包括:获取模块301、判断模块302、提取模块303、第一发送模块304、第一接收模块305和上传模块306。
[0127]
其中,获取模块301设置为获取待上传文件;判断模块302设置为判断待上传文件是否为视频文件;提取模块303设置为在所述判断模块302的判断结果为是时,提取待上传文件的文件名和字幕;第一发送模块304设置为将待上传文件的文件名和字幕发送给网盘服务器,以使网盘服务器在其内检索与待上传文件的文件名和字幕均匹配的视频文件以得到检索结果,并将检索结果发送给用户终端;第一接收模块305设置为接收网盘服务器发送的检索结果;所述第一发送模块304还设置为将检索结果推送给用户;上传模块306设置为基于用户指示确定是否将待上传文件上传至网盘服务器。
[0128]
在一种具体实施方式中,第一发送模块304设置为,将待上传文件的文件名发送给网盘服务器,以使网盘服务器对待上传文件的文件名进行预处理得到文件名关键信息,并在预存的视频文件信息表中检索所述文件名关键信息,响应于检索到至少一条与所述文件名关键信息匹配的视频文件信息,向用户终端返回文件名匹配成功消息。第一接收模块305还设置为接收网盘服务器发送的文件名匹配成功消息。第一发送模块304还设置为,在第一接收模块305接收到网盘服务器发送的文件名匹配成功消息后,再将待上传文件的字幕发送给网盘服务器,以使网盘服务器使用各条与所述文件名关键信息匹配的视频文件信息对应的视频文件字幕分别在待上传文件的字幕中进行检索以得到检索结果,并将检索结果发送给用户终端。
[0129]
在一种具体实施方式中,判断模块302还设置为,在获取模块301获取到待上传文件之后,先判断待上传文件的大小是否低于预设阈值,若否,再判断待上传文件是否为视频文件。
[0130]
在一种具体实施方式中,获取模块301还设置为在判断模块302判断待上传文件的
大小不低于预设阈值之后,获取待上传文件的校验码。第一发送模块304还设置为,将待上传文件的校验码发送给网盘服务器,以使网盘服务器在其内的校验码库中检索待上传文件的校验码,响应于未检索到待上传文件的校验码,向用户终端返回无相同校验码信息。判断模块302具体设置为,在第一接收模块305接收到网盘服务器发送的无相同校验码信息后,再判断待上传文件是否为视频文件。
[0131]
本发明实施例提供的用户终端,将待上传文件的文件名与字幕发送给网盘服务器,由网盘服务器将用户待上传文件与服务器端已存储的视频文件进行文件名与字幕双匹配,能够准确识别出与待上传文件的内容相同的视频文件,并将识别结果返回给用户终端,而用户终端将识别结果推送给用户,以便用户根据识别结果做出是否将待上传文件上传至服务器端的指示,可有效避免相同内容的视频文件重复上传,节省了服务器端的存储资源。
[0132]
图4为本发明实施例提供的网盘服务器的结构示意图。如图4所示,网盘服务器包括:第二接收模块401、检索模块402和第二发送模块403。
[0133]
其中,第二接收模块401设置为接收用户终端发送的待上传文件的文件名和字幕,其中用户终端在获取待上传文件后,判断待上传文件为视频文件时提取其文件名和字幕并发送给网盘服务器;检索模块402设置为在网盘服务器中检索与待上传文件的文件名和字幕均匹配的视频文件以得到检索结果;第二发送模块403设置为将检索结果发送给用户终端,以使用户终端将检索结果推送给用户,并基于用户指示确定是否将待上传文件上传至网盘服务器。
[0134]
在一种具体实施方式中,网盘服务器还包括:预处理模块。
[0135]
预处理模块设置为在第二接收模块401接收到用户终端发送的待上传文件的文件名之后,对待上传文件的文件名进行预处理得到文件名关键信息。
[0136]
相应地,检索模块402包括第一检索单元和第二检索单元。
[0137]
其中,第一检索单元设置为在预存的视频文件信息表中检索所述文件名关键信息。第二发送模块403还设置为在第一检索单元检索到至少一条与所述文件名关键信息匹配的视频文件信息时,向用户终端返回文件名匹配成功消息,以使得用户终端基于文件名匹配成功消息将待上传文件的字幕发送给网盘服务器。第二检索单元设置为使用各条与所述文件名关键信息匹配的视频文件信息对应的视频文件字幕分别在待上传文件的字幕中进行检索以得到检索结果。
[0138]
在一种具体实施方式中,第二检索单元具体设置为:
[0139]
针对每条与所述文件名关键信息匹配的视频文件信息所对应的视频文件字幕,在其中随机抽取预设长度的第一字幕段,并使用第一字幕段在待上传文件的字幕中进行检索;
[0140]
响应于在待上传文件的字幕中检索到第一字幕段,再随机抽取预设长度的第二字幕段,并使用第二字幕段在待上传文件的字幕中进行检索,重复执行前述字幕段抽取与检索步骤,直至在待上传文件的字幕中检索到第n字幕段,n≥2,将该视频文件的预设基础信息加入相同文件集合并生成检索结果。
[0141]
在一种具体实施方式中,第二检索单元还设置为:
[0142]
响应于在待上传文件的字幕中未检索到从该视频文件字幕中抽取的第i字幕段,1≤i≤n,跳出从该视频文件字幕中继续抽取下一字幕段及检索的步骤,并在待上传文件的
字幕中继续检索下一条视频文件信息对应的视频文件字幕,直至与所述文件名关键信息匹配的全部视频文件信息对应的视频文件字幕均检索完。
[0143]
本发明实施例提供的网盘服务器,在接收到用户终端发送的待上传文件的文件名与字幕后,将用户待上传文件与服务器端已存储的视频文件进行文件名与字幕双匹配,能够准确识别出与待上传文件的内容相同的视频文件,并将识别结果通过用户终端推送给用户,以便用户根据识别结果做出是否将待上传文件上传至服务器端的指示,可有效避免相同内容的视频文件重复上传,节省了服务器端的存储资源。
[0144]
图5为本发明实施例提供的文件上传系统的结构示意图。如图5所示,所述系统包括:用户终端51和网盘服务器52。
[0145]
用户终端51内安装有网盘客户端,并通过网盘客户端与网盘服务器52建立通信。用户终端51与网盘服务器52可采用前述实施例的结构,此处不再赘述。
[0146]
基于相同的技术构思,本发明实施例相应还提供一种计算机设备,如图6所示,所述计算机设备包括存储器61和处理器62,所述存储器61中存储有计算机程序,当所述处理器62运行所述存储器61存储的计算机程序时,所述处理器62执行前述文件上传方法。
[0147]
基于相同的技术构思,本发明实施例相应还提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时,所述处理器执行前述文件上传方法。
[0148]
综上所述,本发明实施例提供的文件上传方法、系统、用户终端、网盘服务器、计算机设备及存储介质,通过在网盘服务器中检索与待上传文件的文件名和字幕均匹配的视频文件,以实现文件名与字幕双匹配,能够准确识别出与待上传文件的内容相同的视频文件,并将识别结果推送给用户,以便用户根据识别结果做出是否将待上传文件上传至服务器端的指示,可有效避免相同内容的视频文件重复上传,节省了服务器端的存储资源。
[0149]
本领域普通技术人员可以理解,上文中所公开方法中的全部或某些步骤、系统、装置中的功能模块/单元可以被实施为软件、固件、硬件及其适当的组合。在硬件实施方式中,在以上描述中提及的功能模块/单元之间的划分不一定对应于物理组件的划分;例如,一个物理组件可以具有多个功能,或者一个功能或步骤可以由若干物理组件合作执行。某些物理组件或所有物理组件可以被实施为由处理器,如中央处理器、数字信号处理器或微处理器执行的软件,或者被实施为硬件,或者被实施为集成电路,如专用集成电路。这样的软件可以分布在计算机可读介质上,计算机可读介质可以包括计算机存储介质(或非暂时性介质)和通信介质(或暂时性介质)。如本领域普通技术人员公知的,术语计算机存储介质包括在用于存储信息(诸如计算机可读指令、数据结构、程序模块或其他数据)的任何方法或技术中实施的易失性和非易失性、可移除和不可移除介质。计算机存储介质包括但不限于ram、rom、eeprom、闪存或其他存储器技术、cd-rom、数字多功能盘(dvd)或其他光盘存储、磁盒、磁带、磁盘存储或其他磁存储装置、或者可以用于存储期望的信息并且可以被计算机访问的任何其他的介质。此外,本领域普通技术人员公知的是,通信介质通常包含计算机可读指令、数据结构、程序模块或者诸如载波或其他传输机制之类的调制数据信号中的其他数据,并且可包括任何信息递送介质。
[0150]
最后应说明的是:以上各实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述各实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进
行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围。
再多了解一些

本文用于创业者技术爱好者查询,仅供学习研究,如用于商业用途,请联系技术所有人。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献