一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

文档搜索的优化处理方法、装置及电子设备与流程

2023-03-14 17:23:16 来源:中国专利 TAG:


1.本技术涉及数据处理技术领域,尤其涉及一种文档搜索的优化处理方法、装置及电子设备。


背景技术:

2.不同的客户使用文档库检索时,可能输入相同或不同的检索条件,文档库不可避免的因为客户的输入条件不足导致搜索结果不准确,从而导致大量的翻页才能找到所需的文档结果,导致文档的搜索效率较低。
3.因此,亟需一种能够提高文档搜索效率的技术方案。


技术实现要素:

4.有鉴于此,本技术提供一种文档搜索的优化处理方法、装置及电子设备,用以解决文档搜索速率较低的技术问题。如下:
5.一种文档搜索的优化处理方法,所述方法包括:
6.获得文档搜索请求,所述文档搜索请求中包含至少一个搜索关键词;
7.根据所述搜索关键词,在文档库中获得文档搜索结果;所述文档搜索结果包含多个目标文档;
8.通过至少两个搜索页面输出所述目标文档对应的文档信息,且所述至少两个搜索页面中的目标页面处于可见状态;
9.在路径库中,获得与所述搜索关键词相匹配的目标搜索路径;所述路径库中包含有多条文档搜索路径,所述文档搜索路径至少表征其对应的历史文档对应的文档信息在历史搜索结果中的文档位置;
10.根据所述目标搜索路径所表征的文档位置,至少对所述目标文档对应的文档信息所在的搜索页面进行调整,以使得所述目标搜索路径在所述目标文档中对应的第一文档对应的文档信息在所述目标页面中显示。
11.上述方法,优选的,所述方法还包括:
12.获得历史关键词和所述历史关键词命中的历史文档;
13.至少根据所述历史关键词对应的搜索页面翻页次数、所述历史文档对应的文档信息所在的搜索页面以及所述历史文档对应的文档信息在其所在搜索页面中的文档位置,生成所述历史关键词以及所述历史文档对应的文档搜索路径;
14.将所述文档搜索路径添加到所述路径库中。
15.上述方法,优选的,所述方法还包括:
16.获得所述历史文档的文档关键词;
17.在所述文档关键词中,获得所述历史关键词对应的关键词补充项;
18.将所述关键词补充项添加到所述历史文档对应的文档搜索路径中。
19.上述方法,优选的,所述根据所述目标搜索路径所表征的文档位置,至少对所述目
标文档对应的文档信息所在的搜索页面进行调整,包括:
20.根据所述目标搜素路径所表征的文档位置,确定所述目标搜素路径在所述目标文档中对应的第一文档;
21.将所述第一文档对应的文档信息从其所在的当前页面调整到所述目标页面上的第一位置,以使得所述第一位置对应的文档及排序在所述第一位置之后的文档在所述文档搜索结果中排序在所述第一文档之后。
22.上述方法,优选的,在将所述第一文档对应的文档信息从当前页面调整到所述目标页面上的第一位置之后,所述方法还包括:
23.监测是否接收到针对所述第一文档的命中确定操作;
24.在接收到针对所述第一文档的命中确定操作的情况下,根据所述搜索关键词、所述第一文档以及所述第一位置,生成所述搜索关键词和所述第一文档对应的文档搜索路径。
25.上述方法,优选的,还包括:
26.监测是否接收到针对所述第一文档的命中舍弃操作;
27.在接收到针对所述第一文档的命中舍弃操作的情况下,在所述目标文档中,获得与所述第一文档满足关联关系的第二文档;
28.将所述第二文档对应的文档信息从其所在的当前页面调整到与所述第一位置相关联的第二位置。
29.上述方法,优选的,所述第二位置为所述文档搜索结果中处于所述第一位置之后且与所述第一位置相邻的位置,以使得所述第二位置对应的文档及排序在所述第二位置之后的文档在所述文档搜索结果中排序在所述第二文档之后;
30.其中,所述方法还包括:
31.监测是否接收到针对所述第二文档的命中确定操作;
32.在接收到针对所述第二文档的命中确定操作的情况下,根据所述搜索关键词、所述第二文档以及所述第二位置,生成所述搜索关键词和所述第二文档对应的文档搜索路径。
33.上述方法,优选的,所述关联关系包括:
34.所述第一文档对应的文档标识包含所述第二文档对应的文档标识。
35.一种文档搜索的优化处理装置,所述装置包括:
36.请求获得单元,用于获得文档搜索请求,所述文档搜索请求中包含至少一个搜索关键词;
37.结果获得单元,用于根据所述搜索关键词,在文档库中获得文档搜索结果;所述文档搜索结果包含多个目标文档;
38.页面输出单元,用于通过至少两个搜索页面输出所述目标文档对应的文档信息,且所述至少两个搜索页面中的目标页面处于可见状态;
39.路径获得单元,用于在路径库中,获得与所述搜索关键词相匹配的目标搜索路径;所述路径库中包含有多条文档搜索路径,所述文档搜索路径至少表征其对应的历史文档对应的文档信息在历史搜索结果中的文档位置;
40.页面调整单元,用于根据所述目标搜索路径所表征的文档位置,至少对所述目标
文档对应的文档信息所在的搜索页面进行调整,以使得所述目标搜索路径在所述目标文档中对应的第一文档对应的文档信息在所述目标页面中显示。
41.一种电子设备,包括:
42.存储器,用于存储计算机程序以及所述计算机程序运行所产生的数据;
43.处理器,用于执行所述计算机程序,以实现:获得文档搜索请求,所述文档搜索请求中包含至少一个搜索关键词;根据所述搜索关键词,在文档库中获得文档搜索结果;所述文档搜索结果包含多个目标文档;通过至少两个搜索页面输出所述目标文档对应的文档信息,且所述至少两个搜索页面中的目标页面处于可见状态;在路径库中,获得与所述搜索关键词相匹配的目标搜索路径;所述路径库中包含有多条文档搜索路径,所述文档搜索路径至少表征其对应的历史文档对应的文档信息在历史搜索结果中的文档位置;根据所述目标搜索路径所表征的文档位置,至少对所述目标文档对应的文档信息所在的搜索页面进行调整,以使得所述目标搜索路径在所述目标文档中对应的第一文档对应的文档信息在所述目标页面中显示。
44.从上述技术方案可以看出,本技术公开的一种文档搜索的优化方法、装置及电子设备中,在获得到文档搜索请求之后,根据其中的搜索关键词,在文档库中获得多个目标文档,这多个目标文档对应的文档信息通过多个搜索页面显示,且仅其中的一个目标页面中的文档信息处于可见状态,之后,通过获得搜索关键词对应的文档搜索路径,进而使用该文档搜索路径所表征的历史搜索中命中的文档对应的文档信息在历史搜索结果中的文档位置,对目标文档对应的文档信息所在的搜索页面进行调整,使得搜索关键词在历史搜索中命中的第一文档对应的文档信息处于可见状态。可见,本技术中通过历史搜索中命中文档对应的文档信息在历史搜索结果中的文档位置对当前的文档搜索结果中的文档信息进行定位,进而将定位到的文档信息排序在文档搜索结果中处于可见状态的搜索页面中,使得用户及时发现历史命中的文档对应的文档信息,进而提高文档的搜索效率。
附图说明
45.为了更清楚地说明本技术实施例的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
46.图1为本技术实施例一提供的一种文档搜索的优化处理方法的流程图;
47.图2、图3、图4、图5、图6分别为本技术实施例一提供的一种文档搜索的优化处理方法的部分流程图;
48.图7为本技术实施例二提供的一种文档搜索的优化处理装置的结构示意图;
49.图8为本技术实施例二提供的一种文档搜索的优化处理装置的另一结构示意图;
50.图9为本技术实施例三提供的一种电子设备的结构示意图。
具体实施方式
51.下面将结合本技术实施例中的附图,对本技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本技术一部分实施例,而不是全部的实施例。基于
本技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本技术保护的范围。
52.参考图1所示,为本技术实施例一提供的一种文档搜索的优化处理方法的实现流程图,该方法可以适用于能够进行数据处理的电子设备中,如计算机或服务器。本实施例中的技术方案主要用于提高文档搜索效率。
53.具体的,本实施例中的方法可以包含如下步骤:
54.步骤101:获得文档搜索请求。
55.其中,文档搜索请求中包含至少一个搜索关键词。搜索关键词可以为待搜索的文档的名称、标题中的字或词。搜索关键词可以有一个或多个。
56.例如,文档搜索请中包含有“利率”、“调息”、“银行”、“企业”和“帮扶”等搜索关键词。
57.步骤102:根据搜索关键词,在文档库中获得文档搜索结果。
58.其中,文档搜索结果包含多个目标文档。
59.具体的,文档库为存储有多个文档的数据库,在接收到文档搜索请求之后,可以按照搜索关键词在文档库中查找与搜索关键词相匹配的文档,进而得到多个目标文档。目标文档与搜索关键词相匹配是指:目标文档中包含搜索关键词,或者目标文档中的文档字符与搜索关键词之间的相似度高于相似阈值。
60.例如,按照“利率”、“调息”、“银行”、“企业”和“帮扶”等搜索关键词,在文档库中检索到100个目标文档与这些搜索关键词相匹配。
61.步骤103:通过至少两个搜索页面输出目标文档对应的文档信息,且至少两个搜索页面中的目标页面处于可见状态。
62.其中,文档信息可以为相应文档的跳转链接,该跳转链接用于指向相应文档的存储位置,进而在用户点击该跳转链接时,可以读取到相应的文档并输出给用户。
63.另外,受限于电子设备输出区域,多个目标文档可以分页显示,分页所形成的多个搜索页面中仅有一个目标页面处于可见状态,相应的,搜索页面对应有翻页控件,在翻页控件被点击的情况下,切换搜索页面,以使得被选择的搜索页面被作为目标页面处于可见状态。
64.例如,本实施例中将检索到的100个目标文档按照每页10个跳转链接的显示方式输出,由此,通过10个搜索页面输出这100个目标文档的跳转连接,在任意时刻,仅有其中一个页面上的10个目标文档的跳转链接处于可见状态。
65.步骤104:在路径库中,获得与搜索关键词相匹配的目标搜索路径。
66.其中,路径库中包含有多条文档搜索路径,文档搜索路径至少表征其对应的历史文档对应的文档信息在历史搜索结果中的文档位置。这里的文档位置可以包含:历史文档对应的文档信息在历史搜索中被命中时在历史搜索结果中的搜索页面的次序以及在所在搜索页面中的次序。
67.例如,文档a在历史搜索中被命中时,文档a的跳转链接处于第二页的第三行,该文档a对应的文档搜索路径即表征文档a的跳转链接在历史搜索结果中处于第二个搜索页面的第三行。
68.基于此,本实施例中可以在路径库中,按照搜索关键词查找与搜索关键词相匹配
的文档搜索路径,即目标搜索路径。
69.步骤105:根据目标搜索路径所表征的文档位置,至少对目标文档对应的文档信息所在的搜索页面进行调整,以使得目标搜索路径在目标文档中对应的第一文档对应的文档信息在目标页面中显示。
70.具体的,本实施例中可以将目标搜索路径在目标文档中对应的第一文档对应的文档信息从其所在的当前页面调整到目标页面上,这样第一文档的文档信息就可以处于可见状态。
71.从上述技术方案可以看出,本技术实施例一提供的一种文档搜索的优化方法中,在获得到文档搜索请求之后,根据其中的搜索关键词,在文档库中获得多个目标文档,这多个目标文档对应的文档信息通过多个搜索页面显示,且仅其中的一个目标页面中的文档信息处于可见状态,之后,通过获得搜索关键词对应的文档搜索路径,进而使用该文档搜索路径所表征的历史搜索中命中的文档对应的文档信息在历史搜索结果中的文档位置,对目标文档对应的文档信息所在的搜索页面进行调整,使得搜索关键词在历史搜索中命中的第一文档对应的文档信息处于可见状态。可见,本实施例中通过历史搜索中命中文档对应的文档信息在历史搜索结果中的文档位置对当前的文档搜索结果中的文档信息进行定位,进而将定位到的文档信息排序在文档搜索结果中处于可见状态的搜索页面中,使得用户及时发现历史命中的文档对应的文档信息,进而提高文档的搜索效率。
72.在一种实现方式中,本实施例中还可以包含如下步骤,用以建立路径库,如图2中所示:
73.步骤201:获得历史关键词和历史关键词命中的历史文档。
74.其中,历史关键词为历史搜索中用户的原始输入关键词,历史关键词命中的历史文档为历史搜索中使用历史关键词在文档库中进行搜索所确定的文档。
75.具体的,本实施例中可以通过对文档的历史搜索记录进行读取,进而根据这些历史搜索记录获得历史关键词和历史关键词命中的历史文档。
76.步骤202:至少根据历史关键词对应的搜索页面翻页次数、历史文档对应的文档信息所在的搜索页面以及历史文档对应的文档信息在其所在搜索页面中的文档位置,生成历史关键词以及历史文档对应的文档搜索路径。
77.其中,本实施例中在历史搜索中对用户的历史关键词、文档信息点选记录、搜索页面翻页次数、目标结果(命中的历史文档)等信息进行记录,得到历史搜索记录,文档信息点选记录可以理解为:在命中目标结果之前,用户选择一个或多个文档信息,以便于查看对应的文档是否为需要的文档,最后用户选择作为目标结果的历史文档。基于此,本实施例中可以在历史搜索记录中获得到对应于历史关键词的文档信息点选记录、搜索页面翻页次数、命中的历史文档等信息,之后,对这些信息进行解析,以确定被命中的历史文档对应的文档信息所在的搜索页面在所有搜索页面中的页面次序、并确定历史文档对应的文档信息在其所在搜索页面中的文档位置,基于此,本实施例中就可以生成该历史关键词和历史文档对应的文档搜索路径,该文档搜索路径能够表征历史关键词对应的命中的历史文档对应的文档信息所在的搜索页面的页面次序以及历史文档对应的文档信息在搜索页面中的文档位置。
78.步骤203:将文档搜索路径添加到路径库中。
79.由此,随着历史搜索次数的增加,路径库中保存有各个历史关键词以及其对应的命中的历史文档对应的文档搜索路径。
80.基于以上实现,本实施例中在步骤202之后,还可包含如下步骤,如图3中所示:
81.步骤204:获得历史文档的文档关键词。
82.其中,本实施例中可以对历史文档的详细文档内容进行提取,如提取历史文档的标题名称、关键词列表、文档标签等内容,之后,在这些详细内容中进行关键词提取,以得到文档关键词。
83.步骤205:在文档关键词中,获得历史关键词对应的关键词补充项。
84.其中,本实施例中可以将这些文档关键词与历史关键词进行相似度计算,进而将与历史关键词相似度低于阈值的文档关键词作为历史关键词对应的关键词补充项。例如,将文档关键词中区别于历史关键词的所有关键词均作为关键词补充项。
85.步骤206:将关键词补充项添加到历史文档对应的文档搜索路径中。
86.也就是说,在文档搜索路径中除了包含有历史关键词,还包含历史文档中区别于历史关键词的其他关键词,由此,可以通过更多个的关键词检索到该文档搜索路径。
87.在一种实现方式中,步骤105中在对目标文档对应的文档信息所在的搜索页面进行调整时,具体可以通过以下方式实现,如图4中所示:
88.步骤401:根据目标搜素路径所表征的文档位置,确定目标搜素路径在目标文档中对应的第一文档。
89.步骤402:将第一文档对应的文档信息从其所在的当前页面调整到目标页面上的第一位置,以使得第一位置对应的文档及排序在第一位置之后的文档在文档搜索结果中排序在第一文档之后。
90.其中,第一位置可以为目标页面中的任意位置,或者,第一位置可以为目标页面中排序在前n个的位置,n为大于或等于1的正整数,或者,第一位置可以为目标页面排序在后n个的位置。
91.可见,本实施例中将第一文档对应的文档信息前移到目标页面中的第一位置,使得在第一位置以及之后位置上的其他文档对应的文档信息均顺次后移,也就是说,在文档搜索结果中,将第一文档前移,相应将相应的其他文档后移,以优化第一文档对应的文档信息的输出位置,使得第一文档对应的文档信息处于可见状态,以便于用户及时查看到第一文档对应的文档信息。
92.例如,按照搜索关键词匹配到的目标搜索路径即表征文档a的跳转链接在历史搜索结果中处于第二个搜索页面的第三行。基于此,在当前的文档搜索结果中,按照该目标搜索路径,定位到文档a的跳转链接,由于文档a的跳转链接处于第二个搜索页面的第三行,没有处于可见状态,因此,本实施例中将文档a的跳转链接从第二个搜索页面的第三行移动到当前处于可见状态的第一个搜索页面的第二行,使得除了第一个搜索页面的第一行上的文档跳转链接不懂,其他文档的跳转链接均后移一个次序,由此,文档a的跳转链接被前移到用户可见的位置,无需用户再次进行翻页操作。
93.在一种实现方式中,在步骤402之后,本实施例中还可以包含如下步骤,如图5中所示:
94.步骤403:监测是否接收到针对第一文档的命中确定操作,在接收到针对第一文档
的命中确定操作的情况下,执行步骤404。
95.其中,命中确定操作可以理解为读取第一文档的至少部分文档内容的操作,例如,在点击第一文档的文档信息并复制第一文档中部分文字的操作,再如,点击第一文档的文档信息并下载第一文档的操作;再如,下载第一文档的操作。命中确定操作表征第一文档为当前搜索所需要的文档。
96.步骤404:根据搜索关键词、第一文档以及第一位置,生成搜索关键词和第一文档对应的文档搜索路径。
97.其中,步骤404中生成文档搜索路径的方式可以参考前文中的相应内容。
98.也就是说,本实施例中在优化第一文档对应的文档信息的输出位置之后,对第一文档对应的文档搜索路径进行优化,在文档库中添加搜索关键词和第一文档对应的优化后的文档搜索路径。
99.在一种实现方式中,在步骤402之后,本实施例中的方法还可以包含如下步骤,如图6中所示:
100.步骤405:监测是否接收到针对第一文档的命中舍弃操作;在接收到针对第一文档的命中舍弃操作的情况下,执行步骤406。
101.其中,命中舍弃操作可以为忽略第一文档的操作。例如,在点击第一文档的文档信息后关闭第一文档的文档页面的操作,再如,点击第一文档的文档信息并不再对第一文档进行浏览或关闭等处理的操作;再如,浏览第一文档所在的搜索页面但未点击第一文档的操作。命中舍弃操作表征第一文档为当前搜索不所需要的文档。
102.步骤406:在目标文档中,获得与第一文档满足关联关系的第二文档。
103.其中,关联关系可以为:第一文档对应的文档标识包含第二文档对应的文档标识,或者,第一文档对应的文档标识与第二文档对应的文档标识之间的相似度高于关联阈值。基于此,在目标文档中检索到与第一文档相关联的第二文档,第二文档可以理解为与第一文档相关度较高推测为当前搜索所需要的文档。
104.具体的,文档标识可以理解为命名为文档的路径标识,如文档id、名称等。
105.步骤407:将第二文档对应的文档信息从其所在的当前页面调整到与第一位置相关联的第二位置。
106.在一种实现方式中,第二位置可以为文档搜索结果中处于第一位置之后且与第一位置相邻的位置,以使得第二位置对应的文档及排序在第二位置之后的文档在所述文档搜索结果中排序在所述第二文档之后。
107.具体的,调整第二文档的方式可以参考前文中调整第一文档的方式。
108.基于以上实现,本实施例中还可以进一步监测是否接收到针对第二文档的命中确定操作,在接收到针对第二文档的命中确定操作的情况下,根据搜索关键词、第二文档以及第二位置,生成搜索关键词和第二文档对应的文档搜索路径。
109.也就是说,本实施例中如果第二文档被命中,那么生成相应新的文档搜索路径,并添加到路径库中,以便于下次使用。
110.在另一种实现方式中,第二位置可以为文档搜索结果中处于第一位置之前且与第一位置相邻的位置,以使得第一置对应的文档及排序在第一位置之后的文档在所述文档搜索结果中排序在所述第二文档之后。
111.需要说明的是,由于第一文档所在的位置被调整,相应的,可以对路径库中第一文档对应的文档搜索路径进行更新,即:以第一文档当前新的位置与搜索关键词生成新的文档搜索路径。
112.参考图7,为本技术实施例二提供的一种文档搜索的优化处理装置的结构示意图,该装置可以配置在能够进行数据处理的电子设备中,如计算机或服务器。本实施例中的技术方案主要用于提高文档搜索效率。
113.具体的,本实施例中的装置可以包含如下单元:
114.请求获得单元701,用于获得文档搜索请求,所述文档搜索请求中包含至少一个搜索关键词;
115.结果获得单元702,用于根据所述搜索关键词,在文档库中获得文档搜索结果;所述文档搜索结果包含多个目标文档;
116.页面输出单元703,用于通过至少两个搜索页面输出所述目标文档对应的文档信息,且所述至少两个搜索页面中的目标页面处于可见状态;
117.路径获得单元704,用于在路径库中,获得与所述搜索关键词相匹配的目标搜索路径;所述路径库中包含有多条文档搜索路径,所述文档搜索路径至少表征其对应的历史文档对应的文档信息在历史搜索结果中的文档位置;
118.页面调整单元705,用于根据所述目标搜索路径所表征的文档位置,至少对所述目标文档对应的文档信息所在的搜索页面进行调整,以使得所述目标搜索路径在所述目标文档中对应的第一文档对应的文档信息在所述目标页面中显示。
119.从上述技术方案可以看出,本技术实施例二提供的一种文档搜索的优化装置中,在获得到文档搜索请求之后,根据其中的搜索关键词,在文档库中获得多个目标文档,这多个目标文档对应的文档信息通过多个搜索页面显示,且仅其中的一个目标页面中的文档信息处于可见状态,之后,通过获得搜索关键词对应的文档搜索路径,进而使用该文档搜索路径所表征的历史搜索中命中的文档对应的文档信息在历史搜索结果中的文档位置,对目标文档对应的文档信息所在的搜索页面进行调整,使得搜索关键词在历史搜索中命中的第一文档对应的文档信息处于可见状态。可见,本实施例中通过历史搜索中命中文档对应的文档信息在历史搜索结果中的文档位置对当前的文档搜索结果中的文档信息进行定位,进而将定位到的文档信息排序在文档搜索结果中处于可见状态的搜索页面中,使得用户及时发现历史命中的文档对应的文档信息,进而提高文档的搜索效率。
120.在一种实现方式中,本实施例中的装置还可以包含如下单元,如图8中所示:
121.路径处理单元706,用于获得历史关键词和所述历史关键词命中的历史文档;至少根据所述历史关键词对应的搜索页面翻页次数、所述历史文档对应的文档信息所在的搜索页面以及所述历史文档对应的文档信息在其所在搜索页面中的文档位置,生成所述历史关键词以及所述历史文档对应的文档搜索路径;将所述文档搜索路径添加到所述路径库中。
122.在一种实现方式中,路径处理单元706还用于:获得所述历史文档的文档关键词;在所述文档关键词中,获得所述历史关键词对应的关键词补充项;将所述关键词补充项添加到所述历史文档对应的文档搜索路径中。
123.在一种实现方式中,页面调整单元705具体用于:根据所述目标搜素路径所表征的文档位置,确定所述目标搜素路径在所述目标文档中对应的第一文档;将所述第一文档对
应的文档信息从其所在的当前页面调整到所述目标页面上的第一位置,以使得所述第一位置对应的文档及排序在所述第一位置之后的文档在所述文档搜索结果中排序在所述第一文档之后。
124.在一种实现方式中,页面调整单元705在将所述第一文档对应的文档信息从当前页面调整到所述目标页面上的第一位置之后,还用于:监测是否接收到针对所述第一文档的命中确定操作;在接收到针对所述第一文档的命中确定操作的情况下,触发路径处理单元706根据所述搜索关键词、所述第一文档以及所述第一位置,生成所述搜索关键词和所述第一文档对应的文档搜索路径。
125.在一种实现方式中,页面调整单元705还用于:监测是否接收到针对所述第一文档的命中舍弃操作;在接收到针对所述第一文档的命中舍弃操作的情况下,在所述目标文档中,获得与所述第一文档满足关联关系的第二文档;将所述第二文档对应的文档信息从其所在的当前页面调整到与所述第一位置相关联的第二位置。
126.在一种实现方式中,所述第二位置为所述文档搜索结果中处于所述第一位置之后且与所述第一位置相邻的位置,以使得所述第二位置对应的文档及排序在所述第二位置之后的文档在所述文档搜索结果中排序在所述第二文档之后;
127.其中,页面调整单元705还用于:监测是否接收到针对所述第二文档的命中确定操作;在接收到针对所述第二文档的命中确定操作的情况下,,触发路径处理单元706根据所述搜索关键词、所述第二文档以及所述第二位置,生成所述搜索关键词和所述第二文档对应的文档搜索路径。
128.优选方案中,所述关联关系包括:所述第一文档对应的文档标识包含所述第二文档对应的文档标识。
129.需要说明的是,本实施例中各单元的具体实现可以参考前文中的相应内容,此处不再详述。
130.参考图9,为本技术实施例三提供的一种电子设备的结构示意图,该电子设备可以为能够进行数据处理的电子设备中,如计算机或服务器。本实施例中的技术方案主要用于提高文档搜索效率。
131.具体的,本实施例中的电子设备可以包含如下结构:
132.存储器901,用于存储计算机程序以及所述计算机程序运行所产生的数据;
133.处理器902,用于执行所述计算机程序,以实现:获得文档搜索请求,所述文档搜索请求中包含至少一个搜索关键词;根据所述搜索关键词,在文档库中获得文档搜索结果;所述文档搜索结果包含多个目标文档;通过至少两个搜索页面输出所述目标文档对应的文档信息,且所述至少两个搜索页面中的目标页面处于可见状态;在路径库中,获得与所述搜索关键词相匹配的目标搜索路径;所述路径库中包含有多条文档搜索路径,所述文档搜索路径至少表征其对应的历史文档对应的文档信息在历史搜索结果中的文档位置;根据所述目标搜索路径所表征的文档位置,至少对所述目标文档对应的文档信息所在的搜索页面进行调整,以使得所述目标搜索路径在所述目标文档中对应的第一文档对应的文档信息在所述目标页面中显示。
134.从上述技术方案可以看出,本技术实施例三提供的一种电子设备中,在获得到文档搜索请求之后,根据其中的搜索关键词,在文档库中获得多个目标文档,这多个目标文档
对应的文档信息通过多个搜索页面显示,且仅其中的一个目标页面中的文档信息处于可见状态,之后,通过获得搜索关键词对应的文档搜索路径,进而使用该文档搜索路径所表征的历史搜索中命中的文档对应的文档信息在历史搜索结果中的文档位置,对目标文档对应的文档信息所在的搜索页面进行调整,使得搜索关键词在历史搜索中命中的第一文档对应的文档信息处于可见状态。可见,本实施例中通过历史搜索中命中文档对应的文档信息在历史搜索结果中的文档位置对当前的文档搜索结果中的文档信息进行定位,进而将定位到的文档信息排序在文档搜索结果中处于可见状态的搜索页面中,使得用户及时发现历史命中的文档对应的文档信息,进而提高文档的搜索效率。
135.以客户对银行文档库的搜索场景为例,不同的客户使用文档库检索时,可能输入相同或不同的检索条件,文档库不可避免的因为客户的输入条件不足导致搜索结果不准确,从而导致大量的翻页才能找到所需的文档结果,现有的文档库不能动态的对用户的翻页或者输入补充关键词的过程进行记录,从而对后续相似客户的检索提供支持,影响了客户体验的提升。
136.有鉴于此,基于本技术,本实施例中提出一种文档库回放搜索优化方案,客户搜索完成后,通过对客户的搜索历史和操作动作记录对搜索过程进行离线回放,回放完成后针对客户的输入和目标结果集采用动态分析的方式对文档结果路径进行优化,并且对各个优化路径生成路径标识,在客户在线检索的过程中对路径标识进行匹配从而优化自动优化客户的命中文档集,帮助客户快速定位所需的文档,减少客户的无效操作次数。
137.本实施例中的方案主要包含两个部分:
138.离线回放模块:根据客户的输入和命中结果对客户的点选路径进行动态优化,并根据文档采样生成路径标识和关联关系。
139.在线应用模块:在客户搜索时采用标识匹配快速逼近的方法对命中结果集进行优化,帮助客户快速逼近目标结果。
140.基于此,本实施例中建立一种基于检索历史的文档库回放搜索优化方法,该方法能够自动对客户的检索历史进行回放,对客户的点选路径进行优化和关联,实现客户文档命中集的优化,具体方案如下:
141.当客户使用文档库进行搜索时,系统对客户的原始输入关键词、文档点选记录、翻页次数、目标结果、目标结果所在页码等进行记录,将记录结果传入离线回放模块,模块生成优化路径表,当客户后续使用文档库检索时,自动根据优化路径表进行匹配和结果集点选优化。
142.离线回放模块负责对客户的点选记录回放和搜索优化,具体过程如下:对系统记录的搜索信息,提取原始关键词m和目标结果d,根据检索记录生成客户的检索路径作为m和d对的原路径。其次对目标结果d,获取文档的详细内容包括标题名称、关键词列表、标签等,将上述要素项与m进线相似度计算,获取相似度差别最大的要素项值作为m的补充项,再次计算m到d的路径,将所述结果记为补充关键词路径p。
143.在线应用模块中,在待检索的文档要素项与关键词结果m相似时,对命中结果集中的翻页结果进行优化,将d所在的分页项前移,将所述结果记为优化路径q。
144.在优化路径p和q生成的过程中,对命中文档集中的结果进行采样,例如对第5*n 1条文档进行采样(n为页码,每页有5条文档的信息),将文档的id、文档名称作为路径标识,
对p和q中的所有文档标识进行比对,如果优化路径1(即采样到的文档)的标识包括优化路径2(如p对应的文档)的标识,将路径1和路径2建立关联关系,即先对优化路径2进行优化(前移文档),如果优化路径2后路径1发生变化,那么再对优化路径1进行优化。
145.客户使用系统时即可在线对上述生成的优化路径表进行应用,在线应用采用标识匹配快速逼近的方法对命中文档集进行优化,具体方法如下:首先采用原生的匹配方法对文档库进行检索,在点选过程中动态对文档进行采样和标识匹配,当点选过程中的文档命中标识结果时自动对命中优化路径变化,方便客户的后续结果集选择;如果文档集未命中,此时继续根据关联关系对相关优化路径进行命中优化,直到命中客户所需的结果集。
146.本发明提供的文档搜索的优化处理方法、装置及电子设备可用于大数据或其他领域,例如,可用于大数据领域中的海量数据搜索场景。其他领域为除金融领域之外的任意领域,例如,分布式领域、云计算领域、人工智能领域、物联网领域。上述仅为示例,并不对本发明提供的发明名称的应用领域进行限定。
147.本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的装置而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。
148.专业人员还可以进一步意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本技术的范围。
149.结合本文中所公开的实施例描述的方法或算法的步骤可以直接用硬件、处理器执行的软件模块,或者二者的结合来实施。软件模块可以置于随机存储器(ram)、内存、只读存储器(rom)、电可编程rom、电可擦除可编程rom、寄存器、硬盘、可移动磁盘、cd-rom、或技术领域内所公知的任意其它形式的存储介质中。
150.对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本技术。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本技术的精神或范围的情况下,在其它实施例中实现。因此,本技术将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。
再多了解一些

本文用于创业者技术爱好者查询,仅供学习研究,如用于商业用途,请联系技术所有人。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献