信息检索方法及装置与流程

2022-09-02 20:37:41 来源：中国专利 TAG：

1.本发明涉及通信技术领域，尤其涉及一种信息检索方法及装置。

背景技术：

2.以信息技术发展为代表的社会进步，数据信息的积累以级数速度增长，数据量大和价值密度低却是困扰如此海量数据信息利用的难题，在巨大的市场需求面前，互联网搜索为当今互联网应用的热门，各种搜索引擎也应运而生。
3.目前，用户在网页或者本地搜索栏中通过输入文本信息检索需求的信息，通常，网页首先将用户输入的文本信息与索引库中的索引信息进行匹配，这些索引信息为具有逻辑指向性的指针，然后通过与用户输入的文本信息相匹配的索引信息指向与文本信息相匹配的数据，并向用户展示这些数据。这一过程中，网页会直接将用户输入的文本信息与索引库中的索引信息进行匹配，例如计算两者的语义相似度，并选择语义相似度较高的作为检索结果。
4.但是，索引库包含海量历史数据，同时各个历史数据之间的语义相似度也较高，如果只通过计算用户输入的文本信息与索引信息之间的语义相似度确定检索结果，不仅会耗费大量时间，同时，检索结果的准确度也难以确保。

技术实现要素：

5.本发明实施例提供一种信息检索方法及装置，以解决现有的检索方式存在检索效率低、以及检索结果的准确度低的问题。
6.为解决上述技术问题，本发明实施例是这样实现的：
7.第一方面，本发明实施例提供了一种信息检索方法，包括：
8.确定检索词所对应的指定数量个领域类别；
9.确定在各所述领域类别中，所述检索词分别与索引库中各索引信息的检索匹配分值及地理位置匹配分值；
10.根据各所述检索匹配分值和各所述地理位置匹配分值，计算各所述索引信息分别对应的最终检索分值；
11.按照所述最终检索分值对各所述索引信息进行排序，得到第一排序结果，基于所述第一排序结果生成所述检索词对应的检索结果。
12.第二方面，本发明实施例还提供了一种信息检索装置，包括：
13.第一确定模块，用于确定检索词所对应的指定数量个领域类别；
14.第二确定模块，用于确定在各所述领域类别中，所述检索词分别与索引库中各索引信息的检索匹配分值及地理位置匹配分值；
15.计算模块，用于根据各所述检索匹配分值和各所述地理位置匹配分值，计算各所述索引信息分别对应的最终检索分值；
16.排序及生成模块，用于按照所述最终检索分值对各所述索引信息进行排序，得到
第一排序结果，基于所述第一排序结果生成所述检索词对应的检索结果。
17.第三方面，本发明实施例还提供了一种信息检索设备，包括：
18.存储器，存储有计算机程序指令；
19.处理器，当所述计算机程序指令被所述处理器执行时实现如上述第一方面所述的信息检索方法。
20.第四方面，本发明实施例还提供了一种计算机可读存储介质，所述计算机可读存储介质包括指令，当所述指令在计算机上运行时，使得所述计算机执行如上述第一方面所述的信息检索方法。
21.在本发明实施例中，通过确定检索词所对应的指定数量个领域类别，并确定在各领域类别中，检索词分别与索引库中各索引信息的检索匹配分值及地理位置匹配分值，根据各检索匹配分值和各地理位置匹配分值，计算各索引信息分别对应的最终检索分值，从而按照最终检索分值对各索引信息进行排序，得到第一排序结果，进而基于第一排序结果生成检索词对应的检索结果。可见，该技术方案在进行信息检索时，能够充分考虑检索词与各索引信息之间的检索匹配程度及地理位置匹配程度，并对应计算出各索引信息的最终检索分值，根据最终检索分值的排序结果确定检索词对应的检索结果，相较于传统的仅计算检索词与各索引信息的语义相似度来确定检索词对应的检索结果的方式而言，能够对检索词与各索引信息进行更具针对性的计算，避免大量的无效计算，提高了信息检索的检索效率，且提高了检索结果的准确度。
附图说明
22.为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明中记载的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动性的前提下，还可以根据这些附图获得其他的附图。
23.图1是本发明的一个实施例中一种信息检索方法的示意性流程图。
24.图2是本发明的一个实施例中一种衰减函数的曲线图。
25.图3是本发明的另一个实施例中一种信息检索方法的示意性流程图。
26.图4是本发明的一个实施例中一种信息检索装置的结构示意图。
27.图5是本发明的一个实施例中一种信息检索设备的结构示意图。
具体实施方式
28.下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。
29.图1是本发明的一个实施例中一种信息检索方法的示意性流程图，图1的方法可包括：
30.s102，确定检索词所对应的指定数量个领域类别。
31.需要说明的是，本发明实施例提供的信息检索方法可应用于在应用商城检索应
用、在商品平台检索商品、在搜索引擎检索信息等多种信息检索场景。以在商品平台检索商品为例，领域类别可包括服装、母婴、饰品、家电、日用品、数码产品等类别。
32.s104，确定在各领域类别中，检索词分别与索引库中各索引信息的检索匹配分值及地理位置匹配分值。
33.s106，根据各检索匹配分值和各地理位置匹配分值，计算各索引信息分别对应的最终检索分值。
34.s108，按照最终检索分值对各索引信息进行排序，得到第一排序结果，基于第一排序结果生成检索词对应的检索结果。
35.其中，在基于第一排序结果生成检索词对应的检索结果时，可根据预设的需展示的检索结果的目标数量，提取第一排序结果中的前目标数量个索引信息作为检索结果推送给用户。
36.在本发明实施例中，通过确定检索词所对应的指定数量个领域类别，并确定在各领域类别中，检索词分别与索引库中各索引信息的检索匹配分值及地理位置匹配分值，根据各检索匹配分值和各地理位置匹配分值，计算各索引信息分别对应的最终检索分值，从而按照最终检索分值对各索引信息进行排序，得到第一排序结果，进而基于第一排序结果生成检索词对应的检索结果。可见，该技术方案在进行信息检索时，能够充分考虑检索词与各索引信息之间的检索匹配程度及地理位置匹配程度，并对应计算出各索引信息的最终检索分值，根据最终检索分值的排序结果确定检索词对应的检索结果，相较于传统的仅计算检索词与各索引信息的语义相似度来确定检索词对应的检索结果的方式而言，能够对检索词与各索引信息进行更具针对性的计算，避免大量的无效计算，提高了信息检索的检索效率，且提高了检索结果的准确度。
37.在一个实施例中，执行s102时，可分别计算检索词与索引库中各个领域类别之间的语义相似度，按照语义相似度对各个领域类别进行排序，得到第二排序结果，并根据第二排序结果、以及预先设定的指定数量，确定出该检索词所对应的指定数量个领域类别。
38.其中，在按照语义相似度对各个领域类别进行排序时，可按照语义相似度从高到低的顺序对各个领域类别进行排序，得到第二排序结果，从而根据预先设定的指定数量，确定第二排序结果中前指定数量个领域类别为该检索词所对应的领域类别。
39.假设索引库中包含k个领域类别，预先设定的指定数量为n，则在执行s102时，可分别计算检索词与k个领域类别之间的语义相似度s
1-sk，并根据第二排序结果，确定第二排序结果中的前n个领域类别为该检索词所对应的领域类别m
1-mn。
40.本实施例中，可通过word2vec(word to vector，将单词转换成向量)算法将检索词及领域类别转换成向量，然后计算检索词向量和各个领域类别向量的余弦向量度，作为检索词与各个领域类别之间的语义相似度。
41.在本实施例中，通过准确确定检索词所对应的指定数量个领域类别，为后续步骤打下基础，有利于后续步骤中对检索词与各索引信息的检索匹配分值及地理位置匹配分值的准确计算。
42.在一个实施例中，可根据如下步骤a1-a3，确定在各领域类别中，检索词分别与索引库中各索引信息的检索匹配分值：
43.步骤a1，确定各领域类别分别对应的检索相关分值。
44.其中，对于各个领域类别c，可预设检索相关分值k(c)。且由于特定领域类别可能对检索有不同的影响，因此可对不同的领域类别预设不同的检索相关分值。沿用上述实施例中所列举的检索词对应的领域类别m
1-mn，可预设领域类别m
1-mn的检索相关分值
45.步骤a2，分别计算检索词与各索引信息的匹配度。
46.其中，可首先采用分词算法对检索词进行分词，得到检索词对应的各分词，并可将各分词与各索引信息的倒排索引列表进行一一比较，如果匹配中则可确定此索引信息为检索命中的索引信息，并计算检索词与命中的索引信息的匹配度a。如果检索词中各分词与一索引信息的倒排索引列表均不匹配，则可确定该索引信息不是检索命中的索引信息，检索词与该索引信息的匹配度a为0。
47.本实施例中，可采用bm25算法计算检索词与命中的索引信息的匹配度a。bm25是一种用来评价检索词和文档(即各索引信息的倒排索引列表)之间相关性的算法，它是一种基于概率检索模型提出的算法。根据bm25算法，依据不同分词的词频可计算得到检索词与各索引信息的匹配度a。bm25算法的公式为：
[0048][0049]
公式(1)中，d为文档document，也即各索引信息的倒排索引列表；q为查询语句query，也即检索词；score(d，q)表示查询语句在该文档下的打分函数，也即上述的匹配度a。qi是对q分词后项term，也即q的分词；idf(inverse document frequency，倒排文件频次)指在倒排索引列表中出现的次数；f(qi，d)是qi在文档中出现的频次；k1和b是可调参数，默认值k1为1.2，b为0.75；|d|是文档的单词的个数，avgdl指索引库里的平均文档长度。
[0050]
其中，idf的计算公式为：公式(2)中，n是总的文档数目，n(qi)是出现qi的文档数目。
[0051]
步骤a3，根据检索相关分值和匹配度，分别计算在各领域类别中查询检索词的检索匹配分值。
[0052]
本实施例中，可将步骤a2中确定的匹配度a分别与步骤a1中预设的领域类别m
1-mn的检索相关分值进行乘法计算，得到各领域类别中查询该检索词的检索匹配分值
[0053]
在本实施例中，通过确定各领域类别分别对应的检索相关分值，分别计算检索词与各索引信息的匹配度，并根据检索相关分值和匹配度，分别计算在各领域类别中查询检索词的检索匹配分值，为后续步骤提供了数据基础，有利于确定出各索引信息分别对应的最终检索分值，从而有利于准确确定出符合用户需求的检索结果。
[0054]
在一个实施例中，可根据如下步骤b1-b3，确定在各领域类别中，检索词分别与索引库中各索引信息的地理位置匹配分值：
[0055]
步骤b1，确定各领域类别分别对应的地理位置相关分值。
[0056]
其中，对于各个领域类别c，可预设地理位置相关分值l(c)。且由于特定领域类别可能对检索有不同的影响，因此可对不同的领域类别预设不同的地理位置相关分值。例如，对于受地理位置影响较大的餐饮领域类别，可预设较大的地理位置相关分值，而对于受地理位置影响较小的科技领域类别，可预设较小的地理位置相关分值。沿用上述实施例中所列举的检索词对应的领域类别m
1-mn，可预设领域类别m
1-mn的地理位置相关分值
[0057]
步骤b2，筛选匹配度大于第一预设阈值的索引信息作为目标索引信息，分别确定各目标索引信息的地理位置与检索词的地理位置之间的距离远近程度。
[0058]
其中，匹配度为上述步骤a2中计算出的检索词与各索引信息的匹配度a。第一预设阈值可为0，执行该步骤时筛选匹配度a大于0的索引信息作为目标索引信息，也即排除掉检索未命中的索引信息，减少了计算量，有利于提高信息检索的检索效率。需要说明的是，在具体的应用场景中，第一预设阈值可根据需求进行设置，以进一步通过减少计算量来提高信息检索的检索效率。
[0059]
其中，可通过公式(3)确定地理位置因素的得分score(u，a)，也即目标索引信息的地理位置与检索词的地理位置之间的距离远近程度b：
[0060]
score(u，a)＝func(decay，scale，offset，origin，destination)，
ꢀꢀꢀ
(3)
[0061]
其中，u为用户，a为各目标索引信息对应的广告商家。func支持三种衰减函数，分别包括gauss高斯函数、exp指数函数和lin线性函数。orgin为用户的地理位置(即检索词的地理位置)，destination为广告商家的地理位置(即目标索引信息的地理位置)。origin为中心点，或是字段可能的最佳值(本实施例中即为检索词的地理位置)，落在origin上则score(u，a)为满分1.0。offset为偏移量，以origin为中心，设置offset覆盖一个范围，在此范围内所有的评分score(u，a)也都是和origin一样为满分1.0。scale为衰减率，即是从origin下落时，score(u，a)改变的速度。decay为从origin衰减到scale所得的评分score(u，a)，默认为0.5(一般不需要改变，这个参数使用默认的就好)。
[0062]
本实施例中，func支持的三种衰减函数的曲线图可参考图2，其中横轴为地理位置坐标，纵轴为地理位置因素的得分score(u，a)。lin线性函数是条直线，一旦直线与横轴相交，所有其他值的评分都是0。exp指数函数是先剧烈衰减然后变缓。gauss高斯函数则是钟形的，其衰减速率是先缓慢，然后变快，最后又放缓。
[0063]
图2中所有曲线(lin、exp和gauss)的origin都是40，offset是5，因此目标索引信息的地理位置与检索词的地理位置之间的距离范围在40-5至40 5时，score(u，a)都是满分1.0。而在此范围之外，score(u，a)会开始衰减，衰减率由scale值(此处是5)和decay值(此处是默认值0.5)决定，在origin
±
(offset scale)处的评分是decay值，也就是在30、50处的score(u，a)是0.5。也就是说，在origin offset scale或是origin-offset-scale的点上，得到的分数仅有decay分。
[0064]
步骤b3，根据地理位置相关分值和距离远近程度，分别计算在各领域类别中查询检索词的地理位置匹配分值。
[0065]
本实施例中，可将步骤b2中确定的距离远近程度b分别与步骤b1中预设的领域类别m
1-mn的地理位置相关分值进行乘法计算，得到各领域类别中查询该检索词的地理位置匹配分值
[0066]
在本实施例中，通过确定各领域类别分别对应的地理位置相关分值，筛选匹配度大于第一预设阈值的索引信息作为目标索引信息，分别确定各目标索引信息的地理位置与检索词的地理位置之间的距离远近程度，根据地理位置相关分值和距离远近程度，分别计算在各领域类别中查询检索词的地理位置匹配分值，为后续步骤提供了数据基础，有利于确定出各索引信息分别对应的最终检索分值，从而有利于准确确定出符合用户需求的检索结果。
[0067]
在一个实施例中，执行上述步骤a1之前，可首先计算各领域类别的实时热度值，若任一领域类别的实时热度值大于第一热度阈值，则将该领域类别对应的检索相关分值和地理距离相关分值按照第一指定倍数增大。其中，第一指定倍数为大于1的倍数，如1.2倍、1.3倍等。
[0068]
执行上述步骤b1之前，可首先计算各领域类别的实时热度值，若任一领域类别的实时热度值小于第二热度阈值，则将该领域类别对应的检索相关分值和地理距离相关分值按照第二指定倍数减小。其中，第二指定倍数为小于1的倍数，如0.8倍、0.6倍等。
[0069]
其中，可根据每一个领域类别的热度数据，如点击率、浏览时间等，计算实时热度值，并根据实时热度值与第一热度阈值或者第二热度阈值的大小关系，对预设的领域类别m
1-mn的检索相关分值或者地理位置相关分值l
m1-l
mn
进行动态调整。
[0070]
需要说明的是，上述的动态调整的相关步骤是自动执行的，动态调整后的检索相关分值以及地理位置相关分值适用于当前应用场景中的任一次信息检索操作。
[0071]
在本实施例中，通过计算各领域类别的实时热度值，能够对检索相关分值和地理位置相关分值的动态调整，使得动态调整后的数据更符合当前用户的检索习惯，从而有利于准确确定出符合用户需求的检索结果。
[0072]
在一个实施例中，可根据如下步骤c1-c3，根据各检索匹配分值和各地理位置匹配分值，计算各索引信息分别对应的最终检索分值：
[0073]
步骤c1，针对任一索引信息，根据各领域类别分别对应的检索匹配分值和地理位置匹配分值，计算该索引信息的各领域类别分别对应的总分值。
[0074]
其中，可将上述步骤a3确定出的检索匹配分值与上述步骤b3确定出的地理位置匹配分值相加，得到该索引信息在预设的领域类别m
1-mn分别对应的总分值(即)。
[0075]
步骤c2，计算索引信息的各领域类别分别对应的总分值的平方和。
[0076]
步骤c3，将平方和进行开平方运算，得到运算结果并确定为索引信息对应的最终检索分值。
[0077]
其中，可根据公式(4)：确定索引信息对应的最终检索分值s。采用该公式可以综合各个领域类别分别对应的总分值，同时会扩大总分值较高的领域类别的影响，缩小总分值较低的领域类别的影响，从而使得检索结果更加的合理。
[0078]
在本实施例中，通过计算各索引信息分别对应的最终检索分值，为后续生成检索
结果提供了数据基础，有利于准确确定出符合用户需求的检索结果。
[0079]
在一个实施例中，执行上述步骤c1时，针对任一领域类别，可根据该领域类别对应的检索匹配分值和地理位置匹配分值，以及预设的检索匹配分值对应的第一权重和地理位置匹配分值对应的第二权重，计算该领域类别对应的总分值。
[0080]
其中，可根据公式(5)：计算该领域类别对应的总分值a为第一权重，b为第二权重。
[0081]
需要说明的是，第一权重和第二权重的大小可根据具体的应用场景进行调整，这一调整过程需要人为干预，调整后的各权重适用于当前应用场景中的任一次信息检索操作。
[0082]
在本实施例中，针对任一领域类别，能够根据该领域类别对应的检索匹配分值和地理位置匹配分值，以及预设的检索匹配分值对应的第一权重和地理位置匹配分值对应的第二权重，计算该领域类别对应的总分值，有利于确定出符合用户需求的检索结果，从而提高了检索结果的准确度。
[0083]
图3是本发明的另一个实施例中一种信息检索方法的示意性流程图，如图3所示，该方法可包括：
[0084]
s301，分别计算检索词与索引库中各个领域类别之间的语义相似度。
[0085]
s302，按照语义相似度对各个领域类别进行排序，得到第二排序结果。
[0086]
s303，根据第二排序结果、以及预先设定的指定数量，确定出检索词所对应的指定数量个领域类别。
[0087]
s304，确定该指定数量个领域类别分别对应的检索相关分值和地理位置相关分值。
[0088]
其中，可计算该指定数量个领域类别的实时热度值，若任一领域类别的实时热度值大于第一热度阈值，则将该领域类别对应的检索相关分值和地理距离相关分值按照第一指定倍数增大。若任一领域类别的实时热度值小于第二热度阈值，则将该领域类别对应的检索相关分值和地理距离相关分值按照第二指定倍数减小。
[0089]
s305，分别计算检索词与索引库中各索引信息的匹配度，根据检索相关分值和匹配度，分别计算在各领域类别中查询检索词的检索匹配分值。
[0090]
s306，筛选匹配度大于第一预设阈值的索引信息作为目标索引信息，分别确定各目标索引信息的地理位置与检索词的地理位置之间的距离远近程度。
[0091]
s307，根据地理位置相关分值和距离远近程度，分别计算在各领域类别中查询检索词的地理位置匹配分值。
[0092]
s308，针对任一领域类别，根据该领域类别对应的检索匹配分值和地理位置匹配分值，以及预设的检索匹配分值对应的第一权重和地理位置匹配分值对应的第二权重，计算该领域类别对应的总分值。
[0093]
s309，计算索引信息的各领域类别分别对应的总分值的平方和，将平方和进行开平方运算，得到运算结果并确定为索引信息对应的最终检索分值。
[0094]
s310，按照最终检索分值对各索引信息进行排序，得到第一排序结果，并基于第一排序结果生成检索词对应的检索结果。
[0095]
上述s301-s310的具体过程在上述实施例中已进行详细说明，此处不再赘述。
[0096]
在本发明实施例中，通过确定检索词所对应的指定数量个领域类别，并确定在各领域类别中，检索词分别与索引库中各索引信息的检索匹配分值及地理位置匹配分值，根据各检索匹配分值和各地理位置匹配分值，计算各索引信息分别对应的最终检索分值，从而按照最终检索分值对各索引信息进行排序，得到第一排序结果，进而基于第一排序结果生成检索词对应的检索结果。可见，该技术方案在进行信息检索时，能够充分考虑检索词与各索引信息之间的检索匹配程度及地理位置匹配程度，并对应计算出各索引信息的最终检索分值，根据最终检索分值的排序结果确定检索词对应的检索结果，相较于传统的仅计算检索词与各索引信息的语义相似度来确定检索词对应的检索结果的方式而言，能够对检索词与各索引信息进行更具针对性的计算，避免大量的无效计算，提高了信息检索的检索效率，且提高了检索结果的准确度。
[0097]
上述对本说明书特定实施例进行了描述。其它实施例在所附权利要求书的范围内。在一些情况下，在权利要求书中记载的动作或步骤可以按照不同于实施例中的顺序来执行并且仍然可以实现期望的结果。另外，在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中，多任务处理和并行处理也是可以的或者可能是有利的。
[0098]
对应上述图1所示实施例提供的信息检索方法，基于相同的技术构思，本发明实施例还提供了一种信息检索装置，图4为本发明实施例提供的信息检索装置的结构示意图，该信息检索装置用于执行图1描述的信息检索方法，如图4所示，该信息检索装置包括：
[0099]
第一确定模块410，用于确定检索词所对应的指定数量个领域类别；
[0100]
第二确定模块420，用于确定在各领域类别中，检索词分别与索引库中各索引信息的检索匹配分值及地理位置匹配分值；
[0101]
计算模块430，用于根据各检索匹配分值和各地理位置匹配分值，计算各索引信息分别对应的最终检索分值；
[0102]
排序及生成模块440，用于按照最终检索分值对各索引信息进行排序，得到第一排序结果，基于第一排序结果生成检索词对应的检索结果。
[0103]
在一个实施例中，第二确定模块420包括：
[0104]
第一确定单元，用于确定各领域类别分别对应的检索相关分值；
[0105]
第一计算单元，用于分别计算检索词与各索引信息的匹配度；
[0106]
第二计算单元，用于根据检索相关分值和匹配度，分别计算在各领域类别中查询检索词的检索匹配分值。
[0107]
在一个实施例中，第二确定模块420还包括：
[0108]
第二确定单元，用于确定各领域类别分别对应的地理位置相关分值；
[0109]
筛选及确定单元，用于筛选匹配度大于第一预设阈值的索引信息作为目标索引信息，分别确定各目标索引信息的地理位置与检索词的地理位置之间的距离远近程度；
[0110]
第三计算单元，用于根据地理位置相关分值和距离远近程度，分别计算在各领域类别中查询检索词的地理位置匹配分值。
[0111]
在一个实施例中，第二确定模块420还包括：
[0112]
第四计算单元，用于计算各领域类别的实时热度值；
[0113]
第一执行单元，用于若任一领域类别的实时热度值大于第一热度阈值，则将领域类别对应的检索相关分值和地理距离相关分值按照第一指定倍数增大；
[0114]
第二执行单元，用于若任一领域类别的实时热度值小于第二热度阈值，则将领域类别对应的检索相关分值和地理距离相关分值按照第二指定倍数减小。
[0115]
在一个实施例中，第一确定模块410包括：
[0116]
第五计算单元，用于分别计算检索词与索引库中各个领域类别之间的语义相似度；
[0117]
排序单元，用于按照语义相似度对各个领域类别进行排序，得到第二排序结果；
[0118]
第三确定单元，用于根据第二排序结果、以及预先设定的指定数量，确定出指定数量个领域类别。
[0119]
在一个实施例中，计算模块430包括：
[0120]
第六计算单元，用于针对任一索引信息，根据各领域类别分别对应的检索匹配分值和地理位置匹配分值，计算索引信息的各领域类别分别对应的总分值；
[0121]
第七计算单元，用于计算索引信息的各领域类别分别对应的总分值的平方和；
[0122]
第三执行单元，用于将平方和进行开平方运算，得到运算结果并确定为索引信息对应的最终检索分值。
[0123]
在一个实施例中，第六计算单元具体用于：
[0124]
针对任一领域类别，根据领域类别对应的检索匹配分值和地理位置匹配分值，以及预设的检索匹配分值对应的第一权重和地理位置匹配分值对应的第二权重，计算领域类别对应的总分值。
[0125]
本发明实施例提供的信息检索装置能够实现上述方法实施例中信息检索方法实现的各个过程，为避免重复，这里不再赘述。
[0126]
在本发明实施例中，通过确定检索词所对应的指定数量个领域类别，并确定在各领域类别中，检索词分别与索引库中各索引信息的检索匹配分值及地理位置匹配分值，根据各检索匹配分值和各地理位置匹配分值，计算各索引信息分别对应的最终检索分值，从而按照最终检索分值对各索引信息进行排序，得到第一排序结果，进而基于第一排序结果生成检索词对应的检索结果。可见，该装置在进行信息检索时，能够充分考虑检索词与各索引信息之间的检索匹配程度及地理位置匹配程度，并对应计算出各索引信息的最终检索分值，根据最终检索分值的排序结果确定检索词对应的检索结果，相较于传统的仅计算检索词与各索引信息的语义相似度来确定检索词对应的检索结果的方式而言，能够对检索词与各索引信息进行更具针对性的计算，避免大量的无效计算，提高了信息检索的检索效率，且提高了检索结果的准确度。
[0127]
请参阅图5，图5是本发明的一个实施例中一种信息检索设备的结构示意图，能够实现上述实施例中由信息检索设备执行的信息检索方法的细节，并达到相同的效果。如图5所示，信息检索设备500包括：处理器501、收发机502、存储器503、用户接口504和总线接口，其中：
[0128]
在本发明实施例中，信息检索设备500还包括：存储在存储器上503并可在处理器501上运行的计算机程序，计算机程序被处理器501执行时实现如下步骤：
[0129]
确定检索词所对应的指定数量个领域类别；
[0130]
确定在各领域类别中，检索词分别与索引库中各索引信息的检索匹配分值及地理位置匹配分值；
[0131]
根据各检索匹配分值和各地理位置匹配分值，计算各索引信息分别对应的最终检索分值；
[0132]
按照最终检索分值对各索引信息进行排序，得到第一排序结果，基于第一排序结果生成检索词对应的检索结果。
[0133]
在图5中，总线架构可以包括任意数量的互联的总线和桥，具体由处理器501代表的一个或多个处理器和存储器503代表的存储器的各种电路链接在一起。总线架构还可以将诸如外围设备、稳压器和功率管理电路等之类的各种其他电路链接在一起，这些都是本领域所公知的，因此，本文不再对其进行进一步描述。总线接口提供接口。收发机502可以是多个元件，即包括发送机和接收机，提供用于在传输介质上与各种其他装置通信的单元。针对不同的用户设备，用户接口504还可以是能够外接内接需要设备的接口，连接的设备包括但不限于小键盘、显示器、扬声器、麦克风、操纵杆等。
[0134]
处理器501负责管理总线架构和通常的处理，存储器503可以存储处理器501在执行操作时所使用的数据。
[0135]
在本发明实施例中，通过确定检索词所对应的指定数量个领域类别，并确定在各领域类别中，检索词分别与索引库中各索引信息的检索匹配分值及地理位置匹配分值，根据各检索匹配分值和各地理位置匹配分值，计算各索引信息分别对应的最终检索分值，从而按照最终检索分值对各索引信息进行排序，得到第一排序结果，进而基于第一排序结果生成检索词对应的检索结果。可见，该设备在进行信息检索时，能够充分考虑检索词与各索引信息之间的检索匹配程度及地理位置匹配程度，并对应计算出各索引信息的最终检索分值，根据最终检索分值的排序结果确定检索词对应的检索结果，相较于传统的仅计算检索词与各索引信息的语义相似度来确定检索词对应的检索结果的方式而言，能够对检索词与各索引信息进行更具针对性的计算，避免大量的无效计算，提高了信息检索的检索效率，且提高了检索结果的准确度。
[0136]
优选的，本发明实施例还提供一种信息检索设备，包括处理器501，存储器503，存储在存储器503上并可在所述处理器501上运行的计算机程序，该计算机程序被处理器501执行时实现上述信息检索方法实施例的各个过程，且能达到相同的技术效果，为避免重复，这里不再赘述。
[0137]
本发明实施例还提供一种计算机可读存储介质，计算机可读存储介质上存储有计算机程序，该计算机程序被处理器执行时实现上述信息检索方法实施例的各个过程，且能达到相同的技术效果，为避免重复，这里不再赘述。其中，所述的计算机可读存储介质，如只读存储器(read-only memory，简称rom)、随机存取存储器(random access memory，简称ram)、磁碟或者光盘等。
[0138]
需要说明的是，在本文中，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下，由语句“包括一个
……”
限定的要素，并不排除在包括该要素的过程、方法、物品或者装置中还存在另外的相同要素。
[0139]
通过以上的实施方式的描述，本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现，当然也可以通过硬件，但很多情况下前者是更佳的实施方式。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质(如rom/ram、磁碟、光盘)中，包括若干指令用以使得一台终端(可以是手机，计算机，服务器，空调器，或者网络设备等)执行本发明各个实施例所述的方法。
[0140]
上面结合附图对本发明的实施例进行了描述，但是本发明并不局限于上述的具体实施方式，上述的具体实施方式仅仅是示意性的，而不是限制性的，本领域的普通技术人员在本发明的启示下，在不脱离本发明宗旨和权利要求所保护的范围情况下，还可做出很多形式，均属于本发明的保护之内。

再多了解一些

1/2 1 2 下一页尾页

本文用于企业家、创业者技术爱好者查询，结果仅供参考。

上一篇：返回列表
下一篇：多目标服务资源科技服务方法与系统与流程

信息检索方法及装置与流程

相关文献

最热文献