一种确定搜索结果顺序的方法和装置与流程

2021-11-20 00:56:00 来源：中国专利 TAG：

1.本发明涉及计算机技术领域，尤其涉及一种确定搜索结果顺序的方法和装置。

背景技术：

2.随着互联网技术的发展，信息数量急剧膨胀，信息搜索成为互联网的核心功能。为了提高查找数据的效率，搜索引擎通常建立索引，一般将搜索结果的索引分为全量索引和增量索引两部分，其中，增量索引指的是实时更新的索引数据，一旦有增量数据会实时更新到搜索引，全量索引指的是一段时间范围的全部索引数据，通常，每隔一段时间根据全部索引数据对全量索引进行更新。
3.在实现本发明过程中，发明人发现现有技术中至少存在如下问题：
4.通常按照时间的顺序，对已有的索引标识进行累加，以确定新增数据的增量索引；对于数据量比较大的系统，比如电子商城的商品数据，为了用户的浏览体验，在搜索的过程中可以设置返回的搜索结果的数量上限而截断索引值排在后面的数据，因此增量索引排列位置越靠后，则其关联的数据被返回的几率越小，而索引值排在前面的搜索结果，即便其数据质量比较低也依然被优先返回给用户，这降低了搜索结果的数据质量，影响了用户的浏览体验。

技术实现要素：

5.有鉴于此，本发明实施例提供一种确定搜索结果顺序的方法和装置，能够根据历史数据的搜索结果和分布模型，构建基于质量数值形成的区间，通过计算新增数据的质量数值，确定新增数据所归属的区间，并根据区间的信息确定新增数据的索引值，解决了新增数据以时间顺序确定索引值而未考虑数据质量的问题，从而提高了数据搜索结果的数据质量，提升了用户的浏览体验。
6.为实现上述目的，根据本发明实施例的一个方面，提供了一种确定搜索结果顺序的方法，其特征在于，包括：获取预定义时间段内的历史搜索结果的质量数值，根据多个所述质量数值，计算所述质量数值的平均值和标准差，其中所述质量数值是根据所述历史搜索结果的一个或多个质量因子的取值而计算得到的；利用所述平均值和所述标准差，基于分布模型，确定所述历史搜索结果的质量数值对应的区间信息，以及所述历史搜索结果的索引值；获取新增数据，根据所述新增数据的一个或多个质量因子的取值，计算所述新增数据的质量数值；根据所述新增数据的质量数值，确定所述新增数据对应的区间和索引值；根据所述索引值，确定返回所述新增数据的搜索结果的顺序。
7.可选地，所述确定搜索结果顺序的方法，其特征在于，
8.所述区间信息包括对应于所述区间的质量数值的范围和所述区间所包含的搜索结果数量上限。
9.可选地，所述确定搜索结果顺序的方法，其特征在于，
10.根据所述质量因子的数值，计算所述新增数据的质量数值，包括：
11.基于所述质量因子的数值和所述质量因子的权重值，计算所述新增数据的质量数值。
12.可选地，所述确定搜索结果顺序的方法，其特征在于，
13.根据所述新增数据的质量数值，确定所述新增数据对应的区间和索引值，包括：
14.在所确定的区间所包括的新增数据的数量小于所述搜索结果数量上限时，递增所述区间已包括的所述新增数据的最大索引值，以确定所述新增数据的索引值。
15.可选地，所述确定搜索结果顺序的方法，其特征在于，
16.根据所述新增数据的质量数值，确定所述新增数据对应的区间和索引值，包括：
17.在所确定的区间所包括的新增数据的数量不小于所述搜索结果数量上限时，累计各个所述区间的搜索结果数量的上限数值，以确定所述新增数据的索引值。
18.可选地，所述确定搜索结果顺序的方法，其特征在于，
19.当新增数据指示为所述历史搜索结果的更新数据时，确定所述历史搜索结果的索引值为所述新增数据的索引值。
20.可选地，所述确定搜索结果顺序的方法，其特征在于，
21.利用所述平均值和所述标准差，基于分布模型，确定所述历史搜索结果的质量数值对应的区间信息，包括：
22.所述分布模型为正态分布模型。
23.为实现上述目的，根据本发明实施例的第二方面，提供了一种确定搜索结果顺序的装置，其特征在于，包括：生成区间模块、计算质量模块和确定标识模块；其中，
24.所述生成区间模块，用于获取预定义时间段内的各历史搜索结果的质量数值，根据多个所述质量数值，计算所述质量数值的平均值和标准差，其中所述质量数值是根据所述历史搜索结果的一个或多个质量因子的取值而计算得到的；利用所述平均值和所述标准差，基于分布模型，确定所述历史搜索结果的质量数值对应的区间信息，以及所述历史搜索结果的索引值；
25.所述计算质量模块，用于获取新增数据，根据所述新增数据的一个或多个质量因子的取值，计算所述新增数据的质量数值；
26.所述确定顺序模块，用于根据所述新增数据的质量数值，确定所述新增数据对应的区间和索引值；根据所述索引值，确定返回所述新增数据的搜索结果的顺序。
27.可选地，所述确定搜索结果顺序的装置，其特征在于，
28.所述区间信息包括对应于所述区间的质量数值的范围和所述区间所包含的搜索结果数量上限。
29.可选地，所述确定搜索结果顺序的装置，其特征在于，
30.根据所述质量因子的数值，计算所述新增数据的质量数值，包括：
31.基于所述质量因子的数值和所述质量因子的权重值，计算所述新增数据的质量数值。
32.可选地，所述确定搜索结果顺序的装置，其特征在于，
33.根据所述新增数据的质量数值，确定所述新增数据对应的区间和索引值，包括：
34.在所确定的区间所包括的新增数据的数量小于所述搜索结果数量上限时，递增所述区间已包括的所述新增数据的最大索引值，以确定所述新增数据的索引值。
35.可选地，所述确定搜索结果顺序的装置，其特征在于，
36.根据所述新增数据的质量数值，确定所述新增数据对应的区间和索引值，包括：
37.在所确定的区间所包括的新增数据的数量不小于所述搜索结果数量上限时，累计各个所述区间的搜索结果数量的上限数值，以确定所述新增数据的索引值。
38.可选地，所述确定搜索结果顺序的装置，其特征在于，
39.当新增数据指示为所述历史搜索结果的更新数据时，确定所述历史搜索结果的索引值为所述新增数据的索引值。
40.可选地，所述确定搜索结果顺序的装置，其特征在于，
41.利用所述平均值和所述标准差，基于分布模型，确定所述历史搜索结果的质量数值对应的区间信息，包括：
42.所述分布模型为正态分布模型。
43.为实现上述目的，根据本发明实施例的第三方面，提供了一种确定搜索结果顺序的电子设备，其特征在于，包括：一个或多个处理器；存储装置，用于存储一个或多个程序，当所述一个或多个程序被所述一个或多个处理器执行，使得所述一个或多个处理器实现如上述确定搜索结果顺序的方法中任一所述的方法。
44.为实现上述目的，根据本发明实施例的第四方面，提供了一种计算机可读介质，其上存储有计算机程序，其特征在于，所述程序被处理器执行时实现如上述确定搜索结果顺序的方法中任一所述的方法。
45.上述发明中的一个实施例具有如下优点或有益效果：能够根据历史数据的搜索结果和分布模型，构建基于质量数值形成的区间，通过计算新增数据的质量数值，确定新增数据所归属的区间，并根据区间的信息确定新增数据的索引值，解决了新增数据以时间顺序确定索引值而未考虑数据质量的问题，从而提高了数据搜索结果的数据质量，提升了用户的浏览体验。
46.上述的非惯用的可选方式所具有的进一步效果将在下文中结合具体实施方式加以说明。
附图说明
47.附图用于更好地理解本发明，不构成对本发明的不当限定。其中：
48.图1是本发明第一实施例提供的一种确定搜索结果顺序的方法的流程示意图；
49.图2是本发明一个实施例提供的一种数据质量数值分布的示意图；
50.图3是本发明第二实施例提供的一种确定搜索结果顺序的方法的流程示意图；
51.图4是本发明第二实施例提供的一种确定搜索结果顺序的示意图；
52.图5是本发明一个实施例提供的一种确定搜索结果顺序的系统的结构示意图；
53.图6是本发明实施例可以应用于其中的示例性系统架构图；
54.图7是适于用来实现本发明实施例的终端设备或服务器的计算机系统的结构示意图。
具体实施方式
55.以下结合附图对本发明的示范性实施例做出说明，其中包括本发明实施例的各种
细节以助于理解，应当将它们认为仅仅是示范性的。因此，本领域普通技术人员应当认识到，可以对这里描述的实施例做出各种改变和修改，而不会背离本发明的范围和精神。同样，为了清楚和简明，以下的描述中省略了对公知功能和结构的描述。
56.如图1所示，本发明实施例提供了一种确定搜索结果顺序的方法，该方法可以包括以下步骤：
57.步骤s101：获取预定义时间段内的历史搜索结果的质量数值，根据多个所述质量数值，计算所述质量数值的平均值和标准差，其中所述质量数值是根据所述历史搜索结果的一个或多个质量因子的取值而计算得到的；利用所述平均值和所述标准差，基于分布模型，确定所述历史搜索结果的质量数值对应的区间信息，以及所述历史搜索结果的索引值；
58.具体地，获取预定义时间段内的历史搜索结果的质量数值，所述预定义时间内的各个搜索结果包含相同的质量因子，以商品信息数据为例，其包含商品名称、商品价格、商品销量等质量因子；并且新增数据与历史搜索结果包含相同的质量因子；
59.所述质量数值为根据某一数据包含的因子计算所得；在数据输入中，新增数据通常根据时间顺序排序，经过预定义的时间进行更新之后形成了历史数据。
60.当数据库包含了过多数据量的时候，为了保证用户体验，往往根据预定义数量阈值对返回给用户的搜索结果进行截断，返回搜索结果的顺序也是基于该索引的。在现有技术中，通常基于时间顺序来截取预定义数量的搜索结果。
61.为了保证搜索结果的有效性和用户体验，相比于按时间顺序来截取预定义数量的搜索结果并建立索引的方法，本实施例采用按照搜索结果的质量数值的高低排序进行截取并建立索引的方法。进一步地，根据经验，历史搜索结果的质量分数呈现正态分布的特征；
62.即，利用所述平均值和所述标准差，基于分布模型，确定所述历史搜索结果的质量数值对应的区间信息，进一步地，所述分布模型为正态分布模型。
63.进一步地，获取预定义时间段内的历史搜索结果，例如：过去一个月内的商品搜索结果，根据已经存在的每条商品数据的质量数值，计算得到这一个月的商品搜索结果的数据的质量数值的平均值和标准差，优选地，进一步确定正态分布模型下的区间信息。即，获取预定义时间段内的历史搜索结果的质量数值，根据多个所述质量数值，计算所述质量数值的平均值和标准差，其中所述质量数值是根据所述历史搜索结果的一个或多个质量因子的取值而计算得到的；利用所述平均值和所述标准差，基于分布模型，确定所述历史搜索结果的质量数值对应的区间信息，以及所述历史搜索结果的索引值；
64.图2示出了正态分布的示例图形；
65.进一步地，所述目标区间模型包含一个或者多个区间，所述区间指示了搜索结果数量上限，和所述质量数值的数值范围；可以理解的是，所述区间之间所对应的质量数值为由大到小排序；
66.如图2中的正态分布的示例图形所示，从左到右，被划分为三个区间，最左侧的区间1所对应的质量数值最大(即，质量较高的搜索结果)，但其涉及的搜索结果(例如，商品信息)的数量并不是最多的；中间的区间2所涉及的搜索结果(例如，商品信息)的数量是最多的，但其对应的质量数值却不是最大的；最右侧的区间3所对应的质量数值最小(即，质量较低的新增数据)，但其涉及的搜索结果(例如，商品信息)的数量也不是最多的。
67.即，所述区间信息包括对应于所述区间的质量数值的范围和所述区间所包含的搜
索结果数量上限。
68.本发明对历史数据的具体内容和包含的质量因子的数值、质量数值的正态分布的具体模型和区间划分不做限定。
69.步骤s102：获取新增数据，根据所述新增数据的一个或多个质量因子的取值，计算所述新增数据的质量数值；
70.具体地，获取新增数据，新增数据来源于第三方或者其他数据输入的方式，时间间隔可能是一秒、一分钟等，例如，新增的商品信息，这里的新增数据为一条数据，即对每一条输入的新增数据进行实时地计算质量数值；
71.所述新增数据包含一个或多个质量因子；根据所述质量因子的数值，计算所述新增数据的质量数值；
72.具体地，新增数据中的质量因子为数据中用来判断和计算质量数值的选项，例如，商品信息数据中的销量、好评数、价格等一个或者多个质量因子，根据质量因子的数值，计算新增数据的质量数值；
73.进一步地，根据所述质量因子的数值，计算所述新增数据的质量数值，包括：基于所述质量因子的数值和所述质量因子的权重值，计算所述新增数据的质量数值。
74.具体地，仍以商品信息数据为例，获取商品销量的数值，运用商品销量的函数计算商品销量的质量数值；类似地，获取商品价格的数值，运用商品价格的函数计算商品价格的质量数值；获取商品好评数的数值，运用商品好评数的函数计算商品好评数的质量数值；基于商品销量的质量数值、商品价格的质量数值、商品好评数的质量数值等，分别对上述各个选项设置权重的值，并分别获得各个权重值与各个数值乘积的和，得到新增数据的质量数值。
75.例如，计算质量数值的示例公式如下所示：
76.q＝w1*f(x1) w2*f(x2) w3*f(x3)
…
..w
n
*f(x
n
)
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(1)
77.其中，q为质量数值，w
1-w
n
为各个质量因子对应的权重值，f(x1)-f(x
n
)为各个质量因子计算其质量数值所使用的函数，函数可以是预定义的计算公式；可以理解的是，所述各个函数计算所得的结果之间为同一个数值范围，例如，数值范围都是0-100；根据不同的应用场景定义不同的预定义的计算公式；例如：商品价格相关的预定义的计算公式是根据该类商品历史商品价格的平均值，计算新增数据的商品价格与平均值的差值并附0-100之间相应的分数；
78.即，根据所述质量因子的数值，计算所述新增数据的质量数值，包括：基于所述质量因子的数值和所述质量因子的权重值，计算所述新增数据的质量数值；
79.进一步地，当新增数据指示为所述历史搜索结果的更新数据时，确定所述历史搜索结果的索引值为所述新增数据的索引值。具体地，当获取的新增数据指示为已经存在的历史搜索结果的更新数据时，即新增数据对某一条的历史数据中的一个或者多个信息进行更新，则利用已有的历史搜索结果的索引值作为该新增数据的索引值，即确定所述历史搜索结果的索引值为所述新增数据的索引值；
80.本发明对预定义的计算公式和权重值的设置、以及计算质量数值的具体公式不作限定。
81.步骤s103：根据所述新增数据的质量数值，确定所述新增数据对应的区间和索引
值；根据所述索引值，确定返回所述新增数据的搜索结果的顺序。
82.具体地，计算质量数值的步骤如s102所描述，根据所述新增数据的质量数值，确定所述新增数据对应的区间和索引值；进一步地，所述索引值可以与新增数据以不同的方式和位置存储，而保证通过索引值可以搜索到其关联的新增数据；本发明对于新增数据的存储方式和索引值的存储方式不做限定；
83.进一步地，根据所述新增数据的质量数值，确定所述新增数据对应的区间和索引值，包括：在所确定的区间所包括的新增数据的数量小于所述搜索结果数量上限时，递增所述区间已包括的所述新增数据的最大索引值，以确定所述新增数据的索引值。
84.下面仍以商品信息数据为例说明上述步骤：
85.假设经过如步骤s102的计算，新增商品信息1的质量数值为99；根据预定义的区间信息，假设区间1搜索结果数量上限为500，质量数值的范围为：85-100；由此可见，新增商品信息1根据其质量数值可以确定为对应于为区间1，查看区间内已经所包括的新增数据数量，例如，已经存在50个，则将新增商品信息1的索引值递增，设置为包含51相关的标识；即，在所确定的区间所包括的新增数据的数量小于所述搜索结果数量上限时，递增所述区间已包括的所述新增数据的最大索引值，以确定所述新增数据的索引值。
86.可以理解的是，优选地，为了保证数据连续性，新增数据的索引值与全量数据的最大索引值相关，例如，假设全量数据的最大索引值为doc100000，则区间1的起始的索引值设置为：doc100001，因此上述新增商品信息1的索引值为doc100052，其中，每一个新增商品信息都包含指示该商品信息为新增商品信息的标志，即，可以根据新增标志确定区间内新增数据的数量；可以理解的是，通常一段时间之后，新增数据会合并到全量数据中，合并之后，指示是否是新增数据的标志也相应变更；
87.如图3所示，本发明实施例提供了一种确定搜索结果顺序的方法，该方法可以包括以下步骤：
88.步骤s301：获取预定义时间段内的历史搜索结果的质量数值，根据多个所述质量数值，计算所述质量数值的平均值和标准差，其中所述质量数值是根据所述历史搜索结果的一个或多个质量因子的取值而计算得到的；利用所述平均值和所述标准差，基于分布模型，确定所述历史搜索结果的质量数值对应的区间信息，以及所述历史搜索结果的索引值；
89.关于根据预定义时间段内的历史搜索结果的质量数值，确定所述历史搜索结果的质量数值对应的区间信息，以及所述历史搜索结果的索引值的描述与步骤s101一致，在此不再赘述。
90.步骤s302：获取新增数据，根据所述新增数据的一个或多个质量因子的取值，计算所述新增数据的质量数值；
91.关于计算新增数据的质量数值的描述与步骤s102一致，在此不再赘述。
92.步骤s303：根据所述新增数据的质量数值，确定所述新增数据对应的区间和索引值；包括：在所确定的区间所包括的新增数据的数量不小于所述搜索结果数量上限时，累计各个所述区间的搜索结果数量的上限数值，以确定所述新增数据的索引值。根据所述索引值，确定返回所述新增数据的搜索结果顺序。
93.具体地，计算质量数值的步骤如s302所描述，根据所述新增数据的质量数值，确定所述新增数据对应的区间和索引值；
94.进一步地，在所确定的区间所包括的新增数据的数量不小于所述搜索结果数量上限时，累计各个所述区间的搜索结果数量的上限数值，以确定所述新增数据的索引值；
95.下面仍以商品信息数据为例说明上述步骤：
96.假设经过计算，新增商品信息1的质量数值为99；，区间1搜索结果数量上限值为500，并且区间1质量数值的范围为：85-100；由此可见，新增商品信息1根据其数据质量对应区间1中的位置，查看区间内所包括的新增数据的数量，假设已经存在500条，500为区间1的搜索结果数量上限，因此新增商品信息1的索引值则通过累计各个所述区间的搜索结果数量的上限数值，以确定所述新增数据的索引值；具体地，当所述区间内所包括的新增数据的数量大于等于所述搜索结果数量上限时，设置所述新增数据的索引值在各个所述区间范围之外，例如设置在所有区间的末尾，即，累计各个所述区间的搜索结果数量的上限数值，以确定所述新增数据的索引值；进一步地，优选地，其索引值与全量索引的数量以及新增数据各个区间定义的搜索结果数量的上限的数量相关，例如：根据全量数据的数量，全量数据的最大的索引值为doc100000，基于各个新增数据区间的新增数据数量的搜索结果数量的上限的和，得到的值为5000，累计总和为100000 5000＝105000，假设新增商品信息1为第一个设置在末尾的唯一标识，则新增商品信息1的索引值为doc1005001，可以理解的是，在所确定的区间所包括的新增数据的数量不小于所述搜索结果数量上限时，每一个上述条件下的新增数据，无论归属于哪个区间，其索引值均为基于末尾的索引值进行累加设置；该操作为了保证在正态分布模型下，质量数值高的新增数据尽可能满足期待的搜索结果数量的上限，有助于提高搜索结果的数据质量，在满足搜索结果数量的上限之后，新进入的新增数据依照时间顺序排列在最后；
97.其中，每一个新增商品信息都包含指示该商品信息为新增商品信息的标志，即，可以根据新增标志确定数据是否是新增数据；可以理解的是，通常一段时间之后，新增数据会合并到全量数据中，合并之后，指示是否是新增数据的标志也相应变更；
98.图4为步骤s303的示意图，如图4所示，
99.其中“2增量”指示各个区间范围内的索引范围，假设增量部分累计各个所述区间的搜索结果数量的上限数值为5000，则增量部分的索引值范围为doc100001-doc105000；“1全量”用虚线表示，指示为已经存在的数据和已经分配的索引值，假设已经存在100000个索引值，则基于全量索引的累加的增量索引从doc100001开始；
100.其中“3增量”指示的范围为各个区间之外的索引值，其索引值范围从doc105001开始，即，在所确定的区间所包括的新增数据的数量不小于所述搜索结果数量上限时，累计各个所述区间的搜索结果数量的上限数值，以确定所述新增数据的索引值。
101.进一步地，根据所述索引值，确定返回所述新增数据的搜索结果的顺序。
102.如图5所示，本发明实施例提供了一种确定搜索结果顺序的装置500，包括：生成区间模块501、计算质量模块502和确定顺序模块503；其中，
103.所述区间模型模块501，用于获取预定义时间段内的各历史搜索结果的质量数值，根据多个所述质量数值，计算所述质量数值的平均值和标准差，其中所述质量数值是根据所述历史搜索结果的一个或多个质量因子的取值而计算得到的；利用所述平均值和所述标准差，基于分布模型，确定所述历史搜索结果的质量数值对应的区间信息，以及所述历史搜索结果的索引值；
104.所述计算质量模块502，用于获取新增数据，根据所述新增数据的一个或多个质量因子的取值，计算所述新增数据的质量数值；
105.所述确定顺序模块503，用于根据所述新增数据的质量数值，确定所述新增数据对应的区间和索引值；根据所述索引值，确定返回所述新增数据的搜索结果的顺序。
106.可选地，所述区间模型模块501，包括所述区间信息包括对应于所述区间的质量数值的范围和所述区间所包含的搜索结果数量上限。
107.可选地，所述计算质量模块502，用于根据所述质量因子的数值，计算所述新增数据的质量数值，包括：
108.基于所述质量因子的数值和所述质量因子的权重值，计算所述新增数据的质量数值。
109.可选地，所述计算质量模块502，用于根据所述新增数据的质量数值，确定所述新增数据对应的区间和索引值，包括：
110.在所确定的区间所包括的新增数据的数量小于所述搜索结果数量上限时，递增所述区间已包括的所述新增数据的最大索引值，以确定所述新增数据的索引值。
111.可选地，所述确定顺序模块503，用于根据所述新增数据的质量数值，确定所述新增数据对应的区间和索引值，包括：
112.在所确定的区间所包括的新增数据的数量不小于所述搜索结果数量上限时，累计各个所述区间的搜索结果数量的上限数值，以确定所述新增数据的索引值。
113.可选地，所述确定顺序模块503，用于当新增数据指示为所述历史搜索结果的更新数据时，确定所述历史搜索结果的索引值为所述新增数据的索引值。
114.可选地，所述区间模型模块501，用于利用所述平均值和所述标准差，基于分布模型，确定所述历史搜索结果的质量数值对应的区间信息，包括：所述分布模型为正态分布模型。
115.本发明实施例还提供了一种确定搜索结果顺序的电子设备，包括：一个或多个处理器；存储装置，用于存储一个或多个程序，当所述一个或多个程序被所述一个或多个处理器执行，使得所述一个或多个处理器实现上述任一实施例提供的方法。
116.本发明实施例还提供了一种计算机可读介质，其上存储有计算机程序，所述程序被处理器执行时实现上述任一实施例提供的方法。
117.图6示出了可以应用本发明实施例的确定搜索结果顺序的方法或确定搜索结果顺序的装置的示例性系统架构600。
118.如图6所示，系统架构600可以包括终端设备601、602、603，网络604和服务器605。网络604用以在终端设备601、602、603和服务器605之间提供通信链路的介质。网络604可以包括各种连接类型，例如有线、无线通信链路或者光纤电缆等等。
119.用户可以使用终端设备601、602、603通过网络604与服务器605交互，以接收或发送消息等。终端设备601、602、603上可以安装有各种客户端应用，例如电子商城客户端、网页浏览器应用、搜索类应用、即时通信工具和邮箱客户端等。
120.终端设备601、602、603可以是具有显示屏并且支持网页浏览的各种电子设备，包括但不限于智能手机、平板电脑、膝上型便携计算机和台式计算机等等。
121.服务器605可以是提供各种服务的服务器，例如对用户利用终端设备601、602、603
所浏览的购物类网站提供支持的后台管理服务器。后台管理服务器可以对新增的商品信息数据进行处理，确定该数据的索引值，根据搜索的请求确定搜索结果的顺序并反馈给终端设备。
122.需要说明的是，本发明实施例所提供的确定搜索结果顺序的方法一般由服务器605执行，相应地，确定搜索结果顺序的装置一般设置于服务器605中。
123.应该理解，图6中的终端设备、网络和服务器的数目仅仅是示意性的。根据实现需要，可以具有任意数目的终端设备、网络和服务器。
124.下面参考图7，其示出了适于用来实现本发明实施例的终端设备的计算机系统700的结构示意图。图7示出的终端设备仅仅是一个示例，不应对本发明实施例的功能和使用范围带来任何限制。
125.如图7所示，计算机系统700包括中央处理单元(cpu)701，其可以根据存储在只读存储器(rom)702中的程序或者从存储部分708加载到随机访问存储器(ram)703中的程序而执行各种适当的动作和处理。在ram 703中，还存储有系统700操作所需的各种程序和数据。cpu 701、rom 702以及ram 703通过总线704彼此相连。输入/输出(i/o)接口705也连接至总线704。
126.以下部件连接至i/o接口705：包括键盘、鼠标等的输入部分706；包括诸如阴极射线管(crt)、液晶显示器(lcd)等以及扬声器等的输出部分707；包括硬盘等的存储部分708；以及包括诸如lan卡、调制解调器等的网络接口卡的通信部分709。通信部分709经由诸如因特网的网络执行通信处理。驱动器710也根据需要连接至i/o接口705。可拆卸介质711，诸如磁盘、光盘、磁光盘、半导体存储器等等，根据需要安装在驱动器710上，以便于从其上读出的计算机程序根据需要被安装入存储部分708。
127.特别地，根据本发明公开的实施例，上文参考流程图描述的过程可以被实现为计算机软件程序。例如，本发明公开的实施例包括一种计算机程序产品，其包括承载在计算机可读介质上的计算机程序，该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中，该计算机程序可以通过通信部分709从网络上被下载和安装，和/或从可拆卸介质711被安装。在该计算机程序被中央处理单元(cpu)701执行时，执行本发明的系统中限定的上述功能。
128.需要说明的是，本发明所示的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件，或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于：具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(ram)、只读存储器(rom)、可擦式可编程只读存储器(eprom或闪存)、光纤、便携式紧凑磁盘只读存储器(cd-rom)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本发明中，计算机可读存储介质可以是任何包含或存储程序的有形介质，该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本发明中，计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号，其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式，包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质，该计算机可读介质可以发送、传播或者传输用于
由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输，包括但不限于：无线、电线、光缆、rf等等，或者上述的任意合适的组合。
129.附图中的流程图和框图，图示了按照本发明各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上，流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分，上述模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意，在有些作为替换的实现中，方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如，两个接连地表示的方框实际上可以基本并行地执行，它们有时也可以按相反的顺序执行，这依所涉及的功能而定。也要注意的是，框图或流程图中的每个方框、以及框图或流程图中的方框的组合，可以用执行规定的功能或操作的专用的基于硬件的系统来实现，或者可以用专用硬件与计算机指令的组合来实现。
130.描述于本发明实施例中所涉及到的模块和/或单元可以通过软件的方式实现，也可以通过硬件的方式来实现。所描述的模块和/或单元也可以设置在处理器中，例如，可以描述为：一种处理器包括生成模型模块、计算质量模块和确定标识模块其中，这些模块的名称在某种情况下并不构成对该模块本身的限定，例如，确定标识模块还可以被描述为“根据新增数据的质量数值，确定所述数据的唯一标识的模块”。
131.作为另一方面，本发明还提供了一种计算机可读介质，该计算机可读介质可以是上述实施例中描述的设备中所包含的；也可以是单独存在，而未装配入该设备中。上述计算机可读介质承载有一个或者多个程序，当上述一个或者多个程序被一个该设备执行时，使得该设备包括：获取预定义时间段内的历史搜索结果的质量数值，根据多个所述质量数值，计算所述质量数值的平均值和标准差，其中所述质量数值是根据所述历史搜索结果的一个或多个质量因子的取值而计算得到的；利用所述平均值和所述标准差，基于分布模型，确定所述历史搜索结果的质量数值对应的区间信息，以及所述历史搜索结果的索引值；获取新增数据，根据所述新增数据的一个或多个质量因子的取值，计算所述新增数据的质量数值；根据所述新增数据的质量数值，确定所述新增数据对应的区间和索引值；根据所述索引值，确定返回所述新增数据的搜索结果的顺序。
132.根据本发明实施例的技术方案，根能够据历史数据的搜索结果和分布模型，构建基于质量数值形成的区间，通过计算新增数据的质量数值，确定新增数据所归属的区间，并根据区间的信息确定新增数据的索引值，解决了新增数据以时间顺序确定索引值而未考虑数据质量的问题，从而提高了数据搜索结果的数据质量，提升了用户的浏览体验。
133.上述具体实施方式，并不构成对本发明保护范围的限制。本领域技术人员应该明白的是，取决于设计要求和其他因素，可以发生各种各样的修改、组合、子组合和替代。任何在本发明的精神和原则之内所作的修改、等同替换和改进等，均应包含在本发明保护范围之内。

再多了解一些

1/2 1 2 下一页尾页

本文用于企业家、创业者技术爱好者查询，结果仅供参考。

一种确定搜索结果顺序的方法和装置与流程

相关文献

最热文献