一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

需求评估信息生成方法、需求评估信息展示方法及装置与流程

2022-02-19 11:45:59 来源:中国专利 TAG:


1.本公开涉及数据处理技术领域,尤其涉及检索语句处理技术领域,具体涉及需求评估信息生成方法、需求评估信息展示方法及装置。


背景技术:

2.知识内容生产是指在不同领域垂类下,以文字、图片、视频、音频等多媒体形式,生产出满足用户需求的知识内容。由于检索语句(query)的检索量是很好反映出用户需求的指标,因此,常用的知识内容生产的策略为:检索量越大的检索语句对应的知识内容越优先被生产。
3.相关技术中,将检索语句最近一周内的平均检索量或者近三天的检索总量,作为该检索语句的需求评估信息,需求评估信息为指示知识内容的生产需求程度的信息。


技术实现要素:

4.本公开提供了一种用于生成能够准确反映实际需求的需求评估信息的需求评估信息生成方法及装置,在此基础上,本公开还提供了一种用于展示能够准确反映实际需求的需求评估信息的需求评估信息展示方法及装置。
5.根据本公开的一方面,提供了一种需求评估信息生成方法,包括:
6.确定待分析的目标检索语句;
7.获取所述目标检索语句在第一时间段内的检索量信息;其中,所述第一时间段为当前时间之前时间段,任一检索语句在一时间段内的检索量信息包括:该检索语句在该时间段内每一统计周期内的检索量;
8.基于所获取的检索量信息,确定所述目标检索语句对应的预估量;其中,所述预估量用于表征所述目标检索语句在第二时间段内的检索需求,所述第二时间段为当前时间之后的时间段;
9.基于所述目标检索语句对应的预估量,生成所述目标检索语句的需求评估信息。
10.根据本公开的另一方面,提供了一种需求评估信息展示方法,所述方法包括:
11.获取针对检索语句的筛选信息;
12.从需求评估数据库存储的各检索语句中,筛选与所述筛选信息相匹配的目标检索语句;其中,所述需求评估数据库中存储有多个检索语句以及每一检索语句的需求评估信息,每一检索语句的需求评估信息为按照任一项所述的需求评估信息生成方法所确定;
13.从所述需求评估数据库中,确定所述目标检索语句的需求评估信息;输出所述目标检索语句以及所述目标检索语句的需求评估信息。
14.根据本公开的另一方面,提供了一种需求评估信息生成装置,包括:
15.第一语句确定模块,用于确定待分析的目标检索语句;
16.第一信息获取模块,用于获取所述目标检索语句在第一时间段内的检索量信息;其中,所述第一时间段为当前时间之前时间段,任一检索语句在一时间段内的检索量信息
包括:该检索语句在该时间段内每一统计周期内的检索量;
17.预估量确定模块,用于基于所获取的检索量信息,确定所述目标检索语句对应的预估量;其中,所述预估量用于表征所述目标检索语句在第二时间段内的检索需求,所述第二时间段为当前时间之后的时间段;
18.信息生成模块,用于基于所述目标检索语句对应的预估量,生成所述目标检索语句的需求评估信息。
19.根据本公开的另一方面,提供了一种需求评估信息展示装置,所述装置包括:
20.筛选信息获取模块,用于获取针对检索语句的筛选信息;
21.语句筛选模块,用于从需求评估数据库存储的各检索语句中,筛选与所述筛选信息相匹配的目标检索语句;其中,所述需求评估数据库中存储有多个检索语句以及每一检索语句的需求评估信息,每一检索语句的需求评估信息为按照任一项所述的需求评估信息生成装置所确定;
22.信息确定模块,用于从所述需求评估数据库中,确定所述目标检索语句的需求评估信息;
23.信息输出模块,用于输出所述目标检索语句以及所述目标检索语句的需求评估信息。
24.根据本公开的另一方面,提供了一种电子设备,包括:
25.至少一个处理器;以及
26.与所述至少一个处理器通信连接的存储器;其中,
27.所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行需求评估信息生成方法及需求评估信息展示方法。
28.根据本公开的另一方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,其中,所述计算机指令用于使所述计算机执行需求评估信息生成方法及需求评估信息展示方法。
29.根据本公开的另一方面,提供了一种计算机程序产品,包括计算机程序,所述计算机程序在被处理器执行时实现需求评估信息生成方法及需求评估信息展示方法。
30.应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。
附图说明
31.附图用于更好地理解本方案,不构成对本公开的限定。其中:
32.图1是根据本公开第一实施例的示意图;
33.图2是根据本公开第二实施例的示意图;
34.图3是根据本公开第三实施例的示意图;
35.图4是根据本公开第四实施例的示意图;
36.图5是根据本公开第五实施例的示意图;
37.图6是根据本公开第六实施例的示意图;
38.图7是用来实现本公开实施例的需求评估信息生成方法的电子设备的框图;
具体实施方式
39.以下结合附图对本公开的示范性实施例做出说明,其中包括本公开实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本公开的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
40.知识内容生产是指在不同领域垂类下,以文字、图片、视频、音频等多媒体形式,生产出满足用户需求的知识内容,例如:针对能够实现内容搜索的客户端,业务人员可以生产出满足用户需求的视频、图片、文字等内容,以在用户利用该客户端进行内容搜索时,为用户提供满足需求的内容。并且,由于检索语句(query)的检索量是很好反映出用户需求的指标,因此,常用的知识内容生产的策略为:检索量越大的检索语句对应的知识内容越优先被生产。
41.随着互联网的发展,互联网上每天都会产生大量的非重复的检索语句,其中,高频检索语句约占20%左右,而中长尾检索语句约占40%以上,上述高频检索语句为周日均检索量大于10的检索语句,上述中长尾检索语句为周日均搜索量大于2,且不大于10的检索语句。
42.如何在有限的生产力下,合理量化检索语句价值,从而高效地利用检索语句,指导知识业务线来生产能够满足用户需求的知识内容,是当下行业所面临的核心挑战。
43.相关技术中,将检索语句最近一周内的平均检索量或者近三天的检索总量,作为该检索语句的需求评估信息。但是,该相关技术的方案,没有考虑到大部分检索语句的检索量随时间明显变化的问题。这样,对于时效性热点检索语句而言,如果生产周期较长,不但无法即时生成出满足用户需求的知识内容,而且生产出的知识内容的时效性较差,会使得利用程度往往也达不到预期,导致投入产出比较低。
44.由此可见,相关技术至少存在以下技术问题:
45.1、由于检索语句的检索量随时间变化明显,若以最近一周内的平均检索量或者近三天的检索总量作为需求检索信息,需求检索信息往往不能准确反映实际需求;
46.2、利用相关技术所提供的需求检索信息,往往无法生成出与实际需求相匹配的知识内容。
47.为了解决相关技术中,需求评估信息不能准确反映实际需求的问题,本公开实施例提供需求评估信息生成方法。
48.需要说明的,在具体应用中,本公开实施例所提供的需求评估信息生成方法可以应用于各类电子设备,例如,个人电脑、服务器、以及其他具有数据处理能力的设备。另外,可以理解的是,该需求评估信息生成可以通过软件、硬件或软硬件结合的方式实现。并且,该需求评估信息生成方法可以应用于任一存在需求评估的场景下,例如:针对能够实现内容搜索的客户端而言,用户可以通过该客户端进行内容检索,那么,针对用户进行内容检索时所输入的检索语句,可以通过该需求评估信息生成方法进行需求评估;或者,针对能够实现多媒体内容播放的客户端而言,用户可以通过该客户端进行多媒体内容检索,那么,针对用户进行多媒体内容检索时所输入的检索语句,也可以通过该需求评估信息生成方式进行需求评估。
49.其中,本公开实施例所提供的需求评估信息生成方法,可以包括:
50.确定待分析的目标检索语句;
51.获取目标检索语句在第一时间段内的检索量信息;其中,第一时间段为当前时间之前时间段,任一检索语句在一时间段内的检索量信息包括:该检索语句在该时间段内每一统计周期内的检索量;
52.基于所获取的检索量信息,确定目标检索语句对应的预估量;其中,预估量用于表征目标检索语句在第二时间段内的检索需求,第二时间段为当前时间之后的时间段;
53.基于目标检索语句对应的预估量,生成目标检索语句的需求评估信息。
54.本公开提供的上述方案,可以利用目标检索语句在当前时刻之前的第一时间段内的检索量信息,确定目标检索语句在当前时间之后的第二时间段内的预估量,进而基于所确定的预估量,生成目标检索语句的需求评估信息。由于预估量表征目标检索语句在第二时间段内的检索需求,因此,需求评估信息可以准确反映目标检索语句在未来第二时间段的实际需求。可见,本公开所提供的方案,可以解决相关技术中需求评估信息不能准确反映实际需求的问题。
55.进一步的,由于需求评估信息能够准确反映实际需求,从而在利用需求评估信息指导知识内容生产时,可以生产出与实际需求相匹配的知识内容,本公开所提供的方案为生产出与实际需求相匹配的知识内容提供了实现基础。
56.下面结合附图对本公开实施例所提供的一种需求评估信息生成方法进行介绍。
57.如图1所示,本公开实施例提供所一种需求评估信息生成方法可以包括如下步骤:
58.s101,确定待分析的目标检索语句;
59.其中,目标检索语句为需要确定需求评估信息的检索语句。可以结合实际应用场景采用不同的方式确定目标检索语句,例如,确定目标检索语句的方式包括以下两种方式中的至少一种:
60.第一种确定方式中,当存在针对指定的检索语句进行分析的需求时,可以将所接收到的指定操作所指的检索语句,作为目标检索语句。其中,指定操作可以包括选择操作、输入操作等。
61.第二种确定方式,当存在针对符合筛选条件的检索语句进行分析的需求时,可以将符合筛选条件的检索语句,作为目标检索语句。上述筛选条件可以根据需求和经验确定,例如,属于某一时间段,或者,在某一时间段内检索频率高于预定频率阈值,等等,该某一时间段可以为存在语句分析需求的时刻之前的时间段。
62.另外,在一种实现方式中,上述筛选条件可以为:第一时间段内检索频率大于预设频率阈值的检索语句,那么,本步骤中确定待分析的目标检索语句,可以包括:
63.从第一时间段内各检索语句中,筛选检索频率大于预设频率阈值的检索语句,作为待分析的目标检索语句。通过筛选检索频率大于预设频率阈值的目标检索语句,可以确保目标检索语句是具有一定需求的检索语句。
64.其中,上述预设频率阈值可以根据需求和经验确定,例如,1次/天、2次/周等。
65.上述第一时间段可以为当前时间之前的时间段,其中,当前时间为执行本方法的时间。可选的,在一种实现方式中,第一时间段可以为以当前时间为终点时间、且时长为第一指定时长的时间段,其中,第一指定时长可以根据需求和经验确定,如3天、1周、10天等,若第一指定时长为1周,当前时间为2021年9月8日,则第一时间段为[2021年9月2日,2021年
9月8日]。可选地,在另一种实现方式中,第一时间段可以为当前时间所在周期之前的连续n1个统计周期,例如,统计周期为一个星期,那么,第一时间段为当前时间所在星期之前的连续n1个星期,即当周之前的连续n1周。
[0066]
上述从第一时间段内各检索语句中,筛选检索频率大于预设频率阈值的检索语句的过程,可以先获取第一时间段内的各检索语句,再统计每一检索语句在第一时间段内出现的次数。进而可以计算每一检索语句出现次数与第一时间段的比值,得到每一检索语句的检索频率,再根据每一检索语句的检索频率,筛选出检索频率大于预设频率阈值的检索语句。
[0067]
另外,可以理解的是,在选取目标检索语句时,所选用的时间段为第一时间段,即为后续s102中获取目标检索语句的检索量信息所利用的时间段,这样可以保证目标检索语句是出现在第一时间段的语句,避免在采用其他时间段筛选出目标检索语句后,由于目标检索语句未出现在第一时间段而造成的数据无效的问题。
[0068]
s102,获取目标检索语句在第一时间段内的检索量信息;
[0069]
其中,任一检索语句在一时间段内的检索量信息包括:该检索语句在该时间段内每一统计周期内的检索量。每一统计周期可以根据经验和需求确定,例如可以为1天或1周等。
[0070]
在确定目标检索语句之后,可以从第一时间段内产生的检索数据中,读取目标检索语句在第一时间段内每一统计周期的检索量。
[0071]
示例性的,如表1所示,为目标检索语句在第一时间段内每一统计周期内的检索量分布。
[0072]
表1
[0073]
统计周期1统计周期2统计周期3统计周期43421
[0074]
则目标检索语句的检索量信息可以包括(3,4,2,1),或者包括{(统计周期1,3),(统计周期2,4),(统计周期3,2),(统计周期4,1)}。s103,基于所获取的检索量信息,确定目标检索语句对应的预估量;
[0075]
其中,预估量用于表征目标检索语句在第二时间段内的检索需求,例如,预估量可以为目标检索语句在第二时间段内的检索总量,或者,预估量也为目标检索语句在第二时间段的每一统计周期内的检索量,或者,预估量还可以为目标检索语句在第二时间段内各统计周期内的平均检索量,等等,这都是合理的。
[0076]
由于检索量信息包括目标检索语句在第一时间段内每一统计周期内的检索量,因此,目标检索语句的检索量信息能够反映目标检索语句的检索量的变化趋势,从而可以基于目标检索语句的检索量的变化趋势,预测目标检索语句在第二时间段内的预估量。
[0077]
示例性的,可以对目标检索语句在第一时间段内各统计周期的检索量进行拟合,得到时间与检索量的目标变化函数,进而利用目标变化函数确定第二时间段内目标检索语句的预估量。或者,还可以通过神经网络模型的方式,确定目标检索语句在第二时间段内的预估量,具体将在后续实施例详细介绍,在此不再赘述。
[0078]
另外,上述第二时间段为当前时间之后的时间段。可选地,在一种实现方式中,第二时间段可以为以当前时间为起点时间,且时长为第二指定时长的时间段,其中第二指定
时长可以根据需求和经验确定,如3天、1周、10天等,若第二指定时长为1周,当时间为2021年9月8日,则第二时间段为[2021年9月8日,2021年9月15日]。可选地,在另一种实现方式中,第二时间段可以为当前时间所在周期之后的连续n2个周期,例如,周期为一个星期,那么,第二时间段为当前时间所在星期之后的连续n2个星期,即当周之后的连续n2周。
[0079]
需要强调的是,为了提高所确定的预估量的准确性,上述第一时间段的时长可以不小于第二时间段的时长,例如,第一时间段可以等于或者大于第二时间段的时长。
[0080]
s104,基于目标检索语句对应的预估量,生成目标检索语句的需求评估信息。
[0081]
本步骤中,在得到目标检索语句在第二时间段内的预估量,则可以进一步的确定目标检索语句的需求评估信息。生成需求评估信息的方式有很多,示例性的,包括以下几种的至少一种:
[0082]
第一种方式,将所得到的预估量作为目标检索语句的需求评估信息;
[0083]
第二种方式,基于预先构建的预估量与需求级别之间的对应关系,确定与所得到的预估量对应的需求级别,作为目标检索语句的需求评估信息。
[0084]
上述需求级别可以根据需求与经验确定,如需求高、需求中、需求低,或一级需求、二级需求、三级需求等。预估量与需求级别之间的对应关系可以根据需求与经验划分,每一需求级别可以对应一预估量范围,属于该预估量范围内的预估量均与该需求级别对应。
[0085]
本公开提供的上述方案,可以利用目标检索语句在当前时刻之前的第一时间段内的检索量信息,确定目标检索语句在当前时间之后的第二时间段内的预估量,进而基于所确定的预估量,生成目标检索语句的需求评估信息,由于预估量表征目标检索语句在第二时间段内的检索需求,因此,需求评估信息可以准确反映目标检索语句在未来第二时间段的实际需求。可见,本公开所提供的方案,可以解决相关技术中需求评估信息不能准确反映实际需求的问题。
[0086]
进一步的,由于需求评估信息能够准确反映实际需求,从而在利用需求评估信息指导知识内容生产时,可以生产出与实际需求相匹配的知识内容,本公开所提供的方案为生产出与实际需求相匹配的知识内容提供了实现基础。
[0087]
可选地,在本公开的另一实施例中,在基于目标检索语句对应的预估量,生成目标检索语句的需求评估信息之后,该需求评估信息生成方式还可以包括:
[0088]
将目标检索语句和目标检索语句的需求评估信息,写入需求评估数据库。
[0089]
可以理解的是,当目标检索语句为多个时,在将多个目标检索语句以及每一目标检索语句的需求评估信息写入需求评估数据库时,可以对各个目标检索语句进行聚簇,得到一个簇标题,以及簇标题对应的需求评估信息;并且,对应记录簇标题与需求评估信息,同时,记录簇标题与相应的目标检索语句的层级关系。这样,在后续查询需求评估数据库时,可以优先展示簇标题以及对应的需求评估信息,在得到进一步细化展示的指令时,再展示簇标题对应的各个目标检索语句以及对应的需求平台信息。通过该种方式可以使得信息记录以及输出更具有层次化。
[0090]
另外,可以定期进行向需求评估数据库中写入目标检索语句和目标检索语句的需求评估信息,具体的,可以每周定期,选取当前日期,以及确定出待预测的各个目标检索语句,进而采用本公开实施例所提供的需求评估信息生成方法,确定目标检索语句的需求评估信息,进而将目标检索语句和目标检索语句的需求评估信息,写入需求评估数据库。从而
可以确保需求评估数据库可以实时存储有较新的目标检索语句和目标检索语句的需求评估信息。
[0091]
本公开提供的上述方案,可以生成能够准确反映实际需求的需求评估信息,并为生产出与实际需求相匹配的知识内容提供了实现基础。进一步的,将目标检索语句和目标检索语句的需求评估信息,写入需求评估数据库,可以为后续利用目标检索语句和目标检索语句的需求评估信息提供了实现基础。
[0092]
基于图1所示实施例,如图2所示,本公开的另一实施例所提供的需求评估信息生成方法,可以包括如下步骤:
[0093]
s201,确定待分析的目标检索语句;
[0094]
s202,获取目标检索语句在第一时间段内的检索量信息;
[0095]
其中,第一时间段为当前时间之前时间段,任一检索语句在一时间段内的检索量信息包括:该检索语句在该时间段内每一统计周期内的检索量;
[0096]
本实施例中,s201

s202与上述实施例的s101

s102相同,在此不做赘述。
[0097]
s203,基于所获取的检索量信息,构建目标检索语句在第一时间段内的特征数据;
[0098]
本步骤中,特征数据可以为特征向量,此时,可以从检索量信息中获取目标检索语句在第一时间段内每一统计周期的检索量,进而将目标检索语句在每一统计周期内的检索量作为特征向量的一个维度值。
[0099]
示例性的,检索量信息为:{(统计周期1,3),(统计周期2,4),(统计周期3,2),(统计周期4,1)},则构建的特征向量为(3,4,2,1)。
[0100]
可选地,特征数据中还可以包含对检索量信息进行处理的其他特征值,此时,上述基于所获取的检索量信息,构建目标检索语句在第一时间段内的特征数据,可以包括:
[0101]
计算所获取的检索量信息中的各个检索量的均值和/或方差,并所获取的检索量信息包括的检索量,以及所计算的均值/或方差,构建特征向量,作为目标检索语句在第一时间段内的特征数据。
[0102]
本步骤中,若需要计算所获取检索信息中的各个检索量的均值,可以先计算各个检索量之和,再将所计算的检索量之和除以第一时间段内统计周期的数量,得到第一时间段内各个统计周期内目标检索语句的均值。
[0103]
如计算所获取检索信息中各个检索量的方差,则可以将各个检索量代入方差计算公式,得到各个检索量的方差。
[0104]
在计算出各个检索量的均值/方差之后,可以基于所获取的检索量信息包括的检索量,以及所计算的均值/或方差,构建特征向量。一种实现方式中,可以直接将各个检索量、以及所计算的均值/或方差分别作为特征向量的一个维度的数据。在另一种实现方式中,还可以先对各个检索量、以及所计算的均值/或方差做对数(log)变换,并将经过对数变换后的值分别作为特征向量的一个维度的数据。
[0105]
s204,利用预先训练的预估量预测模型,对目标检索语句的特征数据进行处理,得到目标检索语句对应的预估量;
[0106]
其中,预估量预测模型为:基于样本数据和与样本数据对应的标注数据训练得到的,样本数据为指定检索语句在样本时间段内的特征数据,标注数据用于表征指定检索语句在标注时间段内的检索需求,样本时间段为基准时间之前的时间段,标注时间段为基准
时间之后的时间段。
[0107]
上述基准时间可以为任一指定的历史时间,示例性的,基准时间为2021年1月15日,则样本时间段可以为[2021年1月8日,2021年1月15日],标注时间段为[2021年1月15日,2021年1月22日]。
[0108]
可选的,上述样本时间段的时长可以与第一时间段的时长相同,上述标注时间段的时长与第二时间段的时长相同。进一步的,样本时间段与标注时间段的时间间距,与第一时间段与第二时间段的间距相同,如均为0。
[0109]
具体而言,可以将目标检索语句的特征数据输入至预估量预测模型,并将预估量预测模型输出的数据作为目标检索语句对应的预估量。
[0110]
上述样本数据对应的标注数据可以为指定检索语句在标注时间段内的检索总量,或者,预估量也为指定检索语句在标注时间段的每一统计周期内的检索量,或者,预估量还可以为指定检索语句在标注时间段内各统计周期内的平均检索量,这都是合理的。
[0111]
预估量预测模型的具体训练方式将在后续实施例进行描述,在此不再赘述。
[0112]
s205,基于目标检索语句对应的预估量,生成目标检索语句的需求评估信息。
[0113]
本实施例中,s205与上述实施例中的s104相同,在此不做赘述。
[0114]
本公开提供的上述方案,可以生成能够准确反映实际需求的需求评估信息,并为生产出与实际需求相匹配的知识内容提供了实现基础。进一步的,可以利用预估量预测模型,预测目标检索语句在第二时间段的预估量,从而为生成能够准确反映实际需求的需求评估信息提供了实现基础,并且通过预估量检测模型,可以准确且快速预测目标检索语句在第二时间段的预估量。
[0115]
基于图2所示实施例,如图3所示,本公开的另一实施例所提供的需求评估信息生成方法中,训练预估量预测模型的训练方式如下:
[0116]
s301,从训练数据集中,获取指定检索语句在样本时间段内的第一检索量信息,以及指定检索语句在标注时间段内的第二检索量信息;
[0117]
其中,训练数据集中可以包含样本时间段内各检索语句的第一检索量信息,以及标注时间段内各检索语句的第二检索量信息。上述指定检索语句可以为样本时间段内任意一检索语句,或样本时间段内检索频率大于预设频率阈值的检索语句,在确定出检索语句之后,可以从训练数据集中获取指定检索语句在样本时间段内的第一检索量信息,以及指定检索语句在标注时间段内的第二检索量信息。
[0118]
上述训练数据集可以为预先构建的。可选的,可以预先指定一基准时间,进而确定在基准时间之后的样本时间段,以及在基准时间之前的标注时间段,进而构建出训练数据集。
[0119]
一种实现方式中,在确定出样本时间段和标注时间段之后,可以确定样本时间段内存在的各个检索语句,进而获取各个检索语句在样本时间段内的第一检索量信息,以及在标注时间段内的第二检索量信息,最后利用各个检索语句,以及各个检索语句的第一检索量信息和第二检索量信息,构建训练数据集。
[0120]
需要强调的是,训练数据集中可以包含多对样本时间段和标注时间段,每一对样本时间段和标注时间段对应一个基准时间。如表2所示:
[0121]
表2
[0122]
训练数据集样本时间段标注时间段基准时间训练集1202004222020093020200708训练集2202004292020100720200715训练集3202005062020101420200722
…………
训练集n202011112021042120210127
[0123]
其中,每一训练集为一对样本时间段和标注时间段,以训练集1为例说明,基准时间为2020年07月08日,其样本时间段为[2020年04月22日,2020年07月08日],其标注时间段为[2020年07月08日,2020年09月30日]。
[0124]
s302,基于第一检索量信息,生成指定检索语句在样本时间段内的特征数据,作为样本数据,并基于第二检索量信息,生成指定检索语句在标注时间段内的标注数据;
[0125]
其中,指定检索语句在样本时间段内的特征数据的确定过程,与前述确定目标检索语句在第一时间段内的特征数据的过程相同或相似,在此不再赘述。
[0126]
上述指定检索语句在标注时间段内的标注数据可以包括:标注时间段内的检索总量、在标注时间段内每一统计周期内的检索量、在标注时间段内各统计周期内的平均检索量等中的至少一个。
[0127]
若标注数据包括检索总量,则可以将第二检索量信息中各个统计周期内的检索量相加,得到检索总量。若标注数据包括标注时间段内每一统计周期内的检索量,则可以直接将第二检索量信息作为标注数据的一部分。若标注数据包括标注时间段内每一统计周期内的平均检索量,则可以在利用第二检索量信息计算出检索总量之后,对检索总量取平均后,得到标注时间段内每一统计周期内的检索量。
[0128]
可选的,标注数据可以根据需求所确定,其形式可以有多种,例如:
[0129]
一种方式中,可以仅以标注时间段内的检索总量,或标注时间段内每一统计周期内的平均检索量作为标注数据;
[0130]
另一种方式中,标注数据可能包含多个数值,如包含标注时间段内每一统计周期内的检索量,或包含标注时间段内每一统计周期内的检索量、标注时间段内的检索总量以及标注时间段内每一统计周期内的平均检索量中的至少两个,此时,可以标注数据可以为标注向量。
[0131]
示例性的,第一种情景,标注数据为标注时间段内每一统计周期内的检索量,则标注数据可以为(a1,a2,...,an),其中,a1,a2,...,an为指定检索语句在标注时间段内每一统计周期内的检索量;
[0132]
第二种情景,标注数据包括:标注时间段内每一统计周期内的检索量和标注时间段内的检索总量,则标注数据可以为(a1,a2,...,an,b),其中,b为标注时间段内的检索总量;
[0133]
第三种情景,标注数据包括:标注时间段内每一统计周期内的检索量和标注时间段内每一统计周期内的平均检索量,则标注数据可以为(a1,a2,...,an,c),其中,b为标注时间段内每一统计周期内的平均检索量;
[0134]
第四种情景,标注数据包括:标注时间段内的检索总量和标注时间段内每一统计周期内的平均检索量,则标注数据可以为(b,c)。
[0135]
s303,将样本数据输入至待训练的神经网络模型,以使神经网络模型基于样本数据,预测指定检索语句在标注时间段内的预估量,作为预测数据;
[0136]
为了对待训练的神经网络模型进行训练,本步骤中,可以将样本数据输入至神经网络模型,以获取神经网络模型所预测的指定样本模型在标注时间段内的预估量。
[0137]
s304,基于预测数据和标注数据,计算神经网络模型的损失函数值;
[0138]
其中,在得到神经网络模型输出的三维数据后,可以基于预测数据、标注数据,计算神经网络模型的损失函数值,以通过损失函数值表征神经网络模型输出的预测数据与理想的标注数据之间的差距大小。
[0139]
可选的,在一种实现方式中,可以计算预测数据与标注数据相同维度数据的差值,在计算各维度差值之和,作为神经网络模型的损失函数值。
[0140]
示例性的,标注数据为(a1,a2,...,an),预测数据为(b1,b2,...,bn),则
[0141]
s305,根据损失函数值,调整神经网络模型参数;
[0142]
其中,对于神经网络模型而言,损失越大,所要调整的参数的调整幅度也越大,因此,可以结合实际情况与需求,基于结果损失,调整神经网络模型的参数。可选的,可以通过梯度下降等调参算法,基于损失函数值对神经网络模型参数进行调节。
[0143]
s306,判断述训练样本集内的检索量信息是否均被利用,若是,则结束训练,若不是,则返回执行s301。
[0144]
在根据损失函数值,调整神经网络模型参数之后,可以进行下一次训练,直至训练样本集内的检索量信息均被利用。
[0145]
本公开提供的上述方案,可以生成能够准确反映实际需求的需求评估信息,并为生产出与实际需求相匹配的知识内容提供了实现基础,进一步的,通过训练预估量模型为生成能够准确反映实际需求的需求评估信息提供了实现基础。
[0146]
需要说明的是,本实施例中的预估量预测模型并不是针对某一特定用户的模型,并不能反映出某一特定用户的个人信息。
[0147]
需要说明的是,本公开的技术方案中,所涉及的用户个人信息的收集、存储、使用、加工、传输、提供和公开等处理,均符合相关法律法规的规定,且不违背公序良俗。本实施例中的检索语句可以来自于公开数据集。
[0148]
为了更好的理解本公开所提供的方案,本公开的一实施例中,以12周为指定时长为例,介绍下本公开所提供的方案:
[0149]
首先,可以基于当周内(即当前星期内)移动端用户搜索的日志数据,确定出目标检索语句,或可以指定目标检索语句,进而获取当周之间的历史12周内目标检索语句的检索量。
[0150]
然后,对目标检索语句在历史12周内的检索量,以及12周内目标检索语句的检索量的均值和方差进行对数变换,得到变换后的数值,作为目标检索语句的特征数据。
[0151]
最后,将所得到的特征数据输入预先构建的预估量预测模型,得到当前之后的未来12周目标检索语句的检索量之和。
[0152]
上述预估量预测模型,可以基于历史检索语句的检索量训练得到。
[0153]
例如,当周日期2021年5月5日,则如表3所示,可以获取从2020年4月22日到2021年
4月21日检索语句的检索量数据,作为训练集数据,且按照不同的基准时间划分出多个训练集,如表3所示:
[0154]
表3
[0155]
训练数据集样本时间段标注时间段基准时间训练集1202004222020093020200708训练集2202004292020100720200715训练集3202005062020101420200722
…………
训练集n202011112021042120210127测试集202011182021042820210203
[0156]
进一步的,还可以额外增加测试数据,例如表3中以2021年2月3日作为基准时间的测试集数据。
[0157]
需要说明的是,表3中每一日期为其所在周中的周三,即以每周三代表所在周数据。
[0158]
在得到训练数据和测试数据之后,即可利用训练数据对预估量预测模型进行训练,并利用测试数据对应训练后的预估量模型进行测试,直至得到满足要求的预估量预测模型。
[0159]
在通过预估量预测模型,得到目标检索语句在未来12周的检索量之和后,可以将目标检索语句在历史12周内的检索量之和,以及目标检索语句在未来12周的检索量之和入库到elasticsearch数据库进行数据存储,其中,elasticsearch数据库是一个具有实时的分布式存储、搜索、分析的引擎的数据库。
[0160]
本公开提供的上述方案,可以利用目标检索语句在当前时刻之前的第一时间段内的检索量信息,确定目标检索语句在当前时间之后的第二时间段内的预估量,进而基于所确定的预估量,生成目标检索语句的需求评估信息。由于预估量表征目标检索语句在第二时间段内的检索需求,因此,需求评估信息可以准确反映目标检索语句在未来第二时间段的实际需求。可见,本公开所提供的方案,可以解决相关技术中需求评估信息不能准确反映实际需求的问题。
[0161]
进一步的,由于需求评估信息能够准确反映实际需求,从而在利用需求评估信息指导知识内容生产时,可以生产出与实际需求相匹配的知识内容,本公开所提供的方案为生产出与实际需求相匹配的知识内容提供了实现基础。
[0162]
如图4所示,本公开实施例提供所一种需求评估信息展示方法,可以包括如下步骤:
[0163]
s401,获取针对检索语句的筛选信息;
[0164]
其中,筛选信息可以根据接收到的用户的筛选操作所确定的,该筛选信息即为筛选条件。可选的,可以预先展示前端页面,前端页面可以根据需要向用户展示不同的信息,如簇标题选项、pv(周日均检索量)范围、关键词、需求评估信息生成日期、知识内容生产的类型等信息。可选的,可以可视化展示上述信息。
[0165]
当然,在前端页面中还可以存在其他的信息,以便提供更丰富的用于信息筛选的选项。例如:需求分类:一级分类、二级分类,其中,一级分类和二级分类为领域分类,且二级
分类是一级分类的细化分类。当接收到用户可以在前端页面进行选择、输入等操作时,可以根据用户的操作,生成针对检索语句的筛选信息。本公开不并对具有的筛选信息进行限定。
[0166]
s402,从需求评估数据库存储的各检索语句中,筛选与筛选信息相匹配的目标检索语句;
[0167]
其中,需求评估数据库中存储有多个检索语句以及每一检索语句的需求评估信息,每一检索语句的需求评估信息为按照本公开所提供的需求评估信息生成方法所确定;
[0168]
每一检索语句的需求评估信息的确定方式,参见前述实施例,在此不再赘述。在获取到筛选信息之后,可以需求评估数据库存储的各检索语句中,筛选与筛选信息相匹配的目标检索语句。
[0169]
示例性的,筛选信息为筛选出教育行业、包含“中学”的关键词,则可以筛选出“中学语文怎么学习”、“中学物理的学习方法”等目标检索语句。
[0170]
可以理解的是,需求评估数据库还可以记录有各个检索语句的描述信息,例如:所属领域、生成时间、知识内容生产的类型,等等,以便于在给出筛选信息后,可以按照筛选信息,对各检索语句进行筛选。
[0171]
s403,从需求评估数据库中,确定目标检索语句的需求评估信息;
[0172]
在确定出目标检索语句之后,可以进一步的,从需求评估数据库中,确定目标检索语句的需求评估信息。
[0173]
s404,输出目标检索语句以及目标检索语句的需求评估信息。
[0174]
在确定目标检索语句以及目标检索语句的需求评估信息之后,可以输出目标检索语句以及目标检索语句的需求评估信息。可选的,可以可视化展示目标检索语句以及目标检索语句的需求评估信息。
[0175]
可以理解的是,在输出目标检索语句以及目标检索语句的需求评估信息之外,在需求评估数据库记录有其他相关信息的前提下,还可以输出目标检索语句的相关信息,例如:在全网的点击量和展示量的比值,即结果点展比;或者,在某个域名下的点击量和展示量的比值,即知识结果点展比;或者,所属的需求分类级别、所属的簇标题,等等。
[0176]
本公开提供的上述方案,可以生成能够准确反映实际需求的需求评估信息,并为生产出与实际需求相匹配的知识内容提供了实现基础,进一步的,还可以展示目标检索语句以及目标检索语句的需求评估信息,从而可以方便知识内容生产者获取所需的信息。
[0177]
根据本公开的实施例,如图5所示,本公开还提供了一种需求评估信息生成装置,装置包括:
[0178]
第一语句确定模块501,用于确定待分析的目标检索语句;
[0179]
第一信息获取模块502,用于获取目标检索语句在第一时间段内的检索量信息;其中,第一时间段为当前时间之前时间段,任一检索语句在一时间段内的检索量信息包括:该检索语句在该时间段内每一统计周期内的检索量;
[0180]
预估量确定模块503,用于基于所获取的检索量信息,确定目标检索语句对应的预估量;其中,预估量用于表征目标检索语句在第二时间段内的检索需求,第二时间段为当前时间之后的时间段;
[0181]
信息生成模块504,用于基于目标检索语句对应的预估量,生成目标检索语句的需求评估信息。
[0182]
可选的,预估量确定模块,包括:
[0183]
数据构建子模块,用于基于所获取的检索量信息,构建目标检索语句在第一时间段内的特征数据;
[0184]
模型处理子模块,用于利用预先训练的预估量预测模型,对目标检索语句的特征数据进行处理,得到目标检索语句对应的预估量;
[0185]
其中,预估量预测模型为:基于样本数据和与样本数据对应的标注数据训练得到的,样本数据为指定检索语句在样本时间段内的特征数据,标注数据用于表征指定检索语句在标注时间段内的检索需求,样本时间段为基准时间之前的时间段,标注时间段为基准时间之后的时间段。
[0186]
可选的,数据构建子模块,具体用于计算所获取的检索量信息中的各个检索量的均值和/或方差;基于所获取的检索量信息包括的检索量,以及所计算的均值和/或方差,构建特征向量,作为目标检索语句在第一时间段内的特征数据。
[0187]
可选的,装置还包括:
[0188]
第二信息获取模块,用于从训练数据集中,获取指定检索语句在样本时间段内的第一检索量信息,以及指定检索语句在标注时间段内的第二检索量信息;
[0189]
数据生成模块,用于基于第一检索量信息,生成指定检索语句在样本时间段内的特征数据,作为样本数据,并基于第二检索量信息,生成指定检索语句在标注时间段内的标注数据;
[0190]
数据输入模块,用于将样本数据输入至待训练的神经网络模型,以使神经网络模型基于样本数据,预测指定检索语句在标注时间段内的预估量,作为预测数据;
[0191]
基于预测数据和标注数据,计算神经网络模型的损失函数值;
[0192]
参数调整训练,用于根据损失函数值,调整神经网络模型参数,并进行下一次训练,直至训练样本集内的检索量信息均被利用。
[0193]
可选的,装置还包括:
[0194]
第二语句确定模块,用于确定样本时间段内存在的各个检索语句;
[0195]
第三信息获取模块,用于获取各个检索语句在样本时间段内的第一检索量信息,以及在标注时间段内的第二检索量信息;
[0196]
数据集构建模块,用于利用各个检索语句,以及各个检索语句的第一检索量信息和第二检索量信息,构建训练数据集。
[0197]
可选的,第一语句确定模块,具体用于从第一时间段内各检索语句中,筛选检索频率大于预设频率阈值的检索语句,作为待分析的目标检索语句。
[0198]
可选的,装置还包括:
[0199]
信息写入模块,用于在信息生成模块执行基于目标检索语句对应的预估量,生成目标检索语句的需求评估信息步骤之后,将目标检索语句和目标检索语句的需求评估信息,写入需求评估数据库。
[0200]
本公开实施例提供的上述方案中,可以利用目标检索语句在当前时刻之前的第一时间段内的检索量信息,确定目标检索语句在当前时间之后的第二时间段内的预估量,进而基于所确定的预估量,生成目标检索语句的需求评估信息。由于预估量表征目标检索语句在第二时间段内的检索需求,因此,需求评估信息可以准确反映目标检索语句在未来第
二时间段的实际需求。可见,本公开所提供的方案,可以解决相关技术中需求评估信息不能准确反映实际需求的问题。
[0201]
进一步的,由于需求评估信息能够准确反映实际需求,从而在利用需求评估信息指导知识内容生产时,可以生产出与实际需求相匹配的知识内容,本公开所提供的方案为生产出与实际需求相匹配的知识内容提供了实现基础。
[0202]
根据本公开的实施例,如图6所示,本公开还提供了一种需求评估信息展示装置,装置包括:
[0203]
筛选信息获取模块601,用于获取针对检索语句的筛选信息;
[0204]
语句筛选模块602,用于从需求评估数据库存储的各检索语句中,筛选与筛选信息相匹配的目标检索语句;其中,需求评估数据库中存储有多个检索语句以及每一检索语句的需求评估信息,每一检索语句的需求评估信息为按照本公开所提供的任一项的需求评估信息生成装置所确定;
[0205]
信息确定模块603,用于从需求评估数据库中,确定目标检索语句的需求评估信息;
[0206]
信息输出模块604,用于输出目标检索语句以及目标检索语句的需求评估信息。
[0207]
本公开提供的上述方案,可以生成能够准确反映实际需求的需求评估信息,并为生产出与实际需求相匹配的知识内容提供了实现基础,进一步的,还可以展示目标检索语句以及目标检索语句的需求评估信息,从而可以方便知识内容生产者获取所需的信息。
[0208]
根据本公开的实施例,本公开还提供了一种电子设备、一种可读存储介质和一种计算机程序产品。
[0209]
本公开实施例提供了一种电子设备,包括:
[0210]
至少一个处理器;以及
[0211]
与至少一个处理器通信连接的存储器;其中,
[0212]
存储器存储有可被至少一个处理器执行的指令,指令被至少一个处理器执行,以使至少一个处理器能够执行实现需求评估信息生成方法或需求评估信息展示方法。
[0213]
本公开实施例一种存储有计算机指令的非瞬时计算机可读存储介质,其中,计算机指令用于使计算机执行实现需求评估信息生成方法或需求评估信息展示方法。
[0214]
本公开实施例一种计算机程序产品,包括计算机程序,计算机程序在被处理器执行时实现需求评估信息生成方法或需求评估信息展示方法。
[0215]
图7示出了可以用来实施本公开的实施例的示例电子设备700的示意性框图。电子设备旨在表示各种形式的数字计算机,诸如,膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机
[0216]
。电子设备还可以表示各种形式的移动装置,诸如,个人数字处理、蜂窝电话、智能电话、可穿戴设备和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例,并且不意在限制本文中描述的和/或者要求的本公开的实现。
[0217]
如图7所示,设备700包括计算单元701,其可以根据存储在只读存储器(rom)702中的计算机程序或者从存储单元708加载到随机访问存储器(ram)703中的计算机程序,来执行各种适当的动作和处理。在ram 703中,还可存储设备700操作所需的各种程序和数据。计算单元701、rom 702以及ram 703通过总线704彼此相连。输入/输出(i/o)接口705也连接至
总线704。
[0218]
设备700中的多个部件连接至i/o接口705,包括:输入单元706,例如键盘、鼠标等;输出单元707,例如各种类型的显示器、扬声器等;存储单元708,例如磁盘、光盘等;以及通信单元709,例如网卡、调制解调器、无线通信收发机等。通信单元709允许设备700通过诸如因特网的计算机网络和/或各种电信网络与其他设备交换信息/数据。
[0219]
计算单元701可以是各种具有处理和计算能力的通用和/或专用处理组件。计算单元701的一些示例包括但不限于中央处理单元(cpu)、图形处理单元(gpu)、各种专用的人工智能(ai)计算芯片、各种运行机器学习模型算法的计算单元、数字信号处理器(dsp)、以及任何适当的处理器、控制器、微控制器等。计算单元701执行上文所描述的各个方法和处理,例如实现需求评估信息生成方法或需求评估信息展示方法。例如,在一些实施例中,实现需求评估信息生成方法或需求评估信息展示方法可被实现为计算机软件程序,其被有形地包含于机器可读介质,例如存储单元708。在一些实施例中,计算机程序的部分或者全部可以经由rom 702和/或通信单元709而被载入和/或安装到设备700上。当计算机程序加载到ram 703并由计算单元701执行时,可以执行上文描述的实现需求评估信息生成方法或需求评估信息展示方法的一个或多个步骤。备选地,在其他实施例中,计算单元701可以通过其他任何适当的方式(例如,借助于固件)而被配置为执行实现需求评估信息生成方法或需求评估信息展示方法。
[0220]
本文中以上描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、场可编程门阵列(fpga)、专用集成电路(asic)、专用标准产品(assp)、芯片上系统的系统(soc)、负载可编程逻辑设备(cpld)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括:实施在一个或者多个计算机程序中,该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释,该可编程处理器可以是专用或者通用可编程处理器,可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令,并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。
[0221]
用于实施本公开的方法的程序代码可以采用一个或多个编程语言的任何组合来编写。这些程序代码可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器或控制器,使得程序代码当由处理器或控制器执行时使流程图和/或框图中所规定的功能/操作被实施。程序代码可以完全在机器上执行、部分地在机器上执行,作为独立软件包部分地在机器上执行且部分地在远程机器上执行或完全在远程机器或服务器上执行。
[0222]
在本公开的上下文中,机器可读介质可以是有形的介质,其可以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的程序。机器可读介质可以是机器可读信号介质或机器可读储存介质。机器可读介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备,或者上述内容的任何合适组合。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(ram)、只读存储器(rom)、可擦除可编程只读存储器(eprom或快闪存储器)、光纤、便捷式紧凑盘只读存储器(cd

rom)、光学储存设备、磁储存设备、或上述内容的任何合适组合。
[0223]
为了提供与用户的交互,可以在计算机上实施此处描述的系统和技术,该计算机
具有:用于向用户显示信息的显示装置(例如,crt(阴极射线管)或者lcd(液晶显示器)监视器);以及键盘和指向装置(例如,鼠标或者轨迹球),用户可以通过该键盘和该指向装置来将输入提供给计算机。其它种类的装置还可以用于提供与用户的交互;例如,提供给用户的反馈可以是任何形式的传感反馈(例如,视觉反馈、听觉反馈、或者触觉反馈);并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。
[0224]
可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如,作为数据服务器)、或者包括中间件部件的计算系统(例如,应用服务器)、或者包括前端部件的计算系统(例如,具有图形用户界面或者网络浏览器的用户计算机,用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如,通信网络)来将系统的部件相互连接。通信网络的示例包括:局域网(lan)、广域网(wan)和互联网。
[0225]
计算机系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端

服务器关系的计算机程序来产生客户端和服务器的关系。服务器可以是云服务器,也可以为分布式系统的服务器,或者是结合了区块链的服务器。
[0226]
应该理解,可以使用上面所示的各种形式的流程,重新排序、增加或删除步骤。例如,本发公开中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行,只要能够实现本公开公开的技术方案所期望的结果,本文在此不进行限制。
[0227]
上述具体实施方式,并不构成对本公开保护范围的限制。本领域技术人员应该明白的是,根据设计要求和其他因素,可以进行各种修改、组合、子组合和替代。任何在本公开的精神和原则之内所作的修改、等同替换和改进等,均应包含在本公开保护范围之内。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献