一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

构建意图触发策略以及意图识别的方法和装置与流程

2021-11-24 23:44:00 来源:中国专利 TAG:


1.本说明书一个或多个实施例涉及机器学习领域,尤其涉及构建意图触发策略,以及进行意图识别的方法和对应的装置。


背景技术:

2.在机器学习领域,针对用户进行针对性推荐已得到广泛的研究。特别是在用户进入应用首页时,如何在应用提供的众多服务中,让用户更加便捷、快速地找到所需服务,缩短需求满足路径,从而提升用户体验,成为研究的目标。尽管存在一些基于深度学习的推荐模型可以基于用户特征直接确定出推荐内容,然而,这样的神经网络模型一般算法复杂,可解释性不佳。
3.因此,希望能有改进的方案,更好地辅助进行内容推荐,从而便捷用户,提高用户体验。


技术实现要素:

4.本说明书一个或多个实施例描述了一种构建意图触发策略以及进行意图识别的方法和装置,可以自动化、高效地生成具有可解释性的触发策略,从而精准识别用户即刻的需求。
5.根据第一方面,提供了一种构建意图触发策略的方法,包括:
6.获取第一意图对应的第一样本集,其中的单条样本包括,单个用户的对应于多个特征项的特征信息,以及指示该用户是否具有该第一意图的正负样本标签;
7.根据所述多个特征项,确定条件总集,其中的单个条件包括,单个特征项与该特征项的单个取值的对应关系;
8.通过若干次第一迭代生成若干条规则,其中单次第一迭代包括:基于当前样本集,从所述条件总集中选择若干个条件构成单条规则;从所述当前样本集中剔除符合所述单条规则的样本,从而更新所述当前样本集用于下次迭代,直到达到预设的第一停止条件;
9.基于所述若干条规则,形成针对所述第一意图的触发策略。
10.根据一种可能的实施方式,获取第一意图对应的第一样本集,可以包括:获取原始数据集,其中包括用于记录多个用户的历史行为的多条数据记录,单条数据记录包括,历史推荐意图以及用户对该历史推荐意图是否接受的历史标记;从所述原始数据集中筛选出所述历史推荐意图为所述第一意图的第一数据记录;根据所述第一数据记录中的历史标记,确定对应的样本标签;基于添加有所述样本标签的第一数据记录,形成所述第一样本集。
11.在一个实施例中,上述多个特征项包括类别型的第一特征项,该第一特征项具有m种类别取值;所述确定条件总集,包括:将该第一特征项与其对应的m种类别取值分别组合,得到m个条件,归入所述条件总集。
12.在一个实施例中,上述多个特征项包括连续数值型的第二特征项;所述确定条件总集,包括:将该第二特征项的可能取值范围划分为n个范围区间作为n个范围取值;将该第
二特征项与该n个范围取值分别组合,得到n个条件,归入所述条件总集。
13.根据一种实施方式,上述第一停止条件包括,满足以下之一:所述第一迭代的执行次数达到次数阈值;所述当前样本集中的正样本数量或比例达到对应的预设阈值。
14.根据一种实施方式,形成单条规则的过程可以包括:
15.执行若干次第二迭代,单次第二迭代用于至少根据所述当前样本集中的正样本,选择一个条件,添加到已选中条件集中;
16.在达到预设的第二停止条件时,将已选中条件集中的条件的组合形成所述单条规则。
17.在上述实施方式的一个实施例中,第二停止条件可以包括满足以下之一:所述已选中条件集中的条件数目达到第一数目阈值;所述第一样本集中,满足所述已选中条件集中所有条件的正样本数目小于第二数目阈值。
18.进一步的,在上述实施方式的一个实施例中,单次第二迭代包括:确定备选条件集;至少基于各个备选规则针对所述当前样本集中的正样本的命中信息,评估各个备选规则的得分;其中,所述各个备选规则是将备选条件集中的各个备选条件分别添加到已选中条件集中得到的;选择得分最优的备选规则对应的备选条件,添加到已选中条件集中。
19.在一个例子中,确定备选条件集,具体包括:通过剔除操作,得到剩余条件集,所述剔除操作包括,从所述条件总集中剔除所述已选中条件集;或者,确定所述已选中条件集中涉及的已选中特征项,从所述条件总集中剔除涉及所述已选中特征项的条件;基于剩余条件集,得到所述备选条件集。
20.进一步的,基于剩余条件集,得到所述备选条件集可以具体包括:确定所述已选中条件集对应的既有规则的全局准确率作为既有准确率,所述全局准确率是针对所述第一样本集的正样本命中准确率;将所述剩余条件集中的各个条件分别添加到所述已选中条件集中,生成各个假定规则;确定各个假定规则的全局准确率,得到各个假定准确率;将假定准确率相对于所述既有准确率的提升超过预定阈值的若干条件,构成所述备选条件集。
21.在一个实施例中,上述各个备选规则包括第一备选规则;评估各个备选规则的得分,具体包括:确定所述第一备选规则的全局准确率作为第一准确率,所述全局准确率是针对所述第一样本集的正样本命中准确率;确定所述第一备选规则的局部召回率作为第一召回率,所述局部召回率是针对所述当前样本集的正样本召回率;根据所述第一准确率和所述第一召回率,确定所述第一备选规则的得分。
22.进一步的,在一个示例中,确定所述第一备选规则的得分,包括:根据所述第一准确率,所述第一召回率,以及第一权重参数,确定所述第一备选规则的得分。
23.在另一示例中,确定所述第一备选规则的得分,包括:获取所述已选中条件集对应的既有规则的全局准确率作为既有准确率,以及该既有规则的局部召回率作为既有召回率;确定所述第一准确率相对于所述既有准确率的第一比例,以及所述第一召回率相对于所述既有召回率的第二比例;根据所述第一比例,所述第二比例以及第二权重参数,计算所述第一备选规则的得分。
24.更进一步的,在一个具体例子中,可以以所述第二比例为底数,以第一中间量为指数,计算得到所述第一备选规则的得分,所述第一中间量与所述第一比例正相关,与所述第二权重参数负相关。
25.根据一种可能的实施方式,上述基于所述若干条规则,形成针对所述第一意图的触发策略,可以包括:判断所述若干条规则中的各条规则是否满足接受条件,将满足接受条件的规则归入所述触发策略;所述接受条件为,同时满足以下子条件:
26.针对所述第一样本集的正样本命中准确率达到第一比例阈值;
27.针对所述第一样本集的正样本命中数量达到第二数目阈值;
28.规则所包含的条件数目在预设区间。
29.根据第二方面,提供了一种意图识别方法,包括:
30.获取目标用户的对应于多个特征项的特征信息;
31.将所述特征信息与预先构建的策略集中的各条规则进行匹配,从而识别出目标意图,其中,所述策略集包括针对多个意图中的每个意图,根据第一方面的方法形成的触发策略;
32.根据所述目标意图,向所述目标用户展示该目标意图下的内容信息。
33.根据第三方面,提供了一种构建意图触发策略的装置,包括:
34.样本集获取单元,配置为获取第一意图对应的第一样本集,其中的单条样本包括,单个用户的对应于多个特征项的特征信息,以及指示该用户是否具有该第一意图的正负样本标签;
35.条件总集确定单元,配置为根据所述多个特征项,确定条件总集,其中的单个条件包括,单个特征项与该特征项的单个取值的对应关系;
36.规则生成单元,配置为通过若干次第一迭代生成若干条规则,其中单次第一迭代包括:基于当前样本集,从所述条件总集中选择若干个条件构成单条规则;从所述当前样本集中剔除符合所述单条规则的样本,从而更新所述当前样本集用于下次迭代,直到达到预设的第一停止条件;
37.策略形成单元,配置为基于所述若干条规则,形成针对所述第一意图的触发策略。
38.根据第四方面,提供了一种意图识别装置,包括:
39.特征获取单元,配置为获取目标用户的对应于多个特征项的特征信息;
40.匹配单元,配置为将所述特征信息与预先构建的策略集中的各条规则进行匹配,从而识别出目标意图,其中,所述策略集包括针对多个意图中的每个意图,根据第三方面的装置形成的触发策略;
41.内容展示单元,配置为根据所述目标意图,向所述目标用户展示该目标意图下的内容信息。
42.根据第五方面,提供了一种计算机可读存储介质,其上存储有计算机程序,当所述计算机程序在计算机中执行时,令计算机执行第一方面或第二方面所述的方法。
43.根据第六方面,提供了一种计算设备,包括存储器和处理器,其特征在于,所述存储器中存储有可执行代码,所述处理器执行所述可执行代码时,实现第一方面或第二方面的方法。
44.在本说明书的实施例中,针对任意意图,通过序贯方式训练出该意图下的若干规则,从而得到具有可解释性的意图触发策略。基于如此形成的意图识别策略集,就可以即时准确地识别出用户的当前意图和需求,更好地进行场景化推荐。
附图说明
45.为了更清楚地说明本发明实施例的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它的附图。
46.图1示出在一个实施例中意图触发基于的特征信息示意图;
47.图2示出在一个实施例中构建意图触发策略以及进行意图识别的示意图;
48.图3示出根据一个实施例的构建意图触发策略的方法流程图;
49.图4示出根据一个实施例的形成单个规则的步骤流程;
50.图5示出根据一个实施例的意图识别方法;
51.图6示出根据一个实施例的用于构建意图触发策略的装置的结构示意图;
52.图7示出根据一个实施例的意图识别装置的结构示意图。
具体实施方式
53.下面结合附图,对本说明书提供的方案进行描述。
54.根据本说明书的实施例,为了更好地发现用户所需服务,利用场景化推荐的方式进行针对性的内容推荐。场景化推荐是在场景信息发生变化的情况下才会触发的推荐形式。在场景化推荐中,需要获取包括场景在内的用户的全面特征信息,基于这些特征信息确定推荐内容。
55.为了进一步优化推荐效果,在本说明书的实施例中,提出首先基于用户特征信息识别出用户当前的需求,或称为意图,然后在该意图之下进行服务推荐。并且,希望使得,用户意图的识别过程具有更强的可解释性。
56.为了增强可解释性,可以设想基于一些显式的规则形成意图识别策略,如此,在得到意图识别结果的同时,还可以得到定位出该意图的原因。然而,在场景化推荐的情况下,需要考虑包括用户静态信息,动态变化的场景信息等全面特征信息,这些特征信息构成极大的搜索空间,为意图识别策略的建立带来了很大困难。
57.图1示出在一个实施例中意图触发基于的特征信息示意图。如图1所示意的,一项用户意图的触发,可能基于多方面特征项形成的多种条件共同的作用,例如包括,静态特征项形成的静态条件,动态特征项形成的动态条件。进一步的,静态特征项可以包括,用户基本属性特征,例如性别,年龄,职业等,以及其他在较长时间段内不发生变化的特征项,如较长的时间周期(月,星期)。而动态特征项是随时间不断变化的特征项,其与场景信息紧密相关。动态特征项可以包括,用户行为序列特征,例如意图序列,位置序列,操作序列等,环境特征,例如天气特征(包括温度、湿度等)、时间特征、空间特征,等等。
58.如以上示例性的图示,对于场景化推荐来说,仅考虑个性化的静态特征是不足够的,需要全面结合静态特征和动态特征,动态地识别用户需求。例如,一个出差的用户可能几天之内都有很强的交通需求(或称为交通意图),但是并不适合几天内一直持续地触发交通推荐,还需结合场景信息的变化,发现与场景变化有更强关联性的因素。例如,在这几天中,在下雨的情况下可以推荐共享雨伞,此时,天气的变化体现出更强的场景关联性和场景化程度。
59.因此,在针对场景化推荐构建意图识别策略的情况下,要考虑的特征项繁多,搜索空间巨大,并且,不同特征项具有不同的场景化程度,特征项之间还具有一定的关联关系,这为确定意图触发条件,进而构建意图识别策略带来了很大的挑战。
60.为此,在本说明书的实施例中,提出构建意图触发策略以及进行意图识别的方法,可以自动化、高效地生成具有可解释性的触发策略,从而精准识别用户即刻的需求。
61.图2示出在一个实施例中构建意图触发策略以及进行意图识别的示意图。在本说明书实施例的技术构思中,针对有待分析的各项意图,通过序贯方式训练得到该意图下的若干规则作为该意图的触发策略,其中每条规则由若干条件形成,一个条件指示一个特征项与特征取值的对应关系。例如,对于图2中的意图1,通过序贯方式得到规则1,规则2,规则3作为触发该意图1的触发策略。
62.所谓序贯方式,即有序、迭代地对一个集合进行子集挖除的操作。具体地,在针对意图1进行规则挖掘时,首先基于样本总集进行规则挖掘,其中样本总集包含具有该意图1的用户形成的正样本,和不具有该意图1的用户形成的负样本。假定基于样本总集挖掘出规则1,该规则1包含若干特征条件,用于在一定程度上描述正样本的特点。然后将样本总集中符合该规则1的样本剔除,从而对样本集进行更新。然后,基于更新后的样本集挖掘出规则2,再将符合该规则2的样本进一步剔除,再次更新样本集。持续不断挖掘出规则,并剔除该规则覆盖的样本,直到样本集中正样本数量达到一定阈值(例如,正样本数量为0)。将此时得到的规则1到规则3,形成该意图1的触发策略。
63.可以理解,针对其他意图,例如意图2至意图n的每一项,均按照上述方式,序贯地进行规则挖掘,从而得到各个意图的触发策略,形成意图识别策略集。
64.基于如此形成的意图识别策略集,就可以即时准确地识别出用户的当前意图和需求。具体地,对于当前用户,可以将其用户特征信息与上述得到的意图识别策略集中各个意图下的触发规则进行匹配,从而匹配出当前用户意图,例如假定是意图3。然后可以基于该意图3进行内容推荐,从而更好地满足用户需求。
65.下面具体描述构建意图触发策略的过程。
66.图3示出根据一个实施例的构建意图触发策略的方法流程图,该方法可以通过任何具有计算、处理能力的装置、设备、平台、设备集群执行。如图3所示,该方法包括以下步骤:步骤31,获取第一意图对应的第一样本集;步骤32,根据多个特征项,确定条件总集;步骤33,通过若干次第一迭代生成若干条规则,其中单次第一迭代包括:基于当前样本集,从条件集合中选择若干个条件构成单条规则;从所述当前样本集中剔除符合所述单条规则的样本,从而更新所述当前样本集用于下次迭代;直到达到预设的第一停止条件;步骤34,基于若干条规则,形成针对第一意图的触发策略。下面对上述各个步骤的具体执行过程进行详细描述。
67.首先在步骤31,获取第一意图对应的第一样本集,其中的单条样本包括,单个用户的对应于多个特征项的特征信息,以及指示该用户是否具有该第一意图的正负样本标签。
68.可以理解,上述第一意图是意图识别中预先设定的多个备选意图中任意的一个意图。实践操作中,可以预先将用户意图进行层级化整理,划分为多层级的意图。具体的,一类意图可以是最为粗粒度的意图分类,例如包括交通意图,购物意图,餐饮意图等等。二类意图可以是针对各个一类意图进行更细粒度的进一步划分。例如,一类意图“交通意图”可以
进一步划分为如下几个二类意图:公交意图,打车意图,火车意图,飞机意图;一类意图“餐饮意图”也可以进一步划分为:快餐意图,茶饮意图,酒吧意图,等等。根据需要,二类意图也可以再进行进一步细化划分。
69.根据场景化推荐的粒度设置,上述意图识别中预先设定的多个备选意图可以包括同一层级的各个意图。在较为优选的实施方式中,上述多个备选意图是二类意图的集合。上述第一意图是多个备选意图中任意一个意图。
70.第一样本集是针对第一意图形成的样本集,其中每个样本包括特征部分和二分类标签,特征部分包括,用户的对应于多个特征项的特征信息,二分类标签即指示正负样本的标签,正样本表示该样本中的用户具有该第一意图,负样本表示该样本中的用户不具有该第一意图。
71.为了准确地进行场景化推荐,如前所述,需获得用户的全面的特征信息,包括场景信息。因此,上述多个特征项可以包括静态特征项和动态特征项。更具体的,如图1所示,静态特征项可以包括,用户基本属性特征,例如性别,年龄,职业等,以及其他在较长时间段内不发生变化的特征项。而动态特征项是随时间不断变化的特征项,具体可以包括,用户行为序列特征,例如意图序列,位置序列,操作序列等,环境特征,例如天气特征(包括温度、湿度等)、时间特征、空间特征,等等。
72.正负样本的标签反映对应用户是否具有该第一意图。在一个实施例中,这样的标签可以由打标人员根据用户行为历史人工标注。更典型的,在一个实施例中,这样的标签可以根据用户历史上是否接受相应意图下的推荐而自动生成。若用户接受了该第一意图下的推荐,例如点击了推荐内容,购买了推荐服务等等,则捕获其当时的特征信息作为样本特征部分,并为该用户样本添加正样本标签。反之,则为其添加负样本标签。
73.实践中,与推荐有关的大量用户行为历史一般会不区分意图地统一获得。因此,在一个实施例中,第一样本集可以通过以下方式获取。首先获取原始数据集,其中包括用于记录多个用户的历史行为的多条数据记录,单条数据记录包括,用户当时的特征信息,历史推荐意图以及用户对该历史推荐意图是否接受的历史标记。然后从该原始数据集中筛选出历史推荐意图为该第一意图的第一数据记录,并根据第一数据记录中的历史标记,确定对应的样本标签。从而,基于添加有所述样本标签的第一数据记录,形成上述第一样本集。
74.此外,在步骤32,根据上述的多个特征项,确定条件总集,其中的单个条件包括,单个特征项与该特征项的单个取值的对应关系。
75.一般地,一个条件可以表示为[x op v],其中x表示一项特征,v是该特征项值域内的某个取值,op表示一种对应关系,常见的,op可以是以下关系之一:小于,大于等于,等于,不等于,属于,不属于,等等。在本说明书的典型实施例中,取op为等于,即,单个条件表示单个特征项与单个取值的相等关系。
[0076]
可以理解,在用户的诸多特征项中,往往既包括类别型特征项,还包括连续数值型的特征项。对于类别型特征项,其具有离散的、有限数目的类别取值,因此可以简单地形成与类别数目相对应的条件。例如,某一类别型特征项,简单起见称为第一特征项,具有m种类别取值。例如,第一特征项可以为性别,则m=2;第一特征项可以是职业,则m为预设的职业种类。对于这样的特征项,可以将该第一特征项与m种类别取值分别组合,得到m个条件,归入上述条件总集。
[0077]
而对于连续数值型的特征项,例如年龄,收入,则需要将其原始特征取值离散化。具体的,对于某个连续数值型特征项,简单起见称为第二特征项,可以首先将该第二特征项的可能取值范围划分为n个范围区间作为n个范围取值,将该第二特征项与该n个范围取值分别组合,得到n个条件,归入上述条件总集。
[0078]
在一个实施例中,对于前述多个特征项中的每个特征项,将其与值域范围内所有可能的特征取值分别组合,得到每个特征项的所有可能条件,形成上述条件总集。在另一实施例中,可以仅将上述第一样本集中出现过的特征值与对应特征项组合,将如此得到的条件形成上述条件总集,从而初步排除一些不可能作为候选的条件,减小搜索空间。
[0079]
基于以上获取的第一样本集合和条件总集,接下来,在步骤33,以序贯方式训练生成若干条规则,该序贯方式的训练具体包括若干次第一迭代过程,单次第一迭代包括,在步骤331,基于当前样本集,从条件集合中选择若干个条件构成单条规则;在步骤332,从当前样本集中剔除符合上述单条规则的样本,从而更新当前样本集用于下次迭代。在步骤333,判断是否达到预设的第一停止条件,如果没有达到,返回步骤331进行下一次第一迭代,直到第一停止条件得到满足。
[0080]
下面具体描述单条规则的具体生成过程,即上述步骤331的具体执行方式。
[0081]
如前所述,一条规则由不区分顺序的若干个条件构成,并且,这样的规则后续用于判断用户是否具有对应意图,因此,希望生成的规则可以尽量地符合当前样本集中正样本的特点。
[0082]
为了生成这样的规则,在一种实施方式中,从前述的条件总集中随机选择一定数量的条件,组合成多个备选规则;然后评估各个备选规则针对当前样本集的正样本命中量,将命中量最高的备选规则作为一次第一迭代得到的单条规则。
[0083]
在另一种实施方式中,通过迭代方式依次添加适当的条件,形成单个规则。更具体的,生成单条规则的过程可以包括,执行若干次第二迭代,单次第二迭代用于至少根据当前样本集中的正样本,选择一个条件,添加到已选中条件集中;在达到预设的第二停止条件时,将已选中条件集中的条件的组合形成上述单条规则。上述已选中样本集初始值设置为空,然后,每执行一次第二迭代,向其中添加一个条件,直到满足第二停止条件,将此时的已选中条件集中的条件进行组合,即得到单条规则。
[0084]
在一个实施例中,每次第二迭代中,根据预定的条件评估函数来选择条件,所选择的条件是使得该条件评估函数的函数值或分值达到最优的条件。上述条件评估函数依赖于基于正样本命中情况而计算的一些评估指标。下面对涉及的一些评估指标进行说明。
[0085]
对于一条规则r和样本集d,该条规则的准确率p(precision)定义为:
[0086][0087]
其中,tp表示规则r在样本集d中命中的正样本数,fp表示规则r在样本集d中命中的负样本数。因此,准确率p是规则r命中的正样本数与命中的样本总量的比值。
[0088]
规则r针对样本集d的召回率r(recall)定义为:
[0089][0090]
其中,tp表示规则r在样本集d中命中的正样本数,fn表示样本集d中规则r未能命中的正样本数。因此,召回率r是规则r命中的正样本数与样本集中正样本总数的比值。
[0091]
进一步的,在本说明书的若干实施例中,进一步引入全局和局部的概念。当上述准确率p和召回率r计算所针对的样本集d为全量样本集,也就是前述的第一样本集时,此时得到的指标为全局指标,用下角标g表示,因此可以得到全局准确率pg和全局召回率rg。另一方面,当上述计算所针对的样本集d为当前第一迭代时的当前样本集时,此时得到的指标为局部指标,用下角标l表示,因此可以得到局部准确率pl和局部召回率rl。
[0092]
在以上通过第二迭代选择条件时,所使用的条件评估函数至少基于局部召回率rl,即当前样本集中正样本的命中情况。更进一步的,在一些实施例中,条件评估函数基于全局准确率pg和局部召回率rl的综合考量。
[0093]
下面详细描述第二迭代的过程。
[0094]
图4示出根据一个实施例的形成单个规则的步骤流程,该步骤流程可以视为前述步骤331的一种具体执行方式。如图4所示,在单次第二迭代中,首先在步骤41,确定备选条件集。
[0095]
具体的,在一个实施例中,可以从前述条件总集中剔除已选中条件集中的条件,得到剩余条件集,作为备选条件集。在另一实施例中,可以确定已选中条件集中涉及的已选中特征项,从条件总集中剔除涉及所述已选中特征项的条件,得到剩余条件集,作为备选条件集。可以理解,针对同一特征项的多个条件一般是彼此互斥的,例如,若特征项为年龄,则一个人的年龄不可能同时落入多个年龄区段,因此,如果已选中条件集中已经包含“年龄=a区段”这样的条件,那么备选条件集中无需包含特征项为年龄的其他条件。
[0096]
在一个实施例中,在通过剔除操作得到上述剩余条件集后,还对剩余条件集进行进一步筛选,形成备选条件集。具体的,可以确定已选中条件集对应的既有规则rule的全局准确率作为既有准确率此外,将上述剩余条件集中的各个条件分别添加到已选中条件集中,生成各个假定规则new_rule;并确定各个假定规则的全局准确率,得到各个假定准确率将假定准确率相对于所述既有准确率的提升超过预定阈值的若干条件,构成备选条件集。
[0097]
在一个例子中,如果剩余条件集中某个条件对应的假定准确率满足:
[0098][0099]
则将该条件归入备选条件集,上式中δ1为预先设定的比例阈值。
[0100]
在另一例子中,假定准确率相对于既有准确率的提升也可以通过二者之差来衡量。在这样的情况下,如果某个条件对应的假定准确率满足:
[0101][0102]
则将该条件归入备选条件集,上式中δ2为预先设定的差值阈值。
[0103]
以上通过多种方式确定出备选条件集。
[0104]
然后,在步骤42,至少基于各个备选规则针对当前样本集中的正样本的命中信息,评估各个备选规则的得分;其中,各个备选规则是将上述备选条件集中的各个备选条件分别添加到已选中条件集中得到的。在之前的步骤41通过全局准确率筛选得到备选条件集的
情况下,这里的备选规则等同于被保留的假定规则,下面也记为new_rule。
[0105]
可以通过多种方式,即多种条件评估函数,评估一条备选规则的得分。
[0106]
在一个实施例中,对于任意一条备选规则,方便起见称为第一备选规则,可以确定该第一备选规则的全局准确率p
g
作为第一准确率;还确定该第一备选规则的局部召回率r
l
作为第一召回率;从而可以根据上述第一准确率和第一召回率,确定第一备选规则的得分s。
[0107]
在一个例子中,根据下式(5)计算得分s:
[0108][0109]
其中,β作用为权重系数,可取值在(0,1)之间,β越小,表明越看中全局准确率的影响。
[0110]
在另一例子中,可以根据下式(6)计算得分s:
[0111]
s=α*r
l
(1

α)*p
g
ꢀꢀ
(6)
[0112]
其中,α为权重系数,用于调节r
l
和p
g
的影响权重。
[0113]
在另一实施例中,通过与既有规则的指标的对比,评估第一备选规则的得分。为了与既有规则进行区分,将上述第一备选规则对应的第一准确率和第一召回率分别记为和此外,获取已选中条件集对应的既有规则rule的全局准确率作为既有准确率以及该既有规则rule的局部召回率作为既有召回率在此基础上,确定第一准确率相对于既有准确率的第一比例r1,以及第一召回率相对于既有召回率的第二比例r2;从而根据所述第一比例r1,第二比例r2以及第二权重参数,计算第一备选规则的得分s。
[0114]
在一个例子中,可以根据下式(7)计算得分s:
[0115][0116]
其中,α为权重系数,用于调节r1和r2的影响权重。
[0117]
在另一例子中,可以根据下式(8)计算得分s:
[0118][0119]
也就是,以第二比例为底数,以第一中间量为指数,计算第一备选规则的得分,该第一中间量与第一比例正相关,与权重参数β负相关。其中β取值为0到正无穷,β越小,表明越看中局部召回率的影响。
[0120]
还可以设想其他形式的条件评估函数来计算备选规则的得分。优选的,条件评估函数基于全局准确率和局部召回率的综合。这是因为,随着序贯的执行,当前样本集中正样本数量急剧衰减,为避免正样本数量衰减导致的样本偏差,需考虑全局的准确率。而对于召回率,以当前样本集为对象计算局部召回率,有助于体现序贯的作用,以及保持规则得分的可变性。
[0121]
以上通过各种方式,评估得到各个备选规则的得分。于是,在步骤43,选择得分最优的备选规则对应的备选条件,添加到已选中条件集中。根据条件评估函数的具体形式,得分最优一般意味着上述得分s最高;但也不排除在一些函数形式下,得分越低性能越优的情况。
[0122]
接着在步骤44,判断是否达到预设的第二停止条件。该第二停止条件是已选中条件集的添加截止条件,具体可以包括满足以下任一种情况:已选中条件集中的条件数目达到第一数目阈值θ2;所述第一样本集中,满足已选中条件集中所有条件的正样本数目(也就是,当前规则命中的正样本数目)小于第二数目阈值μ。
[0123]
如果没有达到上述第二停止条件,则返回到步骤41,进行下一次第二迭代;直到达到上述第二停止条件。此时,前进至步骤45,将已选中条件集中的条件的组合形成单条规则。
[0124]
可以理解,以上图4是形成单条规则的过程,是图3中步骤331的子步骤。
[0125]
回到图3,通过反复执行生成单条规则的第一迭代过程,可以形成若干条规则,直到达到步骤333中的第一停止条件。
[0126]
具体的,该第一停止条件可以包括以下任意一条得到满足:(1)第一迭代的执行次数达到预设的一个次数阈值;相应的,形成的规则的条数达到对应的条数阈值;(2)当前样本集中正样本数量或比例达到预设阈值。可以理解,随着序贯的执行,当前样本集中的样本量越来越少,当其中正样本的数量或比例少到一个设定阈值时,就停止第一迭代。典型的,该阈值可以是0,这意味着,在当前样本集中不包含正样本的情况下,停止第一迭代的执行。
[0127]
在达到上述第一停止条件的情况下,流程进行至步骤34,基于步骤33若干次第一迭代生成的若干条规则,形成针对第一意图的触发策略。
[0128]
在一个实施例中,将前述若干条规则的集合,作为第一意图的触发策略。
[0129]
在另一实施例中,进一步判断前述步骤得到的若干条规则中的各条规则是否满足接受条件,将满足接受条件的规则归入所述触发策略;所述接受条件为,同时满足以下子条件:针对第一样本集的正样本命中准确率p
g
达到第一比例阈值λ;针对第一样本集的正样本命中数量count达到前述的第二数量阈值μ;以及,单条规则所包含的条件数目num在预设区间θ1≤num≤θ2。由此,排除掉不满足上述接受条件的规则,保留在正样本命中情况和条件数量方面都更加理想的规则,构成触发策略。
[0130]
通过以上过程,以序贯方式形成了针对第一意图的触发策略。在序贯执行过程中,与标签强相关的特征项会在序贯的前几轮被选中进入规则,随着规则命中的样本被删除,这些特征项的重要性会逐步降低。根据前述条件评估函数的设计,在接下来的迭代中,会选择对局部数据(当前样本集)影响较大但对全局数据(第一样本集)影响相对较弱的特征项进入规则,从而使得策略中的规则体现出多样性,能够更加全面地对用户进行意图识别。
[0131]
以上针对任意的第一意图描述了构建触发策略的过程。可以理解,对于预先设定的多个备选意图中的每个意图,都可以按照上述方式构建触发策略。于是,各个意图的触发策略的集合,可以形成策略集,如图2中所示。利用这样的策略集,就可以对用户进行意图识别和场景化推荐。
[0132]
图5示出根据一个实施例的意图识别方法。该方法可以通过任何具有计算、处理能力的装置、设备、平台、设备集群执行。如图5所示,该方法包括以下步骤。
[0133]
在步骤51,获取目标用户的对应于多个特征项的特征信息。可以理解,目标用户是当前有待分析的用户。上述多个特征项可以包括静态特征项和动态特征项,所述静态特征项包括用户基本属性,所述动态特征项包括,当前环境状态特征,行为序列特征,等等。
[0134]
在步骤52,将上述特征信息与预先构建的策略集中的各条规则进行匹配,从而识别出目标意图,其中,所述策略集包括针对多个意图中的每个意图,按照前述方法形成的触发策略。在该步骤中,将当前的目标用户的特征信息与策略集中的各条规则进行匹配,将匹配的规则所对应的意图作为目标意图。
[0135]
于是,在步骤53,根据上述目标意图,向目标用户展示该目标意图下的内容信息,也就是进行内容推荐。例如,当目标意图为茶饮意图,则展示的内容信息可以包括附近的咖啡店或奶茶店,当目标意图为打车意图,则展示的内容信息可以包括打车小程序的链接,打车优惠券等等。本说明书实施例对于确定目标意图之下的推荐内容的具体过程和算法不做限定。
[0136]
在一个实施例中,上述图5的方法可以是在用户打开服务平台的应用客户端时执行;相应的,可以在应用首页中展示所推荐的内容信息,避免对用户的打扰。
[0137]
回顾以上过程,在本说明书的实施例中,针对任意意图,通过序贯方式训练出该意图下的若干规则,从而得到具有可解释性的意图触发策略。基于如此形成的意图识别策略集,就可以即时准确地识别出用户的当前意图和需求,更好地进行场景化推荐。
[0138]
根据另一方面的实施例,还提供了一种构建意图触发策略的装置。图6示出根据一个实施例的用于构建意图触发策略的装置的结构示意图,该装置可以部署在任何具有数据存储、计算、处理能力的设备、平台或设备集群中。如图6所示,该装置600包括:
[0139]
样本集获取单元61,配置为获取第一意图对应的第一样本集,其中的单条样本包括,单个用户的对应于多个特征项的特征信息,以及指示该用户是否具有该第一意图的正负样本标签;
[0140]
条件总集确定单元62,配置为根据所述多个特征项,确定条件总集,其中的单个条件包括,单个特征项与该特征项的单个取值的对应关系;
[0141]
规则生成单元63,配置为通过若干次第一迭代生成若干条规则,其中单次第一迭代包括:基于当前样本集,从所述条件总集中选择若干个条件构成单条规则;从所述当前样本集中剔除符合所述单条规则的样本,从而更新所述当前样本集用于下次迭代,直到达到预设的第一停止条件;
[0142]
策略形成单元64,配置为基于所述若干条规则,形成针对所述第一意图的触发策略。
[0143]
在各个实施例中,上述各个单元具体配置为,执行以上结合图3和图4所述的方法中的各个步骤,在此不复赘述。
[0144]
根据又一方面的实施例,还提供了一种意图识别装置。图7示出根据一个实施例的意图识别装置的结构示意图,该装置可以部署在任何具有数据存储、计算、处理能力的设备、平台或设备集群中。如图7所示,该装置700包括:
[0145]
特征获取单元71,配置为获取目标用户的对应于多个特征项的特征信息;
[0146]
匹配单元72,配置为将所述特征信息与预先构建的策略集中的各条规则进行匹配,从而识别出目标意图,其中,所述策略集包括,针对多个意图中的每个意图,根据图6的
装置形成的触发策略;
[0147]
内容展示单元73,配置为根据所述目标意图,向所述目标用户展示该目标意图下的内容信息。
[0148]
在各个实施例中,上述各个单元具体配置为,执行以上结合图5所述的方法中的各个步骤,在此不复赘述。
[0149]
通过以上装置,针对任意意图,以序贯方式训练出该意图下的若干规则,从而得到具有可解释性的意图触发策略。基于如此形成的意图识别策略集,就可以即时准确地识别出用户的当前意图和需求,更好地进行场景化推荐。
[0150]
根据另一方面的实施例,还提供一种计算机可读存储介质,其上存储有计算机程序,当所述计算机程序在计算机中执行时,令计算机执行结合图3所描述的方法。
[0151]
根据再一方面的实施例,还提供一种计算设备,包括存储器和处理器,所述存储器中存储有可执行代码,所述处理器执行所述可执行代码时,实现结合图3所述的方法。
[0152]
本领域技术人员应该可以意识到,在上述一个或多个示例中,本发明所描述的功能可以用硬件、软件、固件或它们的任意组合来实现。当使用软件实现时,可以将这些功能存储在计算机可读介质中或者作为计算机可读介质上的一个或多个指令或代码进行传输。
[0153]
以上所述的具体实施方式,对本发明的目的、技术方案和有益效果进行了进一步详细说明,所应理解的是,以上所述仅为本发明的具体实施方式而已,并不用于限定本发明的保护范围,凡在本发明的技术方案的基础之上,所做的任何修改、等同替换、改进等,均应包括在本发明的保护范围之内。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献