一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

事件处理方法、装置及设备与流程

2022-02-20 19:34:44 来源:中国专利 TAG:


1.本技术涉及互联网领域,尤其是一种事件处理方法、装置及设备。


背景技术:

2.随着客服行业的业务变化和技术更迭,客服行业越来越重视数据分析工作,希望通过数据分析来深度挖掘业务价值、消费行为、市场信息、工作效率,实现方便快捷的智能化。在电商应用场景下,评论分析系统是一套可跨多个电商平台运营的独立系统,通过抓取电商平台的客服数据,并对电商平台的客服数据进行深度分析,挖掘用户关注点,从而改进商品,提升复购率,增加销售额。
3.但是,为了实现客服数据的深度分析,在相关技术中,通常需要分析人员对电商平台的客服数据进行深度分析,即需要分析人员的参与,显然,由于电商平台的客服数据的数据量很大,由分析人员参与对电商平台的客服数据的深度分析时,分析人员的工作量很大,而且,容易出现分析错误等问题。


技术实现要素:

4.本技术提供一种事件处理方法,所述方法包括:
5.根据原始文本数据获取至少一个触发词;
6.基于已训练的目标神经网络对所述至少一个触发词进行处理,得到与所述原始文本数据对应的事件类型、与所述事件类型对应的事件元素;
7.根据所述事件类型和所述事件元素确定目标事件;
8.根据所述目标事件的统计信息对所述目标事件进行处理。
9.本技术提供一种事件处理方法,所述方法包括:
10.获取与原始文本数据对应的事件类型、与所述事件类型对应的事件元素;
11.根据所述事件类型和所述事件元素确定目标事件;
12.根据所述目标事件的统计信息对所述目标事件进行处理。
13.本技术提供一种事件处理装置,所述装置包括:
14.获取模块,用于根据原始文本数据获取至少一个触发词;
15.处理模块,用于基于已训练的目标神经网络对所述至少一个触发词进行处理,得到与原始文本数据对应的事件类型、与所述事件类型对应的事件元素;
16.确定模块,用于根据所述事件类型和所述事件元素确定目标事件;
17.处理模块,还用于根据所述目标事件的统计信息对所述目标事件进行处理。
18.本技术提供一种事件处理设备,包括:
19.处理器和机器可读存储介质,所述机器可读存储介质上存储有若干计算机指令,所述处理器执行所述计算机指令时进行如下处理:
20.根据原始文本数据获取至少一个触发词;
21.基于已训练的目标神经网络对所述至少一个触发词进行处理,得到与所述原始文
本数据对应的事件类型、与所述事件类型对应的事件元素;
22.根据所述事件类型和所述事件元素确定目标事件;
23.根据所述目标事件的统计信息对所述目标事件进行处理。
24.基于上述技术方案,本技术实施例中,可以根据目标神经网络得到与原始文本数据对应的事件类型、与事件类型对应的事件元素,根据事件类型和事件元素确定目标事件,根据目标事件的统计信息对目标事件进行处理,从而采用目标神经网络对事件类型和事件元素进行识别和抽取,有效提升了对上下文语境的利用率,有助于歧义问题的解决,将从词和短语粒度的预警,升级为基于“事件”级别的预警,极大地丰富预警结果的信息维度,提升可读性,能够较为完整和全面地将信息呈现给用户。而且,不需要分析人员对电商平台的原始文本数据进行深度分析,解决分析人员的工作量大,容易出现分析错误等问题。
附图说明
25.为了更加清楚地说明本技术实施例或者现有技术中的技术方案,下面将对本技术实施例或者现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本技术中记载的一些实施例,对于本领域普通技术人员来讲,还可以根据本技术实施例的这些附图获得其它的附图。
26.图1是本技术一种实施方式中的事件处理方法的流程示意图;
27.图2是本技术另一种实施方式中的事件处理方法的流程示意图;
28.图3是本技术另一种实施方式中的事件处理方法的流程示意图;
29.图4是本技术另一种实施方式中的事件处理方法的流程示意图;
30.图5是本技术一种实施方式中的事件处理装置的结构示意图;
31.图6是本技术一种实施方式中的事件处理设备的结构示意图。
具体实施方式
32.在本技术实施例使用的术语仅仅是出于描述特定实施例的目的,而非限制本技术。本技术和权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其它含义。还应当理解,本文中使用的术语“和/或”是指包含一个或多个相关联的列出项目的任何或所有可能组合。
33.应当理解,尽管在本技术实施例可能采用术语第一、第二、第三等来描述各种信息,但这些信息不应限于这些术语。这些术语仅用来将同一类型的信息彼此区分开。例如,在不脱离本技术范围的情况下,第一信息也可以被称为第二信息,类似地,第二信息也可以被称为第一信息。取决于语境,此外,所使用的词语“如果”可以被解释成为“在
……
时”或“当
……
时”或“响应于确定”。
34.本技术实施例中提出一种事件处理方法,可以应用于任意应用场景,如电商应用场景,对此不做限制,后续以电商应用场景为例,该事件处理方法用于实现电商领域实时事件的跟踪预警,能够对消费者集中反映的问题/机会点进行“事件”粒度的多维度结构化表达,对事件进行全生命周期内的跟踪预警。
35.参见图1所示,为该事件处理方法的流程示意图,该方法可以包括:
36.步骤101,根据原始文本数据获取至少一个触发词。
37.示例性的,可以获取原始文本数据,该原始文本数据可以是消费者针对某商品的数据,如原始文本数据是电商平台的客服数据或者电商平台的评价数据,对此原始文本数据的类型不做限制。比如说,原始文本数据可以为:“我投诉xx店铺售卖假货,我前几天在他家买了a款运动鞋,结果发现是高仿yy牌的鞋”。
38.在得到原始文本数据后,可以将原始文本数据划分为至少一个触发词,例如,采用分词器将原始文本数据划分为触发词,对此划分方式不做限制,只要能够将原始文本数据划分为至少一个触发词即可。针对上述原始文本数据可得到如下触发词:投诉、xx店铺、售卖、假货、鞋、a款运动鞋、高仿、yy牌等。
39.在一种可能的实施方式中,可以从客服系统获取消费者-人工的客服日志,或者,从客服系统获取消费者-客服机器人的客服日志,该客服日志是原始文本数据,当然,上述只是获取原始文本数据的两个示例,对此不做限制。
40.在得到原始文本数据后,可以对原始文本数据进行预处理,得到至少一个触发词。比如说,对原始文本数据进行数据清理和/或数据过滤,在数据清理和数据过滤过程,用于去掉原始文本数据中的冗余信息,对此不做限制,如去掉数字串、脏话、url(uniform resource locator,统一资源定位符)等冗余信息。
41.在对原始文本数据进行数据清理和/或数据过滤等处理后,对处理后的原始文本数据进行分词、去停用词、同义词归一化等处理,得到至少一个触发词。
42.步骤102,基于已训练的目标神经网络对至少一个触发词进行处理,得到与该原始文本数据对应的事件类型、与该事件类型对应的事件元素。
43.示例性的,可以将该至少一个触发词输入给已训练的目标神经网络,以使目标神经网络基于该至少一个触发词确定事件类型触发词,并基于该事件类型触发词确定与原始文本数据对应的事件类型,并基于该至少一个触发词确定事件元素触发词,基于该事件元素触发词确定与该事件类型对应的事件元素。
44.其中,该事件类型触发词是该至少一个触发词中用于确定事件类型的触发词,该事件元素触发词是该至少一个触发词中用于确定事件元素的触发词。
45.基于该至少一个触发词确定事件元素触发词,基于该事件元素触发词确定与该事件类型对应的事件元素,包括但不限于:基于目标神经网络确定与该事件类型对应的元素角色,基于至少一个触发词确定与该元素角色对应的事件元素触发词,并基于该事件元素触发词确定与该元素角色对应的事件元素。
46.示例性的,步骤102中,涉及事件类型、事件元素、元素角色等概念,以下结合具体应用场景,对这些概念进行说明。事件是原始文本数据中对参与的主体、作用对象、以及二者关系和状态的结构化表示,也就是说,事件是描述主体与作用对象之间关系的客观事实,事件抽取就是要从原始文本数据中抽取这种主体-对象-关系的组合。事件类型是事件所属的领域,元素角色是事件的实体类型名,事件元素是元素角色的实体枚举和描述,即元素角色的取值。
47.比如说,可以预先配置多个事件类型对应的事件模板,事件模板可以参见表1或表2所示,表1是事件类型“假货投诉”对应的事件模板,表2是事件类型“退货退款”对应的事件模板,当然,表1和表2只是示例,对此事件类型不做限制,针对不同的事件类型,可以配置与该事件类型对应的事件模板。
48.表1
49.事件类型假货投诉时间 品类 店铺 商品 50.表2
51.事件类型退货退款时间 品类 店铺 商品 52.在表1和表2中,时间、品类、店铺、商品等,表示的是元素角色,进一步的,在事件模板中添加事件元素后,可以参见表3和表4所示。
53.表3
54.事件类型假货投诉时间x月x日品类鞋店铺xx店铺商品a款运动鞋
55.表4
56.事件类型退货退款时间x月x日品类连衣裙店铺xx店铺商品c款连衣裙
57.参见表3所示,记录了事件类型“假货投诉”对应的事件元素,“鞋”表示的是元素角色“品类”对应的事件元素,“xx店铺”表示的是元素角色“店铺”对应的事件元素,“a款运动鞋”表示的是元素角色“商品”对应的事件元素。
58.参见表4所示,记录了事件类型“退货退款”对应的事件元素,“连衣裙”表示的是元素角色“品类”对应的事件元素,“xx店铺”表示的是元素角色“店铺”对应的事件元素,“c款连衣裙”表示的是元素角色“商品”对应的事件元素。
59.步骤102中,实际上就是基于目标神经网络对原始文本数据对应的至少一个触发词进行处理,得到事件类型(如假货投诉等)和各事件元素(如鞋、xx店铺、a款运动鞋等)的过程,以下结合具体应用场景对此过程进行说明。
60.例如,基于原始文本数据对应的触发词,如投诉、xx店铺、售卖、假货、鞋、a款运动鞋、高仿、yy牌等,可以将这些触发词输入给已训练的目标神经网络,以使目标神经网络对这些触发词进行处理,对此处理过程不做限制。
61.目标神经网络对这些触发词进行处理后,可以基于这些触发词确定事件类型触发词,该事件类型触发词是用于确定事件类型的触发词,如事件类型触发词为“假货”和“投诉”。然后,目标神经网络可以基于事件类型触发词确定事件类型,如根据“假货”和“投诉”确定出事件类型为“假货投诉”。
62.进一步的,在得到事件类型后,目标神经网络可以确定与该事件类型对应的元素角色,如基于表1所示的事件类型“假货投诉”对应的事件模板,确定与该事件类型对应的元素角色,如元素角色为时间、品类、店铺、商品等。
63.例如,目标神经网络对上述触发词进行处理后,还可以基于这些触发词确定与每个元素角色对应的事件元素触发词,该事件元素触发词是用于确定事件元素的触发词,目标神经网络可以基于元素角色对应的事件元素触发词确定与该元素角色对应的事件元素。比如说,元素角色“品类”对应的事件元素触发词为“鞋”,继而能够确定与元素角色“品类”对应的事件元素为“鞋”。元素角色“店铺”对应的事件元素触发词为“xx店铺”,继而能够确定与元素角色“店铺”对应的事件元素为“xx店铺”。元素角色“商品”对应的事件元素触发词为“a款运动鞋”,继而能够确定与元素角色“商品”对应的事件元素为“a款运动鞋”。
64.在事件类型对应的元素角色中还包括“时间”,因此,还可以将原始文本数据的发生时间(表示何时产生该原始文本数据)输入给目标神经网络,目标神经网络基于该原始文本数据的发生时间确定与元素角色“时间”对应的事件元素,如该事件元素可以为该原始文本数据的发生时间,如x月x日。
65.综上所述,将原始文本数据对应的触发词输入给目标神经网络后,目标神经网络可以输出与原始文本数据对应的事件类型、与事件类型对应的事件元素。
66.步骤103,根据该事件类型和该事件元素确定目标事件。
67.在得到事件类型和事件元素后,可以将事件类型和事件元素组成目标事件,比如,在得到事件类型“假货投诉”、事件元素“鞋”、事件元素“xx店铺”、事件元素“a款运动鞋”、事件元素“x月x日”后,基于这些事件类型和事件元素确定目标事件,参见表3所示,为目标事件的示例,将其记为目标事件a,目标事件a的事件类型是“假货投诉”,目标事件a的事件元素包括:与元素角色“品类”对应的事件元素“鞋”、与元素角色“店铺”对应的事件元素“xx店铺”、与元素角色“商品”对应的事件元素“a款运动鞋”、与元素角色“时间”对应的事件元素“x月x日”。
68.步骤104,根据目标事件的统计信息对目标事件进行处理。
69.在一种可能的实施方式中,可以根据目标事件的统计信息确定目标事件的告警分数,该统计信息表示目标事件的统计量越多时,则告警分数越大。若该告警分数大于阈值,则将目标事件的告警信息发送给目标设备。
70.示例性的,根据目标事件的统计信息确定目标事件的告警分数,可以包括但不限于:根据目标事件的统计信息和目标事件的重要程度,确定该目标事件的告警分数;其中,该重要程度表示目标事件越重要时,告警分数越大。
71.综上所述,针对目标事件来说,可以确定该目标事件的统计信息,该统计信息表示该目标事件的统计量,比如说,基于原始文本数据1确定目标事件为目标事件a,则目标事件a的统计量更新为1,基于原始文本数据2确定目标事件为目标事件a,则目标事件a的统计量更新为2,基于原始文本数据3确定目标事件为目标事件b,则目标事件b的统计量更新为1,
基于原始文本数据4确定目标事件为目标事件a,则目标事件a的统计量更新为3,以此类推。
72.针对目标事件来说,还可以确定该目标事件的重要程度,该重要程度可以为不重要,一般重要,非常重要等,对此重要程度的等级不做限制,可以根据经验配置。此外,可以预先配置事件类型与重要程度的映射关系,如退货退款与一般重要的映射关系,假货投诉与非常重要的映射关系等,对此映射关系不做限制,可以根据经验配置。综上所述,基于目标事件的事件类型,通过该事件类型查询上述映射关系,就可以得到该目标事件的重要程度。
73.在得到目标事件的统计信息和目标事件的重要程度后,可以根据目标事件的统计信息和目标事件的重要程度,确定该目标事件的告警分数;其中,该重要程度表示目标事件越重要时,告警分数越大,该统计信息表示目标事件的统计量越多时,则告警分数越大。比如说,对目标事件的统计信息和目标事件的重要程度进行归一化,得到目标事件的统计分数值和目标事件的重要程度分数值,对统计分数值和重要程度分数值进行加权运算,得到目标事件的告警分数。
74.例如,在对目标事件的统计信息进行归一化时,目标事件的统计量越大,则目标事件的统计分数值越大,目标事件的统计量越小,则目标事件的统计分数值越小。如目标事件a的统计量为1-10时,统计分数值为10,目标事件a的统计量为11-20时,统计分数值为20,以此类推,对此归一化过程不做限制。
75.在对目标事件的重要程度进行归一化时,目标事件的重要程度越重要,目标事件的重要程度分数值越大,目标事件的重要程度越不重要,目标事件的重要程度分数值越小。如目标事件a的重要程度是不重要时,重要程度分数值为30,目标事件a的重要程度是一般重要时,重要程度分数值为60,目标事件a的重要程度是非常重要时,重要程度分数值为90,对此归一化过程不做限制。
76.基于统计分数值和重要程度分数值,可以采用如下公式得到目标事件的告警分数:s=s1*w1 s2*w2,s1表示统计分数值,w1表示统计分数值的权重系数,s2表示重要程度分数值,w2表示重要程度分数值的权重系数。关于w1和w2的取值,可以根据经验配置,对此不做限制,如w1为0-1之间的数值,w2为0-1之间的数值,w1与w2的和可以为1。在实际应用中,当侧重统计分数值时,w1可以大于w2,当侧重重要程度分数值时,w2可以大于w1。
77.综上所述,可以得到目标事件的告警分数,若该告警分数大于阈值(根据经验配置,对此阈值不做限制),则将目标事件的告警信息发送给目标设备(如目标事件包括“xx店铺”时,目标设备是“xx店铺”的商户对应的设备)。
78.在一个例子中,上述执行顺序只是为了方便描述给出的一个示例,在实际应用中,还可以改变步骤之间的执行顺序,对此执行顺序不做限制。而且,在其它实施例中,并不一定按照本说明书示出和描述的顺序来执行相应方法的步骤,其方法所包括的步骤可以比本说明书所描述的更多或更少。此外,本说明书中所描述的单个步骤,在其它实施例中可能被分解为多个步骤进行描述;本说明书中所描述的多个步骤,在其它实施例也可能被合并为单个步骤进行描述。
79.基于上述技术方案,本技术实施例中,可以根据目标神经网络得到与原始文本数据对应的事件类型、与事件类型对应的事件元素,根据事件类型和事件元素确定目标事件,根据目标事件的统计信息对目标事件进行处理,从而采用目标神经网络对事件类型和事件
元素进行识别和抽取,有效提升了对上下文语境的利用率,有助于歧义问题的解决,将从词和短语粒度的预警,升级为基于“事件”级别的预警,极大地丰富预警结果的信息维度,提升可读性,能够较为完整和全面地将信息呈现给用户。而且,不需要分析人员对电商平台的原始文本数据进行深度分析,解决分析人员的工作量大,容易出现分析错误等问题。
80.在一种可能的实施方式中,可以获取初始神经网络,并对初始神经网络进行训练,得到已训练的目标神经网络,可以基于已训练的目标神经网络执行步骤102,得到与原始文本数据对应的事件类型、与该事件类型对应的事件元素,以下对初始神经网络的训练过程,目标神经网络的使用过程进行说明。
81.在初始神经网络的训练过程中,可以获取大量训练文本数据,针对每个训练文本数据,根据该训练文本数据获取至少一个触发词,基于训练文本数据对应的至少一个触发词对初始神经网络进行训练,得到已训练的目标神经网络;目标神经网络包括事件类型触发词与事件类型的映射关系,事件元素触发词与事件元素的映射关系;事件类型触发词是至少一个触发词中用于确定事件类型的触发词;事件元素触发词是至少一个触发词中用于确定事件元素的触发词。
82.比如说,针对训练文本数据对应的每个触发词,该触发词可具有标定信息,该标定信息表示该触发词是事件类型触发词,或者,该触发词是事件元素触发词,或者,该触发词既不是事件类型触发词,也不是事件元素触发词。若该触发词是事件类型触发词,则该标定信息还表示该触发词对应的事件类型,若该触发词是事件元素触发词,则该标定信息还表示该触发词对应的事件元素。
83.然后,将训练文本数据对应的每个触发词及各触发词的标定信息输入给初始神经网络,从而利用这些触发词及标定信息对初始神经网络进行训练,对此训练过程不做限制,可以采用各种类型的神经网络训练方式。在训练过程结束后,可以得到已训练的目标神经网络,该目标神经网络可以包括事件类型触发词与事件类型的映射关系,事件元素触发词与事件元素的映射关系。
84.在初始神经网络的训练过程中,针对训练文本数据对应的多个触发词,存在如下情况:n(大于或等于1的正整数)个触发词的组合可以对应同一个事件类型,比如说,n个触发词的标定信息均表示该触发词是事件类型触发词,且这n个触发词的标定信息表示这n个触发词对应的是同一个事件类型。
85.在初始神经网络的训练过程中,针对训练文本数据对应的多个触发词,存在如下情况:m(大于或等于1的正整数)个触发词的组合可以对应同一个事件元素,比如说,m个触发词的标定信息均表示该触发词是事件元素触发词,且这m个触发词的标定信息表示这m个触发词对应的是同一个事件元素。
86.在初始神经网络的训练过程中,针对训练文本数据对应的触发词,若该触发词是事件元素触发词,则该触发词的标定信息还可以表示元素角色。
87.综上所述,可以得到已训练的目标神经网络,对此过程不再赘述。在得到已训练的目标神经网络后,针对步骤101和步骤102,可以获取原始文本数据,根据原始文本数据获取至少一个触发词,将这些触发词输入给目标神经网络,由目标神经网络对这些触发词进行处理,得到事件类型触发词。由于目标神经网络包括事件类型触发词与事件类型的映射关系,因此,目标神经网络可以基于该事件类型触发词确定与原始文本数据对应的事件类型,
对此不再赘述。
88.在得到与原始文本数据对应的事件类型后,目标神经网络还可以确定与该事件类型对应的至少一种元素角色。针对每种元素角色,目标神经网络对这些触发词进行处理时,可以得到与该元素角色对应的事件元素触发词。由于目标神经网络包括事件元素触发词与事件元素的映射关系,因此,目标神经网络可以基于该事件元素触发词确定与该元素角色对应的事件元素,对此不再赘述。
89.综上所述,目标神经网络可以得到与原始文本数据对应的事件类型,与每种元素角色对应的事件元素(即与事件类型对应的事件元素),至此,目标神经网络可以输出与原始文本数据对应的事件类型、与事件类型对应的事件元素。
90.在上述实施例中,目标神经网络的结构可以采用gru(gate recurrent unit,门循环单元)和crf(conditional random field,条件随机场)的网络结构,当然,gru和crf的网络结构只是一个示例,对此目标神经网络的结构不做限制。gru属于循环神经网络的一种,为了解决反向传播中的长期记忆依赖问题而提出,crf是给定一组输入序列条件下另一组输出序列的条件概率分布模型。
91.综上所述,本实施例中,可以采用双向gru网络,并外接crf模型求解最大概率路径分布,从而对事件类型、事件元素、元素角色进行联合抽取,可以更高效地利用上下文环境,有效的解决事件类型和事件元素抽取的歧义问题,能够对触发词和触发词所在上下文进行分析,将事件类型、事件元素、元素角色进行有效结合,能够互相共享上下文环境,避免相互之间彼此割裂。
92.在一种可能的实施方式中,针对步骤103来说,基于该事件类型和该事件元素,参见图2所示,可以采用如下步骤确定目标事件:
93.步骤1031,基于该事件元素的类型,确定该事件元素对应的归一化元素。
94.示例性的,该事件元素的类型可以为商品域类型或者一般域类型,商品域类型表示事件元素是商品,一般域类型表示事件元素不是商品。比如说,针对上述事件元素“鞋”,该事件元素“鞋”的类型为商品域类型。针对上述事件元素“a款运动鞋”,该事件元素“a款运动鞋”的类型为商品域类型。针对上述事件元素“xx店铺”,该事件元素“xx店铺”的类型为一般域类型。
95.示例性的,确定事件元素对应的归一化元素的过程,实际上是实体统一的过程,实体统一的任务是将同一类事物的不同表达方式(每种表达方式对应的是事件元素)归一化到同一种表达方式(归一化后的表达方式对应的是归一化元素)。使用符号如下:事件元素-e(i,j),归一化元素-e^(j),j表示第j个归一化元素,i表示第j个归一化元素的第i种表达方式,即第i个事件元素。
96.比如说,“a款运动鞋”可以是“复古男款运动鞋”,“复古男款运动鞋”的表达方式可以是:“复古男款运动鞋”、“2020新款民族风复古男鞋”、“新款复古低帮男款运动鞋”、“民族风复古风运动范男鞋”,需要将上述表达方式均归一化到“复古男款运动鞋”。例如,步骤102中,若目标神经网络输出的事件元素是“复古男款运动鞋”,则该事件元素对应的归一化元素是“复古男款运动鞋”,若目标神经网络输出的事件元素是“2020新款民族风复古男鞋”,则该事件元素对应的归一化元素是“复古男款运动鞋”,若目标神经网络输出的事件元素是“新款复古低帮男款运动鞋”,则该事件元素对应的归一化元素是“复古男款运动鞋”。
97.为了将同一类事物的不同表达方式(即不同的事件元素)归一化到同一种表达方式(即归一化元素),可以将事件元素的枚举空间划分为商品域和一般域,商品域是所有商品名的枚举空间,一般域是除商品以外的枚举空间。
98.在上述应用场景下,确定事件元素对应的归一化元素,可以包括但不限于:
99.方式一、若该事件元素的类型为商品域类型,则可以基于商品知识图谱,确定该事件元素对应的归一化元素;其中,该商品知识图谱可以为预先配置的,且该商品知识图谱可以包括事件元素与归一化元素之间的映射关系。
100.示例性的,可以预先配置商品知识图谱,商品知识图谱用于记录事件元素与归一化元素之间的映射关系,对此商品知识图谱的内容不做限制。参见表5所示,为商品知识图谱的示例,当然,这里只是一个示例,对此不做限制。
101.表5
102.事件元素归一化元素2020新款民族风复古男鞋复古男款运动鞋新款复古低帮男款运动鞋复古男款运动鞋民族风复古风运动范男鞋复古男款运动鞋
……
103.基于上述商品知识图谱,若目标神经网络输出的事件元素是“复古男款运动鞋”,由于商品知识图谱中已经存在“复古男款运动鞋”作为归一化元素,因此,直接确定该事件元素对应的归一化元素是“复古男款运动鞋”。若目标神经网络输出的事件元素是“2020新款民族风复古男鞋”,则通过查询表5所示的商品知识图谱,确定该事件元素对应的归一化元素是“复古男款运动鞋”。
104.综上所述,基于商品知识图谱,针对商品域类型的事件元素-e(i,j),可以查询到该事件元素-e(i,j)对应的归一化元素-e^(j),比如说,针对“2020新款民族风复古男鞋”、“新款复古低帮男款运动鞋”、“民族风复古风运动范男鞋”等事件元素,可以查询到对应的归一化元素为“复古男款运动鞋”,对此不再赘述。
105.方式二、若事件元素的类型为一般域类型,则可以基于事件元素与元素实体的相似度,从元素实体中确定该事件元素对应的目标元素实体;基于已生成的元素字典,确定该目标元素实体对应的归一化元素;其中,该元素字典包括归一化元素与至少一个元素实体的映射关系。示例性的,该元素字典的生成过程,可以包括但不限于:获取多个元素实体,基于密度聚类算法对多个元素实体进行聚类,得到元素集合,该元素集合包括至少一个元素实体;基于元素集合对应的归一化元素与元素集合包括的至少一个元素实体,生成该元素字典。
106.例如,针对一般域的实体统一,可以采用元素字典映射和语义相似性计算的组合方法。针对元素字典的生成过程,可以包括:训练文本数据
--
》分词
--
》词性过滤、商品过滤
--
》词向量化
--
》基于密度的聚类(dbscan)
--
》生成初始词典
--
》人工校验
--
》生成完整的元素字典,元素字典的形式为:实体a-(实体a1,实体a2,...,实体ai)。针对语义相似度计算过程,可以包括:对于事件元素的候选集,对每个事件元素进行遍历,首先对事件元素进行向量化,然后与已有事件中的元素实体进行相似度计算,如果满足设定阈值,则将二者归为同一实体。
107.以下结合具体应用场景,对元素字典映射和语义相似性计算过程进行说明。
108.获取多个训练文本数据,对这些训练文本数据进行分词处理,得到多个词语,对这些词语进行词性过滤(即过滤掉指定词性的词语)和商品过滤(即过滤掉商品域类型的词语),并去除重复词语(当多个词语重复时,只保留一个词语),这样,将剩余的词语作为元素实体,至此,可以获取到多个元素实体。
109.对每个元素实体进行词语向量化,得到每个元素实体的词向量,即以词向量方式表示元素实体。然后,基于密度聚类算法(如dbscan(density-based spatial clustering of applications with noise)等)对多个元素实体进行聚类,得到元素集合,该元素集合包括至少一个元素实体,在对多个元素实体进行聚类时,是基于每个元素实体的词向量进行聚类,对此聚类过程不做限制。比如说,将元素实体a1,元素实体a2,...,元素实体ai聚类到元素集合a,将元素实体b1,元素实体b2,...,元素实体bi聚类到元素集合b,以此类推。
110.然后,可以生成初始词典,该初始词典可以包括各元素集合及其对应的所有元素实体,如元素集合a(元素实体a1,元素实体a2,...,元素实体ai),元素集合b(元素实体b1,元素实体b2,...,元素实体bi),以此类推。
111.确定每个元素集合对应的归一化元素,对此确定方式不做限制,如采用人工校验方式,由用户给出元素集合对应的归一化元素,假设元素集合a内的所有元素实体(元素实体a1,元素实体a2,...,元素实体ai),对应相同的归一化元素a,则元素集合a对应的归一化元素是归一化元素a。假设元素集合b内的所有元素实体(元素实体b1,元素实体b2,...,元素实体bi),对应相同的归一化元素b,则元素集合b对应的归一化元素是归一化元素b。
112.然后,基于元素集合对应的归一化元素与元素集合包括的元素实体,可以生成元素字典,该元素字典可以包括但不限于:元素集合a对应的归一化元素a-(元素实体a1,元素实体a2,...,元素实体ai),元素集合b对应的归一化元素b-(元素实体b1,元素实体b2,...,元素实体bi),以此类推。
113.在步骤102中,目标神经网络可以输出至少一个事件元素,将这些事件元素添加到事件元素的候选集中,针对候选集中的每个事件元素进行遍历,针对当前遍历到的事件元素,若该事件元素的类型为一般域类型,则确定该事件元素与已有事件中的元素实体(如上述元素实体a1,元素实体a2,...,元素实体ai,元素实体b1,元素实体b2,...,元素实体bi等)的相似度。
114.若该事件元素与某个元素实体(以元素实体a1为例)的相似度大于设定阈值(可以根据经验配置),则将二者归为同一实体,即该事件元素属于元素实体a1,也就是说,该事件元素对应的目标元素实体为元素实体a1。
115.在确定该事件元素与已有事件中的元素实体的相似度时,可以对该事件元素进行向量化,且已有事件中的元素实体也为向量化后的元素实体。
116.在得到目标元素实体为元素实体a1后,基于已生成的元素字典,确定该目标元素实体对应的归一化元素,也就是说,通过元素实体a1查询已生成的元素字典,得到元素实体a1对应的归一化元素a,即该事件元素对应归一化元素a。
117.步骤1032,根据该事件类型和该归一化元素确定目标事件。
118.示例性的,在得到该事件类型和该归一化元素(即归一化事件元素)后,则可以将该事件类型和该归一化元素组成目标事件,比如说,在得到事件类型“假货投诉”、归一化元
素“鞋”、归一化元素“xx店铺”、归一化元素“a款运动鞋”、归一化元素“x月x日”后,可以基于这些事件类型和归一化元素确定目标事件。
119.在一种可能的实施方式中,可以采用图3所示的流程,实现事件处理方法。
120.首先,获取原始文本数据,该原始文本数据可以是消费者针对某商品的数据,如原始文本数据是电商平台的客服数据或者电商平台的评价数据。
121.然后,对原始文本数据进行数据预处理,得到至少一个触发词。比如说,对原始文本数据进行数据清理和/或数据过滤,并对处理后的原始文本数据进行分词、去停用词、同义词归一化等处理,得到至少一个触发词。
122.然后,进行事件类型识别和事件元素识别。比如说,在事件类型识别和事件元素识别过程中,基于已训练的目标神经网络对至少一个触发词进行处理,得到与该原始文本数据对应的事件类型、与该事件类型对应的事件元素。
123.然后,根据该事件类型和该事件元素确定目标事件,并对该目标事件进行状态跟踪。比如说,在确定出目标事件a后,可以先判断已有目标事件中是否存在目标事件a。如果存在,则更新目标事件a的状态,参见表6所示。如果不存在,则创建一个目标事件a,即目标事件a作为已有目标事件。
124.表6
[0125][0126]
示例性的,判断已有目标事件中是否存在目标事件a,可以包括:针对每个已有目标事件,确定目标事件a与该已有目标事件的相似度,若该相似度大于预设相似度阈值,则确定该已有目标事件就是目标事件a,即已有目标事件中存在目标事件a,将目标事件a的状态更新到该已有目标事件中,参见表6所示。若目标事件a与所有已有目标事件的相似度均不大于预设相似度阈值,则确定已有目标事件中不存在目标事件a,需要增加一条新记录。
[0127]
综上所述,一个目标事件在初始化创建以后,可以通过流式聚类的方式,将新增的目标事件与已有目标事件进行相似度计算,如果相似度满足一定阈值,则将新增的目标事件归类为该已有目标事件,并刷新该已有目标事件的状态(如事件元素的更新和扩充等);否则,创建一个新的目标事件。显然,目标事件具有生命周期(从创建该目标事件开始,一直
到目标事件的状态不再改变)。
[0128]
然后,在目标事件的状态跟踪过程中,可以进行事件预警。比如说,根据目标事件的统计信息和目标事件的重要程度,确定目标事件的告警分数,重要程度表示目标事件越重要时,告警分数越大,统计信息表示目标事件的统计量越多时,告警分数越大。若该告警分数大于阈值,触发对目标事件的事件预警。
[0129]
示例性的,针对每个目标事件,在该目标事件的状态跟踪过程中,可以检测该目标事件的统计信息,该统计信息包括每个统计周期的统计量(即该统计周期的计数),如统计周期1内发生10次目标事件a时,则统计周期1的统计量为10,若统计周期2内发生8次目标事件a时,则统计周期2的统计量为8。
[0130]
此外,统计信息还可以包括统计周期的环比数量,如统计周期1的统计量为10,统计周期2的统计量为8时,则统计周期2的环比数量为-2,表示比上一个统计周期的统计量少2。当然,上述只是统计信息的示例,对此不做限制。
[0131]
此外,可以对目标事件的统计信息进行归一化,得到目标事件的统计分数值。比如说,统计周期的统计量越大,目标事件在该统计周期的统计分数值越大。统计周期的环比数量越大,目标事件在该统计周期的统计分数值越大。
[0132]
示例性的,针对每个目标事件,还可以确定该目标事件的重要程度,比如说,可以预先配置事件类型与重要程度的映射关系,基于目标事件的事件类型查询该映射关系,就可以得到该目标事件的重要程度,并基于该重要程度确定出目标事件的重要程度分数值。又例如,可以通过逻辑回归(logisticregression)二分类器来给出目标事件的重要程度分数值,对此实现过程不做限制。
[0133]
示例性的,基于统计分数值和重要程度分数值,可以确定目标事件在某个统计周期的告警分数,若该告警分数大于阈值,触发对目标事件的事件预警。
[0134]
在触发对目标事件的事件预警后,可以进行预警推送,即将目标事件的告警信息发送给目标设备。比如说,若目标事件为目标事件a,则可以将目标事件a的告警信息(如事件类型为假货投诉、品类为鞋、店铺为xx店铺、商品为a款运动鞋、事件发生时间为时间a1、时间a2等,以及,在统计周期1内发生10次告警等,对此告警信息的内容不做限制)发送给目标设备。
[0135]
示例性的,在电商场景下,可以通过短信、邮件、工作通知、客服机器人等方式,将目标事件a的告警信息发送给目标设备,对此推送方式不做限制。
[0136]
基于上述技术方案,本技术实施例中,可以采用目标神经网络对事件类型和事件元素进行识别和抽取,有效提升了对上下文语境的利用率,有助于歧义问题的解决,将从词和短语粒度的预警,升级为基于“事件”级别的预警,极大地丰富预警结果的信息维度,提升可读性,能够较为完整和全面地将信息呈现给用户。而且,不需要分析人员对电商平台的原始文本数据进行深度分析,解决分析人员的工作量大,容易出现分析错误等问题。可以采用完全结构化的信息抽取方式,来表示事件本身的信息量,通过对事件类型、事件元素的抽取,能够较为完整和全面地将信息呈现给用户,这些结构化信息中包含了主体、被作用对象、主体和作用对象之间的关系、时间线上的状态等元素。能够对事件本身采用全生命周期跟踪的方式,对事件的起始、发展、消亡等不同的状态,和状态间的切换进行动态更新。能够采用相似度计算归一化、元素实体统一等方法对事件进行归一化表达,能够有效规避关键
短语方式的粒度过细问题。
[0137]
基于与上述方法同样的申请构思,本技术实施例中还提出另一种事件处理方法,参见图4所示,为该方法的流程示意图,该方法可以包括:
[0138]
步骤401,获取原始文本数据对应的事件类型、该事件类型对应的事件元素。
[0139]
示例性的,可以根据原始文本数据获取至少一个触发词,并基于已训练的目标神经网络对所述至少一个触发词进行处理,得到与原始文本数据对应的事件类型、与该事件类型对应的事件元素。当然,目标神经网络的实现方式只是一个示例,对此不做限制,只要能够得到事件类型和事件元素即可。
[0140]
步骤402,根据该事件类型和该事件元素确定目标事件。
[0141]
示例性的,可以基于该事件元素的类型,确定该事件元素对应的归一化元素;然后,根据该事件类型和该归一化元素确定目标事件。
[0142]
步骤403,根据目标事件的统计信息对该目标事件进行处理。
[0143]
示例性的,可以根据目标事件的统计信息确定该目标事件的告警分数;其中,该统计信息表示目标事件的统计量越多时,该告警分数越大;若该告警分数大于阈值,则可以将该目标事件的告警信息发送给目标设备。
[0144]
示例性的,关于步骤402和步骤403,可以参见上述实施例,在此不再赘述。
[0145]
在一个例子中,上述执行顺序只是为了方便描述给出的一个示例,在实际应用中,还可以改变步骤之间的执行顺序,对此执行顺序不做限制。而且,在其它实施例中,并不一定按照本说明书示出和描述的顺序来执行相应方法的步骤,其方法所包括的步骤可以比本说明书所描述的更多或更少。此外,本说明书中所描述的单个步骤,在其它实施例中可能被分解为多个步骤进行描述;本说明书中所描述的多个步骤,在其它实施例也可能被合并为单个步骤进行描述。
[0146]
进一步需要说明的是,本说明书中描述的事件处理方法,不仅仅可以应用在电商领域,推而广之,可以在电信服务领域、政务领域、金融领域、教育领域、文娱领域、健康领域、旅游领域等多种行业内进行应用。
[0147]
基于与上述方法同样的申请构思,本技术实施例中还提供一种事件处理装置,如图5所示,为事件处理装置的结构图,所述装置包括:
[0148]
获取模块51,用于根据原始文本数据获取至少一个触发词;
[0149]
处理模块52,用于基于已训练的目标神经网络对所述至少一个触发词进行处理,得到与原始文本数据对应的事件类型、与所述事件类型对应的事件元素;
[0150]
确定模块53,用于根据所述事件类型和所述事件元素确定目标事件;所述处理模块52,还用于根据所述目标事件的统计信息对所述目标事件进行处理。
[0151]
所述处理模块52基于已训练的目标神经网络对所述至少一个触发词进行处理,得到与所述原始文本数据对应的事件类型、与所述事件类型对应的事件元素时具体用于:将至少一个触发词输入给目标神经网络,以使所述目标神经网络基于所述至少一个触发词确定事件类型触发词,基于所述事件类型触发词确定与所述原始文本数据对应的事件类型,并基于所述至少一个触发词确定事件元素触发词,基于所述事件元素触发词确定与所述事件类型对应的事件元素。
[0152]
所述确定模块53根据所述事件类型和所述事件元素确定目标事件时具体用于:基
于所述事件元素的类型,确定所述事件元素对应的归一化元素;
[0153]
根据所述事件类型和所述归一化元素确定目标事件。
[0154]
所述确定模块53基于所述事件元素的类型,确定所述事件元素对应的归一化元素时具体用于:若所述事件元素的类型为商品域类型,则基于商品知识图谱,确定所述事件元素对应的归一化元素;其中,所述商品知识图谱为预先配置的,且所述商品知识图谱包括事件元素与归一化元素之间的映射关系。
[0155]
所述确定模块53基于所述事件元素的类型,确定所述事件元素对应的归一化元素时具体用于:若所述事件元素的类型为一般域类型,则基于所述事件元素与元素实体的相似度,从元素实体中确定所述事件元素对应的目标元素实体;
[0156]
基于已生成的元素字典,确定所述目标元素实体对应的归一化元素;其中,所述元素字典包括归一化元素与至少一个元素实体的映射关系。
[0157]
所述处理模块52根据所述目标事件的统计信息对所述目标事件进行处理时具体用于:根据所述目标事件的统计信息确定所述目标事件的告警分数;其中,所述统计信息表示所述目标事件的统计量越多时,所述告警分数越大;
[0158]
若所述告警分数大于阈值,将所述目标事件的告警信息发送给目标设备。
[0159]
所述处理模块52根据所述目标事件的统计信息确定所述目标事件的告警分数时具体用于:根据目标事件的统计信息和所述目标事件的重要程度,确定所述目标事件的告警分数;所述重要程度表示目标事件越重要时,告警分数越大。
[0160]
基于与上述方法同样的申请构思,本技术实施例还提供一种事件处理设备,包括:处理器和机器可读存储介质,所述机器可读存储介质上存储有若干计算机指令,所述处理器执行所述计算机指令时进行如下处理:
[0161]
根据原始文本数据获取至少一个触发词;
[0162]
基于已训练的目标神经网络对所述至少一个触发词进行处理,得到与所述原始文本数据对应的事件类型、与所述事件类型对应的事件元素;
[0163]
根据所述事件类型和所述事件元素确定目标事件;
[0164]
根据所述目标事件的统计信息对所述目标事件进行处理。
[0165]
本技术实施例还提供一种机器可读存储介质,所述机器可读存储介质上存储有若干计算机指令;所述计算机指令被执行时进行如下处理:
[0166]
根据原始文本数据获取至少一个触发词;
[0167]
基于已训练的目标神经网络对所述至少一个触发词进行处理,得到与所述原始文本数据对应的事件类型、与所述事件类型对应的事件元素;
[0168]
根据所述事件类型和所述事件元素确定目标事件;
[0169]
根据所述目标事件的统计信息对所述目标事件进行处理。
[0170]
参见图6所示,为本技术实施例中提出的事件处理设备的结构图,事件处理设备60可以包括:处理器61,网络接口62,总线63,存储器64。存储器64可以是任何电子、磁性、光学或其它物理存储装置,可以包含或存储信息,如可执行指令、数据等等。例如,存储器64可以是:ram(radom access memory,随机存取存储器)、易失存储器、非易失性存储器、闪存、存储驱动器(如硬盘驱动器)、固态硬盘、任何类型的存储盘(如光盘、dvd等)。
[0171]
上述实施例阐明的系统、装置、模块或单元,具体可以由计算机芯片或实体实现,
或者由具有某种功能的产品来实现。一种典型的实现设备为计算机,计算机的具体形式可以是个人计算机、膝上型计算机、蜂窝电话、相机电话、智能电话、个人数字助理、媒体播放器、导航设备、电子邮件收发设备、游戏控制台、平板计算机、可穿戴设备或者这些设备中的任意几种设备的组合。
[0172]
为了描述的方便,描述以上装置时以功能分为各种单元分别描述。当然,在实施本技术时可以把各单元的功能在同一个或多个软件和/或硬件中实现。
[0173]
本领域内的技术人员应明白,本技术的实施例可提供为方法、系统、或计算机程序产品。因此,本技术可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本技术实施例可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、cd-rom、光学存储器等)上实施的计算机程序产品的形式。
[0174]
本技术是参照根据本技术实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可以由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其它可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其它可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
[0175]
而且,这些计算机程序指令也可以存储在能引导计算机或其它可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或者多个流程和/或方框图一个方框或者多个方框中指定的功能。
[0176]
这些计算机程序指令也可装载到计算机或其它可编程数据处理设备上,使得在计算机或者其它可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其它可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
[0177]
以上所述仅为本技术的实施例而已,并不用于限制本技术。对于本领域技术人员来说,本技术可以有各种更改和变化。凡在本技术的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本技术的权利要求范围之内。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献