一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

基于关键词识别的显著性分析方法及相关产品与流程

2021-12-01 00:53:00 来源:中国专利 TAG:


1.本技术涉及人工智能技术领域,具体涉及一种基于关键词识别的显著性分析方法及相关产品。


背景技术:

2.舆情通常对宏观经济、行业或者公司的发展具有重要意义,特别是针对公司市场活动(例如,保险销售业务等),舆情能够影响业务走势和发展方向。
3.因此为了预测业务的走势和发展方向,提前做出应对之策,现在各界人士着力从舆情中提取出有效的信息,以期精确的预测业务的走势和发展方向。然而,由于舆情数据涉及的主题多、主题类别多、噪音多,无法从舆情中提取出有效的信息,使预测出的方向和走势精度低。
4.如何从舆情中有效的提取出与产品业务发展相关的信息是目前亟待解决的问题。


技术实现要素:

5.本技术实施例提供了一种基于关键词识别的显著性分析方法及相关产品,通过建立舆情标的,以及计算舆情标的的量化指标,可从舆情数据中提取出与产品业务发展相关的舆情标的,精确的预测产品业务的方向和走势。
6.第一方面,本技术实施例提供一种基于关键词识别的显著性分析方法,包括:
7.获取与待分析产品相关的多条舆情数据;
8.对所述多条舆情数据进行识别,得到至少一个舆情标的,所述至少一个舆情标的根据所述多条舆情数据的实体和主题确定;
9.根据所述多条舆情数据,确定每个所述舆情标的的量化指标,其中,每个所述舆情标的的量化指标用于表征所述舆情标的对所述待分析产品的目标业务的影响程度,所述目标业务为所述待分析产品下的任意一个业务;
10.根据每个所述舆情标的的量化指标,确定所述至少一个舆情标的中的目标舆情标的,所述目标舆情标的对所述目标业务的影响具有显著性。
11.第二方面,本技术实施例提供一种显著性分析产品,包括:
12.获取单元,用于获取与待分析产品相关的多条舆情数据;
13.处理单元,用于对所述多条舆情数据进行识别,得到至少一个舆情标的,所述至少一个舆情标的根据所述多条舆情数据的实体和主题确定;
14.根据所述多条舆情数据,确定每个所述舆情标的的量化指标,其中,每个所述舆情标的的量化指标用于表征所述舆情标的对所述待分析产品的目标业务的影响程度,所述目标业务为所述待分析产品下的任意一个业务;
15.根据每个所述舆情标的的量化指标,确定所述至少一个舆情标的中的目标舆情标的,所述目标舆情标的对所述目标业务的影响具有显著性。
16.第三方面,本技术实施例提供一种电子设备,包括:处理器,所述处理器与存储器
相连,所述存储器用于存储计算机程序,所述处理器用于执行所述存储器中存储的计算机程序,以使得所述电子设备执行如第一方面所述的方法。
17.第四方面,本技术实施例提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序使得计算机执行如第一方面所述的方法。
18.第五方面,本技术实施例提供一种计算机程序产品,所述计算机程序产品包括存储了计算机程序的非瞬时性计算机可读存储介质,所述计算机可操作来使计算机执行如第一方面所述的方法。
19.实施本技术实施例,具有如下有益效果:
20.可以看出,在本技术实施方式中,先获取与待分析产品相关的多条舆情数据,然后从多条舆情数据中识别出与待分析产品对应的舆情标的,并且对每个舆情标的进行量化,得到每个舆情标的量化指标,该量化指标用于表征每个舆情标的待分析产品的目标业务的影响程度;最后,基于每个舆情标的的量化指标从至少一个舆情标的中筛选出目标舆情标的,从而实现从舆情数据中提取出对业务发展具有显著性影响的目标舆情标的,即有效的提取出了与产品业务发展相关的信息,弥补了现有技术的空白,提高了基于目标舆情标的预测业务的走向的精度。
附图说明
21.为了更清楚地说明本技术实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
22.图1为本技术实施例提供的一种基于关键词识别的显著性分析方法的流程示意图;
23.图2为本技术实施例提供的一种显著性分析的示意图;
24.图3为本技术实施例提供的另一种显著性分析的示意图;
25.图4为本技术实施例提供的一种显著性分析装置的功能单元组成框图;
26.图5为本技术实施例提供的一种电子设备的结构示意图。
具体实施方式
27.下面将结合本技术实施例中的附图,对本技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本技术一部分实施例,而不是全部的实施例。基于本技术中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本技术保护的范围。
28.本技术的说明书和权利要求书及所述附图中的术语“第一”、“第二”、“第三”和“第四”等是用于区别不同对象,而不是用于描述特定顺序。此外,术语“包括”和“具有”以及它们任何变形,意图在于覆盖不排他的包含。例如包含了一系列步骤或单元的过程、方法、系统、产品或设备没有限定于已列出的步骤或单元,而是可选地还包括没有列出的步骤或单元,或可选地还包括对于这些过程、方法、产品或设备固有的其它步骤或单元。
29.在本文中提及“实施例”意味着,结合实施例描述的特定特征、结果或特性可以包
含在本技术的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例,也不是与其它实施例互斥的独立的或备选的实施例。本领域技术人员显式地和隐式地理解的是,本文所描述的实施例可以与其它实施例相结合。
30.本技术实施例可以基于人工智能技术对相关的数据进行获取和处理,比如,基于关键词识别技术对舆情数据进行实体和主题的识别。其中,人工智能(artificial intelligence,ai)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。
31.人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、操作/交互系统、机电一体化等技术。人工智能软件技术主要包括计算机视觉技术、机器人技术、生物识别技术、语音处理技术、自然语言处理技术以及机器学习/深度学习等几大方向。
32.参阅图1,图1为本技术实施例提供的一种基于关键词识别的显著性分析方法的流程示意图。该方法应用显著性分析装置。该方法包括以下步骤内容:
33.101:显著性分析装置获取与待分析产品相关的多条舆情数据。
34.示例性的,待分析产品可以为任意一种实体产品,比如,车辆、化妆品、饮料,等等;也可是任意一种虚拟产品,比如,保险、基金,等等。本技术中以待分析产品为成年人保险为例进行说明,并不对待分析产品的类型进行限定。
35.示例性的,显著性分析装置通过爬虫技术从多个第三方平台(比如,新闻媒体平台)获取多条原始舆情数据,然后对多条原始舆情数据分别进行关键词识别筛选和过滤,得到与待分析产品相关的多条舆情数据。
36.102:显著性分析装置对多条舆情数据进行识别,得到至少一个舆情标的。
37.其中,至少一个舆情标根据多条舆情数据中的实体和主题确定。示例性的,通过人工智能技术对每条舆情数据进行实体和主题识别,得到至少一个舆情标的,比如,通过对每条舆情数据进行关键词识别,得到每条舆情数据中的实体和主题,然后将每条舆情数据中的实体和/或主题均作为舆情标的,得到该至少一个舆情标的,例如,该舆情标的为针对该待分析产品的惩罚事件、奖励事件,等等。
38.可选的,该多条新闻数据中包含有多条新闻数据和多条社交媒体数据;因此,该至少一个舆情标的有可能是从多条新闻数据中识别出来,也有可能是从多条社交媒体数据中识别出来的,也有可能是按照一定的业务场景逻辑,从新闻数据和社交媒体数据中按照一定的权重分配综合提取出来。
39.103:显著性分析装置根据多条舆情数据,确定每个舆情标的的量化指标,其中,每个舆情标的的量化指标用于表征舆情标的对待分析产品的目标业务的影响程度,目标业务为待分析产品下的任意一个业务。
40.应说明,每个舆情标的量化指标为每个舆情标的量化表示,比如,舆情标的为惩罚事件,则该量化指标的量化指标为该惩罚事件的影响程度。示例性的,目标业务为该待分析产品下的任意一个业务,比如,待分析产品为成年人保险,则该目标业务可以为成年人保险的退保率,购买量,购买金额,等等;本技术中以目标业务为成年人保险的退保率为例进行说明。
41.示例性的,针对任意一个舆情标的,基于多条新闻数据,确定多条新闻数据对每个
舆情标的的第一贡献度;基于多条社交媒体数据,确定多条社交媒体数据对每个舆情标的的第二贡献度;最后,基于每个舆情标的第一贡献度和第二贡献度,确定每个舆情标的的量化指标。
42.下面以任意一个舆情标的e为例说明计算该舆情标的的量化指标的过程,其他舆情标的的量化指标的计算方式与舆情标的e的计算方式类似,不再叙述。
43.示例性的,确定多条新闻数据中每条新闻数据的类型和情绪值,其中,每条新闻数据的类型包括正面新闻数据或负面新闻数据,每条新闻数据的情绪值用于表征每条新闻数据对待分析产品的目标业务的影响程度,即情绪值为影响程度的量化值。举例来说,新闻数据为负面新闻数据,则可知该新闻数据对目标业务具有负面影响,但是负面影响的程度可通过情绪值反映。具体的,可以对每条新闻数据进行事件提取,确定每条新闻数据中的新闻事件,然后基于预先建立的新闻事件与情绪值的映射关系,确定每条新闻数据的情绪值。
44.进一步的,根据目标新闻数据的类型和情绪值,确定多条新闻数据对舆情标的e第一贡献度,其中,目标新闻数据为该多条新闻数据中包含有该舆情标的e的新闻数据。应说明,多条新闻数据可能对应不同的主题和实体,因此该多条新闻数据中并不是所有新闻数据都包含有该舆情标的e,因此先从多条新闻数据中选取出包含有该舆情标的e的目标新闻数据,其中,该目标新闻数据的数量为一个或多个。
45.示例性的,舆情标的e的第一贡献度可以通过公式(1)表示:
[0046][0047]
其中,为多条新闻数据对舆情标的e的第一贡献度,为目标新闻数据中属于正面新闻数据的数量,为目标新闻数据中的正面新闻数据的情绪值,即表示对目标新闻数据中属于正面新闻数据的目标新闻数据的情绪值进行求和,为目标新闻中属于负面新闻数据的数量,目标新闻数据中的负面新闻数据的情绪值,即表示对目标新闻数据中属于负面新闻数据的目标新闻数据的情绪值进行求和,c
s,0
为多条新闻数据的总数量,γ1和γ2为预设的权重值。
[0048]
与计算第一贡献度的方式类似,确定多条新闻数据中每条社交媒体数据的类型和情绪值,其中,每条社交媒体数据的类型包括正面社交媒体数据或负面社交媒体数据,每条社交媒体数据的情绪值用于表征每条社交媒体数据对待分析产品的目标业务的影响程度;根据目标社交媒体数据的类型和情绪值,确定多条社交媒体数据对每个舆情标的的第二贡献度,其中,目标社交媒体数据为多条社交媒体数据中包含有该舆情标的e的社交媒体数据。
[0049]
示例性的,舆情标的e的第二贡献度可以通过公式(2)表示:
[0050]
[0051]
其中,为社交媒体数据对舆情分析标的e的第二贡献度,表示目标社交媒体数据中属于正面社交媒体数据的数量,为正面社交媒体数据的情绪值,即用于表征对目标社交媒体数据中的正面社交媒体数据的情绪值进行求和;为目标社交媒体数据中属于负面社交媒体数据的数量,为负面社交媒体数据的情绪值,用于表征对目标社交媒体数据中的负面社交媒体数据的情绪值进行求和;c
s,0
为多条社交媒体数据的总数量,γ1和γ2为预设的权重值。
[0052]
进一步的,根据舆情标的e的第一贡献度和第二贡献度,确定舆情标的e的量化指标。同时考虑政策、金融市场和事件的影响后,舆情标的e的量化指标可以通过公式(3)表示:
[0053][0054]
其中,i
(e)
为舆情标的e的量化指标,u为市场修正指数,包括但不限于金融或市场行情数据,p为监管政策修正指数,σ(t)为突发事件影响,α0为预设超参数,w
s
、w
n
、w
u
以及w
p
是预设的权重系数。
[0055]
其中,市场修正指数根据宏观经济、行业经济、股市、债市或其他金融业态数据确定;监管政策修正指数:表征国家或省市区的监管政策对特定行业的影响指数,该指数可以综合反映某项政策影响力的大小、方向、领域、周期长短等;突发事件影响:与监管政策修正指数类似,突发事件影响表征特定事件对特定行业的影响指数,该影响指数可以综合反映该事件影响力的大小、方向、领域、周期长短等。市场修正指数可以从金融市场中获得;监管政策修正指数和突发事件影响指数,根据各行业发展特点进行构建。不再叙述每种指数的具体获取过程。
[0056]
104:显著性分析装置根据每个舆情标的的量化指标,确定至少一个舆情标的中的目标舆情标的,目标舆情标的对目标业务的影响具有显著性。
[0057]
示例性的,上述多条舆情数据可以为任意时刻下的多条舆情数据。这样也就可以基于每个时刻下的多条舆情数据,确定每个时刻下,每个舆情标的的量化指标;根据预设时间段,确定每个舆情标的的量化指标在多个预设时间段内的多个第一变化量;同样,获取待分析产品的目标业务在多个预设时间段内的多个第二变化量,以及第一分析产品的目标业务在多个预设时间段内的第三变化量,其中,第一分析产品的产品属性与待分析产品的产品属性互斥,比如,待分析产品为成年人保险为例,则第一分析产品为非成年人保险,即互斥的产品属性为成年人和非成年人;最后,根据每个舆情标的的量化指标在多个预设时间段内的多个第一变化量、待分析产品的目标业务在多个预设时间段内的多个第二变化量以及第一分析产品的目标业务在多个预设时间段内的多个第三变化量,确定至少一个舆情标的中的目标舆情标的。
[0058]
同样,下面以舆情标的e、目标业务为退保率,以及多个时刻为多个月末时刻为例说明,确定舆情标的e是否为目标舆情标的的过程,其他舆情标的与舆情标的e类似,不再叙述。
[0059]
首先,在每个月的月末时刻获取多条舆情数据,基于多条舆情数据确定出舆情标的e在每个月末时刻的量化指标;若时间间隔为三个月,则可以从第一个月的月末时刻开始,每隔三个月,分别获取每个舆情标的量化指标在多个预设时间段内的变化量,得到多个第一变化量;同样的道理,从第一个月的月末时刻开始,每隔三个月分别获取每种成年人保险(比如,车险、寿险、重疾保险,等等)的退保率的变化量,在每个预设时间段内均可得到多种非成年保险的多个第二变化量;以及从第一个月的月末时刻开始,每隔三个月分别获取每种非成年人保险(比如,婴儿险,等等)的退保率的变化量,在每个预设时间段内均可得到多种非成年保险的多个第三变化量。
[0060]
在本技术的一个实现方式中,先假设舆情标的e的的量化指标的变化对待分析产品的目标业务的影响是正相关的,则可以确定确定多个预设时间段中的第一预设时间段和第二预设时间段,其中,在第一预设时间段内舆情标的e的量化指标的第一变化量大于第一阈值,其中,第一阈值大于零,即从多个预设时间段内找到舆情标的e的量化指标变化较大的预设时间段;第二预设时间段中舆情标的e的量化指标的第一变化量的绝对值小于第一阈值,即从多个预设时间段内找到舆情标的e的量化指标几乎没有变化的预设时间段。举例来说,若舆情标的e的量化指标在第一个月末时刻和第四个月末时刻之间(即第一个预设时间段内)的第一变化量大于第一阈值,则将第一个月末时刻和第四个月末时刻之间的预设时间段作为第一预设时间段;若舆情标的e的量化指标在第一个月末时刻和第四个月末时刻之间的第一变化量的绝对值小于第一阈值,则将第一个月末时刻和第四个月末时刻之间的预设时间段作为第二预设时间段。
[0061]
进一步的,当舆情标的e的量化指标在第一预设时间段内的第一变化量大于第一阈值时,则可根据每种待分析产品的目标业务在多个预设时间段内的多个第二变化量,确定在第一预设时间段内第二变化量大于第二阈值的待分析产品的第一数量,第二阈值大于零;以及根据第一分析产品的目标业务在多个预设时间段内的第三变化量,确定在第一预设时间段内第三变化量大于第二阈值的第一分析产品第二数量。简单来说,当舆情标的e在第一预设时间段内增加较多时,然后从多种成年人保险中,确定在第一预设时间段内退保率大于第一阈值的成年人保险的第一数量,即确定出在第一预设时间段内退保率增加较多的成年人保险的第一数量;从多种非成年人保险中,确定在第一时间段内退保率大于第一阈值的非成年人保险的第二数量,即确定出在第一预设时间段内退保率增加较多的非成年人保险的第二数量。
[0062]
进一步的,当舆情标的e的量化指标在第一预设时间段内的第一变化量的绝对值小于第一阈值(即在第一预设时间段内基本没有变化时),根据每种待分析产品的目标业务在多个预设时间段内的第二变化量,确定在第二预设时间段内目标业务的第二变化量的绝对值大于第二阈值的待分析产品的第三数量;根据述第一分析产品的目标业务在多个预设时间段内的第三变化量,确定在第二预设时间段内目标业务的第三变化量的绝对值大于第二阈值的第一分析产品的第四数量;简单来说,当舆情标的e在第二预设时间段内基本没有变动时,然后在第二预设时间段内,从多种成年人保险中确定出退保率的绝对值大于第二阈值的成年人保险的第三数量,即确定出在第二预设时间段内退保率变化较大的成年人保险的第三数量,以及从多种非成年人保险中确定出退保率的绝对值大于第二阈值的非成年人保险的第四数量,即确定出在第二预设时间段内退保率变化较大的非成年人保险的第四
数量。
[0063]
假设待分析产品用c1表示,第一分析产品用表示,如图2所示,当舆情标的e在第一预设时间段内的量化指标i
(e)
的变化量,即δi
(e)
>i0时,可得到第一数量n1和第二数量m1,即有n1种成年人保险在第一预设时间段内的退保率大于第二阈值b0,以及有m1种非成年人保险的退保率大于第二阈值b0,其中,i0为第一阈值;同样的,当舆情标的e在第二预设时间段内的量化指标i
(e)
的变化量的绝对值,即|δi
(e)
|<i0时,则可以得到第三数量n
′1和第四数量m
′1,即有n
′1种成年人保险在第二预设时间段内的退保率大于第二阈值b0,有m
′1种非成年人保险在第二预设时间段内的退保率大于第二阈值b0。
[0064]
进一步的,基于第一数量、第二数量、第三数量以及第四数量,确定舆情标的e的目标量化指标。
[0065]
示例性的,舆情标的e的目标量化指标可通过公式(4)表示:
[0066]
e1=e
1_p
e
1_q
ꢀꢀꢀꢀ
公式(4);
[0067]
其中,e1为目标量化指标,为目标量化指标,
[0068]
或者,
[0069][0070]
最后,若目标量化指标处于预设区间(σ1,σ2)内时,则确定舆情标的e为目标舆情标的。而且,舆情标的e对待分析产品的目标业务的影响具有正相关,即当舆情标的e的量化指标增加时,则待分析产品的目标业务也会随之增加。
[0071]
在本技术的另一个实施方式中,假设舆情标的e的量化指标的变化对待分析产品的目标业务的影响是负相关的,则确定多个预设时间中的第三预设时间段以及第二预设时间段,其中,第三预设时间段中每个舆情标的的量化指标的第一变化量小于第一阈值的相反数,第一阈值大于零,也就是从多个预设时间段中找到舆情标的e的量化指标降低幅度较小的预设时间段,第二预设时间段为舆情标的e的量化指标的第一变化量的绝对值小于第一阈值,即从多个预设时间段中找到舆情标的e的量化指标几乎不变的预设时间段;
[0072]
然后,与上述确定目标量化指标的方式类似,根据待分析产品的目标业务在多个预设时间段内的第二变化量,确定在第三预设时间段内第二变化量小于第二阈值的相反数的待分析产品的第一数量,第二阈值大于零,即确定多种成年人保险中退保率降的低幅度较高的成年人保险的第一数量;根据第一分析产品的目标业务在多个预设时间段内的第三变化量,确定在第三预设时间段内第三变化量小于第二阈值的相反数的第一分析产品第二数量,即确定出多种非成年人保险的退保率降低幅度较高的非成年人保险的第二数量;根据待分析产品的目标业务在多个预设时间段内的第二变化量,确定在第二预设时间段内目标业务的第二变化量的绝对值大于第二阈值的待分析产品的第三数量,即确定出在第二预
设时间段内,退保率降低幅度较大的成年人保险的第三数量;根据述第一分析产品的目标业务在多个预设时间段内的第三变化量,确定在第二预设时间段内目标业务的第三变化量的绝对值大于第二阈值的第一分析产品的第四数量,即确定在第二预设时间段内退保率降低幅度较大的非成年人保险的第四数量。
[0073]
同样,假设待分析产品用c1表示,第一分析产品用表示,如图3所示,当舆情标的e在第三预设时间段内的量化指标i
(e)
的变化量,即δi
(e)


i0时,可得到第一数量n1和第二数量m1,即有n1种成年人保险在第一预设时间段内的退保率的降低幅度小于第二阈值的相反数,即小于

b0,以及有m1种非成年人保险的退保率的降低幅度小于

b0,其中,i0为第一阈值;同样的,当舆情标的e在第二预设时间段内的量化指标i
(e)
的变化量的绝对值,即|δi
(e)
|<i0时,则可以得到第三数量n
′1和第四数量m
′1,即有n
′1种成年人保险在第二预设时间段内的退保率大于第二阈值b0,有m
′1种非成年人保险在第二预设时间段内的退保率大于第二阈值b0。
[0074]
最后,根据第一数量、第二数量、第三数量以及第四数量,确定每个舆情标的的目标量化指标。其中,确定负相关情况下舆情标的e的目标量化指标的方式,与上述公式(4)类似,不再叙述。
[0075]
同样,若负相关情况下舆情标的e的目标量化指标处于预设区间内,则确定舆情标的e为目标舆情标的。此外,舆情标的e的量化指标的变化,对目标业务的影响呈现负相关。
[0076]
在本技术的一个实施方式中,在确定出目标舆情标的之后,获取当前时刻目标舆情标的的量化指标,相对于上一个时刻的变化量,基于该变化量制定出该目标业务相关的措施。例如,当目标舆情标的与目标业务之间是正相关的,若变化量为增加了10%,则可以预测出未来退保率也会增加,因此提前做好与退保相关的措施,从而为目标业务的规划提供方向。
[0077]
可以看出,在本技术实施方式中,先获取与待分析产品相关的多条舆情数据,然后从多条舆情数据中识别出与待分析产品对应的舆情标的,并且对每个舆情标的进行量化,得到每个舆情标的量化指标,该量化指标用于表征每个舆情标的待分析产品的目标业务的影响程度;最后,基于每个舆情标的的量化指标从至少一个舆情标的中筛选出目标舆情标的,从而实现从舆情数据中提取出对业务发展具有显著性影响的目标舆情标的,即有效的提取出了与产品业务发展相关的信息,弥补了现有技术的空白,提高了基于目标舆情标的预测业务的走向的精度。
[0078]
参阅图4,图4本技术实施例提供的一种xx装置的功能单元组成框图。电子设备400包括:获取单元401和处理单元402;
[0079]
获取单元401,用于获取与待分析产品相关的多条舆情数据;
[0080]
处理单元402,用于对所述多条舆情数据进行识别,得到至少一个舆情标的,所述至少一个舆情标的根据所述多条舆情数据的实体和主题确定;
[0081]
根据所述多条舆情数据,确定每个所述舆情标的的量化指标,其中,每个所述舆情标的的量化指标用于表征所述舆情标的对所述待分析产品的目标业务的影响程度,所述目标业务为所述待分析产品下的任意一个业务;
[0082]
根据每个所述舆情标的的量化指标,确定所述至少一个舆情标的中的目标舆情标的,所述目标舆情标的对所述目标业务的影响具有显著性。
[0083]
在本技术一些可能的实施方式中,所述多条舆情数据包括多条新闻数据和多条社交媒体数据,在根据所述多条舆情数据,确定每个所述舆情标的的量化指标方面,处理单元402,具体用于:
[0084]
确定所述多条新闻数据对每个所述舆情标的的第一贡献度;
[0085]
确定所述多条社交媒体数据对每个所述舆情标的的第二贡献度;
[0086]
根据每个所述舆情标的的第一贡献度和第二贡献度,确定每个所述舆情标的的量化指标。
[0087]
在本技术一些可能的实施方式中,在确定所述多条新闻数据对每个所述舆情标的的第一贡献度方面,处理单元402,具体用于:
[0088]
确定所述多条新闻数据中每条所述新闻数据的类型和情绪值,其中,每条所述新闻数据的类型包括正面新闻数据或负面新闻数据,每条所述新闻数据的情绪值用于表征每条所述新闻数据对所述待分析产品的目标业务的影响程度;
[0089]
根据目标新闻数据的类型和情绪值,确定所述多条新闻数据对每个所述舆情标的的第一贡献度,其中,所述目标新闻数据为所述多条新闻数据中包含有每个所述舆情标的的新闻数据。
[0090]
在本技术一些可能的实施方式中,在确定所述多条社交媒体数据对每个所述舆情标的的第二贡献度方面,处理单元402,具体用于:
[0091]
确定所述多条社交媒体数据中每条所述社交媒体数据的类型和情绪值,其中,每条所述社交媒体数据的类型包括正面社交媒体数据或负面社交媒体数据,每条所述社交媒体数据的情绪值用于表征每条所述社交媒体数据对所述待分析产品的目标业务的影响程度;
[0092]
根据目标社交媒体数据的类型和情绪值,确定所述多条社交媒体数据对每个所述舆情标的的第二贡献度,其中,所述目标社交媒体数据为所述多条社交媒体数据中包含有每个所述舆情标的的社交媒体数据。
[0093]
在本技术一些可能的实施方式中,所述多条舆情数据为任意时刻下的多条舆情数据,每个所述舆情标的的量化指标为所述任意时刻下的量化指标;在根据每个所述舆情标的的量化指标,确定所述至少一个舆情标的中的目标舆情标的方面,处理单元402,具体用于:
[0094]
根据所述任意时刻下每个所述舆情标的的量化指标,确定每个所述舆情标的的量化指标在多个预设时间段内的多个第一变化量;
[0095]
获取所述待分析产品的目标业务在所述多个预设时间段内的多个第二变化量,以及第一分析产品的目标业务在所述多个预设时间段内的第三变化量,其中,所述第一分析产品的产品属性与所述待分析产品的产品属性互斥;
[0096]
根据每个所述舆情标的的量化指标在多个预设时间段内的多个第一变化量、所述待分析产品的目标业务在所述多个预设时间段内的多个第二变化量以及所述第一分析产品的目标业务在所述多个预设时间段内的多个第三变化量,确定所述至少一个舆情标的中的目标舆情标的。
[0097]
在本技术一些可能的实施方式中,当每个所述舆情标的的量化指标的变化对所述待分析产品的目标业务的影响是正相关时,在根据每个所述舆情标的的量化指标在多个预
设时间段内的多个第一变化量、所述待分析产品的目标业务在所述多个预设时间段内的多个第二变化量以及所述第一分析产品的目标业务在所述多个预设时间段内的多个第三变化量,确定所述至少一个舆情标的中的目标舆情标的方面,处理单元402,具体用于:
[0098]
确定所述多个预设时间段中的第一预设时间段以及第二预设时间段,其中,在所述第一预设时间段内每个所述舆情标的的量化指标的第一变化量大于第一阈值,所述第一阈值大于零,在所述第二预设时间段内每个所述舆情标的的量化指标的第一变化量的绝对值小于所述第一阈值;
[0099]
根据所述待分析产品的目标业务在所述多个预设时间段内的第二变化量,确定在所述第一预设时间段内第二变化量大于第二阈值的所述待分析产品的第一数量,所述第二阈值大于零;
[0100]
根据所述第一分析产品的目标业务在所述多个预设时间段内的第三变化量,确定在所述第一预设时间段内第三变化量大于所述第二阈值的所述第一分析产品的第二数量;
[0101]
根据所述待分析产品的目标业务在所述多个预设时间段内的第二变化量,确定在所述第二预设时间段内目标业务的第二变化量的绝对值大于所述第二阈值的所述待分析产品的第三数量;
[0102]
根据所述述第一分析产品的目标业务在所述多个预设时间段内的第三变化量,确定在所述第二预设时间段内目标业务的第三变化量的绝对值大于所述第二阈值的所述第一分析产品的第四数量;
[0103]
根据所述第一数量、所述第二数量、所述第三数量以及所述第四数量,确定每个所述舆情标的的目标量化指标;
[0104]
将所述至少一个舆情标的中目标量化指标处于预设区间内的舆情标的作为所述目标舆情标的。
[0105]
在本技术一些可能的实施方式中,当每个所述舆情标的的量化指标的变化对所述待分析产品的目标业务的影响是负相关时,在根据每个所述舆情标的的量化指标在多个预设时间段内的多个第一变化量、所述待分析产品的目标业务在所述多个预设时间段内的多个第二变化量以及所述第一分析产品的目标业务在所述多个预设时间段内的多个第三变化量,确定所述至少一个舆情标的中的目标舆情标的方面,处理单元402,具体用于:
[0106]
确定所述多个预设时间段中的第三预设时间段以及第二预设时间段,其中,在所述第三预设时间段内每个所述舆情标的的量化指标的第一变化量小于第一阈值的相反数,所述第一阈值大于零,在所述第二预设时间段内每个所述舆情标的的量化指标的第一变化量的绝对值小于所述第一阈值;
[0107]
根据所述待分析产品的目标业务在所述多个预设时间段内的第二变化量,确定在所述第三预设时间段内第二变化量小于第二阈值的相反数的所述待分析产品的第一数量,所述第二阈值大于零;
[0108]
根据所述第一分析产品的目标业务在所述多个预设时间段内的第三变化量,确定在所述第三预设时间段内第三变化量小于所述第二阈值的相反数的所述第一分析产品的第二数量;
[0109]
根据所述待分析产品的目标业务在所述多个预设时间段内的第二变化量,确定在所述第二预设时间段内目标业务的第二变化量的绝对值大于所述第二阈值的所述待分析
产品的第三数量;
[0110]
根据所述述第一分析产品的目标业务在所述多个预设时间段内的第三变化量,确定在所述第二预设时间段内目标业务的第三变化量的绝对值大于所述第二阈值的所述第一分析产品的第四数量;
[0111]
根据所述第一数量、所述第二数量、所述第三数量以及所述第四数量,确定每个所述舆情标的的目标量化指标;
[0112]
将所述至少一个舆情标的中目标量化指标处于预设区间内的舆情标的作为所述目标舆情标的。
[0113]
参阅图5,图5为本技术实施例提供的一种电子设备的结构示意图。如图5所示,电子设备500包括收发器501、处理器502和存储器503。它们之间通过总线504连接。存储器503用于存储计算机程序和数据,并可以将存储器503存储的数据传输给处理器502。
[0114]
处理器502用于读取存储器503中的计算机程序执行以下操作:
[0115]
获取与待分析产品相关的多条舆情数据;
[0116]
对所述多条舆情数据进行识别,得到至少一个舆情标的,所述至少一个舆情标的根据所述多条舆情数据的实体和主题确定;
[0117]
根据所述多条舆情数据,确定每个所述舆情标的的量化指标,其中,每个所述舆情标的的量化指标用于表征所述舆情标的对所述待分析产品的目标业务的影响程度,所述目标业务为所述待分析产品下的任意一个业务;
[0118]
根据每个所述舆情标的的量化指标,确定所述至少一个舆情标的中的目标舆情标的,所述目标舆情标的对所述目标业务的影响具有显著性。
[0119]
在本技术一些可能的实施方式中,所述多条舆情数据包括多条新闻数据和多条社交媒体数据,在根据所述多条舆情数据,确定每个所述舆情标的的量化指标方面,处理器502具体用于执行以下操作:
[0120]
确定所述多条新闻数据对每个所述舆情标的的第一贡献度;
[0121]
确定所述多条社交媒体数据对每个所述舆情标的的第二贡献度;
[0122]
根据每个所述舆情标的的第一贡献度和第二贡献度,确定每个所述舆情标的的量化指标。
[0123]
在本技术一些可能的实施方式中,在确定所述多条新闻数据对每个所述舆情标的的第一贡献度方面,处理器502具体用于执行以下操作:
[0124]
确定所述多条新闻数据中每条所述新闻数据的类型和情绪值,其中,每条所述新闻数据的类型包括正面新闻数据或负面新闻数据,每条所述新闻数据的情绪值用于表征每条所述新闻数据对所述待分析产品的目标业务的影响程度;
[0125]
根据目标新闻数据的类型和情绪值,确定所述多条新闻数据对每个所述舆情标的的第一贡献度,其中,所述目标新闻数据为所述多条新闻数据中包含有每个所述舆情标的的新闻数据。
[0126]
在本技术一些可能的实施方式中,在确定所述多条社交媒体数据对每个所述舆情标的的第二贡献度方面,处理器502具体用于执行以下操作:
[0127]
确定所述多条社交媒体数据中每条所述社交媒体数据的类型和情绪值,其中,每条所述社交媒体数据的类型包括正面社交媒体数据或负面社交媒体数据,每条所述社交媒
体数据的情绪值用于表征每条所述社交媒体数据对所述待分析产品的目标业务的影响程度;
[0128]
根据目标社交媒体数据的类型和情绪值,确定所述多条社交媒体数据对每个所述舆情标的的第二贡献度,其中,所述目标社交媒体数据为所述多条社交媒体数据中包含有每个所述舆情标的的社交媒体数据。
[0129]
在本技术一些可能的实施方式中,所述多条舆情数据为任意时刻下的多条舆情数据,每个所述舆情标的的量化指标为所述任意时刻下的量化指标;在根据每个所述舆情标的的量化指标,确定所述至少一个舆情标的中的目标舆情标的方面,处理器502具体用于执行以下操作:
[0130]
根据所述任意时刻下每个所述舆情标的的量化指标,确定每个所述舆情标的的量化指标在多个预设时间段内的多个第一变化量;
[0131]
获取所述待分析产品的目标业务在所述多个预设时间段内的多个第二变化量,以及第一分析产品的目标业务在所述多个预设时间段内的第三变化量,其中,所述第一分析产品的产品属性与所述待分析产品的产品属性互斥;
[0132]
根据每个所述舆情标的的量化指标在多个预设时间段内的多个第一变化量、所述待分析产品的目标业务在所述多个预设时间段内的多个第二变化量以及所述第一分析产品的目标业务在所述多个预设时间段内的多个第三变化量,确定所述至少一个舆情标的中的目标舆情标的。
[0133]
在本技术一些可能的实施方式中,当每个所述舆情标的的量化指标的变化对所述待分析产品的目标业务的影响是正相关时,在根据每个所述舆情标的的量化指标在多个预设时间段内的多个第一变化量、所述待分析产品的目标业务在所述多个预设时间段内的多个第二变化量以及所述第一分析产品的目标业务在所述多个预设时间段内的多个第三变化量,确定所述至少一个舆情标的中的目标舆情标的方面,处理器502具体用于执行以下操作:
[0134]
确定所述多个预设时间段中的第一预设时间段以及第二预设时间段,其中,在所述第一预设时间段内每个所述舆情标的的量化指标的第一变化量大于第一阈值,所述第一阈值大于零,在所述第二预设时间段内每个所述舆情标的的量化指标的第一变化量的绝对值小于所述第一阈值;
[0135]
根据所述待分析产品的目标业务在所述多个预设时间段内的第二变化量,确定在所述第一预设时间段内第二变化量大于第二阈值的所述待分析产品的第一数量,所述第二阈值大于零;
[0136]
根据所述第一分析产品的目标业务在所述多个预设时间段内的第三变化量,确定在所述第一预设时间段内第三变化量大于所述第二阈值的所述第一分析产品的第二数量;
[0137]
根据所述待分析产品的目标业务在所述多个预设时间段内的第二变化量,确定在所述第二预设时间段内目标业务的第二变化量的绝对值大于所述第二阈值的所述待分析产品的第三数量;
[0138]
根据所述述第一分析产品的目标业务在所述多个预设时间段内的第三变化量,确定在所述第二预设时间段内目标业务的第三变化量的绝对值大于所述第二阈值的所述第一分析产品的第四数量;
[0139]
根据所述第一数量、所述第二数量、所述第三数量以及所述第四数量,确定每个所述舆情标的的目标量化指标;
[0140]
将所述至少一个舆情标的中目标量化指标处于预设区间内的舆情标的作为所述目标舆情标的。
[0141]
在本技术一些可能的实施方式中,当每个所述舆情标的的量化指标的变化对所述待分析产品的目标业务的影响是负相关时,在根据每个所述舆情标的的量化指标在多个预设时间段内的多个第一变化量、所述待分析产品的目标业务在所述多个预设时间段内的多个第二变化量以及所述第一分析产品的目标业务在所述多个预设时间段内的多个第三变化量,确定所述至少一个舆情标的中的目标舆情标的方面,处理器502具体用于执行以下操作:
[0142]
确定所述多个预设时间段中的第三预设时间段以及第二预设时间段,其中,在所述第三预设时间段内每个所述舆情标的的量化指标的第一变化量小于第一阈值的相反数,所述第一阈值大于零,在所述第二预设时间段内每个所述舆情标的的量化指标的第一变化量的绝对值小于所述第一阈值;
[0143]
根据所述待分析产品的目标业务在所述多个预设时间段内的第二变化量,确定在所述第三预设时间段内第二变化量小于第二阈值的相反数的所述待分析产品的第一数量,所述第二阈值大于零;
[0144]
根据所述第一分析产品的目标业务在所述多个预设时间段内的第三变化量,确定在所述第三预设时间段内第三变化量小于所述第二阈值的相反数的所述第一分析产品的第二数量;
[0145]
根据所述待分析产品的目标业务在所述多个预设时间段内的第二变化量,确定在所述第二预设时间段内目标业务的第二变化量的绝对值大于所述第二阈值的所述待分析产品的第三数量;
[0146]
根据所述述第一分析产品的目标业务在所述多个预设时间段内的第三变化量,确定在所述第二预设时间段内目标业务的第三变化量的绝对值大于所述第二阈值的所述第一分析产品的第四数量;
[0147]
根据所述第一数量、所述第二数量、所述第三数量以及所述第四数量,确定每个所述舆情标的的目标量化指标;
[0148]
将所述至少一个舆情标的中目标量化指标处于预设区间内的舆情标的作为所述目标舆情标的。
[0149]
具体地,上述收发器501可为图4所述的实施例的显著性分析装置400的获取单元401,上述处理器502可以为图4所述的实施例的显著性分析装置400的处理单元402。
[0150]
应理解,本技术中的电子设备可以包括智能手机(如android手机、ios手机、windows phone手机等)、平板电脑、掌上电脑、笔记本电脑、移动互联网设备mid(mobile internet devices,简称:mid)或穿戴式设备等。上述电子设备仅是举例,而非穷举,包含但不限于上述电子设备。在实际应用中,上述电子设备还可以包括:智能车载终端、计算机设备等等。
[0151]
本技术实施例还提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行以实现如上述方法实施例中记载的任何一种基
于关键词识别的显著性分析方法的部分或全部步骤。
[0152]
本技术实施例还提供一种计算机程序产品,所述计算机程序产品包括存储了计算机程序的非瞬时性计算机可读存储介质,所述计算机程序可操作来使计算机执行如上述方法实施例中记载的任何一种基于关键词识别的显著性分析方法的部分或全部步骤。
[0153]
需要说明的是,对于前述的各方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本技术并不受所描述的动作顺序的限制,因为依据本技术,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于可选实施例,所涉及的动作和模块并不一定是本技术所必须的。
[0154]
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
[0155]
在本技术所提供的几个实施例中,应该理解到,所揭露的装置,可通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性或其它的形式。
[0156]
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
[0157]
另外,在本技术各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件程序模块的形式实现。
[0158]
所述集成的单元如果以软件程序模块的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储器中。基于这样的理解,本技术的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储器中,包括若干指令用以使得一台计算机设备(可为个人计算机、服务器或者网络设备等)执行本技术各个实施例所述方法的全部或部分步骤。而前述的存储器包括:u盘、只读存储器(rom,read

only memory)、随机存取存储器(ram,random access memory)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。
[0159]
本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,该程序可以存储于一计算机可读存储器中,存储器可以包括:闪存盘、只读存储器(英文:read

only memory,简称:rom)、随机存取器(英文:random access memory,简称:ram)、磁盘或光盘等。
[0160]
以上对本技术实施例进行了详细介绍,本文中应用了具体个例对本技术的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本技术的方法及其核心思想;同时,对于本领域的一般技术人员,依据本技术的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本技术的限制。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献