一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

基于关键词识别的联动性分析方法及相关产品与流程

2021-12-01 00:54:00 来源:中国专利 TAG:


1.本技术涉及人工智能技术领域,具体涉及一种基于关键词识别的联动性分析方法及相关产品。


背景技术:

2.舆情通常对宏观经济、行业或者公司的发展具有重要意义,特别是针对公司市场活动(例如,保险销售业务等),舆情能够影响业务走势和发展方向。
3.因此为了预测业务的走势和发展方向,提前做出应对之策,现在各界人士着力从舆情中提取出有效的信息,以期精确的预测业务的走势和发展方向。然而,由于舆情数据涉及的主题多、主题类别多、噪音多,无法从舆情中提取出有效的信息,使预测出的方向和走势精度低。
4.如何从舆情中有效的提取出与产品业务发展相关的信息是目前亟待解决的问题。


技术实现要素:

5.本技术实施例提供了一种基于关键词识别的联动性分析方法及相关产品,通过建立舆情标的,以及计算舆情标的的量化指标,可从舆情数据中提取出与产品业务发展具有联动性的舆情标的,精确的预测产品业务的方向和走势。
6.第一方面,本技术实施例提供一种基于关键词识别的联动性分析方法,包括:
7.获取与待分析产品相关的多条舆情数据;
8.对所述多条舆情数据进行识别,得到至少一个舆情标的,所述至少一个舆情标的根据所述多条舆情数据的实体和主题确定;
9.根据所述多条舆情数据,确定每个所述舆情标的的量化指标,其中,每个所述舆情标的的量化指标用于表征所述舆情标的对所述待分析产品的目标业务的影响程度,所述目标业务为所述待分析产品下的任意一个业务;
10.根据每个所述舆情标的的量化指标,确定所述至少一个舆情标的中的目标舆情标的,所述目标舆情标的对所述目标业务的影响具有联动性。
11.第二方面,本技术实施例提供一种联动性分析装置,包括:
12.获取单元,用于获取与待分析产品相关的多条舆情数据;
13.处理单元,用于对所述多条舆情数据进行识别,得到至少一个舆情标的,所述至少一个舆情标的根据所述多条舆情数据的实体和主题确定;
14.根据所述多条舆情数据,确定每个所述舆情标的的量化指标,其中,每个所述舆情标的的量化指标用于表征所述舆情标的对所述待分析产品的目标业务的影响程度,所述目标业务为所述待分析产品下的任意一个业务;
15.根据每个所述舆情标的的量化指标,确定所述至少一个舆情标的中的目标舆情标的,所述目标舆情标的对所述目标业务的影响具有联动性。
16.第三方面,本技术实施例提供一种电子设备,包括:处理器,所述处理器与存储器
相连,所述存储器用于存储计算机程序,所述处理器用于执行所述存储器中存储的计算机程序,以使得所述电子设备执行如第一方面所述的方法。
17.第四方面,本技术实施例提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序使得计算机执行如第一方面所述的方法。
18.第五方面,本技术实施例提供一种计算机程序产品,所述计算机程序产品包括存储了计算机程序的非瞬时性计算机可读存储介质,所述计算机可操作来使计算机执行如第一方面所述的方法。
19.实施本技术实施例,具有如下有益效果:
20.可以看出,在本技术实施方式中,在本技术实施方式中,先获取与待分析产品相关的多条舆情数据,然后从多条舆情数据中识别出与待分析产品对应的舆情标的,并且对每个舆情标的进行量化,得到每个舆情标的量化指标,该量化指标用于表征每个舆情标的待分析产品的目标业务的影响程度;最后,基于每个舆情标的的量化指标从至少一个舆情标的中筛选出目标舆情标的,从而实现从舆情数据中提取出对业务发展具有联动性影响的目标舆情标的,即有效的提取出了与产品业务发展相关的信息,弥补了现有技术的空白;最后,基于当前时刻目标舆情标的的量化指标的变化,预测目标业务未来时间段的发展趋势,提高了基于目标舆情标的预测业务的走向的精度
附图说明
21.为了更清楚地说明本技术实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
22.图1为本技术实施例提供的一种基于关键词识别的联动性分析方法的流程示意图;
23.图2为本技术实施例提供的一种确定相关系数的示意图;
24.图3为本技术实施例提供的一种联动性分析装置的功能单元组成框图;
25.图4为本技术实施例提供的一种电子设备的结构示意图。
具体实施方式
26.下面将结合本技术实施例中的附图,对本技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本技术一部分实施例,而不是全部的实施例。基于本技术中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本技术保护的范围。
27.本技术的说明书和权利要求书及所述附图中的术语“第一”、“第二”、“第三”和“第四”等是用于区别不同对象,而不是用于描述特定顺序。此外,术语“包括”和“具有”以及它们任何变形,意图在于覆盖不排他的包含。例如包含了一系列步骤或单元的过程、方法、系统、产品或设备没有限定于已列出的步骤或单元,而是可选地还包括没有列出的步骤或单元,或可选地还包括对于这些过程、方法、产品或设备固有的其它步骤或单元。
28.在本文中提及“实施例”意味着,结合实施例描述的特定特征、结果或特性可以包
含在本技术的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例,也不是与其它实施例互斥的独立的或备选的实施例。本领域技术人员显式地和隐式地理解的是,本文所描述的实施例可以与其它实施例相结合。
29.本技术实施例可以基于人工智能技术对相关的数据进行获取和处理,比如,基于关键词识别技术对舆情数据进行实体和主题的识别。其中,人工智能(artificial intelligence,ai)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。
30.人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、操作/交互系统、机电一体化等技术。人工智能软件技术主要包括计算机视觉技术、机器人技术、生物识别技术、语音处理技术、自然语言处理技术以及机器学习/深度学习等几大方向。
31.参阅图1,图1为本技术实施例提供的一种基于关键词识别的联动性分析方法的流程示意图。该方法应用于联动性分析装置。该方法包括以下步骤内容:
32.101:联动性分析装置获取与待分析产品相关的多条舆情数据。
33.示例性的,待分析产品可以为任意一种实体产品,比如,车辆、化妆品、饮料,等等;也可是任意一种虚拟产品,比如,保险、基金,等等。本技术中以待分析产品为成年人保险为例进行说明,并不对待分析产品的类型进行限定。
34.示例性的,联动性分析装置通过爬虫技术从多个第三方平台(比如,新闻媒体平台)获取多条原始舆情数据,然后对多条原始舆情数据分别进行关键词识别筛选和过滤,得到与待分析产品相关的多条舆情数据。
35.102:联动性分析装置对多条舆情数据进行识别,得到至少一个舆情标的。
36.其中,至少一个舆情标根据多条舆情数据中的实体和主题确定。示例性的,通过人工智能技术对每条舆情数据进行实体和主题识别,得到至少一个舆情标的,比如,通过对每条舆情数据进行关键词识别,得到每条舆情数据中的实体和主题,然后将每条舆情数据中的实体和/或主题均作为舆情标的,得到该至少一个舆情标的,例如,该舆情标的为针对该待分析产品的惩罚事件、奖励事件,等等。
37.可选的,该多条新闻数据中包含有多条新闻数据和多条社交媒体数据;因此,该至少一个舆情标的有可能是从多条新闻数据中识别出来,也有可能是从多条社交媒体数据中识别出来的,也有可能是按照一定的业务场景逻辑,从新闻数据和社交媒体数据中按照一定的权重分配综合提取出来。
38.103:联动性分析装置根据多条舆情数据,确定每个舆情标的的量化指标,其中,每个舆情标的的量化指标用于表征舆情标的对待分析产品的目标业务的影响程度,目标业务为待分析产品下的任意一个业务。
39.应说明,每个舆情标的量化指标为每个舆情标的量化表示,比如,舆情标的为惩罚事件,则该量化指标的量化指标为该惩罚事件的影响程度。示例性的,目标业务为该待分析产品下的任意一个业务,比如,待分析产品为成年人保险,则该目标业务可以为成年人保险的退保率,购买量,购买金额,等等;本技术中以目标业务为成年人保险的退保率为例进行说明。
40.示例性的,针对任意一个舆情标的,基于多条新闻数据,确定多条新闻数据对每个
舆情标的的第一贡献度;基于多条社交媒体数据,确定多条社交媒体数据对每个舆情标的的第二贡献度;最后,基于每个舆情标的第一贡献度和第二贡献度,确定每个舆情标的的量化指标。
41.下面以任意一个舆情标的e为例说明计算该舆情标的的量化指标的过程,其他舆情标的的量化指标的计算方式与舆情标的e的计算方式类似,不再叙述。
42.示例性的,确定多条新闻数据中每条新闻数据的类型和情绪值,其中,每条新闻数据的类型包括正面新闻数据或负面新闻数据,每条新闻数据的情绪值用于表征每条新闻数据对待分析产品的目标业务的影响程度,即情绪值为影响程度的量化值。举例来说,新闻数据为负面新闻数据,则可知该新闻数据对目标业务具有负面影响,但是负面影响的程度可通过情绪值反映。具体的,可以对每条新闻数据进行事件提取,确定每条新闻数据中的新闻事件,然后基于预先建立的新闻事件与情绪值的映射关系,确定每条新闻数据的情绪值。
43.进一步的,根据目标新闻数据的类型和情绪值,确定多条新闻数据对舆情标的e第一贡献度,其中,目标新闻数据为该多条新闻数据中包含有该舆情标的e的新闻数据。应说明,多条新闻数据可能对应不同的主题和实体,因此该多条新闻数据中并不是所有新闻数据都包含有该舆情标的e,因此先从多条新闻数据中选取出包含有该舆情标的e的目标新闻数据,其中,该目标新闻数据的数量为一个或多个。
44.示例性的,舆情标的e的第一贡献度可以通过公式(1)表示:
[0045][0046]
其中,为多条新闻数据对舆情标的e的第一贡献度,为目标新闻数据中属于正面新闻数据的数量,为目标新闻数据中的正面新闻数据的情绪值,即表示对目标新闻数据中属于正面新闻数据的目标新闻数据的情绪值进行求和,为目标新闻中属于负面新闻数据的数量,目标新闻数据中的负面新闻数据的情绪值,即表示对目标新闻数据中属于负面新闻数据的目标新闻数据的情绪值进行求和,c
s,0
为多条新闻数据的总数量,γ1和γ2为预设的权重值。
[0047]
与计算第一贡献度的方式类似,确定多条新闻数据中每条社交媒体数据的类型和情绪值,其中,每条社交媒体数据的类型包括正面社交媒体数据或负面社交媒体数据,每条社交媒体数据的情绪值用于表征每条社交媒体数据对待分析产品的目标业务的影响程度;根据目标社交媒体数据的类型和情绪值,确定多条社交媒体数据对每个舆情标的的第二贡献度,其中,目标社交媒体数据为多条社交媒体数据中包含有该舆情标的e的社交媒体数据。
[0048]
示例性的,舆情标的e的第二贡献度可以通过公式(2)表示:
[0049]
[0050]
其中,为社交媒体数据对舆情分析标的e的第二贡献度,表示目标社交媒体数据中属于正面社交媒体数据的数量,为正面社交媒体数据的情绪值,即用于表征对目标社交媒体数据中的正面社交媒体数据的情绪值进行求和;为目标社交媒体数据中属于负面社交媒体数据的数量,为负面社交媒体数据的情绪值,用于表征对目标社交媒体数据中的负面社交媒体数据的情绪值进行求和;c
s,0
为多条社交媒体数据的总数量,γ1和γ2为预设的权重值。
[0051]
进一步的,根据舆情标的e的第一贡献度和第二贡献度,确定舆情标的e的量化指标。同时考虑政策、金融市场和事件的影响后,舆情标的e的量化指标可以通过公式(3)表示:
[0052][0053]
其中,i
(e)
为舆情标的e的量化指标,u为市场修正指数,包括但不限于金融或市场行情数据,p为监管政策修正指数,σ(t)为突发事件影响,α0为预设超参数,w
s
、w
n
、w
u
以及w
p
是预设的权重系数。
[0054]
其中,市场修正指数根据宏观经济、行业经济、股市、债市或其他金融业态数据确定;监管政策修正指数:表征国家或省市区的监管政策对特定行业的影响指数,该指数可以综合反映某项政策影响力的大小、方向、领域、周期长短等;突发事件影响:与监管政策修正指数类似,突发事件影响表征特定事件对特定行业的影响指数,该影响指数可以综合反映该事件影响力的大小、方向、领域、周期长短等。市场修正指数可以从金融市场中获得;监管政策修正指数和突发事件影响指数,根据各行业发展特点进行构建。不再叙述每种指数的具体获取过程。
[0055]
104:联动性分析装置根据每个所述舆情标的的量化指标,确定所述至少一个舆情标的中的目标舆情标的,所述目标舆情标的对所述目标业务的影响具有联动性。
[0056]
示例性的,上述多条舆情数据可以为任意时刻下的多条舆情数据。这样也就可以基于每个时刻下的多条舆情数据,确定每个时刻下,每个舆情标的的量化指标;然后,基于每个舆情标的在每个时刻下的量化指标,确定以t时刻为起始时刻,在多个预设时间间隔后的多个第一变化率,多个第一变化率与多个预设时间间隔一一对应,其中,该第一变化率为该舆情标的的量化指标在每个预设时间间隔的变化量与该预设时间间隔的比值,t时刻为任意一个时刻;其中,多个预设时间间隔可以分别为一天、一周、一个月、一年或者其他值。
[0057]
针对任意一个预设时间间隔为例来说,同样以t时刻为起始时刻,分别获取目标业务在滞后k个该预设时间间隔后的k个第二变化率,其中,k个第二变化率与k个该预设时间间隔一一对应,k为大于或者等于0的整数。其中,滞后时间间隔可以理解为第二时刻晚于第一时刻的时间间隔,第二时间间隔为确定目标业务的第二变化率的时刻,第一时刻为确定量化指标的第一变化率的时刻。
[0058]
举例来说,若预设时间间隔为一周,且在以t时刻为起始时刻,在一周后获取了舆
情标的e的第一变化率,则滞后0个预设时间间隔可以理解为也从t时刻为起始时刻,在一周后获取目标业务的第二变化率,滞后1个预设时间间隔可以理解为在两周后获取目标业务的第二变化率,以此类推,滞后n个预设时间间隔可以理解为在n 1周后获取目标业务的第二变化率。
[0059]
最后,根据每个舆情标的多个第一变化率和在每个预设时间间隔下的k个第二变化率,确定至少一个舆情标的中的目标舆情标的。示例性的,根据每个舆情标的多个第一变化率,以及在每个预设时间间隔下的k个第二变化率,确定至少一个舆情标的中的候选舆情标的;最后,对候选舆情标进行稳定性检验,得到目标舆情标的。
[0060]
下面结合图2,并以舆情标的e,以及以目标业务为成年人保险的退保率为例说明确定目标舆情标的的过程。
[0061]
如图2所示,dif0、dif1、dif2、dif3、dif4、dif5、dif6分别表示舆情标的e的量化指标在不同预设时间间隔下的第一变化率,lag0、lag1、lag2、lag3、lag4、lag5、lag6分别表示成年人保险的退保率在滞后0个预设时间间隔、1个预设时间间隔、2个预设时间间隔、3个预设时间间隔、4个预设时间间隔、5个预设时间间隔、6个预设时间间隔下的第二变化率。然后,针对每个预设时间间隔,分别计算该预设时间间隔下的第一变化率和多个第二变化率之间的相关系数,得到多个第一相关系数。应说明,本技术所涉及的相关系数可以为person相关系数,当然实际应用中还可以采用其他的相关系数,本技术对此不做限定。如图2所示,p
11
、p
12
、p
13
、p
14
、p
15
、p
16
、p
17
分别是第一个预设时间间隔下的多个第一相关系数,p
21
、p
22
、p
23
、p
24
、p
25
、p
26
、p
27
分别是第二预设时间间隔下的多个第一相关系数,p
31
、p
32
、p
33
、p
34
、p
35
、p
36
、p
37
分别是第三个预设时间间隔下的多个第一相关系数,

,p
71
、p
72
、p
73
、p
74
、p
75
、p
76
、p
77
分别是第七个预设时间间隔下的多个第一相关系数。
[0062]
针对舆情标的e,确定该舆情标的e在每个预设时间间隔下的多个第一相关系数的变化趋势;根据舆情标的e在每个预设时间间隔下的多个第一相关系数的变化趋势,确定舆情标的e是否为候选舆情标的。
[0063]
示例性的,若舆情标的在某个预设时间间隔(比如,第一预设时间间隔,其中,第一预设时间为多个预设时间间隔中的任意一个)下的多个第一相关系数的变化趋势为单调递增,且该多个第一相关系数中大于第一阈值的数量大于数量阈值,比如,第一阈值可以为0.1,则确定该舆情标的e为候选舆情标的;或者,若该舆情标的e在第一预设时间间隔下的多个第一相关系数的变化趋势为单调递减,则该多个第一相关系数中小于第二阈值的数量大于数量阈值,比如,第二阈值可以为

0.1,则确定舆情标的e为候选舆情标的。
[0064]
举例来说,若第一预设时间间隔为dif0,且p
11
、p
12
、p
13
、p
14
、p
15
、p
16
、p
17
的变化趋势为单调递增,且p
11
、p
12
、p
13
、p
14
、p
15
、p
16
、p
17
中大于第一阈值的数量大于数量阈值,则确定舆情标的e为候选舆情标的。
[0065]
进一步的,对舆情标的e进行稳定性检验,若该舆情标的e通过稳定性检验,则确定舆情标的e为目标舆情标的。
[0066]
示例性的,获取舆情标的e在第一预设时间间隔下的多个第一相关系数的最大第一相关系数;然后,确定目标业务在第一最大相关系数下的第二变化率相对于t时刻滞后了l个第一预设时间间隔。比如,p
14
为最大的第一相关系数,则目标业务在第一最大相关系数下的第二变化率相对于t时刻滞后了3个第一预设时间间隔。
[0067]
进一步的,根据该第一预设时间间隔和l个第一预设时间间隔,对候选舆情标的e进行稳定性检验,得到标准差;若该标准差小于标准差阈值,确定该候选舆情标的e为目标舆情标的。
[0068]
具体的,分别以n个不同起始时刻,获取候选舆情标的在第一时间间隔后的多个第三变化率,n为大于1的整数;然后,分别以n个不同起始时刻,获取目标业务在l个第一预设时间间隔后的多个第四变化率,其中,该多个第三变化率和多个第四变化率一一对应。即在同一起始时刻,分别以一个预设时间间隔获取量化指标的第三变化率,以l个第一预设时间间隔获取目标业务的第四变化率;然后,分别确定每个第三变化率和对应的第四变化率之间的第二相关系数,得到多个第二相关系数;最后,确定多个第二相关系数之间的标准差,即可得到上述的标注差。示例性的标准差可以通过公式(4)表示:
[0069][0070]
其中,n是窗口长度,即n个不同起始时刻,i为舆情标的e在不同起始时刻下的第三变化率,b为在不同起始时刻下滞后l个预设时间间隔下的第四变化率,p为pearson相关系数,std为标准差计算函数。
[0071]
在本技术的一个实施方式中,在确定出目标舆情标的之后,获取当前时刻目标舆情标的的量化指标,相对于上一个时刻的变化量,基于该变化量制定出该目标业务相关的措施。例如,当目标舆情标的与目标业务之间的联动性是正相关的,若变化量为增加了10%,则可以预测出未来时间段内成年人的退保率也会增加,因此提前做好与退保相关的措施,从而为目标业务的规划提供方向。
[0072]
可以看出,在本技术实施方式中,在本技术实施方式中,先获取与待分析产品相关的多条舆情数据,然后从多条舆情数据中识别出与待分析产品对应的舆情标的,并且对每个舆情标的进行量化,得到每个舆情标的量化指标,该量化指标用于表征每个舆情标的待分析产品的目标业务的影响程度;最后,基于每个舆情标的的量化指标从至少一个舆情标的中筛选出目标舆情标的,从而实现从舆情数据中提取出对业务发展具有联动性影响的目标舆情标的,即有效的提取出了与产品业务发展相关的信息,弥补了现有技术的空白;最后,基于当前时刻目标舆情标的的量化指标的变化,预测目标业务未来时间段的发展趋势,提高了基于目标舆情标的预测业务的走向的精度。
[0073]
参阅图3,图3本技术实施例提供的一种联动性分析装置的功能单元组成框图。联动性分析装置300包括:获取单元301和处理单元302;
[0074]
获取单元301,用于获取与待分析产品相关的多条舆情数据;
[0075]
处理单元302,用于对所述多条舆情数据进行识别,得到至少一个舆情标的,所述至少一个舆情标的根据所述多条舆情数据的实体和主题确定;
[0076]
根据所述多条舆情数据,确定每个所述舆情标的的量化指标,其中,每个所述舆情标的的量化指标用于表征所述舆情标的对所述待分析产品的目标业务的影响程度,所述目标业务为所述待分析产品下的任意一个业务;
[0077]
根据每个所述舆情标的的量化指标,确定所述至少一个舆情标的中的目标舆情标的,所述目标舆情标的对所述目标业务的影响具有联动性。
[0078]
在本技术的一个实施方式中,所述多条舆情数据包括多条新闻数据和多条社交媒
体数据,在根据所述多条舆情数据,确定每个所述舆情标的的量化指标方面,处理单元302,具体用于:
[0079]
确定所述多条新闻数据对每个所述舆情标的的第一贡献度;
[0080]
确定所述多条社交媒体数据对每个所述舆情标的的第二贡献度;
[0081]
根据每个所述舆情标的的第一贡献度和第二贡献度,确定每个所述舆情标的的量化指标。
[0082]
在本技术的一个实施方式中,所述多条舆情数据为任意时刻下的多条舆情数据;在根据每个所述舆情标的的量化指标,确定所述至少一个舆情标的中的目标舆情标的方面,处理单元302,具体用于:
[0083]
根据每个所述舆情标的在任意时刻下的量化指标,分别确定每个所述舆情标的以t时刻为起始时刻,在多个预设时间间隔后的多个第一变化率,其中,所述多个预设时间间隔与所述多个第一变化率一一对应;
[0084]
以所述t时刻为起始时刻,分别确定所述目标业务在滞后k个每个所述预设时间间隔后的k个第二变化率,其中,所述k个第二变化率和所述k个每个所述预设时间间隔一一对应,k为大于或者等于0的整数;
[0085]
根据所述多个第一变化率和每个所述预设时间间隔的k个第二变化率,确定所述至少一个舆情标的中的目标舆情标的。
[0086]
在本技术的一个实施方式中,在根据所述多个第一变化率和每个所述预设时间间隔的k个第二变化率,确定所述至少一个舆情标的中的目标舆情标的方面,处理单元302,具体用于:
[0087]
针对任意一个预设时间间隔,确定所述预设时间间隔对应的第一变化率分别与所述目标业务在k所述预设时间间隔后的多个k个第二变化率之间的第一相关系数,得到与所述预设时间间隔对应的多个第一相关系数;
[0088]
针对任意一个所述舆情标的,确定所述舆情标的在每个所述预设时间间隔下的多个第一相关系数的变化趋势;
[0089]
根据所述舆情标的在每个所述预设时间间隔下的多个第一相关系数的变化趋势,确定所述至少一个舆情标的中的候选舆情标的;
[0090]
对所述候选舆情标的进行稳定性检验,得到所述目标舆情标的。
[0091]
在本技术的一个实施方式中,在根据所述舆情标的在每个所述预设时间间隔下的多个第一相关系数的变化趋势,确定所述至少一个舆情标的中的候选舆情标的方面,处理单元302,具体用于:
[0092]
若所述舆情标的在第一预设时间间隔下的多个第一相关系数的变化趋势为单调递增,且该多个第一相关系数中大于第一阈值的数量大于数量阈值,确定所述舆情标的为所述候选舆情标的,其中,所述第一预设时间间隔为所述多个预设时间间隔中的任意一个;
[0093]
若所述舆情标的在所述第一预设时间间隔下的多个第一相关系数的变化趋势为单调递减,且该多个第一相关系数中小于第二阈值的数量大于所述数量阈值,确定所述舆情标的为所述候选舆情标的。
[0094]
在本技术的一个实施方式中,在对所述候选舆情标的进行稳定性检验,得到所述目标舆情标的方面,处理单元302,具体用于:
[0095]
获取所述候选舆情标的在所述第一预设时间间隔下的多个第一相关系数中的最大第一相关系数;
[0096]
确定所述目标业务在所述最大第一相关系数下的第二变化率相对于所述t时刻滞后l个所述第一预设时间间隔,0≤l≤k;
[0097]
根据所述第一预设时间间隔和所述l个所述第一预设时间间隔对所述候选舆情标的进行稳定性检验,得到标准差;
[0098]
若所述标准差小于标准差阈值,确定所述候选舆情标的为所述目标舆情标的。
[0099]
在本技术的一个实施方式中,在根据所述第一预设时间间隔和所述l个所述第一预设时间间隔对所述候选舆情标的进行稳定性检验,得到标准差方面,处理单元302,具体用于:
[0100]
分别以n个不同起始时刻,获取所述候选舆情标的在所述第一预设时间间隔间隔后的多个第三变化率,n为大于1的整数;
[0101]
分别以所述n个不同起始时刻,获取所述目标业务滞后l个所述第一预设时间间隔后的多个第四变化率,其中,所述多个第三变化率和所述多个第四变化率一一对应;
[0102]
确定每个所述第三变化率和对应的第四变化率之间的第二相关系数,得到多个第二相关系数;
[0103]
确定所述多个第二相关系数之间的所述标准差。
[0104]
参阅图4,图4为本技术实施例提供的一种电子设备的结构示意图。如图4所示,电子设备400包括收发器401、处理器402和存储器403。它们之间通过总线404连接。存储器403用于存储计算机程序和数据,并可以将存储器403存储的数据传输给处理器402。
[0105]
处理器402用于读取存储器403中的计算机程序执行以下操作:
[0106]
控制收发器401获取与待分析产品相关的多条舆情数据;
[0107]
对所述多条舆情数据进行识别,得到至少一个舆情标的,所述至少一个舆情标的根据所述多条舆情数据的实体和主题确定;
[0108]
根据所述多条舆情数据,确定每个所述舆情标的的量化指标,其中,每个所述舆情标的的量化指标用于表征所述舆情标的对所述待分析产品的目标业务的影响程度,所述目标业务为所述待分析产品下的任意一个业务;
[0109]
根据每个所述舆情标的的量化指标,确定所述至少一个舆情标的中的目标舆情标的,所述目标舆情标的对所述目标业务的影响具有联动性。
[0110]
在本技术的一个实施方式中,所述多条舆情数据包括多条新闻数据和多条社交媒体数据,在根据所述多条舆情数据,确定每个所述舆情标的的量化指标方面,处理器402具体用于执行以下操作:
[0111]
确定所述多条新闻数据对每个所述舆情标的的第一贡献度;
[0112]
确定所述多条社交媒体数据对每个所述舆情标的的第二贡献度;
[0113]
根据每个所述舆情标的的第一贡献度和第二贡献度,确定每个所述舆情标的的量化指标。
[0114]
在本技术的一个实施方式中,所述多条舆情数据为任意时刻下的多条舆情数据;在根据每个所述舆情标的的量化指标,确定所述至少一个舆情标的中的目标舆情标的方面,处理器402具体用于执行以下操作:
[0115]
根据每个所述舆情标的在任意时刻下的量化指标,分别确定每个所述舆情标的以t时刻为起始时刻,在多个预设时间间隔后的多个第一变化率,其中,所述多个预设时间间隔与所述多个第一变化率一一对应;
[0116]
以所述t时刻为起始时刻,分别确定所述目标业务在滞后k个每个所述预设时间间隔后的k个第二变化率,其中,所述k个第二变化率和所述k个每个所述预设时间间隔一一对应,k为大于或者等于0的整数;
[0117]
根据所述多个第一变化率和每个所述预设时间间隔的k个第二变化率,确定所述至少一个舆情标的中的目标舆情标的。
[0118]
在本技术的一个实施方式中,在根据所述多个第一变化率和每个所述预设时间间隔的k个第二变化率,确定所述至少一个舆情标的中的目标舆情标的方面,处理器402具体用于执行以下操作:
[0119]
针对任意一个预设时间间隔,确定所述预设时间间隔对应的第一变化率分别与所述目标业务在k所述预设时间间隔后的多个k个第二变化率之间的第一相关系数,得到与所述预设时间间隔对应的多个第一相关系数;
[0120]
针对任意一个所述舆情标的,确定所述舆情标的在每个所述预设时间间隔下的多个第一相关系数的变化趋势;
[0121]
根据所述舆情标的在每个所述预设时间间隔下的多个第一相关系数的变化趋势,确定所述至少一个舆情标的中的候选舆情标的;
[0122]
对所述候选舆情标的进行稳定性检验,得到所述目标舆情标的。
[0123]
在本技术的一个实施方式中,在根据所述舆情标的在每个所述预设时间间隔下的多个第一相关系数的变化趋势,确定所述至少一个舆情标的中的候选舆情标的方面,处理器402具体用于执行以下操作:
[0124]
若所述舆情标的在第一预设时间间隔下的多个第一相关系数的变化趋势为单调递增,且该多个第一相关系数中大于第一阈值的数量大于数量阈值,确定所述舆情标的为所述候选舆情标的,其中,所述第一预设时间间隔为所述多个预设时间间隔中的任意一个;
[0125]
若所述舆情标的在所述第一预设时间间隔下的多个第一相关系数的变化趋势为单调递减,且该多个第一相关系数中小于第二阈值的数量大于所述数量阈值,确定所述舆情标的为所述候选舆情标的。
[0126]
在本技术的一个实施方式中,在对所述候选舆情标的进行稳定性检验,得到所述目标舆情标的方面,处理器402具体用于执行以下操作:
[0127]
获取所述候选舆情标的在所述第一预设时间间隔下的多个第一相关系数中的最大第一相关系数;
[0128]
确定所述目标业务在所述最大第一相关系数下的第二变化率相对于所述t时刻滞后l个所述第一预设时间间隔,0≤l≤k;
[0129]
根据所述第一预设时间间隔和所述l个所述第一预设时间间隔对所述候选舆情标的进行稳定性检验,得到标准差;
[0130]
若所述标准差小于标准差阈值,确定所述候选舆情标的为所述目标舆情标的。
[0131]
在本技术的一个实施方式中,在根据所述第一预设时间间隔和所述l个所述第一预设时间间隔对所述候选舆情标的进行稳定性检验,得到标准差方面,处理器402具体用于
执行以下操作:
[0132]
分别以n个不同起始时刻,获取所述候选舆情标的在所述第一预设时间间隔间隔后的多个第三变化率,n为大于1的整数;
[0133]
分别以所述n个不同起始时刻,获取所述目标业务滞后l个所述第一预设时间间隔后的多个第四变化率,其中,所述多个第三变化率和所述多个第四变化率一一对应;
[0134]
确定每个所述第三变化率和对应的第四变化率之间的第二相关系数,得到多个第二相关系数;
[0135]
确定所述多个第二相关系数之间的所述标准差。
[0136]
在具体的实施方式中,收发器401可为图3所述的实施例的联动性分析装置300的获取单元301,上述处理器402可以为图3所述的实施例的联动性分析装置300的处理单元302。
[0137]
应理解,本技术中的电子设备可以包括智能手机(如android手机、ios手机、windows phone手机等)、平板电脑、掌上电脑、笔记本电脑、移动互联网设备mid(mobile internet devices,简称:mid)或穿戴式设备等。上述电子设备仅是举例,而非穷举,包含但不限于上述电子设备。在实际应用中,上述电子设备还可以包括:智能车载终端、计算机设备等等。
[0138]
本技术实施例还提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行以实现如上述方法实施例中记载的任何一种基于关键词识别的联动性分析方法的部分或全部步骤。
[0139]
本技术实施例还提供一种计算机程序产品,所述计算机程序产品包括存储了计算机程序的非瞬时性计算机可读存储介质,所述计算机程序可操作来使计算机执行如上述方法实施例中记载的任何一种基于关键词识别的联动性分析方法的部分或全部步骤。
[0140]
需要说明的是,对于前述的各方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本技术并不受所描述的动作顺序的限制,因为依据本技术,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于可选实施例,所涉及的动作和模块并不一定是本技术所必须的。
[0141]
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
[0142]
在本技术所提供的几个实施例中,应该理解到,所揭露的装置,可通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性或其它的形式。
[0143]
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
[0144]
另外,在本技术各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件程序模块的形式实现。
[0145]
所述集成的单元如果以软件程序模块的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储器中。基于这样的理解,本技术的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储器中,包括若干指令用以使得一台计算机设备(可为个人计算机、服务器或者网络设备等)执行本技术各个实施例所述方法的全部或部分步骤。而前述的存储器包括:u盘、只读存储器(rom,read

only memory)、随机存取存储器(ram,random access memory)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。
[0146]
本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,该程序可以存储于一计算机可读存储器中,存储器可以包括:闪存盘、只读存储器(英文:read

only memory,简称:rom)、随机存取器(英文:random access memory,简称:ram)、磁盘或光盘等。
[0147]
以上对本技术实施例进行了详细介绍,本文中应用了具体个例对本技术的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本技术的方法及其核心思想;同时,对于本领域的一般技术人员,依据本技术的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本技术的限制。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献