一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

舆情监控方法、装置、计算机可读存储介质及处理器与流程

2022-04-09 02:59:07 来源:中国专利 TAG:


1.本发明涉及大数据分析领域,具体而言,涉及一种舆情监控方法、装置、计算机可读存储介质及处理器。


背景技术:

2.目前,各大公司的舆情传播方式已从口口相传发展为通过互联网传播,在新媒体环境下,舆情管理工作中,大多数方法只搜集了各个方向的信息,如事件起因、传播源头、主流媒体评论、网民主要关注点等,但是没有充分了解与舆情相关的各个层面(粒度)的信息,如公司层面的口碑、品牌层面的口碑、产品层面的口碑等。面对信息量庞大、信息不对称、网民诉求不一致等情况,当前的信息难以为后续舆情研判提供有效的支持,在舆情发生前,不能起到预防效果,无法及时发出预警。
3.综上所示,针对相关技术中存在的上述问题,目前尚未提出有效的解决方案。


技术实现要素:

4.本发明的主要目的在于提供一种舆情监控方法、装置、计算机可读存储介质及处理器,以解决相关技术中没有将舆情监控颗粒度细化到品牌以及商品的技术问题。
5.为了实现上述目的,根据本发明的一个方面,提供了一种舆情监控方法。该方法包括:获取原始评论数据,并识别原始评论中包含的多个品牌、每个品牌下对应的产品以及每种产品对应的多条评论;确定每条评论所属的极性,并确定每种产品对应的每种极性的评论的数量,其中,极性为以下任意一种:正向、负向、中性;在任意一种产品对应的负向评论的数量大于等于预设数量的情况下,生成并触发与产品对应的预警信息。
6.进一步地,获取原始评论数据,并识别原始评论中包含的多个品牌、每个品牌下对应的产品以及每种产品对应的多条评论包括:通过命名实体识别技术,识别原始评论数据中包含的多个品牌对应的品牌名称以及每个品牌下的产品对应的产品名称;按照第一数据格式,提取识别出的品牌名称以及产品名称;通过序列标注技术或者文本抽取技术,抽取每个产品对应的多条评论;按照第二预设格式,提取识别出的品牌名称、品牌对应的产品名称以及产品对应的多条评论。
7.进一步地,确定每条评论所属的极性包括:将所有评论输入至分类模型,控制分类模型输出评论对应的极性,其中,分类模型是通过多组评论数据训练而成的,其中,每组评论数据均包括多条各个极性的评论;将所有评论输入至分类模型,控制分类模型输出评论对应的极性包括:依据分类模型,确定每条评论对应的语义特征;依据每条评论对应的语义特征,确定每条评论的情感倾向;依据评论的情感倾向,确定评论所属的极性,并控制分类模型输出评论对应的极性。
8.进一步地,在确定每条评论所属的极性,并确定每种产品对应的每种极性的评论的数量之后,方法还包括:提取每种产品对应的每种极性的评论中包含的多个关键词,并确定每个产品对应的极性的评论中每个关键词出现的次数;依据关键词出现的次数,对关键
词进行排序,并确定目标关键词,其中,目标关键词为关键词出现的次数在预设范围之内的关键词;对目标关键词以及目标关键词出现的次数,进行可视化展示。
9.进一步地,在确定每条评论所属的极性,并确定每种产品对应的每种极性的评论的数量之后,方法还包括:依据每种产品对应的极性的评论的数量,确定每种产品对应的评论总数;依据每种产品对应的极性的评论的数量以及评论总数,计算每种极性的评论在评论总数中的占比;对每种极性的评论的占比,进行可视化展示。
10.为了实现上述目的,根据本发明的另一方面,提供了一种舆情监控装置。该装置包括:识别单元、第一确定单元和触发单元,识别单元用于获取原始评论数据,并识别原始评论中包含的多个品牌、每个品牌下对应的产品以及每种产品对应的多条评论;第一确定单元用于确定每条评论所属的极性,并确定每种产品对应的每种极性的评论的数量,其中,极性为以下任意一种:正向、负向、中性;触发单元用于在任意一种产品对应的负向评论的数量大于等于预设数量的情况下,生成并触发与产品对应的预警信息。
11.进一步地,识别单元包括:识别子单元、第一提取子单元、抽取子单元和第二提取子单元,识别子单元用于通过命名实体识别技术,识别原始评论数据中包含的多个品牌对应的品牌名称以及每个品牌下的产品对应的产品名称;第一提取子单元用于按照第一数据格式,提取识别出的品牌名称以及产品名称;抽取子单元用于通过序列标注技术或者文本抽取技术,抽取每个产品对应的多条评论;第二提取子单元用于按照第二预设格式,提取识别出的品牌名称、品牌对应的产品名称以及产品对应的多条评论。
12.进一步地,第一确定单元包括第一控制子单元,第一控制子单元用于将所有评论输入至分类模型,控制分类模型输出评论对应的极性,其中,分类模型是通过多组评论数据训练而成的,其中,每组评论数据均包括多条各个极性的评论;第一控制子单元包括:第一确定模块、第二确定模块和控制模块,第一确定模块,用于依据分类模型,确定每条评论对应的语义特征;第二确定模块,用于依据每条评论对应的语义特征,确定每条评论的情感倾向;控制模块,用于依据评论的情感倾向,确定评论所属的极性,并控制分类模型输出评论对应的极性。
13.根据本技术的另一方面,还提供了一种计算机可读存储介质,计算机可读存储介质包括存储的程序,其中,在程序运行时控制计算机可读存储介质所在设备执行上述任意一种的一种舆情监控方法。
14.根据本技术的另一方面,还提供了一种处理器,处理器用于运行程序,其中,程序运行时执行上述任意一种的一种舆情监控方法。
15.通过本发明,采用以下步骤:获取原始评论数据,并识别原始评论中包含的多个品牌、每个品牌下对应的产品以及每种产品对应的多条评论;确定每条评论所属的极性,并确定每种产品对应的每种极性的评论的数量,其中,极性为以下任意一种:正向、负向、中性;在任意一种产品对应的负向评论的数量大于等于预设数量的情况下,生成并触发与产品对应的预警信息,解决了相关技术中没有将舆情监控颗粒度细化到品牌以及商品的技术问题,进而达到了能够在舆情发生前预警,从而起到预防的效果。
附图说明
16.构成本发明的一部分的附图用来提供对本发明的进一步理解,本发明的示意性实
施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
17.图1是根据本发明实施例的一种舆情监控方法的流程图;
18.图2是根据本发明实施例提供的通过柱状图对关键词以及关键词的出现次数进行可视化展示的示意图;
19.图3是根据本发明实施例提供的每种商品的正向﹑负向和中性这3种极性评论占评论总数的占比的饼状图;
20.图4是根据本发明实施例的一种舆情监控装置的示意图。
具体实施方式
21.需要说明的是,在不冲突的情况下,本发明中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本发明。
22.为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分的实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。
23.需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
24.根据本发明的实施例,提供了一种舆情监控方法。
25.图1是根据本发明实施例的一种舆情监控方法的流程图。如图1所示,该发明包括以下步骤:
26.步骤s101,获取原始评论数据,并识别上述原始评论中包含的多个品牌、每个上述品牌下对应的产品以及每种上述产品对应的多条评论。
27.上述步骤,具体地,从获取的原始评论数据中识别出原始评论中包含的多个品牌、每个品牌下对应的产品以及每种产品对应的多条评论,达到获取品牌以及产品相关信息的目的。
28.步骤s102,确定每条上述评论所属的极性,并确定每种上述产品对应的每种极性的评论的数量,其中,上述极性为以下任意一种:正向、负向、中性。
29.上述步骤,即对每条上述评论进行分类,并确定每种产品对应的类型的评论的数量,为后续对负向评论的数量大于等于预设数量的情况下生成预警做好数据储备。
30.步骤s103,在任意一种上述产品对应的负向评论的数量大于等于预设数量的情况下,生成并触发与上述产品对应的预警信息。
31.上述步骤,即保证能够在舆情发生前,通过对负向评论的数量大于等于预设数量的产品发出预警,从而能起到预防效果;能够对各类商品,甚至是各系列产品的点评内容进行自动观点提取和分析,得出每个商品的点评观点的极性,能够实现产品层面的自动舆情
监控,能够收集不同公司下面不同品牌的不同产品的舆情信息,让客户能够直观了解本公司商品或竞争公司相关商品在用户中的口碑,帮助企业深层次、多维度的理解消费者的想法和建议。通过对比同一类型产品不同商品或不同商家相同商品的评论观点信息,可以辅助商品生产者进行合理的商品生产规划。
32.可选地,在本发明实施例提供的舆情监控方法中,获取原始评论数据,并识别上述原始评论中包含的多个品牌、每个上述品牌下对应的产品以及每种上述产品对应的多条评论包括:通过命名实体识别技术,识别上述原始评论数据中包含的多个上述品牌对应的品牌名称以及每个上述品牌下的产品对应的产品名称;按照第一数据格式,提取识别出的上述品牌名称以及上述产品名称;通过序列标注技术或者文本抽取技术,抽取每个上述产品对应的多条上述评论;按照第二预设格式,提取识别出的上述品牌名称、上述品牌对应的产品名称以及上述产品对应的多条上述评论。
33.具体地,通过命名实体识别(ner)技术识别并提取出用户原始评论中的品牌名和产品名,其具体的数据提取格式如下:
34.品牌名称1:商品名称1;商品名称2;
35.品牌名称2:商品名称3;商品名称4;
36.......
37.具体示例如下:
38.lancome(兰蔻):睫毛膏;保湿乳霜;面霜;
39.dior(迪奥):蓝金唇膏;5色眼影;
40.chanel(香奈尔):香水
41.......
42.按照第二预设格式提取出的数据格式如下:
43.品牌名称1:商品名称1:评论1;评论2;商品名称2:评论3;
44.品牌名称2:商品名称3:评论4;商品名称4:评论5;评论6;
45.......
46.具体示例如下:
47.lancome(兰蔻):睫毛膏:非常好用;太棒了;效果不错;
48.保湿乳霜:保湿效果非常好用;价格实惠;面霜:性价比高;
49.......
50.通过上述步骤,使得商品信息得以一一陈列出来,为后续上述产品对应的多条上述评论分类做好数据基础。
51.可选地,在本发明实施例提供的舆情监控方法中,确定每条上述评论所属的极性包括:将所有上述评论输入至分类模型,控制分类模型输出上述评论对应的极性,其中,上述分类模型是通过多组评论数据训练而成的,其中,每组上述评论数据均包括多条各个极性的评论;将所有上述评论输入至分类模型,控制分类模型输出上述评论对应的极性包括:依据上述分类模型,确定每条上述评论对应的语义特征;依据每条上述评论对应的上述语义特征,确定每条上述评论的情感倾向;依据上述评论的情感倾向,确定上述评论所属的上述极性,并控制上述分类模型输出上述评论对应的上述极性。
52.上述地,本技术提供了一种评论分类模型,通过将评论输入至分类模型中,分类模
型输出评论对应的极性。
53.具体地,分类模型具体的分类依据为每条评论的情感倾向,通过理解评论的语义,来确定评论的情感倾向,其中,正向情感倾向的情感分类类型如表1所示:
54.表1:正向情感倾向的情感分类表
55.[0056][0057]
负向情感倾向的情感分类类型如表2所示:
[0058]
表2:负向情感倾向的情感分类
[0059]
[0060][0061]
中性情感倾向的分类类型如表3所示:
[0062]
表3:中性情感倾向的情感分类
[0063]
[0064][0065]
进一步地,根据每条上述评论对应的语义特征,确定每条上述评论的情感倾向,从而确定每条上述评论的情感倾向,之后依据每条上述评论的情感倾向来确定上述评论所属的极性,最后控制分类模型输出评论对应的极性,达到对评论正确分类的效果。
[0066]
可选地,在本发明实施例提供的舆情监控方法中,在确定每条上述评论所属的极性,并确定每种上述产品对应的每种极性的评论的数量之后,上述方法还包括:提取每种上述产品对应的每种上述极性的评论中包含的多个关键词,并确定每个上述产品对应的上述极性的评论中每个上述关键词出现的次数;依据上述关键词出现的上述次数,对上述关键词进行排序,并确定目标关键词,其中,上述目标关键词为上述关键词出现的次数在预设范围之内的关键词;对上述目标关键词以及上述目标关键词出现的次数,进行可视化展示。
[0067]
具体地,对每个产品对应的每种极性的评论中出现的关键词进行提取,例如正向评论中的关键词,提取出的关键词为“新颖”、“好用”、“有效”等,通过对常规名词进行提取以确定关键词,对上述关键词出现的上述次数进行统计,每个关键词的初始值为1,每提取出一个之前已经存在的关键词其对应的次数加1,待所有评论的关键词都统计后,按“出现次数”对各关键词从大到小排序,得到前top10或者top3、或top5的关键词。
[0068]
在本技术提供的一种实施例中,通过柱状图对关键词以及关键词对应的出现次数进行可视化展示,如图2所示。
[0069]
可选地,在本发明实施例提供的舆情监控方法中,在确定每条上述评论所属的极性,并确定每种上述产品对应的每种极性的评论的数量之后,上述方法还包括:依据每种上述产品对应的上述极性的评论的数量,确定每种上述产品对应的评论总数;依据每种上述产品对应的上述极性的评论的数量以及上述评论总数,计算每种极性的上述评论在上述评论总数中的占比;对每种上述极性的评论的占比,进行可视化展示。
[0070]
上述地,每种商品的正向、负向和中性这3种极性的评论占评论总数的占比。
[0071]
在一种可选的实施例中,通过饼状图对每种评论的占比进行可视化展示,如图3所示,图3是根据本发明实施例提供的每种商品的正向﹑负向和中性这3种极性评论占评论总数的占比的饼状图,通过对评论进行可视化展示,便于直观了解商品在用户中的口碑。
[0072]
本发明实施例提供的一种舆情监控方法,通过获取原始评论数据,并识别上述原始评论中包含的多个品牌、每个上述品牌下对应的产品以及每种上述产品对应的多条评论,确定每条上述评论所属的极性,并确定每种上述产品对应的每种极性的评论的数量,在任意一种上述产品对应的负向评论的数量大于等于预设数量的情况下,生成并触发与上述产品对应的预警信息,解决了相关技术中没有将舆情监控颗粒度细化到品牌以及商品的技术问题,进而达到了能够在舆情发生前预警,从而起到预防的效果。
[0073]
本发明实施例还提供了一种舆情监控装置,需要说明的是,本发明实施例的舆情监控装置可以用于执行本发明实施例所提供的用于舆情监控方法。以下对本发明实施例提供的舆情监控装置进行介绍。
[0074]
图4是根据本发明实施例的一种舆情监控装置的示意图。如图4所示,该装置包括:识别单元401、第一确定单元402和触发单元403,识别单元401用于获取原始评论数据,并识别上述原始评论中包含的多个品牌、每个上述品牌下对应的产品以及每种上述产品对应的多条评论;第一确定单元402用于确定每条上述评论所属的极性,并确定每种上述产品对应的每种极性的评论的数量,其中,上述极性为以下任意一种:正向、负向、中性;触发单元403用于在任意一种上述产品对应的负向评论的数量大于等于预设数量的情况下,生成并触发与上述产品对应的预警信息。
[0075]
通过识别单元从获取的原始评论数据中识别出原始评论中包含的多个品牌、每个上述品牌下对应的产品以及每种上述产品对应的多条评论,达到获取上述品牌相关信息的目的,通过第一确定单元402对每条上述评论进行分类,并确定每种上述产品对应的类型的评论的数量,为后续对负向评论的数量大于等于预设数量的情况下生成预警做好数据储备,保证能够在舆情发生前,通过触发单元403对负向评论的数量大于等于预设数量的产品发出预警,从而能起到预防效果。
[0076]
可选地,在本发明实施例提供的舆情监控装置中,上述识别单元包括:识别子单元、第一提取子单元、抽取子单元和第二提取子单元,识别子单元用于通过命名实体识别技术,识别上述原始评论数据中包含的多个上述品牌对应的品牌名称以及每个上述品牌下的产品对应的产品名称;第一提取子单元用于按照第一数据格式,提取识别出的上述品牌名称以及上述产品名称;抽取子单元用于通过序列标注技术或者文本抽取技术,抽取每个上述产品对应的多条上述评论;第二提取子单元用于按照第二预设格式,提取识别出的上述品牌名称、上述品牌对应的产品名称以及上述产品对应的多条上述评论,使得商品信息得以一一陈列出来,为后续上述产品对应的多条上述评论分类做好数据基础。
[0077]
可选地,在本发明实施例提供的舆情监控装置中,上述第一确定单元402包括第一控制子单元,第一控制子单元用于将所有上述评论输入至分类模型,控制分类模型输出上述评论对应的极性,其中,上述分类模型是通过多组评论数据训练而成的,其中,每组上述评论数据均包括多条各个极性的评论;上述第一控制子单元包括:第一确定模块、第二确定模块和控制模块,第一确定模块,用于依据上述分类模型,确定每条上述评论对应的语义特
征;第二确定模块,用于依据每条上述评论对应的上述语义特征,确定每条上述评论的情感倾向;控制模块,用于依据上述评论的情感倾向,确定上述评论所属的上述极性,并控制上述分类模型输出上述评论对应的上述极性。
[0078]
具体地,即根据每条上述评论对应的上述语义特征,确定每条上述评论的情感倾向,例如正向的频率,款式新颖、质量、面料,前十的,词性分析,常规名词进行提取,从而确定每条上述评论的情感倾向,之后依据每条上述评论的情感倾向来确定上述评论所属的上述极性,最后控制上述分类模型输出上述评论对应的上述极性,达到对上述评论正确分类的效果。
[0079]
可选地,在本发明实施例提供的舆情监控装置中,该装置还包括第二确定单元、第三确定单元和第一展示单元,第二确定单元用于在第一确定单元402确定每条上述评论所属的极性,并确定每种上述产品对应的每种极性的评论的数量之后,提取每种上述产品对应的每种上述极性的评论中包含的多个关键词,并确定每个上述产品对应的上述极性的评论中每个上述关键词出现的次数;第三确定单元用于依据上述关键词出现的上述次数,对上述关键词进行排序,并确定目标关键词,其中,上述目标关键词为上述关键词出现的次数在预设范围之内的关键词;第一展示单元用于对上述目标关键词以及上述目标关键词出现的次数,进行可视化展示。
[0080]
具体地,对上述关键词出现的上述次数进行统计,每种商品的正向﹑负向和中性这3种情感倾向所占总数的比例,展示形式为:饼状图,能够直观地看到每种商品的正向﹑负向和中性这3种情感倾向所占总数的比例,便于直观了解商品在用户中的口碑。
[0081]
可选地,在本发明实施例提供的舆情监控装置中,该装置还包括第四确定单元、计算单元和第二展示单元,第四确定单元用于在第一确定单元402确定每条上述评论所属的极性,并确定每种上述产品对应的每种极性的评论的数量之后,依据每种上述产品对应的上述极性的评论的数量,确定每种上述产品对应的评论总数;计算单元用于依据每种上述产品对应的上述极性的评论的数量以及上述评论总数,计算每种极性的上述评论在上述评论总数中的占比;第二展示单元用于对每种上述极性的评论的占比,进行可视化展示。
[0082]
具体地,对每种上述产品对应的上述极性的评论的数量以及上述评论总数做出统计,每种商品的正向﹑负向这2种情感倾向评论中前top10关键词,展示形式为:柱状图;其中柱状图横坐标为“频率计数”,纵坐标为关键词,能够直观地看到每种商品的正向﹑负向这2种情感倾向评论中前top10关键词的频率,便于直观了解用户对商品的评论,从而了解到商品在用户中的口碑。
[0083]
本发明实施例提供的舆情监控装置,通过识别单元从获取的原始评论数据中识别出原始评论中包含的多个品牌、每个上述品牌下对应的产品以及每种上述产品对应的多条评论,达到获取上述品牌相关信息的目的,通过第一确定单元402对每条上述评论进行分类,并确定每种上述产品对应的类型的评论的数量,为后续对负向评论的数量大于等于预设数量的情况下生成预警做好数据储备,保证能够在舆情发生前,通过触发单元403对负向评论的数量大于等于预设数量的产品发出预警,从而能起到预防效果。
[0084]
所述舆情监控装置包括处理器和存储器,上述识别单元401、第一确定单元402和触发单元403等均作为程序单元存储在存储器中,由处理器执行存储在存储器中的上述程序单元来实现相应的功能。
[0085]
处理器中包含内核,由内核去存储器中调取相应的程序单元。内核可以设置一个或以上,通过调整内核参数来解决相关技术中没有将舆情监控颗粒度细化到品牌以及商品的技术问题。
[0086]
存储器可能包括计算机可读介质中的非永久性存储器,随机存取存储器(ram)和/或非易失性内存等形式,如只读存储器(rom)或闪存(flash ram),存储器包括至少一个存储芯片。
[0087]
本发明实施例提供了一种计算机可读存储介质,其上存储有程序,该程序被处理器执行时实现所述舆情监控方法。
[0088]
本发明实施例提供了一种处理器,所述处理器用于运行程序,其中,所述程序运行时执行所述舆情监控方法。
[0089]
本发明实施例提供了一种设备,设备包括处理器、存储器及存储在存储器上并可在处理器上运行的程序,处理器执行程序时实现以下步骤:获取原始评论数据,并识别所述原始评论中包含的多个品牌、每个所述品牌下对应的产品以及每种所述产品对应的多条评论;确定每条所述评论所属的极性,并确定每种所述产品对应的每种极性的评论的数量,其中,所述极性为以下任意一种:正向、负向、中性;在任意一种所述产品对应的负向评论的数量大于等于预设数量的情况下,生成并触发与所述产品对应的预警信息。
[0090]
进一步地,获取原始评论数据,并识别所述原始评论中包含的多个品牌、每个所述品牌下对应的产品以及每种所述产品对应的多条评论包括:通过命名实体识别技术,识别所述原始评论数据中包含的多个所述品牌对应的品牌名称以及每个所述品牌下的产品对应的产品名称;按照第一数据格式,提取识别出的所述品牌名称以及所述产品名称;通过序列标注技术或者文本抽取技术,抽取每个所述产品对应的多条所述评论;按照第二预设格式,提取识别出的所述品牌名称、所述品牌对应的产品名称以及所述产品对应的多条所述评论。
[0091]
进一步地,确定每条所述评论所属的极性包括:将所有所述评论输入至分类模型,控制分类模型输出所述评论对应的极性,其中,所述分类模型是通过多组评论数据训练而成的,其中,每组所述评论数据均包括多条各个极性的评论;将所有所述评论输入至分类模型,控制分类模型输出所述评论对应的极性包括:依据所述分类模型,确定每条所述评论对应的语义特征;依据每条所述评论对应的所述语义特征,确定每条所述评论的情感倾向;依据所述评论的情感倾向,确定所述评论所属的所述极性,并控制所述分类模型输出所述评论对应的所述极性。
[0092]
进一步地,在确定每条所述评论所属的极性,并确定每种所述产品对应的每种极性的评论的数量之后,所述方法还包括:提取每种所述产品对应的每种所述极性的评论中包含的多个关键词,并确定每个所述产品对应的所述极性的评论中每个所述关键词出现的次数;依据所述关键词出现的所述次数,对所述关键词进行排序,并确定目标关键词,其中,所述目标关键词为所述关键词出现的次数在预设范围之内的关键词;对所述目标关键词以及所述目标关键词出现的次数,进行可视化展示。
[0093]
进一步地,在确定每条所述评论所属的极性,并确定每种所述产品对应的每种极性的评论的数量之后,所述方法还包括:依据每种所述产品对应的所述极性的评论的数量,确定每种所述产品对应的评论总数;依据每种所述产品对应的所述极性的评论的数量以及
所述评论总数,计算每种极性的所述评论在所述评论总数中的占比;对每种所述极性的评论的占比,进行可视化展示。本文中的设备可以是服务器、pc、pad、手机等。
[0094]
本发明还提供了一种计算机程序产品,当在数据处理设备上执行时,适于执行初始化有如下方法步骤的程序:获取原始评论数据,并识别所述原始评论中包含的多个品牌、每个所述品牌下对应的产品以及每种所述产品对应的多条评论;确定每条所述评论所属的极性,并确定每种所述产品对应的每种极性的评论的数量,其中,所述极性为以下任意一种:正向、负向、中性;在任意一种所述产品对应的负向评论的数量大于等于预设数量的情况下,生成并触发与所述产品对应的预警信息。
[0095]
进一步地,获取原始评论数据,并识别所述原始评论中包含的多个品牌、每个所述品牌下对应的产品以及每种所述产品对应的多条评论包括:通过命名实体识别技术,识别所述原始评论数据中包含的多个所述品牌对应的品牌名称以及每个所述品牌下的产品对应的产品名称;按照第一数据格式,提取识别出的所述品牌名称以及所述产品名称;通过序列标注技术或者文本抽取技术,抽取每个所述产品对应的多条所述评论;按照第二预设格式,提取识别出的所述品牌名称、所述品牌对应的产品名称以及所述产品对应的多条所述评论。
[0096]
进一步地,确定每条所述评论所属的极性包括:将所有所述评论输入至分类模型,控制分类模型输出所述评论对应的极性,其中,所述分类模型是通过多组评论数据训练而成的,其中,每组所述评论数据均包括多条各个极性的评论;将所有所述评论输入至分类模型,控制分类模型输出所述评论对应的极性包括:依据所述分类模型,确定每条所述评论对应的语义特征;依据每条所述评论对应的所述语义特征,确定每条所述评论的情感倾向;依据所述评论的情感倾向,确定所述评论所属的所述极性,并控制所述分类模型输出所述评论对应的所述极性。
[0097]
进一步地,在确定每条所述评论所属的极性,并确定每种所述产品对应的每种极性的评论的数量之后,所述方法还包括:提取每种所述产品对应的每种所述极性的评论中包含的多个关键词,并确定每个所述产品对应的所述极性的评论中每个所述关键词出现的次数;依据所述关键词出现的所述次数,对所述关键词进行排序,并确定目标关键词,其中,所述目标关键词为所述关键词出现的次数在预设范围之内的关键词;对所述目标关键词以及所述目标关键词出现的次数,进行可视化展示。
[0098]
进一步地,在确定每条所述评论所属的极性,并确定每种所述产品对应的每种极性的评论的数量之后,所述方法还包括:依据每种所述产品对应的所述极性的评论的数量,确定每种所述产品对应的评论总数;依据每种所述产品对应的所述极性的评论的数量以及所述评论总数,计算每种极性的所述评论在所述评论总数中的占比;对每种所述极性的评论的占比,进行可视化展示。
[0099]
本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、cd-rom、光学存储器等)上实施的计算机程序产品的形式。
[0100]
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程
图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
[0101]
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
[0102]
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
[0103]
在一个典型的配置中,计算设备包括一个或多个处理器(cpu)、输入/输出接口、网络接口和内存。
[0104]
存储器可能包括计算机可读介质中的非永久性存储器,随机存取存储器(ram)和/或非易失性内存等形式,如只读存储器(rom)或闪存(flash ram)。存储器是计算机可读介质的示例。
[0105]
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(pram)、静态随机存取存储器(sram)、动态随机存取存储器(dram)、其他类型的随机存取存储器(ram)、只读存储器(rom)、电可擦除可编程只读存储器(eeprom)、快闪记忆体或其他内存技术、只读光盘只读存储器(cd-rom)、数字多功能光盘(dvd)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
[0106]
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个
……”
限定的要素,并不排除在包括要素的过程、方法、商品或者设备中还存在另外的相同要素。
[0107]
本领域技术人员应明白,本发明的实施例可提供为方法、系统或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、cd-rom、光学存储器等)上实施的计算机程序产品的形式。
[0108]
以上仅为本发明的实施例而已,并不用于限制本发明。对于本领域技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本发明的权利要求范围之内。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献