一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种产品创新概念挖掘方法、装置、存储介质及终端设备与流程

2022-11-14 00:29:22 来源:中国专利 TAG:


1.本发明涉及互联网大数据处理技术领域,尤其涉及一种产品创新概念挖掘方法、装置、计算机可读存储介质及终端设备。


背景技术:

2.新消费时代,企业能够通过互联网更加容易接触到用户,了解用户的消费情况,因此,及时有效地从海量的消费数据中挖掘到市场上的新趋势、新关系、新产品,对企业而言具有十分重要的意义,企业的市场研发部门进行新产品研发、挖掘市场新内容、激发新灵感等工作都离不开从消费者端启发,并从中找到关联关系。
3.但是,在传统的挖掘产品创新概念的过程中,往往需要人工通过不同的渠道进行数据资料整合,并且使用人工抽样查看互联网海量数据,耗时耗力,从而影响产品创新概念的挖掘效率,同时,现有挖掘方案主要是基于时间维度,来判断识别“概念”在时间维度上是否具有从少到多、从无到有的变化过程,而基于单一维度对新概念创新进行判断不具有全面性,从而导致挖掘结果的准确性较差。


技术实现要素:

4.本发明实施例的目的在于,提供一种产品创新概念挖掘方法、装置、计算机可读存储介质及终端设备,能够大幅降低人工参与程度,实现智能化、高效挖掘产品创新概念,并且结合多维度进行产品创新概念挖掘,从而提高了挖掘结果的准确性。
5.为了实现上述目的,本发明实施例提供了一种产品创新概念挖掘方法,包括:从网络平台中获取文本数据;对所述文本数据进行预处理,以去除所述文本数据中的重复数据和无关数据;对处理后的文本数据进行概念识别,获得若干个维度下的实体词;对所述若干个维度下的实体词进行分析,获得语义关系分析结果和情感分析结果;将所述语义关系分析结果和所述情感分析结果输入预设的趋势数据计算模型,输出产品创新概念榜单;其中,所述产品创新概念榜单中包括挖掘到的至少一个创新概念。
6.进一步地,所述产品创新概念榜单中还包括每一个所述创新概念对应的趋势增长指数、趋势规模指数和趋势情感指标;所述趋势增长指数用于指示当前趋势在对应的统计周期内的网络平台数据增长情况的综合指标;所述趋势规模指数用于指示当前趋势在对应的统计周期内的网络平台数据占比情况的综合指标;所述趋势情感指数用于指示当前趋势在对应的统计周期内的网络平台情感指数;其中,所述趋势情感指数=(趋势正面声量-趋势负面声量)/(趋势正面声量 趋势负面声量)*100%。
7.进一步地,所述方法还包括:根据所述产品创新概念榜单分析所述创新概念对应的趋势类型;其中,所述趋势类型为潜力趋势、机会趋势、成熟趋势或爆品趋势。
8.进一步地,所述根据所述产品创新概念榜单分析所述创新概念对应的趋势类型,具体包括:根据所述产品创新概念榜单判断所述创新概念对应的所述趋势增长指数和所述趋势规模指数是否大于预设阈值;当所述趋势增长指数不大于预设阈值且所述趋势规模指数不大于预设阈值时,确定所述创新概念对应的趋势类型为潜力趋势;当所述趋势增长指数不大于预设阈值且所述趋势规模指数大于预设阈值时,确定所述创新概念对应的趋势类型为机会趋势;当所述趋势增长指数大于预设阈值且所述趋势规模指数不大于预设阈值时,确定所述创新概念对应的趋势类型为成熟趋势;当所述趋势增长指数大于预设阈值且所述趋势规模指数大于预设阈值时,确定所述创新概念对应的趋势类型为爆品趋势。
9.进一步地,所述对所述文本数据进行预处理,以去除所述文本数据中的重复数据和无关数据,具体包括:对所述文本数据进行文本聚类、文本去重和文本分类处理,以去除所述文本数据中的重复数据和无关数据,获得所述处理后的文本数据。
10.进一步地,所述对处理后的文本数据进行概念识别,获得若干个维度下的实体词,具体包括:利用实体识别算法对所述处理后的文本数据进行概念识别,获得若干个维度下的实体词;其中,每一个实体词对应一个维度,并且维度是根据产品分类进行设置的,每一种产品分类对应至少两个维度。
11.进一步地,所述对所述若干个维度下的实体词进行分析,获得语义关系分析结果和情感分析结果,具体包括:利用训练后的实体关系识别模型,结合所述处理后的文本数据,对所述若干个维度下的实体词进行语义关系分析,获得所述语义关系分析结果;其中,所述语义关系分析结果中包括实体词对之间的关联关系;利用训练后的情感分析模型,结合所述处理后的文本数据,对所述若干个维度下的实体词进行情感分析,获得所述情感分析结果;其中,所述情感分析结果中包括实体词对应的情感标签。
12.为了实现上述目的,本发明实施例还提供了一种产品创新概念挖掘装置,用于实现上述任一项所述的产品创新概念挖掘方法,所述装置包括:文本数据获取模块,用于从网络平台中获取文本数据;文本数据预处理模块,用于对所述文本数据进行预处理,以去除所述文本数据中的重复数据和无关数据;概念识别模块,用于对处理后的文本数据进行概念识别,获得若干个维度下的实体词;
实体词分析模块,用于对所述若干个维度下的实体词进行分析,获得语义关系分析结果和情感分析结果;创新概念挖掘模块,用于将所述语义关系分析结果和所述情感分析结果输入预设的趋势数据计算模型,输出产品创新概念榜单;其中,所述产品创新概念榜单中包括挖掘到的至少一个创新概念。
13.本发明实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质包括存储的计算机程序;其中,所述计算机程序在运行时控制所述计算机可读存储介质所在的设备执行上述任一项所述的产品创新概念挖掘方法。
14.本发明实施例还提供了一种终端设备,包括处理器、存储器以及存储在所述存储器中且被配置为由所述处理器执行的计算机程序,所述处理器在执行所述计算机程序时实现上述任一项所述的产品创新概念挖掘方法。
15.与现有技术相比,本发明实施例提供了一种产品创新概念挖掘方法、装置、计算机可读存储介质及终端设备,首先从网络平台中获取文本数据,并对文本数据进行预处理,以去除文本数据中的重复数据和无关数据,接着对处理后的文本数据进行概念识别,获得若干个维度下的实体词,并对若干个维度下的实体词进行分析,获得语义关系分析结果和情感分析结果,最后将语义关系分析结果和情感分析结果输入预设的趋势数据计算模型,输出产品创新概念榜单,该产品创新概念榜单中包括挖掘到的至少一个创新概念;从而能够大幅降低人工参与程度,实现智能化、高效挖掘产品创新概念,并且结合多维度进行产品创新概念挖掘,从而提高了挖掘结果的准确性。
附图说明
16.图1是本发明提供的一种产品创新概念挖掘方法的一个优选实施例的流程图;图2是本发明提供的一种产品创新概念挖掘装置的一个优选实施例的结构框图;图3是本发明提供的一种终端设备的一个优选实施例的结构框图。
具体实施方式
17.下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本技术领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
18.需要说明的是,“产品创新概念”指的是基于文本中的产品所对应的多个实体词的词义信息,以及实体词之间的语义关联性,挖掘到的产品的趋势名称,例如,“产品创新概念”可以是多个实体词中的某一个实体词。
19.本发明实施例提供了一种产品创新概念挖掘方法,参见图1所示,是本发明提供的一种产品创新概念挖掘方法的一个优选实施例的流程图,所述方法包括步骤s11至步骤s15:步骤s11、从网络平台中获取文本数据。
20.具体的,可以从社媒平台或者电商平台等网络平台中采集获取文本数据,并对采集到的文本数据进行数据存储,建立数据库,以便于后续信息提取与分析。
21.需要说明的是,所采集的文本数据均是被允许的,数据采集过程也是合法合规的。
22.步骤s12、对所述文本数据进行预处理,以去除所述文本数据中的重复数据和无关数据。
23.具体的,在从网络平台直接采集获得的文本数据中,可能包括一些重复或者无关的数据文本,因此,需要对采集到的文本数据进行一定的预处理,以过滤文本数据中的重复数据和无关数据,相应获得处理后的文本数据。
24.步骤s13、对处理后的文本数据进行概念识别,获得若干个维度下的实体词。
25.具体的,预先针对不同的产品分类,分别为每一个产品分类均设置了至少两个维度,通过对处理后的文本数据进行概念识别,可以相应获得处理后的文本数据所对应的若干个维度下的实体词,并且每一个实体词均对应一个维度。
26.其中,当产品分类为食品时,对应设置的维度可以包括:品类、品牌、口感、成分/原料、包装、口味/味道等等;当产品分类为电子产品时,对应设置的维度可以包括:品类、品牌、产品型号、颜色、人群、科技/工艺、材质、触感/体验、设计/形态等等;其他产品分类同理,所设置的维度一般是基于不同的行业需求进行必要识别的,可以根据不同的行业需求,针对不同的产品类型分别对应设置不同的识别维度。
27.示例性的,假设文本数据为“泰国虾条新品泰国进口网红虾条每一口都酥脆鲜香。”,则经过概念识别之后,可以获得以下三个维度对应的实体词:“虾条-品类”、“酥脆-口感”和“鲜香-口味”。
28.步骤s14、对所述若干个维度下的实体词进行分析,获得语义关系分析结果和情感分析结果。
29.具体的,在获得上述若干个维度下的实体词之后,可以进一步的对这些实体词进行语义关系分析,相应获得语义关系分析结果,以及,对这些实体词进行情感分析,相应获得情感分析结果。
30.示例性的,假设文本数据为“a品牌牛奶和b品牌儿童高钙饼干都是我的最爱,尤其是饼干的鸡屎味。”,则经过概念识别获得相应的实体词,并对识别到的实体词进行语义关系分析之后,可以知晓,“a品牌”和“饼干”没有语义上的联系,而“饼干”和“鸡屎味”有语义上的联系,因此,可以获得语义关系分析结果:“饼干-口味-鸡屎味”。
31.示例性的,假设文本数据为“芋头糖水的下火效果垃圾到死。”,则经过概念识别之后,可以获得以下三个维度对应的实体词:“芋头-原料/成分/材质”、“糖水-品类”和“下火-功效”,对这三个维度对应的实体词进行情感分析之后,可以获得情感分析结果:“芋头-负面(芋头作为原料,效果垃圾)”、“糖水-负面(该分句有负面的情感倾向,主语为糖水)”和“下火-负面(虽然下火有正面的情感倾向,但是被句子中否定词修饰)”,其中,“正面”和“负面”为预先设置的情感标签,经过情感分析之后,可以为每一个实体词标记上对应的情感标签。
32.步骤s15、将所述语义关系分析结果和所述情感分析结果输入预设的趋势数据计算模型,输出产品创新概念榜单;其中,所述产品创新概念榜单中包括挖掘到的至少一个创新概念。
33.具体的,预先构建并训练好趋势数据计算模型,在获得上述语义关系分析结果和情感分析结果之后,可以将获得的语义关系分析结果和情感分析结果输入训练后的趋势数
据计算模型中,通过趋势数据计算模型中的公式进行计算,相应获得产品创新概念榜单并输出该产品创新概念榜单,且该产品创新概念榜单中具体包括从文本数据中挖掘到的至少一个创新概念,则根据该产品创新概念榜单即可获得产品创新概念的挖掘结果。
34.本发明实施例所提供的一种产品创新概念挖掘方法,首先从网络平台中获取文本数据,并对文本数据进行预处理,以去除文本数据中的重复数据和无关数据,接着对处理后的文本数据进行概念识别,获得若干个维度下的实体词,并对若干个维度下的实体词进行分析,获得语义关系分析结果和情感分析结果,最后将语义关系分析结果和情感分析结果输入预设的趋势数据计算模型,输出产品创新概念榜单,从而能够大幅降低人工参与程度,实现智能化、高效挖掘产品创新概念,降低成本,提高效率,同时,结合了多个识别维度提取多维度的语义关系、情感信息,并利用相关的趋势数据计算模型进行产品创新概念挖掘,从而提高了挖掘结果的准确性。
35.在另一个优选实施例中,所述产品创新概念榜单中还包括每一个所述创新概念对应的趋势增长指数、趋势规模指数和趋势情感指标;所述趋势增长指数用于指示当前趋势在对应的统计周期内的网络平台数据增长情况的综合指标;所述趋势规模指数用于指示当前趋势在对应的统计周期内的网络平台数据占比情况的综合指标;所述趋势情感指数用于指示当前趋势在对应的统计周期内的网络平台情感指数;其中,所述趋势情感指数=(趋势正面声量-趋势负面声量)/(趋势正面声量 趋势负面声量)*100%。
36.具体的,结合上述实施例,输出的产品创新概念榜单中除了包括从文本数据中挖掘到的至少一个创新概念之外,还包括每一个挖掘到的创新概念所对应的趋势增长指数、趋势规模指数和趋势情感指标,其中,趋势增长指数具体表示:当前趋势在对应的统计周期内的网络平台(如社媒平台、电商平台)数据增长情况的综合指标,取值范围可设置为(1,100);趋势规模指数具体表示:当前趋势在对应的统计周期内的网络平台(如社媒平台、电商平台)数据占比情况的综合指标,取值范围可设置为(1,100);趋势情感指数具体表示:当前趋势在对应的统计周期内的网络平台(如社媒平台等)情感指数,取值范围可设置为(-1,1),并且趋势情感指数的计算公式为:(趋势正面声量-趋势负面声量)/(趋势正面声量 趋势负面声量)*100%,趋势正面声量和趋势负面声量可以根据具体的实体词情感分析算法逻辑信息相应获得。
37.需要说明的是,由于网络平台数据更新快,为了保证时效性,可以提高文本数据采集效率,例如,按天进行文本数据采集,相应的,上述统计周期也可以对应设置为按天进行,或者上述统计周期也可以根据实际需求进行灵活设置,本发明实施例不作具体限定。
38.在又一个优选实施例中,所述方法还包括:根据所述产品创新概念榜单分析所述创新概念对应的趋势类型;其中,所述趋势类型为潜力趋势、机会趋势、成熟趋势或爆品趋势。
39.具体的,结合上述实施例,在获得上述产品创新概念榜单之后,可以根据产品创新概念榜单中所包含的每一个创新概念及其对应的趋势增长指数、趋势规模指数和趋势情感指标,分别判断每一个创新概念所对应的趋势类型,以根据每一个创新概念所对应的趋势
类型,分析挖掘到的产品创新概念的发展趋势。
40.作为上述方案的改进,所述根据所述产品创新概念榜单分析所述创新概念对应的趋势类型,具体包括:根据所述产品创新概念榜单判断所述创新概念对应的所述趋势增长指数和所述趋势规模指数是否大于预设阈值;当所述趋势增长指数不大于预设阈值且所述趋势规模指数不大于预设阈值时,确定所述创新概念对应的趋势类型为潜力趋势;当所述趋势增长指数不大于预设阈值且所述趋势规模指数大于预设阈值时,确定所述创新概念对应的趋势类型为机会趋势;当所述趋势增长指数大于预设阈值且所述趋势规模指数不大于预设阈值时,确定所述创新概念对应的趋势类型为成熟趋势;当所述趋势增长指数大于预设阈值且所述趋势规模指数大于预设阈值时,确定所述创新概念对应的趋势类型为爆品趋势。
41.具体的,结合上述实施例,对于挖掘到的任意一个创新概念,在确定该创新概念所对应的趋势类型时,可以通过判断该创新概念所对应的趋势增长指数和趋势规模指数是否大于预设阈值,来分析该创新概念所对应的趋势类型是潜力趋势、机会趋势、成熟趋势和爆品趋势中的哪一个;当判定该创新概念所对应的趋势增长指数小于或等于预设阈值,并且该创新概念所对应的趋势规模指数小于或等于预设阈值时,确定该创新概念所对应的趋势类型为潜力趋势;当判定该创新概念所对应的趋势增长指数小于或等于预设阈值,并且该创新概念所对应的趋势规模指数大于预设阈值时,确定该创新概念所对应的趋势类型为机会趋势;当判定该创新概念所对应的趋势增长指数大于预设阈值,并且该创新概念所对应的趋势规模指数小于或等于预设阈值时,确定该创新概念所对应的趋势类型为成熟趋势;当判定该创新概念所对应的趋势增长指数大于预设阈值,并且该创新概念所对应的趋势规模指数大于预设阈值时,确定该创新概念所对应的趋势类型为爆品趋势。
42.需要说明的是,针对上述趋势数据计算模型,经过校验发现数据层面需要继续优化,因此可以通过一定算法调优模型,并通过数据进行对比分析获得80%分位数,则可以将得到的80%分位数作为上述预设阈值,或者,上述预设阈值也可以根据实际需求进行灵活设置,本发明实施例不作具体限定。
43.示例性的,假设预设阈值=80%分位数,针对产品创新概念榜单中的每一个创新概念,对应的榜单指标如表1所示。
44.表1 榜单指标
在又一个优选实施例中,所述对所述文本数据进行预处理,以去除所述文本数据中的重复数据和无关数据,具体包括:对所述文本数据进行文本聚类、文本去重和文本分类处理,以去除所述文本数据中的重复数据和无关数据,获得所述处理后的文本数据。
45.具体的,结合上述实施例,在对采集到的文本数据进行预处理时,可以利用现有的数据处理方案对文本数据进行一定的预处理,例如,采用文本指纹算法即低精度的文本聚类算法对文本数据进行聚类处理,采用相似文本去重算法对文本数据进行去重处理,采用文本分类算法对文本数据进行分类处理,以过滤文本数据中的重复数据和无关数据,相应获得处理后的文本数据。
46.在又一个优选实施例中,所述对处理后的文本数据进行概念识别,获得若干个维度下的实体词,具体包括:利用实体识别算法对所述处理后的文本数据进行概念识别,获得若干个维度下的实体词;其中,每一个实体词对应一个维度,并且维度是根据产品分类进行设置的,每一种产品分类对应至少两个维度。
47.具体的,结合上述实施例,在对处理后的文本数据进行概念识别时,可以利用实体识别算法对处理后的文本数据进行概念识别,相应获得处理后的文本数据所对应的若干个维度下的实体词。
48.如上述实施例所述,识别维度可以根据产品分类进行设置,每一个产品分类对应至少两个识别维度,并且在基于设置好的识别维度对文本数据进行实体词识别时,由于文本数据中针对同一个维度的描述词汇可能不止一个,则识别到的某一个识别维度所对应的实体词也可能不止一个,而某一个识别维度识别不到对应的实体词的情况同样有可能存在,但是可以确定,一定能够识别到实体词,并且每一个实体词均对应一个识别维度。
49.需要说明的是,本发明实施例所采用的实体识别算法可以是现有技术提供的实体识别算法,例如,通过对不同行业的文本数据进行人工标注形成模型,模型通过学习人工标注的数据,主动归纳不同输出类别对应的输入特征,并应用到新文本数据的预测,以完成对新文本数据的概念识别。
50.在又一个优选实施例中,所述对所述若干个维度下的实体词进行分析,获得语义关系分析结果和情感分析结果,具体包括:利用训练后的实体关系识别模型,结合所述处理后的文本数据,对所述若干个维度下的实体词进行语义关系分析,获得所述语义关系分析结果;其中,所述语义关系分析结果中包括实体词对之间的关联关系;利用训练后的情感分析模型,结合所述处理后的文本数据,对所述若干个维度下的实体词进行情感分析,获得所述情感分析结果;其中,所述情感分析结果中包括实体词对应的情感标签。
51.具体的,结合上述实施例,在对获得的若干个维度下的实体词进行语义关系分析时,可以利用训练后的实体关系识别模型,并且结合处理后的文本数据,对获得的若干个维度下的实体词进行语义关系分析,相应获得语义关系分析结果,该语义关系分析结果中具体包括实体词对(即一对实体词)之间的关联关系;在对获得的若干个维度下的实体词进行情感分析时,可以利用训练后的情感分析模型,并且结合处理后的文本数据,对获得的若干
个维度下的实体词进行情感分析,相应获得情感分析结果,该情感分析结果中包括每一个实体词所对应的情感标签。
52.其中,语义关系分析,是指按照原文语义,将语义相关的实体词对标注出来,语义相关的实体词对可能会跨越句子,并且当实体词呈现并列关系时,需要同时标注出来,例如,“a品牌和b品牌都推出了蜜桃口味”,则“蜜桃口味”应同时指向“a品牌”和“b品牌”。
53.需要说明的是,本发明实施例所采用的实体关系识别模型可以是现有技术提供的实体关系识别模型,并且需要进行人工标注、机器学习,不断训练优化模型;例如,向训练后的实体关系识别模型输入原文和实体信息:“我的邻居姐姐真是太好了送零食「品类」茶叶「品类」竟然还要送口红「品类」阿某尼「品牌」”,模型综合考虑语义、位置和实体类型的信息,输出实体对之间的关联关系,可以识别到“口红-品牌-阿某尼”。
54.同理,本发明实施例所采用的情感分析模型也可以是现有技术提供的情感分析模型,并且需要进行人工标注、机器学习,不断训练优化模型;例如,采用基于bert的双重掩码序列模型,模型的输入层掩码:屏蔽分析实体,提高模型泛化能力,输入原文“喜欢a明星,不喜欢b明星”,分析实体“a明星”、“b明星”;bert:根据行业定制的大规模预训练模型,模型的输出层掩码:屏蔽除分析实体外的句子成分,强制模型学习分析实体情感,输出“a明星-正面”、“b明星-负面”。
55.示例性的,假设提取到的文本数据内容为:“睡前折磨人呐没有抵抗住黑巧的诱惑收拾完之后忽然想吃黑巧了长胖变瘦算了来了条黑巧毕竟一口吃不成个胖子浅尝了一下海盐榛子味的可盐可甜菊粉代替白砂糖一口下去瞬间满足了日后一定提早吃 #新一代健康巧克力 #每日黑巧 #每日黑巧海盐榛子味新一代健康巧克力”;进行概念识别后,可以得出各维度下的实体词如下:{“品类”:{“黑巧”:{“index”:[13,29,48,127,135]},“巧克力”:{“index”:[118,150]}},“气味/味道”:{“海盐榛子味”:{“index”:[69,137]},“甜”:{“index”:[80]},“盐味”:{“index”:[78],“originname”:[“盐”]}},“成分/原料/材质”:{“白砂糖”:{“index”:[87]},“菊粉”:{“index”:[83]}}},其中,{“index”:[]}表示对应的实体词在文本中对应的位置;对各维度下实体词进行语义关系分析,可以得出语义关系分析结果如下:{“{\“品类\”:\“巧克力\”}”:“{\“品类\”:\“黑巧\”}”:{“气味/味道”:[“海盐榛子味”,“甜”,“盐味”],“成分/原料/材质”:[“菊粉”]}};对各维度下实体词进行情感分析,可以得出情感分析结果如下:{“品类”:{“黑巧”:{“sentiment”:[“中性”,“正面”,“中性”,“中性”,“中性”],“overallsentiment”:“正面”,“overallsentimentprobability”:0.72263056,“index”:[13,29,48,127,135]},“巧克力”:{“sentiment”:[“中性”,“中性”],“overallsentiment”:“中性”,“overallsentimentprobability”:0.685577,“index”:[118,150]}},“气味/味道”:{“海盐榛子味”:{“sentiment”:[“正面”,“中性”],“overallsentiment”:“正面”,“overallsentimentprobability”:0.5250338,“index”:[69,137]},“甜”:{“sentiment”:[“正面”],“overallsentiment”:“正面”,“overallsentimentprobability”:0.7077429,“index”:[80]},“盐味”:{“sentiment”:[“正面”],“overallsentiment”:“正面”,“overallsentimentprobability”:0.59805006,“index”:[78],“originname”:[“盐”]}},“成分/原料/材质”:{“白砂糖”:{“sentiment”:[“正面”],“overallsentiment”:“正面”,“overallsentimentprobability”:0.5842015,“index”:[87]},“菊粉”:{“sentiment”:[“正面”],“overallsentiment”:“正面”,“overallsentimentprobability”:0.5878,“index”:[83]}}};基于上述过程获得的语义关系分析结果和情感分析结果,使用趋势数据计算模型进行计算,输出产品创新概念榜单,则在榜单中可发现一个趋势名称为“海盐榛子味”。
[0056]
本发明实施例还提供了一种产品创新概念挖掘装置,用于实现上述任一实施例所述的产品创新概念挖掘方法,参见图2所示,是本发明提供的一种产品创新概念挖掘装置的一个优选实施例的结构框图,所述装置包括:文本数据获取模块11,用于从网络平台中获取文本数据;文本数据预处理模块12,用于对所述文本数据进行预处理,以去除所述文本数据中的重复数据和无关数据;概念识别模块13,用于对处理后的文本数据进行概念识别,获得若干个维度下的实体词;实体词分析模块14,用于对所述若干个维度下的实体词进行分析,获得语义关系分析结果和情感分析结果;创新概念挖掘模块15,用于将所述语义关系分析结果和所述情感分析结果输入预设的趋势数据计算模型,输出产品创新概念榜单;其中,所述产品创新概念榜单中包括挖掘到的至少一个创新概念。
[0057]
优选地,所述产品创新概念榜单中还包括每一个所述创新概念对应的趋势增长指数、趋势规模指数和趋势情感指标;所述趋势增长指数用于指示当前趋势在对应的统计周期内的网络平台数据增长情况的综合指标;所述趋势规模指数用于指示当前趋势在对应的统计周期内的网络平台数据占比情况的综合指标;所述趋势情感指数用于指示当前趋势在对应的统计周期内的网络平台情感指数;其中,所述趋势情感指数=(趋势正面声量-趋势负面声量)/(趋势正面声量 趋势负面声量)*100%。
[0058]
优选地,所述装置还包括:创新概念趋势分析模块,用于根据所述产品创新概念榜单分析所述创新概念对应的趋势类型;其中,所述趋势类型为潜力趋势、机会趋势、成熟趋势或爆品趋势。
[0059]
优选地,所述创新概念趋势分析模块具体包括:指数阈值判断单元,用于根据所述产品创新概念榜单判断所述创新概念对应的所述趋势增长指数和所述趋势规模指数是否大于预设阈值;潜力趋势分析单元,用于当所述趋势增长指数不大于预设阈值且所述趋势规模指数不大于预设阈值时,确定所述创新概念对应的趋势类型为潜力趋势;机会趋势分析单元,用于当所述趋势增长指数不大于预设阈值且所述趋势规模指数大于预设阈值时,确定所述创新概念对应的趋势类型为机会趋势;成熟趋势分析单元,用于当所述趋势增长指数大于预设阈值且所述趋势规模指数不大于预设阈值时,确定所述创新概念对应的趋势类型为成熟趋势;
爆品趋势分析单元,用于当所述趋势增长指数大于预设阈值且所述趋势规模指数大于预设阈值时,确定所述创新概念对应的趋势类型为爆品趋势。
[0060]
优选地,所述文本数据预处理模块12具体用于:对所述文本数据进行文本聚类、文本去重和文本分类处理,以去除所述文本数据中的重复数据和无关数据,获得所述处理后的文本数据。
[0061]
优选地,所述概念识别模块13具体用于:利用实体识别算法对所述处理后的文本数据进行概念识别,获得若干个维度下的实体词;其中,每一个实体词对应一个维度,并且维度是根据产品分类进行设置的,每一种产品分类对应至少两个维度。
[0062]
优选地,所述实体词分析模块14具体包括:实体词语义关系分析单元,用于利用训练后的实体关系识别模型,结合所述处理后的文本数据,对所述若干个维度下的实体词进行语义关系分析,获得所述语义关系分析结果;其中,所述语义关系分析结果中包括实体词对之间的关联关系;实体词情感分析单元,用于利用训练后的情感分析模型,结合所述处理后的文本数据,对所述若干个维度下的实体词进行情感分析,获得所述情感分析结果;其中,所述情感分析结果中包括实体词对应的情感标签。
[0063]
需要说明的是,本发明实施例所提供的一种产品创新概念挖掘装置,能够实现上述任一实施例所述的产品创新概念挖掘方法的所有流程,装置中的各个模块、单元的作用以及实现的技术效果分别与上述实施例所述的产品创新概念挖掘方法的作用以及实现的技术效果对应相同,这里不再赘述。
[0064]
本发明实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质包括存储的计算机程序;其中,所述计算机程序在运行时控制所述计算机可读存储介质所在的设备执行上述任一实施例所述的产品创新概念挖掘方法。
[0065]
本发明实施例还提供了一种终端设备,参见图3所示,是本发明提供的一种终端设备的一个优选实施例的结构框图,所述终端设备包括处理器10、存储器20以及存储在所述存储器20中且被配置为由所述处理器10执行的计算机程序,所述处理器10在执行所述计算机程序时实现上述任一实施例所述的产品创新概念挖掘方法。
[0066]
优选地,所述计算机程序可以被分割成一个或多个模块/单元(如计算机程序1、计算机程序2、
······
),所述一个或者多个模块/单元被存储在所述存储器20中,并由所述处理器10执行,以完成本发明。所述一个或多个模块/单元可以是能够完成特定功能的一系列计算机程序指令段,该指令段用于描述所述计算机程序在所述终端设备中的执行过程。
[0067]
所述处理器10可以是中央处理单元(central processing unit,cpu),还可以是其他通用处理器、数字信号处理器(digital signal processor,dsp)、专用集成电路(application specific integrated circuit,asic)、现场可编程门阵列(field-programmable gate array,fpga)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等,通用处理器可以是微处理器,或者所述处理器10也可以是任何常规的处理器,所述处理器10是所述终端设备的控制中心,利用各种接口和线路连接所述终端设备的各个部分。
[0068]
所述存储器20主要包括程序存储区和数据存储区,其中,程序存储区可存储操作系统、至少一个功能所需的应用程序等,数据存储区可存储相关数据等。此外,所述存储器20可以是高速随机存取存储器,还可以是非易失性存储器,例如插接式硬盘,智能存储卡(smart media card,smc)、安全数字(secure digital,sd)卡和闪存卡(flash card)等,或所述存储器20也可以是其他易失性固态存储器件。
[0069]
需要说明的是,上述终端设备可包括,但不仅限于,处理器、存储器,本领域技术人员可以理解,图3结构框图仅仅是上述终端设备的示例,并不构成对终端设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件。
[0070]
综上,本发明实施例所提供的一种产品创新概念挖掘方法、装置、计算机可读存储介质及终端设备,首先从网络平台中获取文本数据,并对文本数据进行预处理,以去除文本数据中的重复数据和无关数据,接着对处理后的文本数据进行概念识别,获得若干个维度下的实体词,并对若干个维度下的实体词进行分析,获得语义关系分析结果和情感分析结果,最后将语义关系分析结果和情感分析结果输入预设的趋势数据计算模型,输出产品创新概念榜单,从而能够大幅降低人工参与程度,实现智能化、高效挖掘产品创新概念,降低成本,提高效率,同时,结合了多个识别维度提取多维度的语义关系、情感信息,并利用相关的趋势数据计算模型进行产品创新概念挖掘,从而提高了挖掘结果的准确性。
[0071]
以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明技术原理的前提下,还可以做出若干改进和变形,这些改进和变形也应视为本发明的保护范围。
再多了解一些

本文用于创业者技术爱好者查询,仅供学习研究,如用于商业用途,请联系技术所有人。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献