一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

内容识别方法、装置、设备、存储介质和计算机程序产品与流程

2022-04-27 03:33:53 来源:中国专利 TAG:


1.本技术涉及人工智能识别分类技术领域,特别是涉及一种内容识别方法、装置、设备、存储介质和计算机程序产品。


背景技术:

2.随着互联网技术的发展,社交平台逐渐兴起,社交平台是给与不同人表达观点以及表达情绪的一种全新的媒介,用户可以在社交平台发表自己的评论。
3.现有技术中,经常存在对社交平台上的评论进行情感识别的需要。例如识别某部电视剧的评论是正面的还是负面的,从而确定电视剧的口碑。然而,目前存在对评论进行情感识别的准确性较低的问题。


技术实现要素:

4.基于此,有必要针对上述技术问题,提供一种内容识别方法、装置、设备、计算机可读存储介质和计算机程序产品。
5.第一方面,本技术提供了一种内容识别方法。所述方法包括:获取目标主体内容对应的评论内容;获取所述评论内容中的表情图片以及所述评论内容对应的内容分词;确定所述表情图片对应的表情情感倾向,以及所述内容分词对应的分词情感倾向;基于所述评论内容确定情感倾向结合方式,所述情感倾向结合方式为加权方式或者反转方式,所述情感倾向结合方式是基于所述评论内容中的子内容之间的位置关系或者所述评论内容的句子结构确定的;基于所述情感倾向结合方式对所述表情情感倾向以及所述分词情感倾向进行情感倾向结合处理,得到所述评论内容对应的内容情感倾向。
6.在其中一个实施例中,基于所述评论内容确定情感倾向结合方式包括:获取所述评论内容中,所述表情图片对应的图片位置以及所述内容分词对应的分词位置;基于所述图片位置与所述分词位置之间的位置关系,确定情感倾向结合方式。
7.在其中一个实施例中,基于所述图片位置与所述分词位置之间的位置关系,确定情感倾向结合方式包括:当所述图片位置与所述分词位置之间的位置关系为相邻,且所述表情情感倾向的类型与所述分词情感倾向的类型相反时,则确定所述情感倾向结合方式为利用所述表情情感倾向对所述分词情感倾向进行反转。
8.在其中一个实施例中,所述表情情感倾向以及所述分词情感倾向均通过数值表示;基于所述情感倾向结合方式对所述表情情感倾向以及所述分词情感倾向进行情感倾向结合处理,得到所述评论内容对应的内容情感倾向包括:当所述情感倾向结合方式为加权时,获取所述表情图片对应的表情情感权重以及所述内容分词对应的分词情感权重;将所述表情情感权重与所述表情情感倾向相乘,得到加权后的表情情感倾向;将所述分词情感权重与所述分词情感倾向相乘,得到加权后的分词情感倾向;将加权后的表情情感倾向以及加权后的分词情感倾向相加,得到所述评论内容对应的内容情感倾向。
9.在其中一个实施例中,获取所述表情图片对应的表情情感权重以及所述内容分词
对应的分词情感权重包括:获取所述评论内容中,所述表情图片对应的出现次数;基于所述出现次数确定所述表情图片对应的表情情感权重,所述表情情感权重与所述出现次数成正相关关系;基于所述表情情感权重得到所述内容分词对应的分词情感权重,所述分词情感权重与所述表情情感权重成负相关关系。
10.在其中一个实施例中,确定所述表情图片对应的表情情感倾向包括:将所述表情图片与预先设置的表情图片集合中的图片进行相似对比,基于对比结果从所述表情图片集合中获取与所述表情图片相似的图片,作为目标表情图片;将所述目标表情图片对应的预先设置的情感倾向,作为所述表情图片对应的表情情感倾向。
11.第二方面,本技术还提供了一种内容识别装置。所述装置包括:评论内容获取模块,用于获取目标主体内容对应的评论内容;图片以及分词获取模块,用于获取所述评论内容中的表情图片以及所述评论内容对应的内容分词;情感倾向确定模块,用于确定所述表情图片对应的表情情感倾向,以及所述内容分词对应的分词情感倾向;情感倾向结合方式模块,用于基于所述评论内容确定情感倾向结合方式,所述情感倾向结合方式为加权方式或者反转方式,所述情感倾向结合方式是基于所述评论内容中的子内容之间的位置关系或者所述评论内容的句子结构确定的;情感倾向结合模块,用于基于所述情感倾向结合方式对所述表情情感倾向以及所述分词情感倾向进行情感倾向结合处理,得到所述评论内容对应的内容情感倾向。
12.在其中一个实施例中,所述情感倾向结合方式模块用于:获取所述评论内容中,所述表情图片对应的图片位置以及所述内容分词对应的分词位置;基于所述图片位置与所述分词位置之间的位置关系,确定情感倾向结合方式。
13.在其中一个实施例中,所述情感倾向结合方式模块用于:当所述图片位置与所述分词位置之间的位置关系为相邻,且所述表情情感倾向的类型与所述分词情感倾向的类型相反时,则确定所述情感倾向结合方式为利用所述表情情感倾向对所述分词情感倾向进行反转。
14.在其中一个实施例中,所述表情情感倾向以及所述分词情感倾向通过数值表示;所述情感倾向结合模块包括:权重获取单元,用于当所述情感倾向结合方式为加权时,获取所述表情图片对应的表情情感权重以及所述内容分词对应的分词情感权重;第一加权单元,用于将所述表情情感权重与所述表情情感倾向相乘,得到加权后的表情情感倾向;第二加权单元,用于将所述分词情感权重与所述分词情感倾向相乘,得到加权后的分词情感倾向;内容情感倾向得到单元,用于将加权后的表情情感倾向以及加权后的分词情感倾向相加,得到所述评论内容对应的内容情感倾向。
15.在其中一个实施例中,所述权重获取单元,用于:获取所述评论内容中,所述表情图片对应的出现次数;基于所述出现次数确定所述表情图片对应的表情情感权重,所述表情情感权重与所述出现次数成正相关关系;基于所述表情情感权重得到所述内容分词对应的分词情感权重,所述分词情感权重与所述表情情感权重成负相关关系。
16.在其中一个实施例中,所述情感倾向确定模块用于:将所述表情图片与预先设置的表情图片集合中的图片进行相似对比,基于对比结果从所述表情图片集合中获取与所述表情图片相似的图片,作为目标表情图片;将所述目标表情图片对应的预先设置的情感倾向,作为所述表情图片对应的表情情感倾向。
17.第三方面,本技术还提供了一种计算机设备。所述计算机设备包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现以下步骤:获取目标主体内容对应的评论内容;获取所述评论内容中的表情图片以及所述评论内容对应的内容分词;确定所述表情图片对应的表情情感倾向,以及所述内容分词对应的分词情感倾向;基于所述评论内容确定情感倾向结合方式;基于所述情感倾向结合方式对所述表情情感倾向以及所述分词情感倾向进行情感倾向结合处理,得到所述评论内容对应的内容情感倾向。
18.第四方面,本技术还提供了一种计算机可读存储介质。所述计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现以下步骤:获取目标主体内容对应的评论内容;获取所述评论内容中的表情图片以及所述评论内容对应的内容分词;确定所述表情图片对应的表情情感倾向,以及所述内容分词对应的分词情感倾向;基于所述评论内容确定情感倾向结合方式;基于所述情感倾向结合方式对所述表情情感倾向以及所述分词情感倾向进行情感倾向结合处理,得到所述评论内容对应的内容情感倾向。
19.第五方面,本技术还提供了一种计算机程序产品。所述计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现以下步骤:获取目标主体内容对应的评论内容;获取所述评论内容中的表情图片以及所述评论内容对应的内容分词;确定所述表情图片对应的表情情感倾向,以及所述内容分词对应的分词情感倾向;基于所述评论内容确定情感倾向结合方式;基于所述情感倾向结合方式对所述表情情感倾向以及所述分词情感倾向进行情感倾向结合处理,得到所述评论内容对应的内容情感倾向。
20.上述内容识别方法、装置、计算机设备、存储介质和计算机程序产品,具有以下技术效果:对于目标主体内容对应的评论内容,由于可以获取评论内容中的表情图片以及评论内容对应的内容分词,并分别获取表情图片对应的情感倾向以及内容分词对应的情感倾向,以及基于评论内容确定结合方式,情感倾向结合方式是基于评论内容中的子内容之间的位置关系或者评论内容的句子结构确定的,因此能够根据评论内容自适应的确定评论内容的结合方式,根据结合方式结合这两种情感倾向确定评论内容的内容情感倾向,因此达到了能够准确的对评论内容进行情感识别,提高情感识别的准确性的技术效果。
附图说明
21.图1为一个实施例中内容识别方法的应用环境图;
22.图2为一个实施例中内容识别方法的流程示意图;
23.图3为一个实施例中基于情感倾向结合方式对表情情感倾向以及分词情感倾向进行情感倾向结合处理,得到评论内容对应的内容情感倾向步骤的流程示意图;
24.图4为一个实施例中对社交论坛短评论进行情感识别的示例性结构流程图;
25.图5为一个实施例中内容识别装置的结构框图;
26.图6为一个实施例中计算机设备的内部结构图。
具体实施方式
27.为了使本技术的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本技术进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本技术,并不
用于限定本技术。
28.需要说明的是,本技术所涉及的用户信息(包括但不限于用户设备信息、用户个人信息等)和数据(包括但不限于用于分析的数据、存储的数据、展示的数据等),均为经用户授权或者经过各方充分授权的信息和数据。本技术技术方案中对数据的获取、存储、使用、处理等均符合国家法律法规的相关规定。
29.本技术实施例提供的内容识别方法,可以应用于如图1所示的应用环境中。其中,终端102通过网络与服务器104进行通信,数据存储系统可以存储服务器104需要处理的数据。数据存储系统可以集成在服务器104上,也可以放在云上或其他网络服务器上。终端102可以响应于用户针对目标主体内容的的评论操作,获取用户输入的评论内容,并将该评论内容发送至服务器104,服务器将目标主体内容与评论内容进行关联,当需要对目标主体内容进行情感分析时,服务器104可以获取目标主体内容对应的每一条评论内容,基于本技术实施例提供的内容识别方法确定评论内容对应的内容情感倾向。当一个目标主体内容对于有多个评论内容时,服务器104还可以基于每一条评论内容对应的内容情感倾向进行统计分析,确定目标主体内容对应的情感分析结果,例如评论内容为正向情感的比例以及评论内容为负向情感的比例。例如当目标主体内容为一部电影,则可以统计得到该电影的正向评论的比例以及负向评论的比例。正向评论是指认为电影是好电影的评论,负向评论评论是指认为电影差的评论。
30.其中,终端102可以但不限于是各种个人计算机、笔记本电脑、智能手机、平板电脑、物联网设备和便携式可穿戴设备,物联网设备可为智能音箱、智能电视、智能空调、智能车载设备等。便携式可穿戴设备可为智能手表、智能手环、头戴设备等。服务器104可以用独立的服务器或者是多个服务器组成的服务器集群来实现。
31.在一个实施例中,如图2所示,提供了一种内容识别方法,以该方法应用于图1中的服务器为例进行说明,包括以下步骤:
32.步骤s202,获取目标主体内容对应的评论内容。
33.其中,目标主体内容可以是内容平台中发布的内容,例如可以是社交平台上发布的一篇文章或者视频平台上的一部视频。目标主体内容对应的评论内容是对目标主体内容进行评论的内容。例如是对一篇文章的评论或者对一部视频的评论。
34.本技术实施例中,服务器可以响应于针对目标主体内容的情感分析指令,获取目标主体内容对应的每一个评论内容,以通过对目标主体内容的评论内容分析用户对目标主体内容的情感。
35.步骤s204,获取评论内容中的表情图片以及评论内容对应的内容分词。
36.其中,评论内容中可以包括文本以及图片。表情图片是包括表情的图片,又称为表情包,可以利用表情图片来表达感受。内容分词是指评论内容中文本的分词,内容分词可以用于表达感受,内容分词可以是评论内容中文本对应的所有分词,也可以是部分分词。例如,假设评论内容中的文本为“这部电影真好看”。则对该文本进行分词,得到的分词为“这”、“部”、“电影”、“真”以及“好看”,其中,“好看”用于表达情感,则内容分词可以是“好看”。
37.本技术实施例中,服务器可以对评论内容进行解析,从评论内容中提取到表情图片以及表达情感的内容分词。例如,服务器可以将评论内容所包含的图片与预先设置的包
含表情的图片进行对比,如果对比结果为相似,则该图片为表情图片。将评论内容中的各个分词与预先设置的用于表达情感的词语进行对比,以获取评论内容中用于表达情感的分词,作为内容分词。
38.步骤s206,确定表情图片对应的表情情感倾向,以及内容分词对应的分词情感倾向。
39.情感倾向可以用数值或者文本表示。情感倾向的类型可以包括正向类型以及负向类型。正向类型可以包括多种不同的情况,例如正向类型可以包括喜欢以及开心,负向类型例如可以包括讨厌以及伤心。情感倾向的类型可以是预先设置的。当情感倾向用数值表示时,则可以是数值越大,表示情感越正面。例如数值为正,则表示情感倾向的类型为正向类型。数值为负,则表示情感倾向的类型为负向类型。表情情感倾向是指表情图片所表达的情感倾向。分词情感倾向是指内容分词所表达的情感倾向。
40.本技术实施例中,可以预先设置图片与情感倾向的对应关系,以及内容分词与情感倾向的对应关系。该对应关系可以是人工标注的,服务器可以基于图片与情感倾向的对应关系,获取表情图片对应的表情情感倾向。服务器基于内容分词与情感倾向的对应关系,获取内容分词对应的分词情感倾向。通过设置对应关系,相比于利用机器学习方法确定情感倾向,可以不需要对文本预料进行训练,不需要考虑模型迁移对于新语料适用性,因此普适性更强。当然,也可以是基于机器学习的方式确定情感倾向。
41.在一个实施例中,还可以获取发表该评论内容的用户账户,获取该用户账户对应的表情图片与情感倾向之间的对应关系,基于该对应关系确定表情图片对应的表情情感倾向。其中,该对应关系可以是预先基于该用户账户对应的历史评论内容以及情感倾向标签确定的。例如可以获取历史评论内容中的表情图片,建立表情图片与情感倾向标签的对应关系,其中情感倾向标签表示该历史评论内容的真实的情感倾向,可以是人工标注的。例如,对于一些无法确定表情倾向的表情图片,例如用户自定义的表情图片,则服务器可以向标注人员对应的终端发送该表情图片,终端可以接收标注人员的表情标注操作,获取标注的情感倾向,向服务器发送该标注的情感倾向,该标签的情感倾向为情感倾向标签,服务器可以建立该标注的情感倾向与表情图片的对应关系,作为该用户账户对应的对应关系,从而在该用户账户下一次发表包括该表情图片的评论时,可以基于该对应关系确定情感倾向。
42.在一个实施例中,可以预先设置词语情感词典以及表情图片情感图库,词语情感词典中包括了各个词语分别对应的情感倾向,如表1所示。例如可以利用爬虫工具从社交平台爬取相应的评论内容,一个评论内容可以包括文本语料与表情图片素材,将评论内容中的文本语料与表情图片素材进行分离。对于文本语料,利用设置好的句式分配规则对文本预料进行句子划分,并利用结巴分词工具对文本语料进行分词整理,去除停用词,得到分词后的文本语料库。从文本语料库的形容词、动词以及语气词中挑选出具有明显情感倾向的词语,加入词语情感词典,并将其分为正向情感词和负向情感词。可以理解,情感词典中的情感词还可以是从外部导入的,例如从网络词库平台导入情感词以及对应的情感倾向。表情图片情感图库包括通过表情表达情感的图片。可以对语料库中社交平台上的表情图片进行处理,根据相关人员对图片的情感标注操作对这些表情图片进行情感标注,构建标注后的表情图片情感图库。
43.表1:正向情感倾向与负向情感倾向分别对应的情感词。
44.情感倾向对应情感词示例正666、可爱、亲和、感人、搞笑、最棒、佩服、好萌负不好看、娇气、无语、郁闷、唉、尴尬、差评、不专业
45.在一个实施例中,情感词典中包括语气词,例如“啊”等语气词。即在分词之后,可以根据语气词选择操作从语气词中挑选出具有情感倾向的词语,加入到情感词库中,从而能够更加细粒度以及全面的描述用户在评论中所表达的情感。
46.在一个实施例中,确定表情图片对应的表情情感倾向包括:将表情图片与预先设置的表情图片集合中的图片进行相似对比,基于对比结果从表情图片集合中获取与表情图片相似的图片,作为目标表情图片;将目标表情图片对应的预先设置的情感倾向,作为表情图片对应的表情情感倾向。
47.本技术实施例中,表情图片集合可以是情感图库中的图片形成的集合。情感图库中预先设置了每个图片对应的情感倾向,并可以对图片进行向量化表示。因此,得到一个表情图片时,可以基于向量化结果将表情图片与情感图库中的进行相似对比,例如找到与表情图片最相似且相似度大于阈值的图片,作为目标表情图片。将情感图库中,该目标表情图片所对应的情感倾向值作为表情图片对应的表情情感倾向。
48.步骤s208,基于评论内容确定情感倾向结合方式。
49.候选的情感倾向结合方式可以包括加权方式以及反转方式。加权方式是指将情感倾向进行加权求和,反转方式是指利用一个情感倾向对另一个情感倾向进行反向转换。例如,如果一个情感倾向的类型是正向的,而另一个情感倾向的类型是负向的。如果是利用情感倾向的类型为负的对正向的进行反转,则反转后的情感倾向是负向的。如果是利用情感倾向为正向的对负向的进行反转,则反转后的情感倾向是正向的。
50.本技术实施例中,情感倾向结合方式是根据评论内容确定的,例如情感倾向结合方式是基于评论内容中的子内容之间的位置关系或者评论内容的句子结构确定的,子内容是指评论内容按照类型以及分词结果进行切分,切分得到的内容,例如一个评论内容中每个表情图片为一个子内容,每一个内容分词为一个子内容,例如根据评论内容中表情图片与内容分词之间的位置关系确定情感结合方式。也可以是根据评论内容的句子结构确定情感结合方式,如果句子结构为反问句,则情感结合方式为反转。
51.步骤s210,基于情感倾向结合方式对表情情感倾向以及分词情感倾向进行情感倾向结合处理,得到评论内容对应的内容情感倾向。
52.本技术实施例中,评论内容对应的内容情感倾向是评论内容对应的整体的倾向。服务器可以是利用表情情感倾向对分词情感倾向进行反转处理,得到评论内容对应的内容情感倾向。也可以是将表情情感倾向与分词情感倾向相加,得到评论内容对应的内容情感倾向。
53.上述内容识别方法中,对于目标主体内容对应的评论内容,由于可以获取评论内容中的表情图片以及评论内容对应的内容分词,并分别获取表情图片对应的情感倾向以及内容分词对应的情感倾向,以及基于评论内容确定结合方式,根据结合方式结合这两种情感倾向确定评论内容的内容情感倾向,因此能够准确的对评论内容进行情感识别,提高了情感识别的准确性。
54.在一个实施例中,基于评论内容确定情感倾向结合方式包括:获取评论内容中,表情图片对应的图片位置以及内容分词对应的分词位置;基于图片位置与分词位置之间的位置关系,确定情感倾向结合方式。
55.本技术实施例中,情感倾向结合方式是根据表情图片的位置与内容分词的位置确定的,位置关系可以为相邻或者不相邻。例如表情图片与内容分词在评论内容中为相邻关系时,则确定结合方式为反转。当不相邻时,则确定为加权。由于位置关系能够反映表情图片与内容分词在表达情感时的协同作用,因此提高了确定结合方式的准确性。
56.在一个实施例中,基于图片位置与分词位置之间的位置关系,确定情感倾向结合方式包括:当图片位置与分词位置之间的位置关系为相邻,且表情情感倾向的类型与分词情感倾向的类型相反时,则确定情感倾向结合方式为利用表情情感倾向对分词情感倾向进行反转。否则,则为加权。
57.利用表情情感倾向对分词情感倾向进行反转,能够使得分词情感倾向变为另外一个相反的类型。正向类型与负向类型是相反的类型,在进行反转时,获取表情情感倾向所对应的情感类型中,与分词情感倾向相反的情感,作为评论内容对应的内容情感倾向。举个例子,假设一个评论内容中,表情图片对应的情感倾向为“讽刺”,属于负向情感类型,而分词情感倾向对应的情感倾向为“开心”,属于正向情感类型。则这两个情感倾向的类型相反,则获取负向情感类型中,与“开心”对立的情感倾向“伤心”,作为该评论内容对应的内容情感倾向。
58.在一个实施例中,还可以限定相邻的方式,例如只有当图片位置与分词位置之间的位置关系为相邻,且分词位置在图片位置之前,表情情感倾向的类型与分词情感倾向的类型相反时,则确定情感倾向结合方式为利用表情情感倾向对分词情感倾向进行反转,否则,则为加权。即当先使用文字表达感情,并在文字之后加入表情包,且表情情感倾向的类型与分词情感倾向的类型相反时,则利用表情包进行情感反转。例如,只有当“讽刺”表情图片紧跟“开心”这一词语后,才确定情感倾向结合方式为利用表情情感倾向对分词情感倾向进行反转。
59.在一个实施例中,当图片位置与分词位置之间的位置关系为相邻,且表情情感倾向的类型与分词情感倾向的类型相同时,则确定情感倾向结合方式为加权。
60.在一个实施例中,当表情情感倾向以及分词情感倾向均通过数值表示,如图3所示,基于情感倾向结合方式对表情情感倾向以及分词情感倾向进行情感倾向结合处理,得到评论内容对应的内容情感倾向包括:
61.步骤s302,当情感倾向结合方式为加权时,获取表情图片对应的表情情感权重以及内容分词对应的分词情感权重。
62.本技术实施例中,表情情感权重是指表情图片所表达的情感倾向的权重。内容分词对应的分词情感权重是指内容分词所表达的情感倾向的权重。权重可以是预先设置的,也可以是基于评论内容得到的。
63.在一个实施例中,获取表情图片对应的表情情感权重以及内容分词对应的分词情感权重包括:获取评论内容中,表情图片对应的出现次数;基于出现次数确定表情图片对应的表情情感权重,表情情感权重与出现次数成正相关关系;基于表情情感权重得到内容分词对应的分词情感权重,分词情感权重与表情情感权重成负相关关系。
64.表情情感权重与出现次数成正相关关系是指出现次数越多,则权重越大,例如可以设置出现次数与情感权重的对应关系,具体可以根据需要设置。如当出现次数为1时,则权重为0.4,当出现次数为2时,则权重为0.5。分词情感权重与表情情感权重成负相关关系是指表情情感权重越大,则分词情感权重越小,例如利用预设数值减去表情情感权重,得到分词情感权重,预设数值可以为1。本技术实施例中,表情情感权重与表情图片的出现次数成正相关关系,分词情感权重与表情情感权重成负相关关系,能够使得表情图片在一个评论中出现的次数越多,则该表情图片对应的情感倾向越重要,故提高了情感识别的准确性。
65.步骤s304,将表情情感权重与表情情感倾向相乘,得到加权后的表情情感倾向。
66.步骤s306,将分词情感权重与分词情感倾向相乘,得到加权后的分词情感倾向。
67.步骤s308,将加权后的表情情感倾向以及加权后的分词情感倾向相加,得到评论内容对应的内容情感倾向。
68.例如,评论内容对应的内容情感倾向的计算方式可以e(p)=a*e(s1) b*e(s2)表示,其中e(s1)为分词情感倾向值,e(s2)为表情情感倾向值;e(p)表示评论内容p对应的内容情感倾向。a为分词情感权重,b为表情情感权重。
69.本技术实施例中,通过将表情情感倾向以及分词情感倾向进行情感倾向进行加权求和,能够提高情感识别的准确性。
70.在一个实施例中,本技术实施例提供的将表情情感倾向以及分词情感倾向进行情感倾向结合处理的方式可以适用于只有一个分句的评论内容中。若评论内容有多个分句,则对表情情感倾向以及分词情感倾向进行情感倾向结合处理时,可以是以分句为单位进行结合,即是分句内的表情情感倾向以及分词情感倾向之间进行结合,得到每个分句分别对应的情感倾向,将每个分句分别对应的情感倾向进行相加,将相加结果作为评论内容对应的内容情感倾向。
71.在一个实施例中,在进行结合时,若评论内容有多个分句,则对表情情感倾向以及分词情感倾向进行情感倾向结合处理时,服务器可以对每个分句对应的内容分词的情感倾向进行相加,得到每个分句在内容分词上的情感倾向,然后将每个分句在内容分词上的情感倾向进行相加,得到评论内容从内容分词角度上计算得到的情感倾向。服务器对每个分句对应的表情图片的情感倾向进行相加,得到每个分句在表情图片上的情感倾向,然后将每个分句在表情图片上的情感倾向进行相加,得到评论内容从表情图片角度上计算得到的情感倾向。服务器将评论内容从内容分词角度上计算得到的情感倾向,与从表情图片角度上计算得到的情感倾向进行加权求和,得到评论内容对应的内容情感倾向。
72.例如,e(s1)的计算公式可以表示如下:e(s1)=sum(e(si)),e(s1)表示分词情感倾向值,即是从内容分词角度上计算得到的情感倾向,“sum”表示求和。e(si)表示评论内容中第i个分句si的情感倾向,第i个分句si的情感倾向是将该分句si中的所有内容分词的情感倾向进行相加得到的。e(s2)的计算公式可以表示如下(s2)=sum(e(emjj)),e(emij)表示第i个分句si中第j个表情图片的情感倾向值。
73.本技术实施例提供的内容识别方法可以应用于对社交平台中的短评论进行情感识别的场景中,社交平台中的短评论可以是评论长度小于长度阈值的评论。情感识别是指对包含主观信息的内容进行情感倾向性判断。社交平台是给与不同人表达观点以及表达情绪的一种全新的媒介,用户在社交平台发表自己的短评论时往往不会是长篇累牍表达,而
是基于此情景下有感而发的观点,这些观点的通常是简单的文本信息,或者是在文本信息中夹杂表情图片。且这些文本多用短句式,不注重语法和结构,发表的观点夹杂着大量的表情图片及语气词,是参与者观点表达以及情绪的释放,能够让众多参与者迅速达到情感的共鸣,以及二次传播。而情感识别时,由于语气词通常被认为是没有意义可以被省略的词,因此相关技术在文本预处理阶段将语气词被过滤掉,这也忽视了语气词本身含有情感色彩的性质,进而影响情感分析的准确性。而通过本技术实施例提供的内容识别方法,结合评论中语气词的情感倾向、形容词的情感倾向以及表情图片的情感倾向等多种模态的情感倾向值,能够准确的得到评论内容对应的内容情感倾向,提高了对社交平台上的短评论进行情感分析的准确性。由于重视表情图片传递的情感信息,因而更能全面的描述用户发表短评论的情感倾向。
74.如图4所示,以对社交论坛中短评论进行情感识别为例,对本技术实施例提供的内容识别方法进行说明。当服务器获取到社交论坛短评论时,可以进行文本预处理,例如过滤停用词等,然后进行去噪,如去除无关的词语,去噪后进行分词,基于情感词典确定分词对应的分词情感倾向值。服务器还获取评论中的表情图片,基于表情包情感图库确定图片对应的情感倾向,即表情情感倾向值。服务器结合分词情感倾向值与表情情感倾向值进行情感倾向值判定,得到评论对应的整体的情感倾向。
75.应该理解的是,虽然如上的各实施例所涉及的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,如上的各实施例所涉及的流程图中的至少一部分步骤可以包括多个步骤或者多个阶段,这些步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤中的步骤或者阶段的至少一部分轮流或者交替地执行。
76.基于同样的发明构思,本技术实施例还提供了一种用于实现上述所涉及的内容识别方法的内容识别装置。该装置所提供的解决问题的实现方案与上述方法中所记载的实现方案相似,故下面所提供的一个或多个内容识别装置实施例中的具体限定可以参见上文中对于内容识别方法的限定,在此不再赘述。
77.在一个实施例中,如图5所示,提供了一种内容识别装置,包括:
78.评论内容获取模块502,用于获取目标主体内容对应的评论内容;
79.图片以及分词获取模块504,用于获取评论内容中的表情图片以及评论内容对应的内容分词;
80.情感倾向确定模块506,用于确定表情图片对应的表情情感倾向,以及内容分词对应的分词情感倾向;
81.情感倾向结合方式模块508,用于基于评论内容确定情感倾向结合方式;
82.情感倾向结合模块510,用于基于情感倾向结合方式对表情情感倾向以及分词情感倾向进行情感倾向结合处理,得到评论内容对应的内容情感倾向。
83.在一个实施例中,情感倾向结合方式模块用于:获取评论内容中表情图片对应的图片位置以及内容分词对应的分词位置;基于图片位置与分词位置之间的位置关系,确定情感倾向结合方式。
84.在一个实施例中,情感倾向结合方式模块用于:当图片位置与分词位置之间的位置关系为相邻,且表情情感倾向的类型与分词情感倾向的类型相反时,则确定情感倾向结合方式为利用表情情感倾向对分词情感倾向进行反转。
85.在一个实施例中,表情情感倾向以及分词情感倾向通过数值表示;情感倾向结合模块包括:权重获取单元,用于当情感倾向结合方式为加权时,获取表情图片对应的表情情感权重以及内容分词对应的分词情感权重;第一加权单元,用于将表情情感权重与表情情感倾向相乘,得到加权后的表情情感倾向;第二加权单元,用于将分词情感权重与分词情感倾向相乘,得到加权后的分词情感倾向;内容情感倾向得到单元,用于将加权后的表情情感倾向以及加权后的分词情感倾向相加,得到评论内容对应的内容情感倾向。
86.在一个实施例中,权重获取单元,用于:获取评论内容中,表情图片对应的出现次数;基于出现次数确定表情图片对应的表情情感权重,表情情感权重与出现次数成正相关关系;基于表情情感权重得到内容分词对应的分词情感权重,分词情感权重与表情情感权重成负相关关系。
87.在一个实施例中,情感倾向确定模块用于:将表情图片与预先设置的表情图片集合中的图片进行相似对比,基于对比结果从表情图片集合中获取与表情图片相似的图片,作为目标表情图片;将目标表情图片对应的预先设置的情感倾向,作为表情图片对应的表情情感倾向。
88.上述内容识别装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
89.在一个实施例中,提供了一种计算机设备,该计算机设备可以是服务器,其内部结构图可以如图6所示。该计算机设备包括通过系统总线连接的处理器、存储器和网络接口。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质和内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于存储评论内容数据。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种内容识别方法。
90.本领域技术人员可以理解,图6中示出的结构,仅仅是与本技术方案相关的部分结构的框图,并不构成对本技术方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
91.在一个实施例中,提供了一种计算机设备,包括存储器和处理器,存储器中存储有计算机程序,该处理器执行计算机程序时实现以下步骤:获取目标主体内容对应的评论内容;获取评论内容中的表情图片以及评论内容对应的内容分词;确定表情图片对应的表情情感倾向,以及内容分词对应的分词情感倾向;基于评论内容确定情感倾向结合方式;基于情感倾向结合方式对表情情感倾向以及分词情感倾向进行情感倾向结合处理,得到评论内容对应的内容情感倾向。
92.在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现以下步骤:获取目标主体内容对应的评论内容;获取评论内容中的表情图片以及评论内容对应的内容分词;确定表情图片对应的表情情感倾向,以及内
容分词对应的分词情感倾向;基于评论内容确定情感倾向结合方式;基于情感倾向结合方式对表情情感倾向以及分词情感倾向进行情感倾向结合处理,得到评论内容对应的内容情感倾向。
93.在一个实施例中,提供了一种计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现以下步骤:获取目标主体内容对应的评论内容;获取评论内容中的表情图片以及评论内容对应的内容分词;确定表情图片对应的表情情感倾向,以及内容分词对应的分词情感倾向;基于评论内容确定情感倾向结合方式;基于情感倾向结合方式对表情情感倾向以及分词情感倾向进行情感倾向结合处理,得到评论内容对应的内容情感倾向。
94.本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本技术所提供的各实施例中所使用的对存储器、数据库或其它介质的任何引用,均可包括非易失性和易失性存储器中的至少一种。非易失性存储器可包括只读存储器(read-only memory,rom)、磁带、软盘、闪存、光存储器、高密度嵌入式非易失性存储器、阻变存储器(reram)、磁变存储器(magnetoresistive random access memory,mram)、铁电存储器(ferroelectric random access memory,fram)、相变存储器(phase change memory,pcm)、石墨烯存储器等。易失性存储器可包括随机存取存储器(random access memory,ram)或外部高速缓冲存储器等。作为说明而非局限,ram可以是多种形式,比如静态随机存取存储器(static random access memory,sram)或动态随机存取存储器(dynamic random access memory,dram)等。本技术所提供的各实施例中所涉及的数据库可包括关系型数据库和非关系型数据库中至少一种。非关系型数据库可包括基于区块链的分布式数据库等,不限于此。本技术所提供的各实施例中所涉及的处理器可为通用处理器、中央处理器、图形处理器、数字信号处理器、可编程逻辑器、基于量子计算的数据处理逻辑器等,不限于此。
95.以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
96.以上所述实施例仅表达了本技术的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本技术专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本技术构思的前提下,还可以做出若干变形和改进,这些都属于本技术的保护范围。因此,本技术的保护范围应以所附权利要求为准。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献