一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

信息流的互动处理方法、装置、电子设备与流程

2021-12-08 00:39:00 来源:中国专利 TAG:


1.本技术涉及互联网技术,尤其涉及一种信息流的互动处理方法、装置、电子设备及计算机可读存储介质。


背景技术:

2.随着终端应用的发展和普及,终端被广泛用于信息浏览,例如新闻、社交动态等。用户可以对终端应用中的信息进行评论等操作,用户的评论可以促进信息的传播推广。然而,相关技术中发表评论需要的编辑时间较长,发表评论的效率较低,且评论难以形象地表达出用户对信息的主观情感。


技术实现要素:

3.本技术实施例提供一种信息流的互动处理方法、装置、电子设备及计算机可读存储介质,能够提高评论编辑效率,丰富评论的表现形式。
4.本技术实施例的技术方案是这样实现的:
5.本技术实施例提供一种信息流的互动处理方法,包括:
6.显示信息流中的至少一条信息、以及与所述至少一条信息对应的评论入口;
7.响应于针对目标信息对应评论入口的触发操作,在所述目标信息的评论编辑区域中显示至少一个表情素材;
8.其中,所述目标信息是所述信息流中待评论的信息,所述至少一个表情素材与所述信息流的高频评论用词相关,所述评论编辑区域用于基于所述至少一个表情素材发表与所述目标信息对应的评论。
9.本技术实施例提供一种信息流的互动处理装置,包括:
10.显示模块,用于显示信息流中的至少一条信息、以及与所述至少一条信息对应的评论入口;响应于针对目标信息对应评论入口的触发操作,在所述目标信息的评论编辑区域中显示至少一个表情素材;其中,所述目标信息是所述信息流中待评论的信息,所述至少一个表情素材与所述信息流的高频评论用词相关,所述评论编辑区域用于基于所述至少一个表情素材发表与所述目标信息对应的评论。
11.上述方案中,所述信息流的高频评论用词包括:所述目标信息的热点评论中的关键词,所述关键词的热度值大于热度阈值;所述显示模块,还用于:
12.在所述目标信息的评论编辑区域中,按照顺序显示与所述目标信息的热点评论中的关键词相关的多个表情素材;
13.其中,所述多个表情素材的排序方式包括:所述表情素材对应的关键词在所述目标信息的多个历史的评论中的热度值;所述表情素材被用于编辑评论的使用频率。
14.上述方案中,所述信息流的高频评论用词包括:所述目标信息的热点评论中的关键词,所述关键词的热度值大于热度阈值;所述显示模块,还用于:
15.响应于评论编辑操作,获取在所述评论编辑区域中输入的文本;
16.当所述文本包括所述目标信息的热点评论中的关键词时,确定将在所述评论编辑区域中显示所述至少一个表情素材。
17.上述方案中,所述信息流的高频评论用词包括:互动账号发表的评论中的关键词,其中,所述互动账号是与登录账号存在互动关系的账号,所述登录账号是用于获取并显示所述信息流的账号;所述显示模块,还用于:
18.响应于评论编辑操作,获取在所述评论编辑区域中输入的文本;
19.当识别出所述文本包括所述互动账号发表的评论中的关键词时,确定将在所述评论编辑区域中显示与所述互动账号发表的评论中的关键词相关的至少一个表情素材。
20.上述方案中,所述显示模块,还用于:
21.在识别出所述文本包括的关键词之前,按照顺序在所述评论编辑区域中显示与多个所述关键词一一对应的多个表情素材,其中,所述多个表情素材的排序方式包括:所述表情素材对应的关键词在所述目标信息的多个历史的评论中的热度值;所述表情素材被用于编辑评论的使用频率;
22.在识别出与所述文本包括的关键词之后,在所述评论编辑区域中突出显示与所述关键词对应的表情素材,其中,所述突出显示的方式包括以下至少之一:高亮显示、放大显示、文字提示、语音提示、排序前置。
23.上述方案中,所述显示模块,还用于:
24.在识别出所述文本包括的关键词之前,在所述评论编辑区域中按照顺序显示多个预设的表情素材,其中,所述多个预设的表情素材的排序方式包括:所述表情素材被用于编辑评论的使用频率;
25.在识别出与所述文本包括的关键词之后,在所述评论编辑区域中插入并突出显示与所述关键词对应的表情素材,其中,所述突出显示的方式包括以下至少之一:高亮显示、放大显示、文字提示、语音提示、排序前置。
26.上述方案中,所述显示模块,还用于:
27.根据与所述目标信息的处于显示状态的评论中的关键词对应的表情素材、登录账号参与互动的评论中的关键词对应的表情素材至少之一,实时更新显示所述目标信息的评论编辑区域;其中,所述登录账号是用于获取并显示所述信息流的账号。
28.上述方案中,所述显示模块,还用于:
29.显示所述信息流中至少一条信息的至少部分内容,响应于信息选择操作,显示被选中的所述目标信息的详情内容、所述目标信息的至少部分评论以及与所述目标信息对应的评论入口;或者
30.显示所述信息流中的至少一条信息的至少部分内容以及与每条所述信息对应的评论入口。
31.上述方案中,所述显示模块,还用于:
32.确定登录账号在所述信息流中的活跃程度,其中,所述登录账号是用于获取并显示所述信息流的账号;
33.在所述目标信息的评论编辑区域中显示数量与所述活跃程度正相关的表情素材。
34.上述方案中,所述显示模块,还用于:
35.响应于登录账号的评论发布操作,其中,所述登录账号是用于获取并显示所述信
息流的账号,将所述登录账号在所述评论编辑区域中输入的文本、以及在所述至少一个表情素材中选中的表情素材组合为评论,并
36.基于所述登录账号的身份发送到发布所述信息流的服务器,以使所述服务器同步到获取所述信息流的其他账号。
37.上述方案中,所述显示模块,还用于:
38.响应于登录账号的评论发布操作,其中,所述登录账号是用于获取并显示所述信息流的账号,将所述登录账号在所述评论编辑区域中输入的文本作为评论,基于所述登录账号的身份发送到发布所述信息流的服务器,以使所述服务器同步到获取所述信息流的其他账号;
39.将自动在所述至少一个表情素材中选中的至少一个表情素材作为评论,基于所述登录账号的身份或评论机器人的身份发送到发布所述信息流的服务器,以使所述服务器同步到获取所述信息流的其他账号。
40.上述方案中,所述显示模块,还用于:
41.响应于登录账号的自动跟评目标评论的评论发布操作,其中,所述登录账号是用于获取并显示所述信息流的账号,所述目标评论是所述目标信息的处于显示状态的评论,将在与所述目标评论相关的所述至少一个表情素材中选中的至少一个表情素材作为评论,并
42.基于所述登录账号的身份或评论机器人的身份发送到发布所述信息流的服务器,以使所述服务器同步到获取所述信息流的其他账号。
43.上述方案中,所述显示模块,还用于:
44.通过以下方式获取与所述目标信息的评论相关的至少一个表情素材:
45.获取所述目标信息的多个评论;
46.确定每个所述评论中的词语对应的热度值;
47.将热度值高于热度阈值的词语作为关键词,并将包括所述关键词的评论作为第一热点评论;
48.基于所述第一热点评论生成对应的表情素材。
49.上述方案中,所述显示模块,还用于:
50.确定信息流的多条信息中每条信息对应的评论的文本向量;
51.对所述多条信息的评论对应的文本向量进行聚类处理,得到至少一个聚类中心;
52.确定与每个所述聚类中心相似的文本向量的数量,将所述数量超过聚类阈值的聚类中心作为热点聚类中心;
53.确定所述多条信息的评论对应的文本向量中与所述热点聚类中心相似的至少一个文本向量,并将所述至少一个文本向量对应的信息的评论作为第二热点评论;
54.将所述第一热点评论和所述第二热点评论的并集作为热点评论集合;
55.生成与所述热点评论集合中的每个评论对应的表情素材。
56.上述方案中,所述显示模块,还用于:
57.获取在采样周期中发表的对应所述目标信息的多个评论;当所述多个评论的数量小于数量阈值时,其中,所述数量阈值是用于识别热点评论的最小值,按照发表时间从新到旧的顺序,获取所述目标信息中与所述数量阈值对应的多个评论;或者,
58.基于至少一个维度确定对应登录账号的关联账号,其中,所述登录账号是用于获取并显示所述信息流的账号,所述维度包括以下至少一种:与所述登录账号的社交距离、与所述登录账号的地理距离;获取所述关联账号针对所述目标信息发表的多个评论。
59.上述方案中,所述显示模块,还用于:
60.基于所述第一热点评论确定文本素材,其中,所述文本素材包括以下至少之一:所述第一热点评论、所述第一热点评论中的关键词、与所述第一热点评论的语义相同的其他文本;
61.从多个候选素材图像中获取与所述第一热点评论的情感特征匹配的图像素材,或者对所述候选素材图像与所述第一热点评论的情感特征进行融合处理,得到所述图像素材;
62.将所述文本素材和所述图像素材组合为表情素材。
63.本技术实施例提供一种电子设备,包括:
64.存储器,用于存储可执行指令;
65.处理器,用于执行所述存储器中存储的可执行指令时,实现本技术实施例提供的信息流的互动处理方法。
66.本技术实施例提供一种计算机可读存储介质,存储有可执行指令,用于被处理器执行时,实现本技术实施例提供的信息流的互动处理方法。
67.本技术实施例提供了一种计算机程序产品或计算机程序,所述计算机程序产品或所述计算机程序包括计算机指令,所述计算机指令存储在计算机可读存储介质中,计算机设备的处理器从所述计算机可读存储介质读取所述计算机指令,处理器执行所述计算机指令,使得所述计算机设备执行本技术实施例提供的信息流的互动处理方法。
68.本技术实施例具有以下有益效果:
69.当接收到针对目标信息对应评论入口的触发操作时,在目标信息的评论编辑区域中显示与信息流的高频评论用词相关的至少一个表情素材,使得用户可将表情素材作为评论进行发表,无需编辑文字,提高了评论编辑和发表的效率,且表情素材可以形象地传达用户对目标信息的主观情感,丰富了评论的表现形式。
附图说明
70.图1a是本技术实施例提供的互动处理系统10的架构示意图;
71.图1b是本技术实施例提供的互动处理系统10的架构示意图;
72.图2a是本技术实施例提供的信息流的互动处理方法的流程示意图;
73.图2b是本技术实施例提供的信息流的互动处理方法的流程示意图;
74.图3a是本技术实施例提供的信息流页面的示意图;
75.图3b是本技术实施例提供的目标信息的详情页面的示意图;
76.图3c是本技术实施例提供的信息流页面的示意图;
77.图3d是本技术实施例提供的表情素材的排序的示意图;
78.图3e是本技术实施例提供的表情素材的排序的示意图;
79.图3f是本技术实施例提供的更新表情素材的示意图;
80.图3g是本技术实施例提供的自动跟评的示意图;
81.图3h是本技术实施例提供的触发自动跟评的示意图;
82.图4是本技术实施例提供的互动处理系统的组成示意图;
83.图5是本技术实施例提供的热点评论挖掘的示意图;
84.图6是本技术实施例提供的表情素材生成的示意图;
85.图7是本技术实施例提供的确定热点评论的流程示意图;
86.图8是本技术实施例提供的训练bert模型的示意图;
87.图9是本技术实施例提供的向量化的示意图;
88.图10是本技术实施例提供的评论的文本向量与聚类中心的距离的示意图;
89.图11是本技术实施例提供的表情素材的示意图;
90.图12申请实施例提供的生成表情素材的示意图;
91.图13是本技术实施例提供的发表评论的示意图;
92.图14是本技术实施例提供的终端400

1的结构示意图。
具体实施方式
93.为了使本技术的目的、技术方案和优点更加清楚,下面将结合附图对本技术作进一步地详细描述,所描述的实施例不应视为对本技术的限制,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本技术保护的范围。
94.在以下的描述中,涉及到“一些实施例”,其描述了所有可能实施例的子集,但是可以理解,“一些实施例”可以是所有可能实施例的相同子集或不同子集,并且可以在不冲突的情况下相互结合。
95.在以下的描述中,所涉及的术语“第一/第二/第三”仅仅是是区别类似的对象,不代表针对对象的特定排序,可以理解地,“第一/第二/第三”在允许的情况下可以互换特定的顺序或先后次序,以使这里描述的本技术实施例能够以除了在这里图示或描述的以外的顺序实施。
96.除非另有定义,本文所使用的所有的技术和科学术语与属于本技术的技术领域的技术人员通常理解的含义相同。本文中所使用的术语只是为了描述本技术实施例的目的,不是旨在限制本技术。
97.对本技术实施例进行进一步详细说明之前,对本技术实施例中涉及的名词和术语进行说明,本技术实施例中涉及的名词和术语适用于如下的解释。
98.1)终端:用户所使用的可以接收消息的电子设备,电子设备中安装有智能操作系统。
99.2)用户:使用电子设备的人。
100.3)终端程序:运行在终端上的产品,有各种功能,例如即时通讯程序、购物程序、浏览器程序等。
101.4)信息流产品:终端程序的一种产品形式,可以在这种产品上获得各种视频和文章信息。
102.5)评论:用户针对信息流产品中的视频或文章的回复。
103.6)表情素材:即表情包,它是以图像为特色的数字媒体块,是在社交软件或社交网站兴起后形成的一系列图像,通常以时下流行的名人、语录、漫画、影视截图等作为素材,配
上一系列相匹配的文字,用以表达特定的情感。
104.7)热点:一定时间内引起大规模用户关注的事件。
105.8)基于变换器的双向编码表征网络(bert,bidirectional encoder representations from transformers):利用文本的左、右语境来预训练深度双向神经网络的表征,在微调阶段,仅需要少量标注数据即可完成特定任务的训练。
106.9)k

均值聚类(k

means clustering)算法:也称为“k

means算法”,它是源于信号处理中的一种向量量化方法,现在则更多地作为一种聚类分析方法流行于数据挖掘领域。它的目的是将n个点(可以是样本的一次观察或一个实例)划分到k个聚类中,使得每个点都属于离它最近的均值(此即聚类中心)对应的聚类,以之作为聚类的标准。
107.10)n元语法(n

gram):指文本中连续出现的n个语词。n元语法模型是基于(n

1)阶马尔可夫链的一种概率语言模型,通过n个语词出现的概率来推断语句的结构。
108.相关技术中发表评论时需要的编辑时间较长,发评效率较低,且评论难以形象地表达出用户对信息的主观情感。针对上述问题,本技术实施例提供一种信息流的互动处理方法、装置、电子设备和计算机可读存储介质,能够提高评论编辑的效率,丰富评论的表现形式。
109.本技术实施例提供的信息流的互动处理方法可以由各种电子设备实施,例如,可以由终端单独实施,也可以由服务器和终端协同实施。例如终端独自执行下文所述的信息流的互动处理方法,或者,由终端和服务器协同执行下文所述的信息流的互动处理方法。例如,终端响应于针对信息流中目标信息所对应的评论入口的触发操作,在目标信息的评论编辑区域中显示至少一个表情素材,响应于登录账号针对评论编辑区域中输入的内容(如文本和表情素材)的评论发布操作,将评论编辑区域中输入的内容发送到发布信息流的服务器,服务器将该内容同步给获取信息流的其他账号对应的终端。
110.本技术实施例中,服务器可以是独立的物理服务器,也可以是多个物理服务器构成的服务器集群或者分布式系统,还可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、cdn、以及大数据和人工智能平台等基础云计算服务的云服务器;测试设备可以是智能手机、平板电脑、笔记本电脑、台式计算机、智能电视等,但并不局限于此。测试设备以及服务器可以通过有线或无线通信方式进行直接或间接地连接,本技术实施例对此不做限制。
111.以服务器为例,例如可以是部署在云端的服务器集群,向用户开放人工智能云服务(aiaas,ai as a service),aiaas平台会把几类常见的ai服务进行拆分,并在云端提供独立或者打包的服务,这种服务模式类似于一个ai主题商城,所有的用户都可以通过应用程序编程接口的方式来接入使用aiaas平台提供的一种或者多种人工智能服务。
112.例如,其中的一种人工智能云服务可以是互动处理服务,即云端的服务器封装有本技术实施例提供的互动处理程序。终端响应于针对信息流中目标信息所对应的评论入口的触发操作,向云端的服务器发送表情素材获取指令,云端的服务器在接收到表情素材获取指令后,调用封装的互动处理程序,对信息流中的信息的评论进行分析,并生成与目标信息的评论相关的至少一个表情素材,将至少一个表情素材发送给终端,以在终端的目标信息的评论编辑区域中显示至少一个表情素材。
113.参见图1a,图1a是本技术实施例提供的互动处理系统10的架构示意图,登录账号
对应的终端400

1通过网络300连接服务器200,网络300可以是广域网或者局域网,又或者是二者的组合。终端400

1响应于针对信息流中目标信息所对应的评论入口的触发操作,在目标信息的评论编辑区域中显示至少一个表情素材,响应于登录账号针对评论编辑区域中输入的评论(如文本和表情素材)的评论发布操作,将评论编辑区域中的评论发送到发布信息流的服务器200,服务器200将该评论同步给获取信息流的其他账号对应的终端400

2。
114.在一些实施例中,参见图1b,图1b是本技术实施例提供的互动处理系统10的架构示意图,服务器和终端都可以加入区块链网络500而成为其中的一个节点(即运行有区块链网络500中的一个节点)。区块链网络500的类型是灵活多样的,例如可以为公有链、私有链或联盟链中的任意一种。以公有链为例,任何业务主体的电子设备例如服务器,都可以在不需要授权的情况下接入区块链网络500,以作为区块链网络500的共识节点,例如,服务器200映射为区块链网络500中的共识节点500

2,终端400

2映射为区块链网络500中的共识节点500

0,终端400

3映射为区块链网络500中的共识节点500

1。
115.以区块链网络500为联盟链为例,服务器在获得授权后可以接入区块链网络500。服务器200在接收到终端400

1发送的目标信息的评论后,在将评论同步给获取信息流的其他账号对应的终端之前,先确定目标信息对应的第一热点评论,并将第一热点评论发送给其他终端(如终端400

2和终端400

3),其他终端可以通过执行智能合约的方式对第一热点评论进行确认,以验证终端400

1所确定的第一热点评论是否为热点评论。当超过数目阈值的节点确认验证通过时,将对其签署数字签名(即背书),当第一热点评论有足够的背书时,服务器200基于第一热点评论生成对应的表情素材,并从生成的表情素材中获取与终端400

1所发送的评论中的关键词对应的表情素材,将表情素材作为跟评和评论一起发送给其他终端。同时,区块链网络500会将第一热点评论进行上链存储。当其他账号发表评论时,可通过存储的第一热点评论确定其他账号发表的评论中是否含有关键词。
116.可见,本技术实施例中通过热点评论集合中的第一热点评论进行共识验证的方式,可以保证第一热点评论的精确性。
117.下面将结合附图对本技术实施例提供的信息流的互动处理方法进行说明,下述信息流的互动处理方法的执行主体可以为终端,具体可以是终端通过运行上文的各种计算机程序来实现的,也可以由客户端、操作系统、软件模块、脚本或小程序执行计算机程序来实现;当然,根据对下文的理解,不难看出也可以由终端和服务器协同实施本技术实施例提供的信息流的互动处理方法。
118.参见图2a,图2a是本技术实施例提供的信息流的互动处理方法的流程示意图,将结合图2a示出的步骤进行说明。
119.在步骤101中,获取信息流。
120.在一些实施例中,终端可以主动从服务器获取信息流,也可以由服务器向终端推送信息流。所获取的信息流可以呈现于中终端的各种信息流产品中,如即时通讯应用、浏览器应用、购物应用、直播应用等。信息流包括多条信息,信息的类型可以是社会、科技、体育、娱乐等。信息中可以包括文本、图像、视频、音频等内容。
121.在步骤102中,显示信息流中的至少一条信息、以及与至少一条信息对应的评论入口。
122.在一些实施例中,显示信息流中的至少一条信息、以及与至少一条信息对应的评
论入口,可以采用以下方式实现。显示信息流中至少一条信息的至少部分内容,响应于信息选择操作,显示被选中的目标信息的详情内容、目标信息的至少部分评论以及与目标信息对应的评论入口。
123.在获取信息流后,将在信息流页面中对信息流进行显示。当信息流中的信息过多,无法在信息流页面中完整显示全部信息时,可以在信息流页面中显示部分信息(至少一条信息),并可以通过拖拉滚动条(横向滚动条或纵向滚动条)或滑动信息流页面等方式浏览全部信息。在显示部分信息时,可以显示信息的完整内容,也可以显示信息的至少部分内容(如全文、摘要、配图等)。例如对于新闻,可以在信息流页面中显示信息的摘要和配图。响应于针对信息流页面中目标信息的信息选择操作,在目标信息的详情页面中显示被选中的目标信息的详情内容、目标信息的至少部分评论以及与目标信息对应的评论入口。其中,当目标信息的评论较少(未超过预设评论数量,或者在目标信息的详情页面中可以完全呈现所有评论)时,显示所有评论;当目标信息的评论较多(超过预设评论数量,或者在目标信息的详情页面中无法完全呈现所有评论)时,可以对评论有选择性的进行显示,例如,可以显示最热门的部分评论、最新的部分评论、或者与获取信息流的登录账号存在互动关系的互动账号所发布的评论等,并通过评论展开入口对其他的评论折叠显示,当评论展开入口被触发时,显示所有评论。
124.如图3a所示,图3a是本技术实施例提供的信息流页面的示意图。在信息流页面中显示了部分信息的部分内容(摘要和附图),响应于针对目标信息301的信息选择操作,显示图3b所示的目标信息的详情页面,因为目标信息的评论较少,只有1条,因此,评论可以完全显示,同时显示目标信息对应的评论入口302,可通过评论入口302对目标信息进行评论。如此,用户可在详情页面中对信息的具体内容进行了解后,对其进行客观的评论。
125.在另一些实施例中,显示信息流中的至少一条信息、以及与至少一条信息对应的评论入口,还可以采用以下方式实现:显示信息流中的至少一条信息的至少部分内容以及与每条信息对应的评论入口。在一些可能的示例中,在显示信息流中的多条信息的同时,还可以显示每个信息下已有的多条评论。
126.如图3c所示,图3c是本技术实施例提供的信息流页面的示意图。图3c中,所显示的每个信息下都有对应的评论入口,例如,第一个信息下显示了对应的评论入口303,用户可通过评论入口303对第一个信息进行评论。
127.如此,在信息流页面中显示每个信息对应的评论入口,用户不需要进入信息的详情页面,也能对信息进行评论,可以提高用户对信息的参与度,还可帮助用户通过信息流页面中显示的信息已有的评论了解信息的大概内容,确定信息是否值得浏览,帮助用户做出浏览决定,节省选择时间,并节省了进入详情页面和退出详情页面的繁复操作。
128.在步骤103中,响应于针对目标信息对应评论入口的触发操作,在目标信息的评论编辑区域中显示至少一个表情素材。
129.在一些实施例中,目标信息可以是信息流中待评论的信息,即登录账号可以对该信息进行评论,同时,可以存在多个其他账号针对目标信息已发布的评论。表情素材是用于表达用户情感的图像,包括静态图像(如emoji情感符号)和动图,表情素材默认显示于评论编辑区域中。评论编辑区域用于基于至少一个表情素材发表与目标信息对应的评论。高频评论用词包括以下至少一种:目标信息的热点评论中的关键词、信息流的全部信息的热点
评论中的关键词。关键词是热度值大于热度阈值的词语。与信息流的高频评论用词相关的至少一个表情素材包括以下至少一种:与目标信息的热点评论中的关键词相关的至少一个表情素材、与信息流的全部信息的热点评论中的关键词相关的至少一个表情素材。
130.在一些实施例中,在目标信息的评论编辑区域中显示至少一个表情素材之前,需要可以通过图2b中的步骤1031至步骤1034获取与目标信息的评论相关的至少一个表情素材。
131.在步骤1031中,获取目标信息的多个评论。
132.在一些实施例中,获取目标信息的多个评论,可以采用以下方式实现。获取在采样周期中发表的对应目标信息的多个评论;当多个评论的数量小于数量阈值时,按照发表时间从新到旧的顺序,获取目标信息中与数量阈值对应的多个评论。
133.其中,采样周期即获取评论的间隔时间的粒度,采样周期可以是12小时、一天、一周等。数量阈值是用于识别热点评论的最小值。获取在采样周期中发表的对应目标信息的多个评论后,确定多个评论的数量,若数量大于或等于数量阈值,则执行步骤1032。若数量小于数量阈值,由于数量较少,无法准确识别出热点评论,此时,不再以采样周期为限制,按照发表时间的顺序,获取与数量阈值相同数量的多个评论。例如,设置的采样周期为1天,数量阈值为100,若目标信息在1天中的评论为50个,小于数量阈值,则按照评论的发表时间,获取前100个评论。如此,可以确保获取的评论的数量,方便后续准确确定出热点评论。
134.在另一些实施例中,获取目标信息的多个评论,还可以采用以下方式实现。基于至少一个维度确定对应登录账号的关联账号。获取关联账号针对目标信息发表的多个评论。
135.其中,登录账号是用于获取并显示信息流的账号,维度包括以下至少一种:与登录账号的社交距离、与登录账号的地理距离。社交距离表示从登录账号到达关联账号需要经过的中间账号的数量。基于至少一个维度确定对应登录账号的关联账号,可以是将与登录账号的社交距离在社交距离阈值内的账号作为关联账号,也可以是将与登录账号的地理距离在地理距离阈值内的账号作为关联账号。若关联账号中存在至少一个账号针对目标信息发表了评论,获取至少一个账号所发表的评论。相对于一般评论而言,登录账号对应的用户更有可能关注与之存在关联的关联账号所发表的评论,因此,获取关联账号所发表的评论,可以方便后续确定出用户所关心的热点评论。
136.需要说明的是,当与信息流的高频评论用词相关的至少一个表情素材包括与信息流的全部信息的热点评论中的关键词相关的至少一个表情素材时,上述获取目标信息的多个评论,实际上是获取信息流中所有信息的多个评论,此时,获取信息流中所有信息的多个评论的方式与获取目标信息的多个评论的方式一样,且步骤1032至步骤1034同样适用。
137.在步骤1032中,确定每个评论中的词语对应的热度值。
138.在一些实施例中,先对评论进行分词处理,得到对应的分词处理结果。例如,评论为“我今天送了同桌一束花”,经过分词处理,分词处理结果(即得到的词语)分别为:我、今天、送了、同学、一束、花。
139.n

gram可用于确定在一句话的一个词或者多个词后面出现特定的词的概率,例如,对于“今天天气很好”,n

gram可确定出“天气”出现在“今天”之后的概率,即“今天天气”这个词语出现的概率。在本技术实施例中,可通过n

gram确定基于分词处理结果确定评论中所有可能的词语。当n=1时,得到的是单个的词语,与分词处理结果一致。当n=2时,是将
分词处理结果中相邻的两个词语按顺序组合在一起形成的词语,可以为:我今天、今天送了、送了同学、同学一束、一束花。当n=3时,是将分词处理结果中顺序相邻的三个词语按顺序组合在一起形成的词语,可以为:我今天送了、今天送了同学、送了同学一束、同学一束花。本技术实施例获取n分别为不同数值时的词语,可以得到评论对应的所有可能的词语。例如,n分别取值为1、2、3,则对于评论“我今天送了同桌一束花”,可以得到对应的所有可能的词语为:我、今天、送了、同学、一束、花、我今天、今天送了、送了同学、同学一束、一束花、我今天送了、今天送了同学、送了同学一束、同学一束花。
140.相关技术只会确定单个词语的热度值,而实际生活中关键词或热点评论通常并不以一个词语的形式出现,而是由多个词语组成。本技术实施例通过n

gram确定所有可能的词语,这些词语可以是单个的词,也可以是由多个词组成,从而大大增加了候选的关键词的数量,提高了所确定的关键词和热点评论的精确性。
141.然后,统计每个词语在所有评论中出现的频次,作为对应的词频,例如,采样周期为一周,而在一周的所有评论中,词语“今天送了”一共出现了3次,则它的词频为3。
142.之后,可基于每个词语的词频计算对应的热度值。热度值是用于衡量词语的热度的数值。在一些可能的示例中,对于评论中的第i个词语,可以通过如下公式(1)计算它的热度值
[0143][0144]
其中,count(w
i
)表示每个词语在统计词频当天对应的词频;t表示时间,其取值范围为d~t,t=6,d为统计词频当天与之前某一天(相差时间在一周内的某一天)的时间差,其取值范围为0~6。
[0145]
如此,可以精确地确定出每个词语的热度值,并确定对应的词语是否为关键词。
[0146]
在步骤1033中,将热度值高于热度阈值的词语作为关键词,并将包括关键词的评论作为第一热点评论。
[0147]
在一些实施例中,可以将热度值高于热度阈值的词语作为关键词,也可以将词语按照热度值进行降序排序,并将排序靠前的多个词语作为关键词。相应地,将包括关键词的评论作为第一热点评论。例如,关键词为“我今天”,则第一热点评论可以是“我今天打扫屋子了”。
[0148]
在步骤1034中,基于第一热点评论生成对应的表情素材。
[0149]
在一些实施例中,基于第一热点评论生成对应的表情素材,可以采用以下方式实现。首先,确定信息流包括的多条信息中每条信息对应的评论的文本向量。可以通过bert模型、文本卷积神经网络(text cnn,text convolutional neural networks)、长短期记忆网络(lstm,long short

term memory)、微(tiny)bert模型等模型生成评论对应的文本向量。
[0150]
然后,对多条信息的评论对应的文本向量进行聚类处理,得到至少一个聚类中心。在一些可能的示例中,可以通过k

means算法、均值漂移聚类、基于密度的聚类、凝聚层次聚类等方法确定聚类中心。
[0151]
可以先将多个评论对应的文本向量随机划分为多类,并初始化各类的中心向量(中心处的文本向量);计算每个文本向量到每个中心向量的距离,将距离小于距离阈值的文本向量划分到对应的中心向量所在的类中;重新将每一类中与各个文本向量的距离相同
的文本向量作为这一类中的中心向量,并将中心向量作为聚类中心。其中,上述计算距离,重新划分文本向量,以及重新确定中心向量的步骤可以迭代执行多次,直至每一类的中心向量在迭代后基本不变,即可停止迭代,并将最后的中心向量作为聚类中心。如此,可以准确地确定出多个文本向量中的聚类中心,而聚类中心是最有可能为热点评论对应的文本向量。
[0152]
之后,确定与每个聚类中心相似的文本向量的数量,将对应数量超过文本向量数量阈值的聚类中心作为热点聚类中心。
[0153]
在一些可能的示例中,可以计算每类中的文本向量与聚类中心的欧式距离,并将欧式距离小于预设距离的文本向量作为与聚类中心相似的文本向量。统计每一类中与聚类中心相似的文本向量的数量,将对应数量超过文本向量数量阈值的聚类中心作为热点聚类中心。其中,欧式距离可以用余弦距离、曼哈顿距离、皮尔逊相关系数等进行代替。可见,热点聚类中心是与多数文本向量间语义较近(欧式距离小)的文本向量,可以通过计算向量间的距离快速确定出热点聚类中心。
[0154]
之后,确定多条信息的评论对应的文本向量中与热点聚类中心相似的至少一个文本向量,并将至少一个文本向量对应的信息的评论作为第二热点评论,将第一热点评论和第二热点评论的并集作为热点评论集合。热点聚类中心对应的评论是热点评论,相应地,与热点聚类中心相似的文本向量对应的评论也是热点评论。热点评论集合中的热点评论可以通过计算热度值确定,也可以通过评论的文本向量所对应的聚类中心确定。如此,可以增加热点评论数量,从而为用户提供更多对应的表情素材。
[0155]
最后,生成与热点评论集合中的每个评论对应的表情素材。
[0156]
在一些实施例中,基于所述第一热点评论生成对应的表情素材,可以采用以下方式实现。基于第一热点评论确定文本素材,其中,文本素材包括以下至少之一:第一热点评论、第一热点评论中的关键词、与第一热点评论的语义相同的其他文本;从多个候选素材图像中获取与第一热点评论的情感特征匹配的图像素材,或者对候选素材图像与第一热点评论的情感特征进行融合处理,得到图像素材;将文本素材和图像素材组合为表情素材。
[0157]
其中,候选素材图像可以是网络图像,也可以是用户的人脸图像。以候选素材图像是人脸图像为例,提取第一热点评论的情感特征,并提取候选素材图像的情感特征,计算二者的情感特征的相似度,当相似度大于相似度阈值时,确定候选素材图像与第一热点评论匹配,此时,人脸图像中的人脸表情(如微笑的表情)与第一热点评论(开心)所表达的情感相对应。在一些可能的示例中,当候选素材图像存在对应的标签(如“笑脸”、“哭泣”、“难过”等)时,也可以提取标签的情感特征,对第一热点评论的情感特征与候选素材图像的标签的情感特征进行匹配,将匹配的标签对应的候选素材图像作为图像素材。例如,第一热点评论的情感特征表征喜悦的心情,标签为“笑脸”的候选素材图像是与之匹配的图像素材。可见,本技术实施例通过获取与第一热点评论的情感特征匹配的图像素材,可以找出准确传达热点评论的情感的表情素材,无需对表情素材进一步加工,直接可用,更为便捷。
[0158]
在一些可能的示例中,对候选素材图像与第一热点评论的情感特征进行融合处理,得到图像素材,这一过程可以通过自编码网络模型等神经网络模型对第一热点评论和候选素材图像进行编码处理,得到对应的情感特征,并对得到的情感特征进行解码处理,生成表达对应情感的图像素材。例如,可以对用户的人脸图像和第一热点评论(开心)的情感
特征进行融合处理,生成微笑的人脸图像。可见,本技术实施例通过融合候选素材图像与第一热点评论的情感特征,可以得到对应的图像素材,在保留候选素材图像原本内容的同时,可以通过表情素材传递出热点评论中的情感,且素材图像整体更为自然生动。
[0159]
在一些可能的示例中,还可以将文本素材和已有的背景模板进行融合,生成对应的表情素材;或者将图像素材与已有的背景模板进行融合,生成对应的表情素材。
[0160]
在一些实施例中,信息流的高频评论用词包括以下至少一种:目标信息的热点评论中的关键词、信息流的全部信息的热点评论中的关键词,关键词的热度值大于热度阈值。在目标信息的评论编辑区域中显示至少一个表情素材之前,响应于评论编辑操作,获取在评论编辑区域中输入的文本;当文本包括目标信息的热点评论中的关键词时,或文本包括信息流的全部信息中的热点评论中的关键词时,确定将在评论编辑区域中显示至少一个表情素材。
[0161]
其中,评论编辑区域中的表情素材是按照默认排序显示的,当确定文本包括热点评论中的关键词时,会将关键词对应的至少一个表情素材的位置调整到评论编辑区域的前方,将其他表情素材的排序顺序后移,因此,之后将在评论编辑区域中显示与关键词相关的至少一个表情素材。如此,可以方便用户选用与文本中关键词对应的表情素材发表评论,命中用户使用需求,快速找到符合需求的表情素材,提高关键词对应的表情素材的使用率,提高用户的发评次数,并提高用户体验感。
[0162]
在一些实施例中,与目标信息的评论相关的至少一个表情素材包括:互动账号发表的评论(例如热点评论)中的关键词相关的至少一个表情素材,其中,互动账号是与登录账号存在互动关系的账号,登录账号是用于获取并显示信息流的账号。在目标信息的评论编辑区域中显示至少一个表情素材之前,响应于评论编辑操作,获取在评论编辑区域中输入的文本;当识别出文本包括互动账号发表的评论中的关键词时,确定将在评论编辑区域中显示与互动账号发表的评论中的关键词相关的至少一个表情素材。
[0163]
其中,互动关系包括评论关系、点赞关系、转发关系等。当识别出文本包括互动账号发表的评论中的关键词时,将在评论编辑区域中显示与关键词相关的至少一个表情素材,如此,可以方便用户选用这些表情素材发表评论,因为这些表情素材是与互动账号发表的评论中的关键词相关的,即这些表情素材也是互动账号常用的、关注的素材,所以,可以吸引互动账号对用户发表的评论进行追评,促进用户间的评论互动。
[0164]
在一些实施例中,在目标信息的评论编辑区域中显示至少一个表情素材,可以采用以下方式实现。在目标信息的评论编辑区域中,按照顺序显示与目标信息的热点评论中的关键词相关的多个表情素材;其中,多个表情素材的排序方式包括:表情素材对应的关键词在目标信息的多个历史的评论中的热度值;表情素材对应的关键词在信息流的所有信息的历史评论中的热度值;表情素材被用于编辑评论的使用频率。
[0165]
其中,表情素材被用于编辑评论的使用频率,可以是用于编辑目标信息中的评论时的使用频率,也可以是用于编辑信息流的所有信息中的评论时的使用频率。当表情素材对应的评论是通过计算热度值确定时,根据热度值对表情素材进行降序排序,并将降序排序后的表情素材显示于目标信息的评论编辑区域中。例如,图3d中,在评论编辑区域304中显示了多个表情素材,且这多个表情素材都是根据热度值降序排序显示的。如此,可以将最热门的表情素材排在评论编辑区域的最前面,方便用户使用热门的表情素材进行评论,提
高热门的表情素材的使用率。
[0166]
当表情素材对应的评论是通过k

means算法等确定时,统计评论编辑区域中的至少一个表情素材被用于编辑评论的使用频率,并根据使用频率对表情素材进行降序排序,并将降序排序后的表情素材显示于目标信息的评论编辑区域中。如此,可以将大众惯用的表情素材排在评论编辑区域的前面,方便用户选用常用的表情素材进行评论,减少表情素材的查找时间。
[0167]
在一些实施例中,在目标信息的评论编辑区域中显示至少一个表情素材,可以采用以下方式实现。在识别出文本包括的关键词之前,按照顺序在评论编辑区域中显示与多个关键词一一对应的多个表情素材,其中,多个表情素材的排序方式包括:表情素材对应的关键词在目标信息的多个历史的评论中的热度值;表情素材被用于编辑评论的使用频率;在识别出与文本包括的关键词之后,在评论编辑区域中突出显示与关键词对应的表情素材,其中,突出显示的方式包括以下至少之一:高亮显示、放大显示、文字提示、语音提示、排序前置。其中,在识别出与文本包括的关键词之后,若与关键词对应的表情素材排序靠后,则将其排序前置,并可对其进行文字提示或语音提示;若与关键词对应的表情素材在前面,则可对其高亮显示、放大显示、文字提示或语音提示。
[0168]
如图3e所示,若登录账号在评论编辑区域中输入了文本“我也想吃!”,确定其对应的关键词为“吃”,在评论编辑区域中将与“吃”这一关键词对应的表情素材305的顺序调整至首位。如此,可以通过调整排序和提示等手段提示用户选用对应的表情素材发表评论,提高表情素材的使用率和针对性,也提高表情素材和评论中文本的相关性,使评论可以传达出更为丰富细致的情感。
[0169]
在一些实施例中,在目标信息的评论编辑区域中显示至少一个表情素材,可以采用以下方式实现。在识别出文本包括的关键词之前,在评论编辑区域中按照顺序显示多个预设的表情素材,其中,多个预设的表情素材的排序方式包括:表情素材被用于编辑评论的使用频率;在识别出与文本包括的关键词之后,在评论编辑区域中插入并突出显示与关键词对应的表情素材,其中,突出显示的方式包括以下至少之一:高亮显示、放大显示、文字提示、语音提示、排序前置。
[0170]
其中,预设的表情素材可以是普通的表情素材(如emoji情感符号),即默认不显示与关键词对应的表情素材。当识别出与文本包括的关键词之后,获取与关键词对应的表情素材,并将表情素材插入到评论编辑区域中(如最前方)突出显示。如此,可以方便用户选用与关键词对应的表情素材发表评论,优化用户体验,避免显示大量无用的表情素材,而挤占了普通的表情素材的显示空间。
[0171]
在一些实施例中,在目标信息的评论编辑区域中显示至少一个表情素材,可以采用以下方式实现。根据与目标信息的处于显示状态的评论中的关键词对应的表情素材、登录账号参与互动的评论中的关键词对应的表情素材至少之一,实时更新显示目标信息的评论编辑区域,以在评论编辑区域中显示表情素材;其中,登录账号是用于获取并显示信息流的账号。
[0172]
如图3f所示,对评论编辑区域306中的表情素材进行更新(将新增的表情素材置于首位,其余表情素材的位置相应后移),将得到新的评论编辑区域307。
[0173]
因为表情素材可以较为形象的传达用户的情感,当多个用户对同一信息的评论中
都用到同一表情素材时,说明用户们对该信息的情感类似,所以,通过目标信息的处于显示状态的评论中的关键词对应的表情素材,更新目标信息的评论编辑区域中的表情素材,可以方便用户在评论时快速选用表情素材表达自己的情感。通过登录账号参与互动的评论中的关键词对应的表情素材,更新目标信息的评论编辑区域中的表情素材,可以将评论编辑区域中的表情素材更新为用户惯用的表情素材,方便用户选用自己最熟悉的、最惯用的表情素材表达自己的情感。
[0174]
在一些实施例中,在目标信息的评论编辑区域中显示至少一个表情素材,可以采用以下方式实现。确定登录账号在信息流中的活跃程度,其中,登录账号是用于获取并显示信息流的账号;在目标信息的评论编辑区域中显示数量与活跃程度正相关的表情素材。
[0175]
在一些可能的示例中,也可以对所有用户开放所有表情素材的使用权限。
[0176]
可见,在本技术实施例中,用户可使用的表情素材的数量与其活跃程度正相关,即活跃程度越高,可使用的表情素材越多,如此,可以鼓励用户对信息进行更深的参与,例如,更长时间的深度阅读,更多的评论、转发、点赞等,从而提高用户粘性。
[0177]
在一些实施例中,响应于登录账号的评论发布操作,通过评论编辑操作将登录账号在评论编辑区域中输入的文本、以及在至少一个表情素材中选中的表情素材组合为评论,并基于登录账号的身份发送到发布信息流的服务器,以使服务器同步到获取信息流的其他账号。
[0178]
在一些可能的示例中,也可以将文本和表情素材作为不同的评论分别发布。
[0179]
在一些实施例中,响应于登录账号的评论发布操作,通过评论编辑操作将登录账号在评论编辑区域中输入的文本作为评论,基于登录账号的身份发送到发布信息流的服务器,以使服务器同步到获取信息流的其他账号;将自动在至少一个表情素材中选中的至少一个表情素材作为评论,基于登录账号的身份或评论机器人的身份发送到发布信息流的服务器,以使服务器同步到获取信息流的其他账号。其中,选中的表情素材是与评论编辑区域中输入的文本相关的。
[0180]
参见图3g,图3g是本技术实施例提供的自动跟评的示意图。在图3g中,昵称为“lucky”的登录账号发布的文本为“冲鸭”,服务器基于登录账号的身份发表的评论为下方的“冲鸭”表情素材308。如此,可以在用户发表评论后,自动获取评论相关的表情素材,并通过表情素材自动跟评。
[0181]
在一些实施例中,响应于登录账号的自动跟评目标评论的评论发布操作,目标评论是目标信息的处于显示状态的评论,将在与目标评论相关的至少一个表情素材中选中的至少一个表情素材作为评论,并基于登录账号的身份或评论机器人的身份发送到发布信息流的服务器,以使服务器同步到获取信息流的其他账号。其中,选中的表情素材是与评论编辑区域中输入的文本相关的。
[0182]
参见图3h,图3h是本技术实施例提供的触发自动跟评的示意图。在图3h中,在目标信息的每个评论下均有自动跟评按钮,响应于针对目标评论“冲鸭”中的自动跟评按钮309的触发操作(即评论发布操作),将在该目标评论下方以对应的“冲鸭”表情素材自动跟评,如图3g中的“冲鸭”表情素材308所示。如此,可以在用户触发自动跟评并发表评论后,通过表情素材实现自动跟评。
[0183]
可以看出,在本技术实施例中,当接收到针对目标信息对应评论入口的触发操作
时,在目标信息的评论编辑区域中显示与信息流的高频评论用词相关的至少一个表情素材,使得用户可将表情素材作为评论进行发表,无需编辑文字,提高了评论编辑和发表的效率,且表情素材可以形象地传达用户对目标信息的主观情感,丰富了评论的表现形式。
[0184]
下面,将说明本技术实施例提供的信息流的互动处理方法在一个实际的应用场景中的示例性应用。
[0185]
在信息流产品中,随着越来越多的内容的产生,用户在信息流中产生的互动行为也越来越多,包括点赞、转发、评论等。其中,评论最能展现用户思想和行为动作。用户在评论时,可以发布文字或者表情素材来表达自己的观点。在信息流产品中,每天产生的评论数量接近千万,其中,很多用户会表达同样的观点或者类似的观点,为了提高用户表达的效率,并提高评论编辑区域整体的氛围,需要对用户发布的评论进行引导,使用合法正向的表情素材引导用户发布积极向上的评论,使用有趣的表情素材促进用户发布评论的积极性。因此,需要对用户发表的评论中的热点、即热点评论进行识别,并根据热点的具体内容生产对应的表情素材并发表到评论编辑区域,引导用户使用这些表情素材进行评论。
[0186]
参见图4,图4是本技术实施例提供的互动处理系统的组成示意图。互动处理系统包括评论热点挖掘模块和评论表情素材生成模块。其中,评论热点挖掘模块和评论表情素材生成模块是后台服务器的功能模块。评论热点挖掘模块通过对当日发布的所有评论进行挖掘,找到当日新增的热点评论的中心思想和对应的评论内容。评论热点挖掘模块由两个子模块组成,分别为词频识别算法子模块和bert向量聚类算法子模块。结合图5说明上述模块的处理过程,词频识别算法子模块通过对评论进行分词,并使用n

gram得到每个评论对应的所有可能的词语,对词语进行日粒度词频计算,即以日为粒度统计确定每个词语的词频,根据每个词语的词频确定它们对应的热度值,得到热度值排序靠前的topn(n=10)个热点词(即关键词)及包含这些热点词的热点评论(即第一热点评论)。bert向量聚类算法子模块使用预训练的bert模型对所有的评论向量化,得到文本向量,并通过k

means算法对所有评论对应的文本向量进行聚类,确定聚类中心,统计与每个聚类中心相似的评论的数量(即图5中的单类别数量统计),确定数量超过评论数量上限(一般取2000)的聚类中心,并将这些聚类中心以及与之相似的文本向量对应的评论作为热点评论(即第二热点评论)。将通过词频识别算法子模块和bert向量聚类算法子模块确定出的热点评论取并集,可以得到热点评论集合。评论表情素材生成模块用于对热点评论集合中的热点评论进行处理。它包括两个子模块:表情素材生成子模块和表情素材发表子模块。表情素材生成子模块使用候选的表情素材,基于热点评论生成相应的热点表情素材,表情素材发表子模块将热点表情素材加入到评论编辑区域的热点表情库中。当用户需要发表的评论属于热点评论时,可以选择对应的热点表情素材进行发表。如此,可以大幅提高用户的发评次数,并促进用户使用表情素材发表相关评论,提高了用户对终端应用的使用时长和互动率。
[0187]
如图6所示,图6是本技术实施例提供的表情素材生成的示意图。分发的内容(如文章)将呈现在信息流产品中,获取用户发表的评论,并挖掘出热点评论,根据热点评论生成对应的表情素材。之后,识别用户在哪些内容下发表热点评论,将热点评论对应的表情素材发布在对应的内容评论编辑区域中,以促进更多用户使用和传播。
[0188]
以下对上文所述模块进行具体说明。
[0189]
1、评论热点挖掘模块
[0190]
1.1、词频识别算法子模块
[0191]
以下将通过图7中的步骤201至步骤205说明词频识别算法子模块确定热点评论的过程。
[0192]
步骤201,以天为粒度收集一周中的评论。
[0193]
步骤202,对一周中每一天的评论进行分词处理,得到每个评论对应的分词处理结果。
[0194]
例如,“我今天送了同桌一束花”,分词处理结果:“我,今天,送了,同学,一束,花”。
[0195]
步骤203,按照n

gram的方式确定每个评论对应的词语。
[0196]
其中,n

gram对分词处理结果中的词语进行组合,得到多个词语,可以增加候选的词语的数量。本技术实施例中,n的取值为1、2、3。例如,分词处理结果为“我、今天、送了、同学、一束、花”,则通过n

gram组合后的多个词语可以是“我、今天、送了、同学、一束、花、我今天、今天送了、送了同学、同学一束、一束花、我今天送了、今天送了同学、送了同学一束、同学一束花。”[0197]
步骤204,统计一周内所有评论对应的词语的词频。
[0198]
其中,词频即每个词语在所有评论中出现的次数。
[0199]
步骤205,使用词频差分算法计算每个词语的热度值,基于热度值对词语进行降序排序,将排序靠前的多个词语作为热点词,将包括热点词的评论作为热点评论。
[0200]
其中,词频差分算法对应的公式如上文中的公式(1)所示。基于热度值对词语降序排序后,可以将排序靠前的10个词语作为热点词。
[0201]
1.2、bert向量聚类算法子模块
[0202]
bert向量聚类算法子模块首先通过训练得到bert模型。如图8所示,通过无标注评论样本训练bert模型,其中,e1‑
e
n
表示输入,t1‑
t
n
表示输出,t
rm
表示中间向量,放大结构中的
“×
a”表示存在a个重复的结构(多头注意力层、相加归一化层、前馈层和相加归一化层)。
[0203]
bert预训练和词向量(wordembedding)类似,预先定义好bert模型的网络结构,使用特定任务的无标记的语料对模型进行训练,为了提升bert模型在评论任务中的效果,使用1.5亿评论语料对bert模型进行预训练,并建立评论的特殊词典,对评论进行分词后使用全词mask方式,增量训练bert模型,生成适用于评论任务的bert模型。
[0204]
然后,通过bert模型对评论向量化。
[0205]
如图9所示,bert模型由12层的transformer(transformer0

transformer11)组成,bert模型的输入为l长度(l指的是一条评论中的所有字符的个数)的评论(文本)。其中,每一层的输出包括评论中每个字的向量及cls向量(w
cls
)和sep向量(w
sep
),因此,每一层的输出一共有(l 2)个向量,将bert模型中第0层transformer0的cls向量与第11层transformer11的cls向量拼接,将得到的文本向量作为bert模型的输出。
[0206]
之后,通过k

means算法对评论对应的文本向量进行聚类处理。
[0207]
通过k

means算法对文本向量聚类之后,得到多个聚类中心。计算每条评论对应的文本向量距离聚类中心的距离,将与聚类中心的距离在20以内的文本向量对应的评论作为该聚类中心对应的评论的相似评论,统计每个聚类中心对应的相似评论,当相似评论的数量超过聚类阈值(如2000)时,认为该聚类中心及相似评论对应的评论属于评论热点类,即将评论热点类中的评论作为热点评论。
[0208]
其中,计算文本向量和聚类中心的距离的方式为欧式距离,得到的评论的文本向量与对应的聚类中心的距离如图10所示,例如,“冲鸭”这一评论对应的文本向量与聚类中心的欧式距离为36.36。
[0209]
最后,将通过词频识别算法子模块确定的热点评论和通过bert向量聚类算法子模块确定的热点评论取并集,得到总的热点评论。
[0210]
2、评论表情素材生成模块
[0211]
确定热点评论之后,根据热点评论生成对应的热点表情素材。例如图11中所示的“冲鸭”表情素材。
[0212]
如图12所示,当对新增评论进行分词等处理,确定评论命中热点词,或者,对新增评论向量化得到的文本向量与各个聚类中心进行相似判断,确定新增评论属于评论热点类时,将新增评论作为热点评论。若此时,用户发表的评论命中热点,即命中热点词,或评论对应的文本向量与聚类中心相似,用户可从评论编辑区域中选取对应的热点表情素材发表,同时,发表的热点表情素材将作为新增评论进入下一轮的热点评论的计算。
[0213]
如图13所示,“冲鸭”属于热点词,当用户想要发表内容为“冲鸭”的评论时,因为该评论属于热点评论,所以,评论编辑区域的(热点)表情库中有对应的“冲鸭”表情素材。此时,用户可在评论编辑区域中选取“冲鸭”表情素材1301作为评论发表。
[0214]
当前,通过使用本技术实施例提供的信息流的互动处理方法,每周可发现10~20个以上的热点评论,预估上线后每周可以产出2~5个表情素材,表情素材整体使用次数不少于10万次/每周,可使评论编辑区域人均消费时长提升5%,用户互动率提升9%。
[0215]
下面说明上文所述的终端的示例性结构。参见图14,图14是本技术实施例提供的终端400

1的结构示意图,图14所示的终端400

1包括:至少一个处理器410、存储器450、至少一个网络接口420和用户接口430。终端400

1中的各个组件通过总线系统440耦合在一起。可理解,总线系统440用于实现这些组件之间的连接通信。总线系统440除包括数据总线之外,还包括电源总线、控制总线和状态信号总线。但是为了清楚说明起见,在图14中将各种总线都标为总线系统440。
[0216]
处理器410可以是一种集成电路芯片,具有信号的处理能力,例如通用处理器、数字信号处理器(dsp,digital signal processor),或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等,其中,通用处理器可以是微处理器或者任何常规的处理器等。
[0217]
用户接口430包括使得能够呈现媒体内容的一个或多个输出装置431,包括一个或多个扬声器和/或一个或多个视觉显示屏。用户接口430还包括一个或多个输入装置432,包括有助于用户输入的用户接口部件,比如键盘、鼠标、麦克风、触屏显示屏、摄像头、其他输入按钮和控件。
[0218]
存储器450可以是可移除的,不可移除的或其组合。示例性的硬件设备包括固态存储器,硬盘驱动器,光盘驱动器等。存储器450可选地包括在物理位置上远离处理器410的一个或多个存储设备。
[0219]
存储器450包括易失性存储器或非易失性存储器,也可包括易失性和非易失性存储器两者。非易失性存储器可以是只读存储器(rom,read only memory),易失性存储器可以是随机存取存储器(ram,random access memory)。本技术实施例描述的存储器450旨在
包括任意适合类型的存储器。
[0220]
在一些实施例中,存储器450能够存储数据以支持各种操作,这些数据的示例包括程序、模块和数据结构或者其子集或超集,下面示例性说明。
[0221]
操作系统451,包括用于处理各种基本系统服务和执行硬件相关任务的系统程序,例如框架层、核心库层、驱动层等,用于实现各种基础业务以及处理基于硬件的任务。
[0222]
网络通信模块452,用于经由个或多个(有线或无线)网络接口420到达其他计算设备,示例性的网络接口420包括:蓝牙、无线相容性认证(wifi)、和通用串行总线(usb,universal serial bus)等。
[0223]
呈现模块453,用于经由一个或多个与用户接口430相关联的输出装置431(例如,显示屏、扬声器等)使得能够呈现信息(例如,用于操作外围设备和显示内容和信息的用户接口)。
[0224]
输入处理模块454,用于对一个或多个来自一个或多个输入装置432之一的一个或多个用户输入或互动进行检测以及翻译所检测的输入或互动。
[0225]
在一些实施例中,本技术实施例提供的信息流的互动处理装置可以采用软件方式实现,图14示出了存储在存储器450中的信息流的互动处理装置455,其可以是程序和插件等形式的软件,包括获取模块4551和显示模块4552。
[0226]
将在下文中说明各个模块的功能。
[0227]
获取模块4551,用于获取信息流,其中,信息流包括多条信息;显示模块4552,用于显示信息流中的至少一条信息、以及与至少一条信息对应的评论入口;响应于针对目标信息对应评论入口的触发操作,在目标信息的评论编辑区域中显示至少一个表情素材;其中,目标信息是信息流中待评论的信息,至少一个表情素材与信息流的高频评论用词相关,评论编辑区域用于基于至少一个表情素材发表与目标信息对应的评论。
[0228]
在一些实施例中,信息流的高频评论用词包括:目标信息的热点评论中的关键词,关键词的热度值大于热度阈值;显示模块4552,还用于在目标信息的评论编辑区域中,按照顺序显示与目标信息的热点评论中的关键词相关的多个表情素材;其中,多个表情素材的排序方式包括:表情素材对应的关键词在目标信息的多个历史的评论中的热度值;表情素材被用于编辑评论的使用频率。
[0229]
在一些实施例中,信息流的高频评论用词包括:与目标信息的热点评论中的关键词,关键词的热度值大于热度阈值;显示模块4552,还用于响应于评论编辑操作,获取在评论编辑区域中输入的文本;当文本包括热点评论中的关键词时,确定将在评论编辑区域中显示与互动账号发表的评论中的关键词相关的至少一个表情素材。
[0230]
在一些实施例中,与目标信息的评论相关的至少一个表情素材包括:互动账号发表的评论中的关键词相关的至少一个表情素材,其中,互动账号是与登录账号存在互动关系的账号,登录账号是用于获取并显示信息流的账号;显示模块4552,还用于响应于评论编辑操作,获取在评论编辑区域中输入的文本;当识别出文本包括互动账号发表的评论中的关键词时,确定将在评论编辑区域中显示与关键词相关的至少一个表情素材。
[0231]
在一些实施例中,显示模块4552,还用于在识别出文本包括的关键词之前,按照顺序在评论编辑区域中显示与多个关键词一一对应的多个表情素材,其中,多个表情素材的排序方式包括:表情素材对应的关键词在目标信息的多个历史的评论中的热度值;表情素
材被用于编辑评论的使用频率;在识别出与文本包括的关键词之后,在评论编辑区域中突出显示与关键词对应的表情素材,其中,突出显示的方式包括以下至少之一:高亮显示、放大显示、文字提示、语音提示、排序前置。
[0232]
在一些实施例中,显示模块4552,还用于在识别出文本包括的关键词之前,在评论编辑区域中按照顺序显示多个预设的表情素材,其中,多个预设的表情素材的排序方式包括:表情素材被用于编辑评论的使用频率;在识别出与文本包括的关键词之后,在评论编辑区域中插入并突出显示与关键词对应的表情素材,其中,突出显示的方式包括以下至少之一:高亮显示、放大显示、文字提示、语音提示、排序前置。
[0233]
在一些实施例中,显示模块4552,还用于根据与目标信息的处于显示状态的评论中的关键词对应的表情素材、登录账号参与互动的评论中的关键词对应的表情素材至少之一,实时更新显示目标信息的评论编辑区域;其中,登录账号是用于获取并显示信息流的账号。
[0234]
在一些实施例中,显示模块4552,还用于显示信息流中至少一条信息的至少部分内容,响应于信息选择操作,显示被选中的目标信息的详情内容、目标信息的至少部分评论以及与目标信息对应的评论入口;或者显示信息流中的至少一条信息的至少部分内容以及与每条信息对应的评论入口。
[0235]
在一些实施例中,显示模块4552,还用于确定登录账号在信息流中的活跃程度,其中,登录账号是用于获取并显示信息流的账号;在目标信息的评论编辑区域中显示数量与活跃程度正相关的表情素材。
[0236]
在一些实施例中,显示模块4552,还用于响应于登录账号的评论发布操作,其中,登录账号是用于获取并显示信息流的账号,将登录账号在评论编辑区域中输入的文本、以及在至少一个表情素材中选中的表情素材组合为评论,并基于登录账号的身份发送到发布信息流的服务器,以使服务器同步到获取信息流的其他账号。
[0237]
在一些实施例中,显示模块4552,还用于响应于登录账号的评论发布操作,其中,登录账号是用于获取并显示信息流的账号,将登录账号在评论编辑区域中输入的文本作为评论,基于登录账号的身份发送到发布信息流的服务器,以使服务器同步到获取信息流的其他账号;将自动在至少一个表情素材中选中的至少一个表情素材作为评论,基于登录账号的身份或评论机器人的身份发送到发布信息流的服务器,以使服务器同步到获取信息流的其他账号。
[0238]
在一些实施例中,显示模块4552,还用于响应于登录账号的自动跟评目标评论的评论发布操作,其中,登录账号是用于获取并显示信息流的账号,目标评论是目标信息的处于显示状态的评论,将在与目标评论相关的至少一个表情素材中选中的至少一个表情素材作为评论,并基于登录账号的身份或评论机器人的身份发送到发布信息流的服务器,以使服务器同步到获取信息流的其他账号。
[0239]
在一些实施例中,显示模块4552,还用于通过以下方式获取与目标信息的评论相关的至少一个表情素材:获取目标信息的多个评论;确定每个评论中的词语对应的热度值;将热度值高于热度阈值的词语作为关键词,并将包括关键词的评论作为第一热点评论;基于第一热点评论生成对应的表情素材。
[0240]
在一些实施例中,显示模块4552,还用于确定信息流的多条信息中每条信息对应
的评论的文本向量;对多条信息的评论对应的文本向量进行聚类处理,得到至少一个聚类中心;确定与每个聚类中心相似的文本向量的数量,将数量超过聚类阈值的聚类中心作为热点聚类中心;确定多条信息的评论对应的文本向量中与热点聚类中心相似的至少一个文本向量,并将至少一个文本向量对应的信息的评论作为第二热点评论;将第一热点评论和第二热点评论的并集作为热点评论集合;生成与热点评论集合中的每个评论对应的表情素材。
[0241]
在一些实施例中,显示模块4552,还用于获取在采样周期中发表的对应目标信息的多个评论;当多个评论的数量小于数量阈值时,其中,数量阈值是用于识别热点评论的最小值,按照发表时间从新到旧的顺序,获取目标信息中与数量阈值对应的多个评论;或者,基于至少一个维度确定对应登录账号的关联账号,其中,登录账号是用于获取并显示信息流的账号,维度包括以下至少一种:与登录账号的社交距离、与登录账号的地理距离;获取关联账号针对目标信息发表的多个评论。
[0242]
在一些实施例中,显示模块4552,还用于基于第一热点评论确定文本素材,其中,文本素材包括以下至少之一:第一热点评论、第一热点评论中的关键词、与第一热点评论的语义相同的其他文本;从多个候选素材图像中获取与第一热点评论的情感特征匹配的图像素材,或者对候选素材图像与第一热点评论的情感特征进行融合处理,得到图像素材;将文本素材和图像素材组合为表情素材。
[0243]
本技术实施例提供了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行本技术实施例上述的信息流的互动处理方法。
[0244]
本技术实施例提供一种存储有可执行指令的计算机可读存储介质,其中存储有可执行指令,当可执行指令被处理器执行时,将引起处理器执行本技术实施例提供的信息流的互动处理方法,例如,如图2a示出的信息流的互动处理方法。
[0245]
在一些实施例中,计算机可读存储介质可以是fram、rom、prom、eprom、eeprom、闪存、磁表面存储器、光盘、或cd

rom等存储器;也可以是包括上述存储器之一或任意组合的各种设备。
[0246]
在一些实施例中,可执行指令可以采用程序、软件、软件模块、脚本或代码的形式,按任意形式的编程语言(包括编译或解释语言,或者声明性或过程性语言)来编写,并且其可按任意形式部署,包括被部署为独立的程序或者被部署为模块、组件、子例程或者适合在计算环境中使用的其它单元。
[0247]
作为示例,可执行指令可以但不一定对应于文件系统中的文件,可以可被存储在保存其它程序或数据的文件的一部分,例如,存储在超文本标记语言(html,hyper text markup language)文档中的一个或多个脚本中,存储在专用于所讨论的程序的单个文件中,或者,存储在多个协同文件(例如,存储一个或多个模块、子程序或代码部分的文件)中。
[0248]
作为示例,可执行指令可被部署为在一个计算设备上执行,或者在位于一个地点的多个计算设备上执行,又或者,在分布在多个地点且通过通信网络互连的多个计算设备上执行。
[0249]
综上所述,在本技术实施例中,当接收到针对目标信息对应评论入口的触发操作
时,在目标信息的评论编辑区域中显示与信息流的高频评论用词相关的至少一个表情素材,使得用户可将表情素材作为评论进行发表,无需编辑文字,提高了评论编辑和发表的效率,且表情素材可以形象地传达用户对目标信息的主观情感,丰富了评论的表现形式。
[0250]
以上所述,仅为本技术的实施例而已,并非用于限定本技术的保护范围。凡在本技术的精神和范围之内所作的任何修改、等同替换和改进等,均包含在本技术的保护范围之内。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献