一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种文本展示方法、装置、电子设备及存储介质与流程

2022-02-22 10:12:31 来源:中国专利 TAG:


1.本公开涉及计算机应用技术领域,尤其涉及一种文本展示方法、装置、电子设备及存储介质。


背景技术:

2.随着互联网的普及,账户可以从互联网中获取到丰富的多媒体资源。例如,电视剧、小说、漫画等。
3.在账户获取多媒体资源时,也可以获取对应的待展示文本。例如,电视剧剧情简介、弹幕、账户评论等。这些待展示文本可以与多媒体资源一同展示。例如,在账户观看视频时也可以同时观看弹幕、在账户观看小说的过程中也可以查看章节评论。
4.但是,待展示文本可能会包含多媒体资源中的剧情信息,进而可能导致账户因为提前获取到包含后续剧情信息的待展示文本而被剧透,造成不好的使用体验。


技术实现要素:

5.本公开提供一种文本展示方法、装置、电子设备及存储介质,以至少解决相关技术中由于待展示文本的剧透造成的较差账户体验。本公开的技术方案如下:
6.根据本公开实施例的第一方面,提供一种文本展示方法,包括:
7.获取目标多媒体对应的第一待展示文本集合,在所获取的第一待展示文本集合中确定剧透文本;所述剧透文本的剧情位置在展示位置之后;所述剧情位置是剧透文本包含的剧情信息在所述目标多媒体中对应的位置;所述展示位置是剧透文本在所述目标多媒体中展示的位置;
8.针对请求获取所述目标多媒体的目标账户,在确定所述目标账户不符合预设获取要求的情况下,删除所述第一待展示文本集合中的剧透文本,得到第二待展示文本集合,将所得到的第二待展示文本集合发送到所述目标账户。
9.可选地,所述将所得到的第二待展示文本集合发送到所述目标账户,包括:
10.在确定所述目标账户拒绝获取剧透文本的情况下,将所得到的第二待展示文本集合发送到所述目标账户。
11.可选地,确定剧透文本的方法,包括以下一种或多种:
12.将所获取的第一待展示文本集合中具有剧透标识的待展示文本,确定为剧透文本;所述剧透标识是针对预设账户操作指定的待展示文本添加的;所述预设账户操作用于指定剧透文本;
13.针对所获取的第一待展示文本集合中包含任一预设剧透关键词的待展示文本,确定所包含的预设剧透关键词在所述目标多媒体中对应的位置;在所确定的位置在所针对的待展示文本的展示位置之后的情况下,将所针对的待展示文本确定为剧透文本;
14.将所获取的第一待展示文本集合中,与任一已确定的剧透文本重合度大于预设重合度的待展示文本,确定为剧透文本。
15.可选地,所述在所获取的第一待展示文本集合中确定剧透文本,包括:
16.确定所述目标多媒体当前对应的文本识别模型;所述模型用于识别所述目标多媒体对应的剧透文本;
17.将所获取的第一待展示文本集合中待展示文本的文本特征和展示位置输入所述模型,并根据所述模型的输出确定剧透文本。
18.可选地,所述确定所述目标多媒体当前对应的文本识别模型,包括:
19.根据所述目标多媒体当前对应的剧透文本,获取训练样本;所述训练样本的样本特征包括剧透文本的文本特征和展示位置;
20.根据所获取的训练样本,训练得到所述目标多媒体当前对应的文本识别模型。
21.可选地,获取训练样本的方法,包括以下一种或多种:
22.将所述目标多媒体当前对应的剧透文本的文本特征和展示位置作为样本特征,并添加用于表征剧透文本的标签,得到训练样本;
23.生成与所述目标多媒体当前对应的任一剧透文本的重合度大于预设重合度的新增文本,将所述新增文本的文本特征和该剧透文本的展示位置作为样本特征,并添加用于表征剧透文本的标签,得到训练样本;
24.从所述目标多媒体当前对应的待展示文本中,确定与所述目标多媒体对应的任一剧透文本的重合度大于预设重合度的待展示文本,将所确定的待展示文本的文本特征和该剧透文本的展示位置作为样本特征,并添加用于表征剧透文本的标签,得到训练样本。
25.可选地,所述预设获取要求,用于表征所述目标账户获取过所述目标多媒体的主要剧情内容。
26.可选地,所述主要剧情内容,包括以下一种或多种:
27.在所述目标多媒体中预设位置的内容;
28.在所述目标多媒体中占比大于预设比例的内容;
29.在所述目标多媒体中账户兴趣程度大于预设兴趣程度的内容;
30.在所述目标多媒体中具有预设主要剧情标记的内容。
31.根据本公开实施例的第二方面,提供一种文本展示装置,包括:
32.获取单元,被配置为执行:获取目标多媒体对应的第一待展示文本集合,在所获取的第一待展示文本集合中确定剧透文本;所述剧透文本的剧情位置在展示位置之后;所述剧情位置是剧透文本包含的剧情信息在所述目标多媒体中对应的位置;所述展示位置是剧透文本在所述目标多媒体中展示的位置;
33.发送单元,被配置为执行:针对请求获取所述目标多媒体的目标账户,在确定所述目标账户不符合预设获取要求的情况下,删除所述第一待展示文本集合中的剧透文本,得到第二待展示文本集合,将所得到的第二待展示文本集合发送到所述目标账户。
34.可选地,所述发送单元,包括:
35.拒绝子单元,被配置为执行:在确定所述目标账户拒绝获取剧透文本的情况下,将所得到的第二待展示文本集合发送到所述目标账户。
36.可选地,所述获取单元,包括:
37.剧透文本确定子单元,被配置为执行以下一种或多种确定剧透文本的方法:
38.将所获取的第一待展示文本集合中具有剧透标识的待展示文本,确定为剧透文
本;所述剧透标识是针对预设账户操作指定的待展示文本添加的;所述预设账户操作用于指定剧透文本;
39.针对所获取的第一待展示文本集合中包含任一预设剧透关键词的待展示文本,确定所包含的预设剧透关键词在所述目标多媒体中对应的位置;在所确定的位置在所针对的待展示文本的展示位置之后的情况下,将所针对的待展示文本确定为剧透文本;
40.将所获取的第一待展示文本集合中,与任一已确定的剧透文本重合度大于预设重合度的待展示文本,确定为剧透文本。
41.可选地,所述获取单元,包括:
42.模型确定子单元,被配置为执行:确定所述目标多媒体当前对应的文本识别模型;所述模型用于识别所述目标多媒体对应的剧透文本;将所获取的第一待展示文本集合中待展示文本的文本特征和展示位置输入所述模型,并根据所述模型的输出确定剧透文本。
43.可选地,所述获取单元,包括:
44.模型训练子单元,被配置为执行:根据所述目标多媒体当前对应的剧透文本,获取训练样本;所述训练样本的样本特征包括剧透文本的文本特征和展示位置;根据所获取的训练样本,训练得到所述目标多媒体当前对应的文本识别模型。
45.可选地,所述模型训练子单元,包括:
46.样本获取子单元,被配置为执行以下一种或多种获取训练样本的方法:
47.将所述目标多媒体当前对应的剧透文本的文本特征和展示位置作为样本特征,并添加用于表征剧透文本的标签,得到训练样本;
48.生成与所述目标多媒体当前对应的任一剧透文本的重合度大于预设重合度的新增文本,将所述新增文本的文本特征和该剧透文本的展示位置作为样本特征,并添加用于表征剧透文本的标签,得到训练样本;
49.从所述目标多媒体当前对应的待展示文本中,确定与所述目标多媒体对应的任一剧透文本的重合度大于预设重合度的待展示文本,将所确定的待展示文本的文本特征和该剧透文本的展示位置作为样本特征,并添加用于表征剧透文本的标签,得到训练样本。
50.可选地,所述预设获取要求,用于表征所述目标账户获取过所述目标多媒体的主要剧情内容。
51.可选地,所述主要剧情内容,包括:
52.在所述目标多媒体中预设位置的内容;和/或
53.在所述目标多媒体中占比大于预设比例的内容;和/或
54.在所述目标多媒体中账户兴趣程度大于预设兴趣程度的内容;和/或
55.在所述目标多媒体中具有主要剧情标记的内容。
56.根据本公开实施例的第三方面,提供一种电子设备,包括:
57.处理器;
58.用于存储所述处理器可执行指令的存储器;
59.其中,所述处理器被配置为执行所述指令,以实现上述文本展示方法。
60.根据本公开实施例的第四方面,提供一种计算机可读存储介质,当所述计算机可读存储介质中的指令由电子设备的处理器执行时,使得所述电子设备能够执行上述文本展示方法。
61.根据本公开实施例的第五方面,提供一种计算机程序产品,包括计算机程序/指令,所述计算机程序被处理器执行时实现上述文本展示方法。
62.本公开的实施例提供的技术方案至少带来以下有益效果:
63.根据目标账户是否符合预设获取要求的情况,确定是否能够获取剧透文本,从而可以在确定目标账户不符合预设获取要求的情况下,避免目标账户因为获取剧透文本而被剧透,提高使用体验。
64.当然,实施本发明的任一产品或方法并不一定需要同时达到以上所述的所有优点。
65.应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。
附图说明
66.此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例,并与说明书一起用于解释本公开的原理,并不构成对本公开的不当限定。
67.图1是根据一示例性实施例示出的一种文本展示方法的流程图;
68.图2是根据一示例性实施例示出的一种视频弹幕展示方法的流程图;
69.图3是根据一示例性实施例示出的一种文本展示装置的框图;
70.图4是根据一示例性实施例示出的一种电子设备的示意框图。
具体实施方式
71.为了使本领域普通人员更好地理解本公开的技术方案,下面将结合附图,对本公开实施例中的技术方案进行清楚、完整地描述。
72.需要说明的是,本公开的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本公开的实施例能够以除了在这里图示或描述的那些以外的顺序实施。以下示例性实施例中所描述的实施方式并不代表与本公开相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本公开的一些方面相一致的装置和方法的例子。
73.随着互联网的普及,账户可以从互联网中获取到丰富的多媒体资源。例如,电视剧、小说、漫画等。这些多媒体资源的形式可以包括:视频、图片、文字等。
74.为了提高账户体验,满足账户需求,在账户获取多媒体资源时,也可以获取对应的待展示文本。例如,电视剧剧情简介、视频弹幕、漫画的评论等。这些待展示文本可以与多媒体资源一同展示。例如,在账户观看视频时也可以同时观看弹幕、在账户观看小说的过程中也可以查看章节评论。
75.为了便于理解,在一种具体的实施例中,当账户点击打开网页观看视频时,网页上通常可以包括视频相关的文本,这些文本可以与视频一同展示在网页中。例如,视频的弹幕、账户评论、视频简介、视频作者介绍、账户针对视频的评价等等。
76.为了便于描述,将可以和多媒体资源一同展示的相关文本称为多媒体对应的待展示文本。
77.其中的待展示文本可以包括多媒体业务方上传的文本,例如,电影名称、电影相关工作人员、电影介绍等;也可以包括账户编辑并上传的文本,例如,视频弹幕、漫画评论、小说评价、电影评价等。
78.但是,待展示文本可能会包含多媒体资源中的剧情信息,进而可能导致账户因为提前获取到包含后续剧情信息的待展示文本而被剧透,造成不好的使用体验。
79.为了解决上述技术问题,本公开提供一种文本展示方法。
80.首先需要针对多媒体对应的待展示文本,确定出其中的剧透文本,为了便于描述,可以将会导致账户被剧透的文本称为剧透文本。之后可以针对不同账户分别确定能否获取剧透文本。
81.具体可以是针对不了解多媒体剧情的账户,确定这类账户无法获取剧透文本,从而可以避免这类账户在获取多媒体时获取到剧透文本,具体可以是将剧透文本从待展示文本中删除,再将删除后的待展示文本发送给账户,也就可以避免这类账户被剧透,提高这类账户的使用体验。
82.当然,由于部分不了解多媒体剧情的账户实际也可能并不在意剧透,也可以进一步根据这类账户的实际需求,在不了解多媒体剧情的账户确定拒绝剧透的情况下,才会确定该账户无法获取剧透文本。
83.此外,由于剧透文本中也可能包含提升账户体验、满足账户需求的文本,例如,涉及剧情的精彩影评、针对剧情进行剖析的精彩账户评论、对剧情进行调侃的精彩弹幕等,并且,针对了解多媒体剧情的账户,这类账户已经知道剧情,并不会因为获取到剧透文本而被剧透,因此为了提高这类账户的体验,可以确定这类账户能够获取剧透文本,可以使得这类账户在获取多媒体时也获取到剧透文本,从而满足账户需求。
84.本方法可以根据不同账户的情况和需求,分别确定能否获取剧透文本,从而可以避免不了解剧情的账户被剧透,也可以使得了解剧情的账户能够获取剧透文本,进而可以提升账户的使用体验。
85.图1是根据一示例性实施例示出的一种文本展示方法的流程图,如图1所示,文本展示方法可以应用于业务方的电子设备,例如,多媒体平台的服务器。
86.可选地,业务方可以存储多媒体和待展示文本的对应关系,具体可以接收账户针对多媒体上传的待展示文本,存储到多媒体对应的待展示文本中。
87.该方法可以包括以下步骤。
88.s101:获取目标多媒体对应的第一待展示文本集合,在所获取的第一待展示文本集合中确定剧透文本。
89.可选地,剧透文本的剧情位置在展示位置之后;剧情位置是剧透文本包含的剧情信息在目标多媒体中对应的位置;展示位置是剧透文本在目标多媒体中展示的位置。
90.针对剧情位置,可选地,针对小说,某一剧透文本的剧情位置可以是剧透文本包含的剧情信息在小说中的位置,具体可以是小说的某一章节处。
91.针对视频,某一剧透文本的剧情位置可以是剧透文本包含的剧情信息在视频播放过程中的时刻或时间段。
92.针对展示位置,可选地,如果剧透文本可以在多媒体中直接展示,则可以直接确定剧透文本的展示位置,例如,视频弹幕是在视频播放过程中展示的,弹幕本身是在视频中展
示的,因此可以将弹幕展示时视频播放的时刻确定为弹幕的展示位置。
93.或者,漫画评论可以是在漫画观看过程中展示的,具体可以展示在漫画的每个章节的最后,因此,可以将漫画评论展示的位置(具体可以是展示的漫画章节)确定为评论的展示位置。
94.如果剧透文本并不在多媒体中直接展示,例如视频评论,通常展示在视频所在网页的下方,随时可能被账户下拉网页而展示出来,因此,需要额外确定多媒体中的一个位置为这类剧透文本的展示位置。
95.可选地,针对不直接在多媒体中展示的剧透文本,可以将多媒体中的预设展示位置确定为剧透文本的展示位置。具体地,预设展示位置可以动态确定的,可以是在展示剧透文本时,将多媒体当前所处的位置确定为预设展示位置。
96.例如,在账户下拉网络查看视频评论时,可以实时地将当前视频播放的时刻确定为预设展示位置,作为所查看的视频评论对应的展示位置。
97.s102:针对请求获取目标多媒体的目标账户,在确定目标账户不符合预设获取要求的情况下,删除第一待展示文本集合中的剧透文本,得到第二待展示文本集合,将所得到的第二待展示文本集合发送到目标账户。
98.在一种可选的实施例中,目标多媒体可以是任一多媒体,为了便于描述,将本方法流程所针对的多媒体称为目标多媒体。可以理解的是,针对其他多媒体,也可以基于相同的方法流程确定剧透文本。
99.可选地,目标账户可以是请求获取目标多媒体的任一账户,为了便于描述,将本方法流程针对的账户称为目标账户。可以理解的是,针对请求获取目标多媒体的其他账户,也可以基于相同的方法流程确定其他账户能否获取目标多媒体对应剧透文本。
100.本方法流程可以根据目标账户是否符合预设获取要求的情况,确定目标账户是否能够获取剧透文本,从而可以在确定目标账户不符合预设获取要求的情况下,避免目标账户因为获取剧透文本而被剧透,提高了使用体验。
101.此外,也可以在确定目标账户符合预设获取要求的情况下,确定目标账户能够获取剧透文本,进而可以因为获取到数量和种类更多的待展示文本而提高使用体验。
102.在一种可选的实施例中,目标账户具体请求获取目标多媒体的情况下,可以并不需要获取目标多媒体对应的待展示文本,例如,在观看漫画时屏蔽弹幕和评论;也可以需要获取目标多媒体对应的待展示文本,例如,在观看视频时点击评论区查看账户评论。
103.其中,在目标账户需要获取目标多媒体对应的待展示文本的情况下,可以在获取目标多媒体的同时,自动获取目标多媒体对应的一个或多个待展示文本,也可以请求获取目标多媒体的一个或多个待展示文本。
104.例如,目标账户在点击打开视频网页后,可以自动获取到视频的账户评论。而目标账户可以通过设置弹幕选项,确定是否获取视频弹幕。具体可以设置“关闭弹幕”,则目标账户并不会获取到视频的弹幕,也可以设置“打开弹幕”,则目标账户可以发送请求,请求获取视频的弹幕进行展示。
105.在一种可选的实施例中,可以根据目标账户是否符合预设获取要求的情况,先确定目标账户针对剧透文本的获取权限。之后具体获取目标多媒体对应的待展示文本,可以根据所确定的文本获取权限,确定能够发送给目标账户的待展示文本。
106.可选地,可以在确定目标账户具有获取剧透文本的权限的情况下,将目标多媒体对应的全部或部分待展示文本发送给目标账户;在确定目标账户不具有获取剧透文本的权限的情况下,将目标多媒体对应的待展示文本中,剧透文本以外的其他全部或不符恩待展示文本,发送给目标账户。
107.具体地,可以是将待展示文本发送到登录目标账户的客户端或设备。
108.其中,可选地,可以响应于目标账户获取目标多媒体对应的待展示文本的请求,在确定目标账户具有获取剧透文本的权限的情况下,将目标多媒体对应的全部或部分待展示文本发送给目标账户;在确定目标账户不具有获取剧透文本的权限的情况下,将目标多媒体对应的待展示文本中,剧透文本以外的其他全部或部分待展示文本,发送给目标账户。
109.在本实施例中,可以根据剧透文本的获取权限,确定能够发送给目标账户的待展示文本,进而可以在避免目标账户被剧透的前提下,可以获取到相应的待展示文本满足账户需求。其中,具有获取剧透文本的权限的账户,可以获取到数量和种类更多的待展示文本,而不具有获取剧透文本的权限的账户,可以避免因为剧透文本而被剧透。
110.一、下面针对s101和s102之间的关系进行解释。
111.在一种可选的实施例中,s101可以预先执行,预先确定出目标多媒体对应的剧透文本。之后针对任一账户获取目标多媒体的请求,可以直接执行s102,判断该账户是否能够获取预先确定的目标多媒体对应的剧透文本。在本实施例中,可以提高本方法流程的执行效率。
112.相对应地,可选地,也可以预先针对多个多媒体确定对应的剧透文本,方便后续针对获取任一多媒体的请求,都可以直接执行s102,提高文本展示的执行效率。
113.在另一种可选的实施例,s101也可以实时执行。具体可以是在接收到任一账户获取目标多媒体的请求之后,再针对目标多媒体确定对应的剧透文本。
114.本实施例并不限定s101和s102的执行时序。可选地,在接收到任一账户获取目标多媒体的请求之后,s101可以与s102并行执行,也可以先执行s101,再执行s102。
115.本实施例中,可以通过实时确定目标多媒体对应的剧透文本,提高剧透文本识别的准确度。
116.二、下面针对s101进行详细的解释。
117.1、针对目标多媒体对应的待展示文本,在一种可选的实施例中,目标多媒体对应的待展示文本,可以包括与目标多媒体相关的文本。例如,针对目标多媒体的弹幕和账户评论等文本。
118.其中可以包括账户针对目标多媒体编辑上传的文本,也可以包括业务方针对目标多媒体编辑上传的文本。
119.本方法流程并不限定具体获取目标多媒体对应的待展示文本的方式。作为示例性说明,可以至少通过以下2种方式获取。
120.1)预先存储有目标多媒体对应的待展示文本,可以直接从存储区域中获取到目标多媒体对应的待展示文本。
121.2)实时获取到任一账户针对目标多媒体上传的文本,确定为目标多媒体对应的待展示文本。
122.因此,可选地,获取目标多媒体对应的待展示文本,可以包括:获取任一账户针对
目标多媒体上传的文本,确定为目标多媒体对应的待展示文本。
123.在一种可选的示例中,可以接收账户上传文本的请求,该请求可以用于针对目标多媒体上传文本。所上传的文本可以包括,账户针对目标多媒体的评论、弹幕、评价等文本。
124.其中,可选地,在将任一账户针对目标多媒体上传的文本确定为目标多媒体对应的待展示文本后,可以将所确定的待展示文本存储到存储区域中,以便于后续从存储区域获取目标多媒体对应的待展示文本。
125.本实施例中,可以将账户针对目标多媒体上传的文本确定为目标多媒体对应的待展示文本,可以实时新增目标多媒体对应的待展示文本,方便实时确定出其中的剧透文本,避免账户被新增的待展示文本剧透,提高使用体验。
126.2、针对剧透文本,剧透文本中可以包含剧情信息。在一种可选的实施例中,剧透文本的剧情位置在展示位置之后,从而会导致剧透。剧情位置是剧透文本包含的剧情信息在目标多媒体中对应的位置;展示位置是剧透文本在目标多媒体中展示的位置。
127.由于剧透文本的剧情位置在展示位置之后,因此,针对第一次获取目标多媒体的账户,如果也获取到剧透文本,则很可能因为剧透文本而提前了解目标多媒体的后续剧情,从而导致被剧透,降低使用体验。
128.在一种具体的示例中,针对第一次获取电影视频的账户,由于设置了“打开弹幕”,因此,也可以获取到电影视频对应的弹幕。如果弹幕中存在剧透文本,例如,“这个主角最后死了”、“这个戴眼镜的人是凶手”等包含剧情信息的弹幕,那么账户很可能因为提前查阅到电影视频的弹幕而被剧透,导致电影观看体验下降。
129.其中,由于剧透文本是从目标多媒体对应的待展示文本中确定的,因此,所确定的剧透文本也可以对应于目标多媒体。
130.为了便于进一步理解剧透文本,下面给出剧透文本的三种示例。
131.剧透文本示例一:针对多个多媒体共通的剧透文本。
132.在不同多媒体提供的剧情中,通常可以包含相通的剧情信息。而包含这些相通剧情信息的剧透文本,通常可以针对不同多媒体,都确定为包含多媒体自身剧情信息的剧透文本。
133.例如,“这个电影结局是好结局”对于所有具有好结局的电影,都包含了电影本身剧情信息;“这部漫画的主角最后是最强的”对于所有主角最强的漫画,都包含了漫画本身剧情信息、“这部小说中有人去世”对于所有存在死亡角色的小说,都包含了小说本身的剧情信息。
134.剧透文本示例二:针对单个多媒体较为独特的剧透文本。
135.在不同多媒体提供的剧情中,也可以包含每个多媒体较为独特的剧情信息。这些较为独特的剧情信息可以是针对较为独特的设定产生的,也可以是根据较为独特的剧情发展产生的。包含单个多媒体的这些较为独特的剧情信息的剧透文本,通常可以针对该多媒体,确定为包含该多媒体自身剧情信息的剧透文本,比较具有针对性。
136.例如,电影一中出现了“原力”这一专有名词,可以将包含“原力”相关剧情信息的文本确定为剧透文本。“原力只能遗传”、“原力可以变异得到”、“主角和反派都有原力”等都可以被确定为剧透文本。
137.这些文本在其他多媒体对应的待展示文本中出现时,也可以因为包含剧情信息而
被确定为剧透文本。这些文本实际更可能出现在电影一对应的待展示文本中。
138.剧透文本示例三:与某一剧透文本重合度较高的文本。
139.不同账户在针对相同剧情信息编辑文本时,可能编辑出不同的相似文本。当然,不同的相似文本也可以包含不同的剧情信息。
140.如果一个待展示文本与一个剧透文本的重合度较高,则该待展示文本很可能包含了该剧透文本中的剧情信息,因此,可以将该待展示文本也确定为剧透文本。
141.例如,“这个角色很快就去世了”、“这个角色快去世了”、“这个角色会去世”、“这个角色不会很快去世”这四个文本。在确定“这个角色很快就去世了”为剧透文本的情况下,其他三个文本与这一剧透文本的重合度较高,可以将其他三个文本也确定为剧透文本。
142.在一种可选的实施例中,由于剧透文本可以是账户编辑上传的,因此,账户可能意识到自己上传的待展示文本包含剧情信息,涉及剧透,可能降低其他账户的使用体验。在这种情况下,账户可能仍然选择上传剧透文本,也可能为了避免剧透而不上传剧透文本。
143.可选地,可以为账户提供一个操作接口,使得账户可以通过预设账户操作,对账户认为包含剧情信息的待展示文本进行标记,从而方便业务方根据标记确定出剧透文本。
144.本实施例可以通过由账户自身对上传的待展示文本进行剧透文本标记,方便账户操作,也可以避免账户因为意识到涉及剧透而不上传待展示文本,提高使用体验。
145.在一种具体的示例中,可以在账户进行文本编辑的旁边,提供一个选项“涉及剧透”,如果勾选这一选项,则可以将当前编辑的待展示文本标记为剧透文本,如果不勾选,则可以并不标记,直接上传。
146.在一种可选的实施例中,业务方上传的待展示文本中,也可能包含剧透文本。例如,电影的官方介绍中可能包含剧情信息,小说的编辑推荐语中也可能包含剧情信息。
147.因此,可以针对目标多媒体对应的全部待展示文本,确定剧透文本。
148.需要注意的是,针对所确定的剧透文本,在一种可选的实施例中,还可以由业务方的审核人员进一步审核,可以针对被错误确定为剧透文本的文本,再次确定为非剧透文本。具体可以是删除剧透标记。本实施例可以提高剧透文本的识别准确率。
149.3、下面针对确定剧透文本的操作进行详细的解释。
150.本方法流程并不具体限定确定剧透文本的方法,作为示例性说明,可以通过以下四种方式确定出剧透文本。其中,这四种方式可以单独使用进行剧透文本的确定,也可以共同使用进行剧透文本的确定。
151.1)根据标识确定。这一标识可以是账户上传待展示文本时主动针对剧透文本添加的,也可以是账户针对获取的待展示文本中的剧透文本添加的,也可以是业务方的业务人员针对审核得到的剧透文本添加的。换言之,可以是账户反馈的剧透文本,也可以是业务方审核的剧透文本。
152.2)根据关键词确定。预设剧情信息可以通过部分关键词体现,例如,“角色”、“结局”、“高潮部分”、“主角”等。
153.3)根据已确定的剧透文本计算重合度。具体可以是针对已确定的剧透文本,将待展示文本中与任一已确定的剧透文本重合度较高的文本,确定为剧透文本。
154.4)根据文本识别模型确定。具体可以是预先训练一个文本识别模型,用于从目标多媒体对应的待展示文本中,确定剧透文本。
155.相对应地,确定剧透文本的方法,可以包括以下一种或多种。
156.将所获取的第一待展示文本集合中具有剧透标识的待展示文本,确定为剧透文本;剧透标识是针对预设账户操作指定的待展示文本添加的;预设账户操作用于指定剧透文本。
157.针对所获取的第一待展示文本集合中包含任一预设剧透关键词的待展示文本,确定所包含的预设剧透关键词在目标多媒体中对应的位置;在所确定的位置在所针对的待展示文本的展示位置之后的情况下,将所针对的待展示文本确定为剧透文本。
158.将所获取的第一待展示文本集合中,与任一已确定的剧透文本重合度大于预设重合度的待展示文本,确定为剧透文本。
159.确定目标多媒体当前对应的文本识别模型;文本识别模型用于识别目标多媒体对应的剧透文本;将所获取的第一待展示文本集合中待展示文本的文本特征和展示位置输入文本识别模型,并根据文本识别模型的输出确定剧透文本。
160.在一种可选的实施例中,可以将所获取的第一待展示文本集合中具有剧透标识的待展示文本,确定为剧透文本。
161.其中,可选地,剧透标识是针对预设账户操作指定的待展示文本添加的;所述预设账户操作用于指定剧透文本。
162.预设账户操作可以是账户针对所获取的第一待展示文本集合中的剧透文本执行的。账户在具体获取待展示文本的过程中,可以自行确定出其中的剧透文本,并执行预设账户操作,针对预设账户操作指定的文本添加剧透标识,标记出剧透文本。也就是由账户针对待展示文本进行反馈,确定其中的剧透文本。
163.例如,账户在第一次观看电影时,被某一个弹幕剧透,则可以针对该弹幕执行预设账户操作,标记为剧透文本。预设账户操作具体可以包括:右键点击该弹幕,唤出菜单项,点击菜单项中的“涉及剧透”。
164.预设账户操作也可以是业务方的审核人员针对所获取的第一待展示文本集合中的剧透文本执行的。审核人员在具体获取待展示文本的过程中,可以通过审核确定出其中的剧透文本,并执行预设账户操作,针对预设账户操作指定的文本添加剧透标识,标记出剧透文本。
165.例如,审核人员在审核漫画评论时,发现其中一个评论涉及剧情讨论,则可以针对该评论执行预设账户操作,标记为剧透文本。
166.预设账户操作也可以是账户针对自身即将上传的待展示文本执行的。账户在针对多媒体上传待展示文本时,可能意识到即将上传的待展示文本涉及剧透,因此,可以针对即将上传的待展示文本执行预设账户操作,针对预设账户操作指定的文本添加剧透标识,标记出剧透文本,从而可以方便账户上传涉及剧透的待展示文本。
167.例如,账户在针对电影希望上传涉及剧透的精彩影评时,可以通过勾选“涉及剧透”选项,将即将上传的影评标记为剧透文本。
168.在另一种可选的实施例中,可以针对所获取的第一待展示文本集合中包含任一预设剧透关键词的待展示文本,确定所包含的预设剧透关键词在目标多媒体中对应的位置;在所确定的位置在所针对的待展示文本的展示位置之后的情况下,将所针对的待展示文本确定为剧透文本。
169.其中,待展示文本所包含的预设剧透关键词在目标多媒体中对应的位置,可以是待展示文本的剧情位置。
170.可选地,预设剧透关键词可以包括剧情中通用的关键词,例如,“主角”、“角色”、“结局”、“高潮部分”等。
171.预设剧透关键词也可以包括多媒体的剧情中较为独特的关键词,例如,主角名字、独特的设定、关键地点等。
172.在另一种可选的实施例中,可以将所获取的第一待展示文本集合中,与任一已确定的剧透文本重合度大于预设重合度的待展示文本,确定为剧透文本。
173.其中,已确定的剧透文本可以包括之前确定的剧透文本、其他多媒体对应的剧透文本、或者其他方法确定的剧透文本,例如上述关键词、剧透标识等。
174.由于和已确定的任一剧透文本相似的文本,通常也会包含剧情信息,因此,可以将与已确定的任一剧透文本相似的文本也确定为剧透文本。具体可以通过计算文本之间的重合度确定是否相似。
175.本实施例并不限定计算重合度的方法,可选地,可以是将文本之间相同字符的数量与字符总数量的比值确定为重合度。
176.因此,可以在获取的待展示文本中,确定任一待展示文本与任一已确定的剧透文本之间的文本重合度,判断是否大于预设重合度,进而确定是否为剧透文本。
177.在本实施例中,可以通过预设操作标识、预设剧透关键词以及文本重合度,快速准确地确定出剧透文本,提高文本展示方法的执行效率,方便后续针对所确定的剧透文本执行操作。
178.在另一种可选的实施例中,可以确定目标多媒体当前对应的文本识别模型;文本识别模型可以用于识别目标多媒体对应的剧透文本;将所获取的第一待展示文本集合中待展示文本的文本特征和展示位置输入文本识别模型,并根据文本识别模型的输出确定剧透文本。
179.可选地,文本识别模型可以是基于剧透文本和非剧透文本预先训练的。其中的剧透文本可以是通过其他方法确定的,或者预先存储的。
180.可选地,文本识别模型可以是基于自然语言处理算法构建的,再进一步基于剧透文本和非剧透文本的样本进行训练。当然,文本识别模型也可以是通过其他算法构建的,例如,深度学习、神经网络等。
181.可选地,文本识别模型的输出,可以是待展示文本为剧透文本的概率,从而可以将输出概率大于预设概率的待展示文本确定为剧透文本。
182.在本实施例中,可以通过预先训练的文本识别模型,准确全面地确定出剧透文本,提高剧透文本识别的准确率和召回率,提高使用体验。
183.4、下面针对确定剧透文本时使用的文本识别模型进行详细的解释。
184.在一种可选的实施例中,不同的多媒体可以对应于相同的文本识别模型,针对不同的多媒体,可以使用相同的文本识别模型确定剧透文本。
185.由于可以将包含任一剧情信息的文本确定为每个多媒体对应的剧透文本,因此,可以综合包含任一多媒体的剧情信息的剧透文本,训练文本识别模型,得到相同的文本识别模型,针对每个多媒体进行剧透文本识别。
186.在本实施例中,使用相同的文本识别模型可以节约计算资源,无需针对每个多媒体分别训练文本识别模型。
187.在另一种可选的实施例中,不同的多媒体可以对应于不同的文本识别模型。针对不同的多媒体,可以使用对应的不同文本识别模型确定剧透文本。
188.由于针对单一多媒体,包含该多媒体自身相关剧情信息的剧透文本的出现频率较高,而包含其他多媒体相关剧情信息的剧透文本出现频率较低。不同的多媒体,所需要重点识别的剧透文本可能并不相同。
189.为了便于更准确地识别出多媒体对应的剧透文本,可以针对不同的多媒体,利用不同的训练集训练得到不同的文本识别模型。
190.在一种可选的实施例中,多媒体对应的待展示文本可以进行更新,例如,账户针对多媒体上传新的待展示文本。相对应地,多媒体对应的剧透文本也可以进行更新。
191.为了便于更准确地识别出多媒体对应的剧透文本,可以获取新的剧透文本重新训练多媒体对应的文本识别模型。
192.可选地,在不同多媒体对应于相同的文本识别模型的情况下,可以获取新的剧透文本,从而得到新的训练样本,共同用于重新训练相同的文本识别模型,可以得到相同的重新训练后的文本识别模型。
193.可选地,在不同多媒体对应于相同的文本识别模型的情况下,可以针对每个多媒体获取新的剧透文本,从而得到新的训练样本。换言之,不同的多媒体可以对应于不同的新训练样本。因此,可以针对不同的多媒体,利用不同的新训练样本重新针对相同的文本识别模型进行训练,可以得到不同的重新训练后的文本识别模型。
194.可选地,在不同多媒体对应于不同的文本识别模型的情况下,可以针对每个多媒体获取新的剧透文本,从而得到新的训练样本。换言之,不同的多媒体可以对应于不同的新训练样本。因此,可以针对不同的多媒体,利用不同的新训练样本重新针对不同的文本识别模型进行训练,可以得到不同的重新训练后的文本识别模型。
195.本方法流程并不限定具体的针对单个多媒体训练文本识别模型的方法,作为一种示例性说明,下面提供一种具体的文本识别模型训练方法。
196.可选地,文本识别模型的训练方法,可以包括:根据目标多媒体当前对应的剧透文本,获取训练样本;训练样本的样本特征包括剧透文本的文本特征和展示位置;根据所获取的训练样本,训练得到目标多媒体当前对应的文本识别模型。
197.其中,由于判断待展示文本是否属于剧透文本,是根据待展示文本的展示位置和剧情位置确定的,如果待展示文本的剧情位置在展示位置之后,则该待展示文本为剧透文本。
198.可选地,其中的展示位置可以直接针对待展示文本确定,剧情位置可以通过文本特征进行表征。因此,训练样本的样本特征可以包括剧透文本的文本特征和展示位置。
199.具体地,待展示文本的文本特征可以表征待展示文本所包含的剧情信息,从而可以表征待展示文本所包含的剧情信息在目标多媒体中的剧情位置。
200.例如,待展示文本本身的文本特征可以是“主角会赢”,可以用于表征目标多媒体中主角胜利剧情所在的位置,具体可以是视频播放过程中的第90分钟。如果该待展示文本的展示位置在第90分钟之后,则可以确定该待展示文本为非剧透文本;如果该待展示文本
的展示位置在第90分钟之前,则可以确定该待展示文本为剧透文本。
201.此外,由于目标多媒体对应的待展示文本可以实时更新,例如,针对同一视频,可能对应的弹幕每天都会增加,因此,在确定目标多媒体当前对应的文本识别模型时,可以实时地根据当前的剧透文本训练文本识别模型,通过最新的剧透文本提高文本识别模型的训练效果,从而提高剧透文本识别的准确率。
202.下面针对目标多媒体当前对应的剧透文本进行详细的解释。
203.在训练初文本识别模型时,需要利用剧透文本进行训练,因此,需要在训练之前,预先获取到剧透文本。具体可以是目标多媒体当前所确定的剧透文本。
204.其中,可选地,目标多媒体当前所确定的剧透文本,可以包括:具有剧透标识的剧透文本,具体可以是业务人员从目标多媒体对应的待展示文本中审核确定的剧透文本、账户标记或反馈的剧透文本等;也可以包括包含任一预设关键词的剧透文本;也可以是其他多媒体所确定的剧透文本,由于其他多媒体所确定的剧透文本包含剧情信息,因此,也可以确定为目标多媒体对应的剧透文本。
205.进一步地,目标多媒体当前所确定的剧透文本的数量可能较少,因此,可选地,可以基于当前确定的剧透文本进行扩展,得到较多的训练样本。
206.其中,可选地,由于与剧透文本相似的文本,可能包含有剧透文本中的剧情信息,因此,可以通过生成或者确定与剧透文本相似的文本,直接确定为剧透文本,得到相应的训练样本。
207.需要注意的是,针对文本特征,可以生成或确定相似的文本,但展示位置通常需要与原本的剧透文本保持一致。
208.因此,可选地,获取训练样本的方法,包括以下一种或多种。
209.将目标多媒体当前对应的剧透文本的文本特征和展示位置作为样本特征,并添加用于表征剧透文本的标签,得到训练样本。
210.生成与目标多媒体当前对应的任一剧透文本的重合度大于预设重合度的新增文本,将新增文本的文本特征和该剧透文本的展示位置作为样本特征,并添加用于表征剧透文本的标签,得到训练样本。
211.从目标多媒体当前对应的待展示文本中,确定与目标多媒体对应的任一剧透文本的重合度大于预设重合度的待展示文本,将所确定的待展示文本的文本特征和该剧透文本的展示位置作为样本特征,并添加用于表征剧透文本的标签,得到训练样本。
212.通过上述方法,可以扩展目标多媒体对应剧透文本的数量,同时也可以扩展训练样本中标注有剧透文本标签的样本数量,从而可以提高文本识别模型的训练效果,提高文本识别模型识别剧透文本的准确率。
213.其中,具体生成新增文本的方法本实施例并不限定,作为一种示例性说明,可以针对当前已经确定的剧透文本,通过增加预设词语、删除预设词语和/或修改预设词语,可以生成多个新增文本,从这些新增文本中,可以确定出与目标多媒体对应的任一剧透文本的重合度大于预设重合度的一个或多个新增文本,认为这些新增文本中包含了任一剧情信息,从而可以被确定为剧透文本,作为训练样本用于文本识别模型的训练。
214.在一种具体的示例中,针对当前已经确定的剧透文本“主角死了”,可以生成多个相似的文本,具体可以是增加或删除或修改预设词语,这些预设词语可以是用于形容或修
饰的。例如,快、不会、即将、马上、壮烈地、很久等等。可以基于这些预设词语生成相似文本,例如,“主角快死了”、“主角壮烈地死了”、“主角即将死了”等等。这些生成的相似文本与剧透文本“主角死了”的重合度较高,可以被确定为剧透文本,作为训练样本用于文本识别模型的训练。
215.确定文本重合度的方法本实施例也不限定,作为一种示例性说明,可以将两个文本之间相同字符数量与两个文本的字符总数量之间的比值确定为重合度。
216.在另一种具体的示例中,针对当前已经确定的剧透文本“主角死了”,可以计算这一剧透文本与待展示文本中的“这主角快死了”之间的重合度,具体可以是相同字符数量4与字符总数量10之间的比值为0.4,大于预设重合度0.3,因此,可以将待展示文本“这主角快死了”确定为剧透文本,作为训练样本用于文本识别模型的训练。
217.在本实施例中,可以根据剧透文本获取到训练样本,并且可以通过生成相似文本或者确定相似文本的方式,扩展剧透文本的数量,也就扩展了训练样本的数量,从而可以提高文本识别模型的训练效果。
218.在一种可选的实施例中,目标多媒体当前对应的文本识别模型可以更新。
219.由于目标多媒体对应的待展示文本可以更新,具体可以是接收账户针对目标多媒体上传的待展示文本,因此,其中也可能存在新的剧透文本。例如,账户最新标记或反馈的剧透文本、审核人员审核确定的新剧透文本等等。此外,随着多媒体的新增,这些多媒体也可以对应于新的剧透文本。
220.为了便于适应不断变化的情况,准确识别出新的剧透文本,可选地,可以利用新确定出的剧透文本,对文本识别模型重新训练,更新当前对应的文本识别模型。
221.可选地,可以在检测到训练样本集合更新后,利用更新后的训练样本集合重新训练当前的文本识别模型,将重新训练后的文本识别模型确定为当前的文本识别模型。
222.其中,训练样本集合可以用于训练文本识别模型,其中可以包括被标记为剧透文本和非剧透文本的训练样本。
223.在本实施例中,训练样本集合更新后,可以重新训练当前的文本识别模型,从而可以方便准确识别出新的剧透文本,提高使用体验。
224.其中,可选地,训练样本集合更新,可以包括:获取目标多媒体对应的新增剧透文本;根据新增剧透文本获取新的训练样本,添加到训练样本集合中。
225.针对目标多媒体,随着时间推移,可以接收到账户发送的新待展示文本,通过其他方式确定的剧透文本也可以新增,因此,可以更新训练样本集合,用于重新训练文本识别模型。
226.在本实施例中,可以通过利用新增的剧透文本更新训练样本集合,帮助更新训练文本识别模型,方便准确识别出新的剧透文本,提高使用体验。
227.其中,可选地,具体根据新增剧透文本获取新的训练样本,可以通过扩展训练样本的数量,提高文本识别模型的训练效果。
228.具体可以将新增剧透文本中的文本特征作为样本特征,并添加用于表征剧透文本的标签,得到训练样本;和/或生成与任一新增剧透文本的重合度大于预设重合度的新增文本,将新增文本中的文本特征作为样本特征,并添加用于表征剧透文本的标签,得到训练样本;和/或从目标多媒体当前对应的待展示文本中,确定与目标多媒体对应的任一新增剧透
文本的重合度大于预设重合度的待展示文本,将所确定的待展示文本中的文本特征作为样本特征,并添加用于表征剧透文本的标签,得到训练样本。
229.其中,生成新增文本的方法和确定重合度的方法的具体解释可以参见上文。
230.在本实施例中,可以在重新训练文本识别模型的过程中,根据新增剧透文本获取到训练样本,并且可以通过生成相似文本或者确定相似文本的方式,扩展剧透文本的数量,也就扩展了训练样本的数量,从而可以提高重新训练的文本识别模型的训练效果。
231.三、下面针对s102进行详细的解释。
232.上述针对s101的解释中,确定出目标多媒体对应的剧透文本,为了提高不同需求的账户的使用体验,可以区分了解目标多媒体剧情的账户和不了解目标多媒体剧情的账户,从而可以分别确定账户能够获取剧透文本。具体可以通过预设获取要求进行区分。
233.其中,针对了解目标多媒体剧情的账户,显然不会被剧透文本造成剧透的使用体验,从而可以获取剧透文本,提供更多数量和种类的待展示文本,提高使用体验;而针对不了解目标多媒体剧情的账户,由于会被剧透文本造成剧透的使用体验,因此,可以限定无法获取剧透文本,避免获取剧透文本后被剧透,提高使用体验。
234.因此,可选地,预设获取要求可以用于区分了解目标多媒体剧情的账户和不了解目标多媒体剧情的账户。
235.可选地,预设获取要求,可以用于表征账户获取过目标多媒体。换言之,可以将第一次获取目标多媒体的账户确定为不了解目标多媒体剧情的账户,将多次获取目标多媒体的账户确定为了解目标多媒体剧情的账户。
236.例如,针对第二次获取漫画的账户,可以认为该账户已经了解漫画剧情,可以允许获取剧透文本,提高该账户的使用体验;针对第一次获取电影的账户,可以认为该账户并不了解电影剧情,可以限定该账户无法获取到剧透文本,从而避免该账户被剧透,提高使用体验。
237.但在实际情况中,也可能存在账户获取目标多媒体的部分内容,从而不了解目标多媒体的剧情的情况,例如,账户只看了电影的前半部,或者只看了小说的第一章,在这种情况下,该账户仍然可能存在获取剧透文本而被剧透的可能。
238.在一种具体的示例中,账户以前获取过电影,但由于时间原因,只看到了电影的前半部分,而后半部分的剧情并不了解。因此,如果账户在第二次获取该电影时,如果获取到剧透文本,也可能被剧透后半部分的剧情,降低使用体验。
239.因此,具体可以是通过账户是否获取过目标多媒体的主要剧情内容,确定账户是否了解多媒体的剧情。其中,主要剧情内容可以包含目标多媒体的主要剧情,从而可以认为,获取过目标多媒体的主要内容的账户,了解目标多媒体的剧情。
240.可选地,预设获取要求,可以用于表征账户获取过目标多媒体的主要剧情内容。
241.相对应地,具体确定目标账户是否符合预设获取要求,可以通过判断目标账户是否获取过目标多媒体的主要剧情内容进行确定。
242.在目标账户获取过目标多媒体的主要剧情内容的情况下,可以确定目标账户符合预设获取要求,也就了解目标多媒体的剧情。
243.在目标账户没有获取过目标多媒体的主要剧情内容的情况下,可以确定目标账户不符合预设获取要求,也就不了解目标多媒体的剧情。
244.在一种具体的示例中,在目标账户获取过目标多媒体的主要剧情内容的情况下,可以为用目标账户添加一个预设获取标记,从而可以根据预设获取标记确定目标账户是否符合预设获取要求。
245.例如,当任一账户将一个电影/电视剧/番剧最后一集播放至片尾曲或结束时,记录该账户对该视频完成播放的状态,记录过该状态的账户可以被视为该电影/电视剧/番剧的“多次观看视频用户”,从而符合预设获取要求,可以被认为了解视频剧情,允许获取剧透文本。
246.在本实施例中,可以通过预设获取要求,快速准确地区分了解目标多媒体剧情的账户和不了解目标多媒体剧情的账户,提高文本展示方法的执行效率,方便后续确定目标账户能否获取剧透文本。
247.可选地,主要剧情内容可以包含目标多媒体的大部分剧情信息。因此,如果账户获取过目标多媒体的主要剧情内容,其中包含的大部分剧情信息已经被账户获取,也就无法因为获取到剧透文本而被剧透。
248.可选地,主要剧情内容具体可以是目标多媒体的全部内容。显然,在账户获取到目标多媒体的全部内容的情况下,可以确定账户了解目标多媒体的剧情。
249.可选地,具体确定主要剧情内容,需要将目标多媒体中的具体内容确定为主要剧情内容。
250.例如,针对电影,可以将片尾曲之前的全部视频内容确定为主要剧情内容;针对一篇漫画,可以将尾页之前的全部图片确定为主要剧情内容;针对一篇小说,可以将部分章节确定为主要剧情内容。
251.可选地,目标多媒体的主要剧情内容,可以包括:在目标多媒体中预设位置的内容;和/或在目标多媒体中占比大于预设比例的内容;和/或在目标多媒体中账户兴趣程度大于预设兴趣程度的内容;和/或在目标多媒体中具有预主要剧情标记的内容。
252.在一种可选的实施例中,主要剧情内容可以是在目标多媒体中预设位置的内容。由于账户在获取多媒体时,通常是按序获取的,因此,如果账户获取到目标多媒体中预设位置的内容,则账户很可能获取到目标多媒体中预设位置之前的内容,从而很可能获取到目标多媒体中的剧情。
253.可选地,预设位置可以是固定的,不同多媒体的预设位置可以相同。例如,不同电影的预设位置都为片尾曲位置。不同小说的预设位置都是尾声位置。例如,账户在获取电影时,通常是按照电影中的时间顺序获取的。如果账户获取到电影中的片尾曲内容,那么账户很可能获取到电影中片尾曲之前的全部内容,从而获取到电影剧情。
254.可选地,预设位置也可以是不固定的,不同多媒体的预设位置可以不同。例如,电影一的预设位置是结尾前5秒,电影二的预设位置是结尾前10秒。
255.在另一种可选的实施例中,主要剧情内容可以是在目标多媒体中占比大于预设比例的内容。如果账户获取过目标多媒体中的大部分内容,则账户很可能获取到目标多媒体中的剧情。其中,不同多媒体的预设比例可以相同,也可以不同。
256.例如,账户在获取漫画时,如果已经获取过99%的内容,那么账户很可能获取到漫画中的剧情。
257.在另一种可选的实施例中,主要剧情内容可以是在目标多媒体中账户兴趣程度大
于预设兴趣程度的内容。由于账户在获取多媒体时,针对多媒体中的关键剧情,通常兴趣程度较大,例如,电影中的关键转折、漫画中的精彩桥段等。因此,如果账户获取过目标多媒体中账户兴趣程度大于预设兴趣程度的内容,则账户很可能获取到目标多媒体中的剧情。
258.例如,账户在获取小说时,如果获取到账户兴趣程度较高的全部内容,则账户很可能获取到小说中的剧情。
259.其中,可选地,兴趣程度可以通过账户评论、弹幕数量等反映。例如,针对电影中的关键剧情,通常可能存在大量弹幕,进而可以确定弹幕数量大于预设弹幕数量的视频片段为主要剧情内容;针对小说的每章节的评论,如果某一章节的评论数量大于预设评论数量,则可以确定该章节为主要剧情内容。
260.在另一种可选的实施例中,主要剧情内容可以是在目标多媒体中具有主要剧情标记的内容。在目标多媒体中,可以由审核人员标记出包含主要剧情或者关键剧情的内容,具体可以是添加主要剧情标记,从而可以方便根据主要剧情标记确定主要剧情内容,
261.例如,业务方审核人员可以针对一部电影,标记出其中的重要剧情;也可以针对一部漫画,标记出中的重要图片;也可以针对一部小说,标记出其中的重要情节段落。
262.上述实施例可以通过预设位置、预设比例、兴趣程度和主要剧情标记,快速准确地确定出主要剧情内容,从而方便判断账户是否获取过主要剧情内容,是否符合预设获取要求,进而提高方法执行效率。
263.在一种可选的实施例中,具体判断目标账户是否符合预设获取要求,可以预先判断,也可以实时判断。
264.可选地,业务方在存储任一多媒体时,可以确定其中的主要剧情内容,当然,主要剧情内容可以更新。之后针对任一账户获取任一多媒体的操作,可以预先判断该账户针对该多媒体,是否符合预设获取要求。具体可以是通过预先判断该账户是否获取到该多媒体中的主要剧情内容进行确定。
265.如果该账户获取到该多媒体中的主要剧情内容,则可以确定该账户针对该多媒体符合预设获取要求。具体可以针对该账户进行标记。
266.本实施例中可以通过预先确定账户针对多媒体是否符合预设获取要求,方便后续快速确定目标账户能够获取剧透文本。
267.可选地,针对请求获取目标多媒体的目标账户,可以实时确定目标账户是否获取过目标多媒体的主要剧情内容,从而确定目标账户是否符合预设获取要求。
268.在确定目标账户符合预设获取要求的情况下,可以确定目标账户能够获取目标多媒体对应的剧透文本。
269.可选地,可以直接向目标账户发送目标多媒体对应的剧透文本,也可以在目标账户需要获取目标多媒体对应的待展示文本时,向目标账户发送包含目标多媒体对应的剧透文本的待展示文本。
270.在确定目标账户不符合预设获取要求的情况下,可以确定目标账户无法获取目标多媒体对应的剧透文本,从而可以避免目标账户获取到目标多媒体对应的剧透文本。即使目标账户需要获取目标多媒体对应的待展示文本,也只会向目标账户发送目标多媒体对应的剧透文本以外的待展示文本。
271.在本实施例中,可以为符合预设获取要求的目标账户提供数量和种类更多的待展
示文本,提高使用体验。也可以避免不符合预设获取要求的目标账户因为获取剧透文本而被剧透,从而提高使用体验。
272.在一种可选的实施例中,由于部分不了解多媒体剧情的账户实际也可能并不在意剧透,也可以进一步根据这类账户的实际需求,在不了解多媒体剧情的账户确定拒绝剧透的情况下,才会确定该账户无法获取剧透文本。
273.可选地,将所得到的第二待展示文本集合发送到目标账户,可以包括:在确定目标账户拒绝获取剧透文本的情况下,将所得到的第二待展示文本集合发送到目标账户。
274.本实施例并不限定如何确定目标账户拒绝获取剧透文本。
275.其中,可选地,确定目标账户拒绝获取剧透文本,可以是确定目标账户设置“避免剧透”或者“屏蔽剧透文本”。也可以是目标账户发送用于表征拒绝获取剧透文本的请求。
276.相对应地,在确定目标账户不拒绝获取剧透文本的情况下,可以将第一待展示文本集合发送到目标账户。
277.可选地,具体可以是将第一待展示文本集合中的全部或部分待展示文本发送到目标账户。
278.本实施例通过确定不符合预设获取要求的目标账户具体的需求,在确定目标账户拒绝获取剧透文本的情况下,才会避免将剧透文本发送给目标账户,从而可以更加贴合账户的使用需求,提高使用体验。
279.上述方法流程可以根据目标账户的需求,确定是否能够获取剧透文本,从而可以在确定目标账户不了解目标多媒体剧情的情况下,避免目标账户因为获取剧透文本而被剧透,提高了使用体验;也可以在确定目标账户了解目标多媒体剧情的情况下,使得了解剧情的目标账户能够获取剧透文本,进而可以因为获取到数量和种类更多的待展示文本而提高使用体验。
280.此外,由于上述方法流程可以是自动执行的,并不需要目标账户的参与,因此,可以在目标账户无感知的情况下,确定是否发送剧透文本,从而提高目标账户的使用体验。
281.而对于多次获取的目标账户,也可以提供更多种类和数量的文本,提高使用体验。
282.并且,屏蔽剧透文本这一功能,也可以与屏蔽其他待展示文本的功能同时生效,并不会彼此影响。
283.为了便于理解,本公开还提供了一种应用实施例。具体可以是在视频弹幕的场景中,识别出剧透弹幕。
284.账户在播放视频时,通常需要打开弹幕,与视频内容一同观看。其中,可以将存在视频剧情泄露信息的弹幕为剧透弹幕。
285.如果账户是初次观看视频,则容易因为观看到剧透弹幕而被剧透,降低观看体验,因此,需要为初始观看视频的账户屏蔽剧透文本,可以避免初次观看视频的账户因为观看到剧透弹幕而被剧透,提高使用体验。
286.如果账户是二次观看视频,甚至是多次观看视频,则并不会因为观看到剧透文本而被剧透,为了丰富视频弹幕数量和种类,并不需要为多次观看视频的账户屏蔽剧透文本,可以提高使用体验。
287.因此,如图2所示,图2是根据一示例性实施例示出的一种视频弹幕展示方法的流程图。具体的方法可以包括以下步骤。
288.s201:在目标视频对应的弹幕中确定剧透弹幕。
289.具体确定剧透弹幕的方法,可以包括:通过预先训练的自然语言处理模型,在目标视频对应的弹幕中确定出剧透弹幕,具体可以将所确定的剧透文本标记为“剧透类弹幕”;也可以在目标视频对应的弹幕中,将与任一已确定的剧透弹幕相似度较高的弹幕确定为剧透弹幕,具体可以是将所确定的剧透文本标记为“剧透类弹幕”;账户在针对目标视频发送弹幕时,可以点击“含有剧透内容”的选项,在点击这一选项的情况下发送的弹幕,可以直接确定为剧透弹幕,具体可以是将所发送的剧透文本标记为“剧透类弹幕”。
290.进一步地,也可以由业务方的审核人员根据经验,确定出目标视频对应的剧透弹幕,并核对其他方法确定出的剧透弹幕。具体可以是由审核人员直接在确定剧透弹幕的情况下,将所确定的剧透弹幕标记为“剧透类弹幕”,在确定某一其他方法确定的剧透弹幕实际并不涉及剧透时,也可以取消该剧透弹幕的标记。
291.可选地,可以设置弹幕数据库,其中存储有视频与弹幕的对应关系。并且针对弹幕信息,可以增加字段用于标记“剧透类弹幕”。
292.s202:针对请求获取目标视频的目标账户,判断是否为初次观看账户。如果是初次观看账户,则可以执行s203,;如果不是初次观看账户,则可以执行s204。
293.其中,当账户没有完成观看该电影/电视剧/番剧的主要内容(不含片尾曲)时,可以认为该账户为该视频的“初次观看账户”,否则可以认为是“多次观看账户”。
294.可选地,当账户将一个电影/电视剧/番剧最后一集播放至片尾曲或结束时,记录该账户对该视频完成播放的状态,记录过该状态的账户可以视为该电影/电视剧/番剧的“多次观看账户”。
295.如果没有记录这一状态,则可以将该账户视为该视频的“初次观看账户”。
296.可选地,可以在账户视频数据库中存储账户与播放完成的视频之间的对应关系,其中可以包括账户标识与视频标识,用于表征账户针对对应的视频,并不是初次观看账户。
297.因此,具体判断是否为初次观看账户,可以通过账户视频数据库,判断目标账户对应的视频标识中,是否包含目标视频标识。如果包含,则目标账户不是初次观看账户;如果不包含,则目标账户是初次观看账户。
298.s203:将目标视频对应弹幕中,剧透弹幕以外的弹幕发送给目标账户。
299.s204:将目标视频对应弹幕发送给目标账户。
300.其中,在本实施例中,针对只看视频的账户,账户在“初次观看”一个视频时,可以看不到“剧透类弹幕”。当该账户想重新观看这个视频时,可以看到包含“剧透类弹幕”在内的所有弹幕。从而可以针对初次观看和多次观看的账户的使用体验。
301.针对发送弹幕的账户,在发送弹幕时可以看到“含有剧透类内容”的勾选框,若担心自己的弹幕会有剧透影响时可勾选此框再进行发送弹幕,可以避免账户因为担心剧透影响而不发送弹幕,提高账户发送弹幕的使用体验。
302.本实施例可以提升多次观看视频账户的体验,提供更多种类/数量的弹幕;也可以提升初次观看视频账户的体验,将剧透类弹幕提前确定并屏蔽;也可以提升弹幕生产者的体验,不再因为含有剧透信息而不敢发送弹幕。
303.图3是根据一示例性实施例示出的一种文本展示装置的框图。参照图3,该装置包括获取单元301和发送单元302。
304.获取单元301,被配置为执行:获取目标多媒体对应的第一待展示文本集合,在所获取的第一待展示文本集合中确定剧透文本;所述剧透文本的剧情位置在展示位置之后;所述剧情位置是剧透文本包含的剧情信息在所述目标多媒体中对应的位置;所述展示位置是剧透文本在所述目标多媒体中展示的位置。
305.发送单元302,被配置为执行:针对请求获取所述目标多媒体的目标账户,在确定所述目标账户不符合预设获取要求的情况下,删除所述第一待展示文本集合中的剧透文本,得到第二待展示文本集合,将所得到的第二待展示文本集合发送到所述目标账户。
306.可选地,发送单元302,包括:拒绝子单元302a,被配置为执行:在确定所述目标账户拒绝获取剧透文本的情况下,将所得到的第二待展示文本集合发送到所述目标账户。
307.可选地,获取单元301,包括:剧透文本确定子单元301a,被配置为执行以下一种或多种确定剧透文本的方法:
308.将所获取的第一待展示文本集合中具有剧透标识的待展示文本,确定为剧透文本;所述剧透标识是针对预设账户操作指定的待展示文本添加的;所述预设账户操作用于指定剧透文本;
309.针对所获取的第一待展示文本集合中包含任一预设剧透关键词的待展示文本,确定所包含的预设剧透关键词在所述目标多媒体中对应的位置;在所确定的位置在所针对的待展示文本的展示位置之后的情况下,将所针对的待展示文本确定为剧透文本;
310.将所获取的第一待展示文本集合中,与任一已确定的剧透文本重合度大于预设重合度的待展示文本,确定为剧透文本。
311.可选地,获取单元301,包括:模型确定子单元301b,被配置为执行:确定所述目标多媒体当前对应的文本识别模型;所述模型用于识别所述目标多媒体对应的剧透文本;将所获取的第一待展示文本集合中待展示文本的文本特征和展示位置输入所述模型,并根据所述模型的输出确定剧透文本。
312.可选地,获取单元301,包括:模型训练子单元301c,被配置为执行:根据所述目标多媒体当前对应的剧透文本,获取训练样本;所述训练样本的样本特征包括剧透文本的文本特征和展示位置;根据所获取的训练样本,训练得到所述目标多媒体当前对应的文本识别模型。
313.可选地,模型训练子单元301c,包括:样本获取子单元301c1,被配置为执行以下一种或多种获取训练样本的方法:
314.将所述目标多媒体当前对应的剧透文本的文本特征和展示位置作为样本特征,并添加用于表征剧透文本的标签,得到训练样本;
315.生成与所述目标多媒体当前对应的任一剧透文本的重合度大于预设重合度的新增文本,将所述新增文本的文本特征和该剧透文本的展示位置作为样本特征,并添加用于表征剧透文本的标签,得到训练样本;
316.从所述目标多媒体当前对应的待展示文本中,确定与所述目标多媒体对应的任一剧透文本的重合度大于预设重合度的待展示文本,将所确定的待展示文本的文本特征和该剧透文本的展示位置作为样本特征,并添加用于表征剧透文本的标签,得到训练样本。
317.可选地,所述预设获取要求,用于表征所述目标账户获取过所述目标多媒体的主要剧情内容。
318.可选地,所述主要剧情内容,包括:
319.在所述目标多媒体中预设位置的内容;和/或
320.在所述目标多媒体中占比大于预设比例的内容;和/或
321.在所述目标多媒体中账户兴趣程度大于预设兴趣程度的内容;和/或
322.在所述目标多媒体中具有主要剧情标记的内容。
323.关于上述实施例中的装置,其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述,此处将不做详细阐述说明。
324.本公开的实施例还提出一种电子设备,包括:
325.处理器;
326.用于存储所述处理器可执行指令的存储器;
327.其中,所述处理器被配置为执行所述指令,以实现上述任一实施例所述的文本展示方法。
328.本公开的实施例还提出一种计算机可读存储介质,当所述计算机可读存储介质中的指令由电子设备的处理器执行时,使得所述电子设备能够执行上述任一实施例所述的文本展示方法。
329.本公开的实施例还提出一种计算机程序产品,包括计算机程序,所述计算机程序被处理器执行时实现上述任一实施例所述的文本展示方法。
330.图4是根据一示例性实施例示出的一种电子设备的示意框图。参照图4,电子设备500可以包括以下一个或多个组件:处理组件502,存储器504,电源组件506,多媒体组件508,音频组件510,输入/输出(i/o)的接口512,传感器组件514,以及通信组件518。上述电子设备/服务器可以采用类似的硬件架构。
331.处理组件502通常控制电子设备500的整体操作,诸如与显示,电话呼叫,数据通信,相机操作和记录操作相关联的操作。处理组件502可以包括一个或多个处理器520来执行指令,以完成上述文本展示方法的全部或部分步骤。此外,处理组件502可以包括一个或多个模块,便于处理组件502和其他组件之间的交互。例如,处理组件502可以包括多媒体模块,以方便多媒体组件508和处理组件502之间的交互。
332.存储器504被配置为存储各种类型的数据以支持在电子设备500的操作。这些数据的示例包括用于在电子设备500上操作的任何应用程序或方法的指令,联系人数据,电话簿数据,消息,图片,视频等。存储器504可以由任何类型的易失性或非易失性存储设备或者它们的组合实现,如静态随机存取存储器(sram),电可擦除可编程只读存储器(eeprom),可擦除可编程只读存储器(eprom),可编程只读存储器(prom),只读存储器(rom),磁存储器,快闪存储器,磁盘或光盘。
333.电源组件506为电子设备500的各种组件提供电力。电源组件506可以包括电源管理系统,一个或多个电源,及其他与为电子设备500生成、管理和分配电力相关联的组件。
334.多媒体组件508包括在电子设备500和用户之间的提供一个输出接口的屏幕。在一些实施例中,屏幕可以包括液晶显示器(lcd)和触摸面板(tp)。如果屏幕包括触摸面板,屏幕可以被实现为触摸屏,以接收来自用户的输入信号。触摸面板包括一个或多个触摸传感器以感测触摸、滑动和触摸面板上的手势。所述触摸传感器可以不仅感测触摸或滑动动作的边界,而且还检测与所述触摸或滑动操作相关的持续时间和压力。在一些实施例中,多媒
体组件508包括一个前置摄像头和/或后置摄像头。当电子设备500处于操作模式,如拍摄模式或视频模式时,前置摄像头和/或后置摄像头可以接收外部的多媒体数据。每个前置摄像头和后置摄像头可以是一个固定的或具有焦距和光学变焦能力的光学透镜系统。
335.音频组件510被配置为输出和/或输入音频信号。例如,音频组件510包括一个麦克风(mic),当电子设备500处于操作模式,如呼叫模式、记录模式和语音识别模式时,麦克风被配置为接收外部音频信号。所接收的音频信号可以被进一步存储在存储器504或经由通信组件518发送。在一些实施例中,音频组件510还包括一个扬声器,用于输出音频信号。
336.i/o接口512为处理组件502和外围接口模块之间提供接口,上述外围接口模块可以是键盘,点击轮,按钮等。这些按钮可包括但不限于:主页按钮、音量按钮、启动按钮和锁定按钮。
337.传感器组件514包括一个或多个传感器,用于为电子设备500提供各个方面的状态评估。例如,传感器组件514可以检测到电子设备500的打开/关闭状态,组件的相对定位,例如所述组件为电子设备500的显示器和小键盘,传感器组件514还可以检测电子设备500或电子设备500一个组件的位置改变,用户与电子设备500接触的存在或不存在,电子设备500方位或加速/减速和电子设备500的温度变化。传感器组件514可以包括接近传感器,被配置用来在没有任何的物理接触时检测附近物体的存在。传感器组件514还可以包括光传感器,如cmos或ccd图像传感器,用于在成像应用中使用。在一些实施例中,该传感器组件514还可以包括加速度传感器,陀螺仪传感器,磁传感器,压力传感器或温度传感器。
338.通信组件518被配置为便于电子设备500和其他设备之间有线或无线方式的通信。电子设备500可以接入基于通信标准的无线网络,如wifi,运营商网络(如2g、3g、4g或5g),或它们的组合。在一个示例性实施例中,通信组件518经由广播信道接收来自外部广播管理系统的广播信号或广播相关信息。在一个示例性实施例中,所述通信组件518还包括近场通信(nfc)模块,以促进短程通信。例如,在nfc模块可基于射频识别(rfid)技术,红外数据协会(irda)技术,超宽带(uwb)技术,蓝牙(bt)技术和其他技术来实现。
339.在本公开一实施例中,电子设备500可以被一个或多个应用专用集成电路(asic)、数字信号处理器(dsp)、数字信号处理设备(dspd)、可编程逻辑器件(pld)、现场可编程门阵列(fpga)、控制器、微控制器、微处理器或其他电子元件实现,用于执行上述文本展示方法。
340.在本公开一实施例中,还提供了一种包括指令的计算机可读存储介质,例如包括指令的存储器504,上述指令可由电子设备500的处理器520执行以完成上述文本展示方法。例如,所述计算机可读存储介质可以是rom、随机存取存储器(ram)、cd-rom、磁带、软盘和光数据存储设备等。
341.本领域技术人员在考虑说明书及实践这里公开的公开后,将容易想到本公开的其它实施方案。本公开旨在涵盖本公开的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本公开的真正范围和精神由下面的权利要求指出。
342.应当理解的是,本公开并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本公开的范围仅由所附的权利要求来限制。
343.需要说明的是,在本公开中,诸如第一和第二等之类的关系术语仅仅用来将一个
实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个
……”
限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
344.以上对本公开实施例所提供的方法和装置进行了详细介绍,本文中应用了具体个例对本公开的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本公开的方法及其核心思想;同时,对于本领域的一般技术人员,依据本公开的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本公开的限制。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献