一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

账号等级识别方法、装置及存储介质与流程

2022-12-23 21:18:00 来源:中国专利 TAG:


1.本发明涉及数据处理技术领域,尤其涉及一种账号等级识别方法、装置及存储介质。


背景技术:

2.各个多媒体应用平台都会对账号进行等级识别,并基于识别的账号等级,确定是否为该账号已发布的多媒体资源提供流量支持。比如,对账号等级高的,提供大量的流量支持,此时,账号等级高的账号已发布的多媒体资源具有较高的点击率和转化率,为该账号对应的创作者带来较大的收益。
3.目前,账号等级的识别方式主要是:基于已发布的各个多媒体资源的历史播放次数确定的。采用目前的识别方式,将导致账号等级两极分化严重,平台流量分布不合理;即等级越高的账号,由于分配大量的流量,使对应的账号等级越来越高,而等级较低的账号由于没有流量支持,使账号等级较低。
4.因此,如何准确识别账号等级,以合理分布多媒体应用平台的流量,是一个需要解决的问题。


技术实现要素:

5.本技术提供一种账号等级识别方法、装置及存储介质,用以提高账号等级识别的准确率。
6.第一方面,本技术实施例提供一种账号等级识别方法,该方法包括:
7.分别获得待识别账号已发布的各个多媒体资源的多媒体资源等级,并基于获得的各个多媒体资源等级,确定待识别账号的第一参考账号等级;
8.基于各个多媒体资源,分别与各个参考账号已发布的各个参考多媒体资源之间的内容相似度,分别确定待识别账号与各个参考账号之间的账号相似度;
9.基于获得的各个账号相似度,在各个参考账号中,筛选出至少一个关联账号,并基于至少一个关联账号的账号等级,确定待识别账号的第二参考账号等级;
10.基于第一参考账号等级和第二参考账号等级,确定待识别账号的目标账号等级。
11.第二方面,本技术实施例提供一种账号等级识别装置,该装置包括:
12.获得单元,用于分别获得待识别账号已发布的各个多媒体资源的多媒体资源等级,并基于获得的各个多媒体资源等级,确定待识别账号的第一参考账号等级;
13.相似度匹配单元,用于基于各个多媒体资源,分别与各个参考账号已发布的各个参考多媒体资源之间的内容相似度,分别确定待识别账号与各个参考账号之间的账号相似度;
14.筛选单元,基于获得的各个账号相似度,在各个参考账号中,筛选出至少一个关联账号,并基于至少一个关联账号的账号等级,确定待识别账号的第二参考账号等级;
15.确定单元,基于第一参考账号等级和第二参考账号等级,确定待识别账号的目标
账号等级。
16.在一种可能的实现方式中,若多媒体资源等级包括内容质量等级;
17.获得单元,具体用于:
18.针对各个多媒体资源,分别执行以下操作:
19.针对各个多媒体资源中的一个多媒体资源,获取一个多媒体资源的内容特征,其中,内容特征是基于图像特征信息、音频特征信息和文字特征信息中的至少一种确定的;
20.基于内容特征,获得一个多媒体资源的内容质量等级。
21.在一种可能的实现方式中,若多媒体资源等级包括目标播放等级;
22.获得单元,具体用于:
23.针对各个多媒体资源,分别执行以下操作:
24.针对各个多媒体资源中的一个多媒体资源,基于获取的一个多媒体资源对应的目标播放参数,以及基于多媒体资源平台的所有多媒体资源确定的第一参考播放参数,确定一个多媒体资源对应的第一子播放等级,其中,目标播放参数是基于一个多媒体资源的目标播放次数、每次播放的播放时长、目标播放完成度以及总目标时长中的至少一种确定的;以及
25.获取一个多媒体资源的内容特征,并基于内容特征,获得一个多媒体资源对应的第二子播放等级,其中,内容特征是基于图像特征信息、音频特征信息和文字特征信息中的至少一种确定的;
26.基于一个多媒体资源的第一子播放等级和第二子播放等级,确定一个多媒体资源的目标播放等级。
27.在一种可能的实现方式中,获得单元,还用于:
28.基于目标播放参数与第一参考播放参数之间的比例关系,确定候选播放等级;
29.基于候选播放等级,确定一个多媒体资源对应的第一子播放等级。
30.在一种可能的实现方式中,获得单元,具体用于:
31.针对各个多媒体资源,分别执行以下操作:针对各个多媒体资源中的一个多媒体资源,基于多媒体资源等级以及一个多媒体资源对应的第一权重参数,确定一个多媒体资源对于待识别账号的第一子参考账号等级;
32.基于获得的各个第一子参考账号等级,确定待识别账号的第一参考账号等级。
33.在一种可能的实现方式中,获得单元通过如下方式确定各个多媒体资源对应的第一权重参数:
34.针对各个多媒体资源,分别执行以下操作:
35.针对各个多媒体资源中的一个多媒体资源,基于一个多媒体资源对应的目标播放参数,与基于待识别账号已发布的所有多媒体资源确定的第二参考播放参数之前的比例关系,确定一个多媒体资源对应的第一权重参数。
36.在一种可能的实现方式中,相似度匹配单元,具体用于:
37.针对各个参考账号,分别执行以下操作:
38.针对各个参考账号中的一个参考账号,获取一个参考账号已发布的各个参考多媒体资源;
39.分别确定各个多媒体资源各自对应的第一子内容相似度集合,并基于从各个第一
子内容相似度集合中筛选出的第一目标子内容相似度,确定第一目标内容相似度,其中,每个第一子内容相似度集合中包括基于相应的一个多媒体资源与各个参考多媒体资源之间的相似度,确定的第一子内容相似度;
40.分别确定各个参考多媒体资源各自对应的第二子内容相似度集合,并基于从各个第二子内容相似度集合中筛选出的第二目标子内容相似度,确定第二目标内容相似度,其中,每个第二子内容相似度集合中包括基于相应的一个参考多媒体资源与各个多媒体资源之间的相似度,确定的第二子内容相似度;
41.基于第一目标内容相似度和第二目标内容相似度,确定待识别账号与一个参考账号之间的账号相似度。
42.在一种可能的实现方式中,筛选单元,具体用于:
43.针对至少一个关联账号,分别执行以下操作:针对至少一个关联账号中的一个关联账号,基于一个关联账号的账号等级,和一个关联账号对应的第二权重参数,确定一个关联账号对应的第二子参考账号等级,其中,第二权重参数是基于一个关联账号对应的账号相似度,以及至少一个关联账号对应的账号相似度总和确定的;
44.基于获得的各个第二子参考账号等级,确定待识别账号的第二参考账号等级。
45.在一种可能的实现方式中,确定单元,还用于:
46.确定待识别账号的目标账号等级后,基于目标账号等级,对待识别账号已发布的各个多媒体资源进行推荐。
47.第三方面,本技术实施例提供一种账号等级识别设备,包括:存储器和处理器,其中,存储器,用于存储计算机指令;处理器,用于执行计算机指令以实现本技术实施例提供的账号等级识别方法。
48.第四方面,本技术实施例提供一种计算机可读存储介质,计算机可读存储介质存储有计算机指令,计算机指令被处理器执行时实现本技术实施例提供的账号等级识别方法。
49.本技术有益效果如下:
50.本技术实施例提供一种账号等级识别方法、装置及存储介质,用以提高账号等级识别的准确性。结合待识别账号已发布的各个多媒体资源的多媒体资源等级,以及与待识别账号相似的至少一个关联账号的账号等级,对待识别账号的账号等级进行识别。在本技术实施例中,基于待识别账号已发布的各个多媒体资源的多媒体资源等级,确定待识别账号的第一参考账号等级,不再仅基于多媒体资源的历史播放情况识别账号等级,避免账号等级固化;同时,根据各个多媒体资源,分别与各个参考账号已发布的各个参考多媒体资源之间的内容相似度,分别确定待识别账号与各个参考账号之间的账号相似度,基于多媒体资源之间的内容相似度,准确的确定出账号相似度,然后基于确定的账号相似度,在各个参考账号中,筛选出符合条件的至少一个关联账号,并基于至少一个关联账号的账号等级,确定待识别账号的第二参考等级,无需等待多媒体资源进行一定时间的曝光后才能进行计算,提高待识别账号的账号等级的时效性;最后,基于第一参考账号等级和第二参考账号等级,确定待识别账号的目标账号等级,提高账号等级识别的准确性。
51.本技术的其它特征向量和优点将在随后的说明书中阐述,并且,子模型地从说明书中变得显而易见,或者通过实施本技术而了解。本技术的目的和其他优点可通过在所写
的说明书、权利要求书、以及附图中所特别指出的结构来实现和获得。
附图说明
52.为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简要介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域的普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
53.图1为本技术实施例提供的一种多媒体资源播放的示意图;
54.图2为本技术实施例提供的一种应用场景示意图;
55.图3为本技术实施例提供的一种账号等级识别的方法流程图;
56.图4为本技术实施例提供的一种第一等级识别模型的结构图;
57.图5为本技术实施例提供的一种确定一个多媒体资源对应的内容质量等级的方法流程图;
58.图6为本技术实施例提供的一种确定一个多媒体资源的第一播放等级的方法流程图;
59.图7为本技术实施例提供的一种确定一个多媒体资源对应的第二子播放等级的方法流程图;
60.图8为本技术实施例提供的一种确定一个多媒体资源的第一权重参数的方法流程图;
61.图9为本技术实施例提供的一种确定待识别账号与一个参考账号之间的账号相似度的方法流程图;
62.图10为本技术实施例提供的一种确定多媒体资源与参考多媒体资源之间的内容相似度的网络结构图;
63.图11为本技术实施例提供的一种确定一个多媒体资源的第二权重参数的方法流程图;
64.图12为本技术实施例提供的一种账号等级识别装置的结构图;
65.图13为本技术实施例提供的一种计算设备结构图。
具体实施方式
66.为了使本技术的目的、技术方案及有益效果更加清楚明白,以下将结合本技术实施例中的附图,对本技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本技术部分实施例,并不是全部的实施例。基于本技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本技术保护的范围。
67.本技术的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本技术的实施例能够以除了在这里图示或描述的那些以外的顺序实施。
68.以下对本技术实施例中的部分用语进行解释说明,以便于本领域技术人员理解。
69.1、语音技术(speech technology)的关键技术有自动语音识别技术(automatic speech recognition,asr)和语音合成技术(text to speech,tts)以及声纹识别技术。让计算机能听、能看、能说、能感觉,是未来人机交互的发展方向,其中语音成为未来最被看好的人机交互方式之一。
70.自动语音识别技术其目标是将人类的语音中的词汇内容转换为文本或计算机可读的输入,例如按键、二进制编码或者字符序列。
71.2、光学字符标识(optical character recognition,orc)是一种将图片上的文字转换成文本的技术。其主要包括图像预处理、文字特征抽取、对比识别、字词后处理以及输出得到的文本等过程,在本技术实施例中主要是对待处理视频中每帧图像包括的文字进行转换,转换成相应的文本信息。
72.3、账号,账号是数字时代的代表,就是每创造者在多媒体资源平台中所代表自己的一些数字等。账号有时可以由中文或英文组成,甚至是一些符号。即一个账号用于表征一个创作者或一个创作团队,该创作者可以使用该账号登录多媒体资源平台,并在该多媒体资源平台上发布多媒体资源,因此一个账号对应多个已发布的多媒体资源。
73.4、多媒体资源等级,本技术实施例中多媒体资源等级是基于多媒体资源内容质量等级、多媒体资源目标播放等级中的至少一种确定的,用于表征多媒体资源的内容受欢迎程度。其中,多媒体资源内容质量等级是基于多媒体资源内容确定的,多媒体资源目标播放等级是基于多媒体资源的播放参数确定的。
74.其中,多媒体资源的播放参数包括该多媒体资源的播放次数,每次播放的播放时长、多媒体资源的总目标时长以及目标播放完成度中的至少一种。
75.以多媒体资源为视频进行举例,请参考图1,图1提供了一种多媒体资源播放的示意图,从图1中可知该多媒体资源的总目标时长为5分32秒,此次播放的播放时长为47秒,目标播放完成度是基于每次播放完成度确定的平均播放完成度,每次播放完成度为每次播放的播放时长与总目标时长之间的比值。
76.5、关联账号,是与待识别账号相似的账号;是基于待识别账号已发布的多媒体资源,与参考账号已发布的参考多媒体资源之间的内容相似度确定的;
77.参考账号,是确定待识别账号的账号等级时,需要参考的账号。参考账号可以为多媒体资源平台中除待识别账号以外的所有账号;也可以为从多媒体平台中除待识别账号以外的所有账号中,筛选出的部分账号。
78.下面对本技术实施例的设计构思进行简单介绍。
79.本技术实施例涉及多媒体资源推荐、分发的场景,在进行多媒体资源推荐、分发的过程中,多媒体资源平台对于同类型的多媒体资源推荐、分发时,也会确定先后顺序,推荐、分发的顺序一般是基于多媒体资源对应的账号等级进行排序的,具体的,对于账号等级较高的账号所发布的多媒体资源进行优先推荐、分发。
80.即,多媒体资源平台针对各个账号进行等级识别,然后基于识别的等级确定是否为账号提供流量支持。对于账号等级高的账号,提供大量的流量支持。也就是说,在推荐、分发的时候优先推荐、分发账号等级高的账号发布的多媒体资源,此时账号等级高的账号所发布的多媒体资源具有较高的点击率和转化率,为账号等级高的创作者带来较大的收益。
81.相关技术中,在进行账号等级识别的过程中,主要基于账号中已发布的多媒体资
源的历史播放次数进行确定。一个多媒体资源播放次数越多,该多媒体资源对应的账号的账号等级也就越高。又因为多媒体平台在进行多媒体资源推荐、分发时,是基于多媒体资源对应的账号等级进行推荐、分发的;在这种情况下,将出现账号等级高的多媒体资源被播放的次数多,而账号等级低的多媒体资源由于没有流量支持,被播放的次数少的情况。
82.因此,在根据播放情况确定账号等级时,账号等级较高的依旧较高。而账号等级较低的,由于被播放的次数较少,导致账号等级提高的难度较大;比如,账号为新账号,由于没有历史播放次数的支持,该新账号的账号等级较低,即使通过该账号发布多媒体资源,由于没有流量支持,被播放的次数较少,在基于播放情况确定账号等级时,账号等级不会发生明显变化。此时,导致账号等级固化,两极分化严重,平台流量分布不合理;严重时还会影响多媒体资源质量,因为不论账号等级高的账号发布什么样的多媒体资源,多媒体资源平台都会给流量支持,而对于账号等级低的账号,即使发布了质量较高的多媒体资源,而由于等级较低没有流量支持,被播放的次数少,至使收益低,影响创作者的创作热情,最终导致多媒体资源平台的多媒体资源质量降低。
83.有鉴于此,本技术实施例提供一种账号等级识别方法、装置及存储介质,以提高账号等级识别的准确性,避免账号等级两极分化,提高多媒体质量平台分布流量的合理性。
84.在本技术实施例中,分别获取待识别账号已发布的各个多媒体资源的多媒体资源等级,并基于获得的各个多媒体资源等级,确定待识别账号的第一参考账号等级;基于各个多媒体资源,分别与各个参考账号已发布的各个参考多媒体资源之间的内容相似度,分别确定待识别账号与各个参考账号之间的账号相似度;然后,基于各个账号相似度,在各个参考账号中,筛选出至少一个关联账号,并基于至少一个关联账号的账号等级,确定待识别账号的第二参考账号等级;最后基于第一参考账号等级和第二参考账号等级,确定待识别账号的目标账号等级。
85.在一种可能的实现方式中,多媒体资源等级是基于多媒体资源的内容质量等级,以及多媒体资源的目标播放等级中的一种确定的;其中,多媒体资源的目标播放等级,是基于多媒体资源的播放参数确定的用于表征历史播放情况的第一子播放等级,以及基于多媒体资源的内容特征预测的第二子播放等级中的一种确定的。
86.在本技术实施例中,确定多媒体资源的内容质量等级,以及预测多媒体资源的第二子播放等级的过程中,涉及人工智能(artificial intelligence,ai)和机器学习技术,基于人工智能中的语音技术、自然语言处理技术和机器学习(machine learning,ml)而设计。
87.人工智能是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。换句话说,人工智能是计算机科学的一个综合技术,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器。
88.人工智能也就是研究各种智能机器的设计原理与实现方法,使机器具有感知、推理与决策的功能。人工智能技术主要包括计算机视觉技术、自然语言处理技术、以及机器学习/深度学习等几大方向。随着人工智能技术研究和进步,人工智能在多个领域展开研究和应用,例如常见的智能家居、智能客服、虚拟助理、智能音箱、智能营销、无人驾驶、自动驾驶、机器人、智能医疗等,相信随着技术的发展,人工智能将在更多的领域获得应用,并发挥
越来越重要的价值。
89.机器学习是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。对比于数据挖掘从大数据之间找相互特性而言,机器学习更加注重算法的设计,让计算机能够自动地从数据中“学习”规律,并利用规律对未知数据进行预测。
90.机器学习是人工智能的核心,是使计算机具有智能的根本途径,其应用遍及人工智能的各个领域。机器学习和深度学习通常包括人工神经网络、置信网络、强化学习、迁移学习、归纳学习等技术。强化学习(reinforcement learning,rl),又称再励学习、评价学习或增强学习,是机器学习的范式和方法论之一,用于描述和解决智能体(agent)在与环境的交互过程中通过学习策略以达成回报最大化或实现特定目标的问题。
91.本技术实施例,在基于各个多媒体资源等级确定第一参考账号等级时,多媒体资源等级是基于多媒体资源的内容质量等级和多媒体资源的目标播放等级中的一种确定的,不再仅参考历史播放次数,因此若仅根据第一参考账号等级确定待识别账号的目标账号等级时,已提高了账号等级识别的准确率;同时,确定与待识别账号相似的关联账号,并基于关联账号的账号等级,确定第二参考账号等级,由于关联账号的账号等级已知,因此可以快速确定第二参考账号等级,提高确定第二参考账号等级的时效性,若仅根据第二参考账号等级确定待识别账号的目标等级时,因为关联账号是基于多媒体资源之间的内容相似度确定的,因此可以准确的确定相似的关联账号,基于关联账号的账号等级准确的确定出目标账号等级,在提高时效性的同时,提高准确性;最后,基于第一参考账号等级和第二参考账号等级,确定待识别账号的时,提高识别的准确性。
92.在介绍完本技术实施例的设计思想之后,下面对本技术实施例的技术方案能够适用的应用场景做一些简单介绍,需要说明的是,以下介绍的应用场景仅用于说明本技术实施例而非限定。在具体实施过程中,可以根据实际需要灵活地应用本技术实施例提供的技术方案。
93.请参考图2,图2示例性提供本技术实施例提供的一种应用场景,该应用场景中包括发布者终端设备10、服务器20以及浏览者终端设备30;
94.其中,发布者终端设备10以及浏览者终端设备30均为安装运行有具有多媒体资源发布功能以及多媒体资源浏览功能的软件及网站,简称多媒体资源软件或网站,比如音乐播放器、视频播放器、阅读播放器、即时通讯应用等。需要说明的是,发布者终端设备10和浏览者终端设备30可以为同一终端设备,或同类型终端设备,可以是个人计算机、手机、平板电脑、笔记本、电子书阅读器、车载终端等计算机设备。
95.服务器20为多媒体资源平台对应的服务器,用于存储多媒体资源,该服务器20可以是独立的物理服务器,也可以是多个物理服务器构成的服务器集群或者分布式系统,还可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、内容分发网络(content delivery network,cdn)、以及大数据和人工智能平台等基础云计算服务的云服务器。
96.在一种可能的实施方式中,发布者终端设备10与服务器20之间可以通过通信网络进行通信,通信网络是有线网络或无线网络。因此发布者终端设备10和服务器20可以通过
有线或无线通信方式进行直接或间接地连接。比如,发布者终端设备10还可以通过无线接入点12与服务器20间接地连接,或发布者终端设备10通过因特网与服务器20直接地连接,本技术在此不做限制。
97.同理,对于浏览者终端设备30与服务器20之间的通信方式,与发布者终端设备10与服务器20之间的通信方式类似,在此不再赘述。
98.在一种可能的应用场景中,创作者通过对应的账号在发布者终端设备10上登录多媒体资源软件,并发布多媒体资源,发布者终端设备10将多媒体资源上传到服务器20中,由服务器20推荐、分发给接收者终端设备30。在进行多媒体资源推荐、分发的过程中,识别创作者的账号等级,基于账号等级对多媒体资源进行推荐、分发。
99.在一种可能的应用场景中,为了便于降低通信时延,可以在各个地区部署服务器20,或者为了负载均衡,可以由不同的服务器20分别去服务各个发布者终端设备10对应的地区,以及各个浏览者终端设备30对应的地区。多个服务器20还可以通过区块链实现数据的共享,多个服务器20相当于多个服务器20构成的数据共享系统。
100.于数据共享系统中的各个服务器20,均具有与该服务器20对应的节点标识,数据共享系统中的各个服务器20均可以存储有数据共享系统中其他服务器20的节点标识,以便后续根据其他服务器20的节点标识,将生成的区块广播至数据共享系统中的其他服务器20。
101.基于上述应用场景,下面结合上述描述的应用场景,根据附图来描述本技术示例性实施方式提供的视频类型识别方法,需要注意的是,上述应用场景仅是为了便于理解本技术的精神和原理而示出,本技术的实施方式在此方面不受任何限制。
102.在一种可能的实现方式中,各个多媒体资源平台中包含有多个多媒体资源创作者发布的至少一个多媒体资源,每个多媒体资源创作者通过自身对应的账号登录多媒体资源平台,因此一个账号用于表征一个多媒体资源创作者。多媒体资源平台在进行多媒体资源推荐、分发的过程中,主要基于账号等级进行,因此多媒体资源平台针对各个账号分别确定相应的账号等级。
103.下面以针对一个账号为例,对确定账号等级的实施方式进行说明。
104.请参考图3,图3示例性提供了本技术实施例中一种账号等级识别的方法流程图,应用于多媒体资源平台中,包括如下步骤:
105.步骤s300,分别获取待识别账号已发布的各个多媒体资源的多媒体资源等级。
106.在本技术实施例中,多媒体资源平台获取待识别账号已发布的各个多媒体资源,并分别获取各个多媒体资源的多媒体资源等级,其中,多媒体资源等级是基于内容质量等级和目标播放等级中的至少一种确定的。
107.因此,在确定多媒体资源等级时,需要确定内容质量等级以及目标播放等级中的至少一种。
108.下面以一个多媒体资源为例,对确定一个多媒体资源对应的内容质量等级和目标播放等级,分别进行说明。
109.情况一:确定一个多媒体资源对应的内容质量等级。
110.在本技术实施例中,一个多媒体资源的内容质量等级是基于已训练的第一等级识别模型确定的;第一等级识别模型是基于大量的带有标注内容质量等级的多媒体资源组成
的训练集进行训练后获得的,其中,标注内容质量等级是通过人工标注的方式确定的。
111.已训练的第一等级识别模型主要用于:获取一个多媒体资源的内容特征,并基于一个多媒体资源的内容特征,识别相应的内容质量等级并输出。
112.请参考图4,图4示例性提供了本技术实施例中一种第一等级识别模型的结构图;该第一等级识别模型中主要包括:
113.输入层,用于输入一个多媒体资源;
114.原始数据提取层,用于从一个多媒体资源中抽取原始数据,其中原始数据包括:一个多媒体资源中的图像数据(即图像帧)、音频数据(即音频帧)以及文本数据中的至少一种。
115.需要说明的是,文本数据中包括有标题文本、通过asr技术获取的文本以及通过orc技术获取的文本中的至少一种。
116.特征信息提取层,用于对得到的原始数据进行特征信息提取,其中特征信息提取包括图像特征信息提取模型、音频特征信息提取模型以及文字特征信息提取模型中的至少一种。
117.图像特征信息提取模型中包含有effiicentnet网络以及与其连接的nextvlad网络;
118.在图像特征信息提取模型中,通过effiicentnet网络调整图像数据的网络深度(depth)、网络宽度(width)和输入图像数据的分辨率(resolution)大小,以准确的对图像数据中的图像特征进行提取;然后,将提取的图像特征信息输入到nextvlad网络中,通过nextvlad网络对图像特征信息进行降维处理,并输出最终的图像特征信息;通过nextvlad网络防止数据量过多而导致的过拟合问题,且nextvlad网络输出的图像特征信息虽然整体参数量下降,但是性能并没有下降。
119.音频特征信息提取模型中包含有vggish网络以及与其连接的nextvlad网络;
120.在音频特征信息提取模型中,通过vggish网络对音频数据进行音频特征提取;然后,提取的音频特征信息输入到nextvlad网络中,通过nextvlad网络对音频特征信息进行降维处理,并输出最终的音频特征信息;通过nextvlad网络防止数据量过多而导致的过拟合问题,且nextvlad网络输出的图像特征信息虽然整体参数量下降,但是性能并没有下降;
121.需要说明的是,vggish网络是在大量的youtube数据集上训练得到的类vgg网络,该vggish网络中生成128维的embedding,支持从音频波形中提取具有语义的128维embedding特征向量。
122.文字特征信息提取模型中包含有embedding网络以及其连接的albert网络。
123.在文字特征信息提取模型中,通过embedding网络将文本数据转换为固定大小的特征向量,即对文本数据进行文本特征提取;然后,将提取的文本特征信息输入到albert网络,以使albert网络采用因式分解的方法来降低参数量,并输出最终的文字特征信息。
124.特征信息融合层,用于将获得的图像特征信息、音频特征信息和文字特征信息中的至少一种进行融合,获得一个多媒体资源的内容特征。
125.全连接层,用于将获得的内容特征映射到样本标记空间,以获得内容特征对应的内容质量等级。
126.输出层,用于输出一个多媒体资源对应的内容质量等级。
127.在本技术实施例中,内容质量等级是基于一个多媒体资源的内容特征确定的,内容特征是基于一个多媒体资源中的图像特征信息、音频特征信息以及文字特征信息中的至少一种确定的。比如,若仅包含有图像特征信息时,则直接将图像特征信息最为内容特征;若包含有图像特征信息和音频特征信息,则基于图像特征信息和音频特征信息共同确定内容特征。
128.需要说明的是,在确定内容特征的过程中,融合的特征信息越多,确定的内容特征越准确。
129.以基于图像特征信息、音频特征信息和文字特征信息三种特征信息确定的内容特征为例,对基于内容特征确定内容质量等级进行说明;请参考图5,图5示例性提供了本技术实施例中一种确定一个多媒体资源对应的内容质量等级的方法流程图,包括如下步骤:
130.步骤s500,通过第一等级识别模型中的原始数据提取层,获取一个多媒体资源的图像数据、音频数据以及文字数据;
131.步骤s501,将获得的图像数据、音频数据以及文字数据,分别通过第一等级识别模型中相应的图像特征信息提取模型、音频特征信息提取模型以及文字特征信息提取模型,获得一个多媒体资源对应的图像特征信息、音频特征信息以及文字特征信息;
132.步骤s502,将获得的图像特征信息、音频特征信息以及文字特征信息,通过特征信息融合层进行多维度特征信息融合,获得一个多媒体资源的内容特征;
133.在本技术实施例,在进行特征信息融合的过程中可以采用加权平均的方式进行特征信息融合。
134.步骤s503,基于内容特征,确定一个多媒体资源的内容质量等级。
135.通过基于大量的带有标注内容质量等级的多媒体资源训练获得的第一等级识别模型,可以准确的确定待识别账号已发布的各个多媒体资源的内容质量等级,且无需人工确定各个多媒体资源的内容质量等级,较少人工成本。
136.情况二:确定一个多媒体资源对应的目标播放等级。
137.在本技术实施例中,目标播放等级是基于用于表征一个多媒体资源的真实播放情况的第一子播放等级,以及用于表征一个多媒体资源的预测播放情况的第二子播放等级中的至少一种确定的;
138.比如,若仅包含有第一子播放等级时,直接将第一子播放等级作为目标播放等级;若仅包含有第二子播放等级时,直接将第二子播放等级作为目标播放等级;若包含有第一子播放等级和第二子播放等级,则目标播放等级=第一子播放等级*α1 第二子播放等级*α2,其中,α1和α2为权重,α1和α2为预设的大于0的值,满足α1 α2=1。
139.在一种可能的实现方式中,通过如下方式确定用于表征一个多媒体资源的真实播放情况的第一子播放等级:
140.请参考图6,图6示例性提供本技术实施例中一种确定一个多媒体资源的第一播放等级的方法流程图,包括如下步骤:
141.步骤s600,获取一个多媒体资源对应的目标播放参数;
142.其中,目标播放参数是基于一个多媒体资源的目标播放次数、每次播放的播放时长、一个多媒体资源的目标总时长(即一个多媒体资源的可播放最大时长)、一个多媒体资源的目标播放完成度、一个多媒体资源的目标已播放时长中的至少一种确定的。
143.一个多媒体资源的目标播放完成度是根据每次播放完成度确定的。比如,该一个多媒体资源共被播放3次,目标播放完成度=(第一次播放完成度 第二次播放完成度 第三次播放完成度)/3。每次播放完成度是根据一个多媒体资源每次播放的播放时长,以及一个多媒体资源的总目标时长确定的,每次播放完成度=每次播放的播放时长/总目标时长;
144.一个多媒体资源的目标已播放时长,是根据每次播放的播放时长的总和,以及目标播放次数确定的。比如,该一个多媒体资源共被播放3次,目标已播放时长=(第一次播放时长 第二次播放时长 第三次播放时长)/3。
145.需要说明的是,一个多媒体资源的目标播放完成度也可以是根据一个媒体资源的目标已播放时长和目标总时长确定的;即,一个多媒体资源的目标播放完成度=一个媒体资源的目标播放时长/目标总时长。
146.步骤s601,获取一个多媒体资源对应的多媒体资源平台中所有多媒体资源的播放参数,并基于所有多媒体资源的播放参数,确定第一参考播放参数;
147.其中,第一参考播放参数是基于多媒体资源平台的平均播放次数,平均总时长,平均播放完成度以及平均已播放时长中的至少一种确定的。
148.多媒体资源平台的平均播放次数,是基于多媒体资源平台中各个多媒体资源的播放参数中的播放次数确定的;比如,多媒体资源平台中包含有n个多媒体资源,多媒体资源平台的平均播放次数=(多媒体资源1的播放次数 多媒体资源2的播放次数
……
多媒体资源n的播放次数)/n,其中n为正整数;
149.多媒体资源平台的平均总时长,是基于多媒体资源平台中各个多媒体资源的播放参数中的总时长确定的,其中,总时长即多媒体资源可播放的最大时长;比如,多媒体资源平台中包含有n个多媒体资源,多媒体资源平台的平均总时长=(多媒体资源1的总时长 多媒体资源2的总时长
……
多媒体资源n的总时长)/n,其中n为正整数;
150.多媒体资源平台的平均播放完成度,是基于多媒体资源平台中各个多媒体资源的播放参数中的播放完成度确定的;比如,多媒体资源平台中包含有n个多媒体资源,多媒体资源平台的平均播放完成度=(多媒体资源1的播放完成度 多媒体资源2的播放完成度
……
多媒体资源n的播放完成度)/n,其中n为正整数;也可以是基于多媒体资源平台的平均已播放时长,以及多媒体资源平台的平均总时长确定的,即多媒体资源平台的平均播放完成度=多媒体资源平台的平均已播放时长/多媒体资源平台的平均总时长;
151.多媒体资源平台的平均已播放时长,是基于多媒体资源平台中各个多媒体资源的播放参数中的已播放时长确定的,其中,已播放时长即每个多媒体资源对应的每次播放的播放时长的总和与播放次数的比值;比如,多媒体资源平台中包含有n个多媒体资源,多媒体资源平台的平均已播放时长=(多媒体资源1的已播放时长 多媒体资源2的已播放时长
……
多媒体资源n的已播放时长)/n,其中n为正整数。
152.步骤s602,基于目标播放参数与第一参考播放参数之间的比例关系,确定候选播放等级;
153.即,候选播放等级=目标播放参数/第一参考播放参数。
154.设基于一个多媒体资源的目标播放次数和目标播放完成度确定目标播放参数;同时,确定相应的多媒体资源平台的平均播放次数,平均播放完成度,并基于多媒体资源平台的平均播放次数和平均播放完成度,确定第一参考播放参数;此时候选播放等级=目标播
放参数/第一参考播放参数=(目标播放次数*目标播放完成度)/(平均播放次数*平均播放完成度)。
155.需要说明的是,确定候选播放等级的方式仅是举例说明,当确定目标播放参数时使用的参数不仅包括有目标播放次数和目标播放完成度时,确定第一参考播放参数时使用的参数中除了包含有平均播放次数和平均播放完成度以外,还包含有与确定目标播放参数时使用的参数一致的参数,此时确定候选播放等级的方式存在一定差异,但整体思路类似,在此不再重复说明。
156.步骤s603,基于候选播放等级,确定一个多媒体资源对应的第一子播放等级。
157.在一种可能的实现方式中,设置一个预设播放等级上限值;将候选播放等级和预设播放等级上限值进行比较,将较小的一个作为一个多媒体资源对应的第一子播放等级。
158.在本技术实施例中,设预设播放等级上限值为1.0,将确定的候选播放等级对应的数值与预设播放等级上限值进行比较;若候选播放等级大于等于1.0,则第一子播放等级为1.0;若候选播放等级小于1.0,则第一子播放等级为候选播放等级。即第一子播放等级=min(候选播放等级,1.0)。
159.在另一种可能的实现方式中,设置一个等级阈值;将候选播放等级和等级阈值进行比较;若候选播放等级大于等级阈值,则为一个多媒体资源对应的第一子播放等级分配一个固定等级;若候选播放等级小于等级阈值,则一个多媒体资源对应的第一子播放等级即为候选播放等级。
160.需要说明的是,多媒体资源平台在进行账号等级识别时,多媒体资源平台内部采用浮点数表示账号等级方便计算,即多媒体资源平台中的账号等级在[0.0,1.0]之间。但是在对外展示账号等级时采用正整数的形式进行展示,比如,1级,2级,3级
……
q级,其中q为正整数。
[0161]
多媒体资源平台在对外展示账号等级时,基于预设的浮点数区间与展示的账号等级之间的映射关系,确定展示的账号等级,比如多媒体平台内部确定账号等级在[0.5,0.6),此时[0.5,0.6)对应的账号等级为6,则在展示的时候,展示待识别账号的账号等级为6。
[0162]
在一种可能的实现方式中,通过如下方式确定用于表征一个多媒体资源的预测播放情况的第二子播放等级:
[0163]
在本技术实施例中,一个多媒体资源的第二子播放等级是基于已训练的第二等级识别模型确定的;第二等级识别模型是基于由至少一个带有标注目标播放等级的一个多媒体资源组成的训练集进行训练后获得的,其中,标注目标播放等级是基于上述确定第一子播放等级的方式确定的。
[0164]
已训练的第二等级识别模型主要用于:获取一个多媒体资源的内容特征,并基于一个多媒体资源的内容特征识别相应的第二子播放等级并输出,其中,内容特征是基于图像特征信息、音频特征信息和文字特征信息中的至少一种确定的。
[0165]
需要说明的是,本技术实施例中的第二等级识别模型的结构与本技术实施例中的第一等级识别模型的结构一致,请参考图4,在此不再重复介绍。
[0166]
需要说明的是,在确定内容特征的过程中,融合的特征信息越多,确定的内容特征越准确。
[0167]
请参考图7,图7示例性提供了本技术实施例中一种确定一个多媒体资源对应的第二子播放等级的方法流程图,包括如下步骤:
[0168]
步骤s700,通过第二等级识别模型中的原始数据提取层,获取一个多媒体资源的图像数据、音频数据以及文字数据;
[0169]
步骤s701,将获得的图像数据、音频数据以及文字数据,分别通过第二等级识别模型中相应的图像特征信息提取模型、音频特征信息提取模型以及文字特征信息提取模型,获得一个多媒体资源对应的图像特征信息、音频特征信息以及文字特征信息;
[0170]
步骤s702,将获得的图像特征信息、音频特征信息以及文字特征信息,通过特征信息融合层进行多维度特征信息融合,获得一个多媒体资源的内容特征;
[0171]
在本技术实施例,在进行特征信息融合的过程中可以采用加权平均值的方式进行特征信息融合。
[0172]
步骤s703,基于内容特征,确定一个多媒体资源的第二子播放等级。
[0173]
通过基于大量的带有标注播放等级的多媒体资源训练获得的第二等级识别模型,可以准确的预测待识别账号已发布的各个多媒体资源的第二子播放等级。
[0174]
步骤s301,基于获得的各个多媒体资源等级,确定待识别账号的第一参考账号等级。
[0175]
在一种可能的实现方式中,采用最简单的加权平均方式确定,即将各个多媒体资源等级相加后,除以待识别账号已发布的多媒体资源的数量;比如,待识别账号已发布的多媒体资源的数量为m,第一参考账号等级=(多媒体资源1的多媒体资源等级 多媒体资源2的多媒体资源等级
……
多媒体资源m的多媒体资源等级)/m,其中m为正整数。
[0176]
在另一种可能的实现方式中,由于待识别账号发布的每个多媒体资源对待识别账号的等级都存在一定的影响,且不同的多媒体资源的多媒体资源等级,对待识别账号的账号等级影响程度不同。
[0177]
比如,当某个多媒体资源的内容为优质内容时,该某个多媒体资源对提高待识别账号的账号等级有很大的帮助;而另一个多媒体资源的内容较差时,该另一个多媒体资源对提高待识别账号的账号等级不但没有帮助,还可能会拉低待识别账号的账号等级。
[0178]
因此,本技术实施例中,在确定待识别账号的账号等级时,为了保证待识别账号的账号等级的准确定,在确定待识别账号的账号等级的过程中,参考待识别账号已发布的所有多媒体资源的多媒体资源等级。
[0179]
在本技术实施例中,采用第一权重参数表征多媒体资源的多媒体资源等级对待识别账号的账号等级的影响程度。
[0180]
由于确定各个多媒体资源的第一权重参数的方式一致;因此,通过如下方式对确定一个多媒体资源的第一权重参数进行说明:
[0181]
请参考图8,图8示例性提供本技术实施例中一种确定一个多媒体资源的第一权重参数的方法流程图,包括如下步骤:
[0182]
步骤s800,获取一个多媒体资源对应的目标播放参数;
[0183]
其中,目标播放参数是基于一个多媒体资源的目标播放次数、每次播放的播放时长、一个多媒体资源的目标总时长(即一个多媒体资源的可播放最大时长)、一个多媒体资源的目标播放完成度、一个多媒体资源的目标已播放时长中的至少一种确定的。具体可参
见图6对应的描述部分,在此不再赘述。
[0184]
步骤s801,获取一个多媒体资源对应的待识别账号已发布的所有多媒体资源的播放参数,并基于所有多媒体资源的播放参数,确定第二参考播放参数;
[0185]
其中,第二参考播放参数为基于各个多媒体资源的播放参数确定的各个子参考播放参数的总和。其中,子参考播放参数是基于相应的多媒体资源的播放次数、每次播放的播放时长、总时长(即多媒体资源的可播放最大时长)、播放完成度、多媒体资源的平均播放时长中的至少一种确定的。
[0186]
步骤s802,基于目标播放参数与第二参考播放参数之间的比例关系,确定第一权重参数。
[0187]
在本技术实施例中,设待识别账号已发布m个多媒体资源,第一权重参数=目标播放参数/第二参考播放参数=目标播放参数/(多媒体资源1的子参考播放参数 多媒体资源2的子参考播放参数
……
多媒体资源m的子参考播放参数)。
[0188]
设基于一个多媒体资源的目标播放次数和目标播放完成度确定目标播放参数;同时,确定相应的待识别账号已发布的各个多媒体资源分别对应的播放次数和播放完成度,并基于播放次数和播放完成度确定相应的多媒体资源的子参考播放参数;此时第一权重参数=目标播放参数/第一参考播放参数=(目标播放次数*目标播放完成度)/[(多媒体资源1的播放次数*多媒体资源1的播放完成度) (多媒体资源2的播放次数*多媒体资源2的播放完成度) (多媒体资源m的播放次数*多媒体资源m的播放完成度)]。
[0189]
需要说明的是,确定第一权重参数的方式仅是举例说明,当确定目标播放参数时使用的参数不仅包括有目标播放次数和目标播放完成度时,确定子参考播放参数时使用的参数中除了包含有播放次数和播放完成度以外,还包含有与确定目标播放参数时使用的参数一致的参数,此时确定第一权重参数的方式存在一定差异,但整体思路类似,在此不再重复说明。
[0190]
在确定各个多媒体资源的多媒体资源等级以及相应的第一权重参数后,基于各个多媒体资源等级以及相应的第一权重参数,确定各个多媒体资源对应的第一子参考账号等级,并将各个第一子参考账号的总和作为第一参考账号等级。
[0191]
其中,一个多媒体资源对应的第一子参考账号等级=一个多媒体资源的多媒体资源等级*相应的第一权重参数。
[0192]
设待识别账号已发布的多媒体资源的数量为m,待识别账号的第一参考账号等级=(多媒体资源1的多媒体资源等级*多媒体资源1的第一权重参数) (多媒体资源2的多媒体资源等级*多媒体资源2的第一权重参数)
……
(多媒体资源m的多媒体资源等级*多媒体资源m的第一权重参数)。
[0193]
在本技术实施例中,由于多媒体资源等级是基于内容质量等级和目标播放等级的至少一种确定的。
[0194]
因此,在仅存在内容质量等级时,多媒体资源等级即内容质量等级;待识别账号的第一参考账号等级=(多媒体资源1的内容质量等级*多媒体资源1的第一权重参数) (多媒体资源2的内容质量等级*多媒体资源2的第一权重参数)
……
(多媒体资源m的内容质量等级*多媒体资源m的第一权重参数);
[0195]
在仅存在目标播放等级时,多媒体资源等级即目标播放等级;待识别账号的第一
参考账号等级=(多媒体资源1的目标播放等级*多媒体资源1的第一权重参数) (多媒体资源2的目标播放等级*多媒体资源2的第一权重参数)
……
(多媒体资源m的目标播放等级*多媒体资源m的第一权重参数);
[0196]
存在内容质量等级和目标播放等级时,多媒体资源等级是基于内容质量等级和目标播放等级确定的;待识别账号的第一参考账号等级=(多媒体资源1的容质量等级*多媒体资源1的目标播放等级*多媒体资源1的第一权重参数) (多媒体资源2的容质量等级*多媒体资源2的目标播放等级*多媒体资源2的第一权重参数)
……
(多媒体资源m的容质量等级*多媒体资源m的目标播放等级*多媒体资源m的第一权重参数);或
[0197]
存在内容质量等级和目标播放等级时,多媒体资源等级是基于内容质量等级和目标播放等级确定的;待识别账号的第一参考账号等级=[(多媒体资源1的容质量等级 多媒体资源1的目标播放等级)*多媒体资源1的第一权重参数] [(多媒体资源2的容质量等级 多媒体资源2的目标播放等级)*多媒体资源2的第一权重参数]
……
[(多媒体资源m的容质量等级 多媒体资源m的目标播放等级)*多媒体资源m的第一权重参数]。
[0198]
步骤s302,基于各个多媒体资源,分别与各个参考账号已发布的各个参考多媒体资源之间的内容相似度,分别确定待识别账号与各个参考账号之间的账号相似度。
[0199]
在本技术实施例中,为了提高待识别账号的账号等级,还参考了与待识别账号相似的关联账号的账号等级。在确定关联账号时,先确定参考账号与待识别账号之间的账号相似度;再基于账号相似度,从参考账号中筛选出关联账号。
[0200]
在一种可能的实现方式中,待识别账号与参考账号之间的账号相似度是基于待识别账号已发布的各个多媒体资源,与参考账号已发布的各个参考多媒体资源之间的内容相似度确定的。
[0201]
由于待识别账号与各个参考账号之间的账号相似度的确定方式是一致的;因此,针对一个参考账号,对确定待识别账号与一个参考账号之间的账号相似度进行说明:
[0202]
请参考图9,图9示例性提供本技术实施例中一种确定待识别账号与一个参考账号之间的账号相似度的方法流程图,包括如下步骤:
[0203]
步骤s900,确定一个参考账号已发布的参考多媒体资源;
[0204]
设一个参考账号已发布了k个参考多媒体资源,分别为参考多媒体资源1,参考多媒体资源2
……
参考多媒体资源k。
[0205]
步骤s901,分别确定各个多媒体资源各自对应的第一子内容相似度集合;
[0206]
设待识别账号已发布了m个多媒体资源,分别为多媒体资源1,多媒体资源2
……
多媒体资源m;
[0207]
并确定m个多媒体资源中每个多媒体资源对应的第一子内容相似度集合,该第一子内容相似度集合中包括基于相应的一个多媒体资源与各个参考多媒体资源之间的相似度,确定的第一子内容相似度。
[0208]
比如,多媒体资源1对应的第一子内容相似度集合1为{第一子内容相似度m
1-k1,第一子内容相似度m
1-k2,
……
第一子内容相似度m
1-kk};其中,该多媒体资源1对应的第一子内容相似度集合1中包含的第一子内容相似度的数量,与参考账号发布的其他多媒体数量一致;第一子内容相似度m
1-k1表征多媒体资源1与参考多媒体资源1之间的内容相似度,第一子内容相似度m
1-k2表征多媒体资源1与参考多媒体资源2之间的内容相似度,第一子内容
相似度m
1-kk表征多媒体资源1与参考多媒体资源k之间的内容相似度;
[0209]
同理,多媒体资源2对应的第一子内容相似度集合2为{第一子内容相似度m
2-k1,第一子内容相似度m
2-k2,
……
第一子内容相似度m
2-kk};其中,该多媒体资源2对应的第一子内容相似度集合2中包含的第一子内容相似度的数量,与参考账号发布的其他多媒体数量一致;第一子内容相似度m
2-k1表征多媒体资源2与参考多媒体资源1之间的内容相似度,第一子内容相似度m
2-k2表征多媒体资源2与参考多媒体资源2之间的内容相似度,第一子内容相似度m
2-kk表征多媒体资源2与参考多媒体资源k之间的内容相似度;
[0210]
以此类推,多媒体资源m对应的第一子内容相似度集合m为{第一子内容相似度m
m-k1,第一子内容相似度m
m-k2,
……
第一子内容相似度m
m-kk};其中,该多媒体资源m对应的第一子内容相似度集合m中包含的第一子内容相似度的数量,与参考账号发布的其他多媒体数量一致;第一子内容相似度m
m-k1表征多媒体资源m与参考多媒体资源1之间的内容相似度,第一子内容相似度m
m-k2表征多媒体资源m与参考多媒体资源2之间的内容相似度,第一子内容相似度m
m-kk表征多媒体资源m与参考多媒体资源k之间的内容相似度。
[0211]
步骤s902,在各个多媒体资源对应的第一子内容相似度集合中,筛选出第一目标子内容相似度;
[0212]
在本技术实施例中,在各个多媒体资源对应的第一子内容相似度集合中,筛选出第一子内容相似度的值最大的第一子内容相似度,并将筛选出的第一子内容相似度作为第一目标子内容相似度;
[0213]
比如,多媒体资源1对应的第一子内容相似度集合1{第一子内容相似度m
1-k1,第一子内容相似度m
1-k2,
……
第一子内容相似度m
1-kk}中,第一子内容相似度m
1-k2的内容相似度值最大,因此第一子内容相似度m
1-k2为筛选出的第一目标子内容相似度。并采用相同的方式从其他第一子内容相似度集合中筛选出相应的第一目标子内容相似度。
[0214]
步骤s903,基于从各个第一子内容相似度集合中筛选出的第一目标子内容相似度,确定第一目标内容相似度;
[0215]
第一目标内容相似度为各个第一目标子内容相似度的总和与待识别账号已发布的多媒体资源的数量之间的比值,即第一目标内容相似度=(第一目标子内容相似度1 第一目标子内容相似度2
……
第一目标子内容相似度m)/m;其中,第一目标子内容相似度1为第一子内容相似度集合1中筛选出的,第一目标子内容相似度2为第一子内容相似度集合2中筛选出的,第一目标子内容相似度m为第一子内容相似度集合m中筛选出的。
[0216]
步骤s904,分别确定各个参考多媒体资源各自对应的第二子内容相似度集合;
[0217]
确定k个参考多媒体资源中每个参考多媒体资源对应的第二子内容相似度集合,该第二子内容相似度集合中包括基于相应的一个参考多媒体资源与各个多媒体资源之间的相似度,确定的第二子内容相似度。
[0218]
比如,参考多媒体资源1对应的第二子内容相似度集合1为{第二子内容相似度k
1-m1,第二子内容相似度k
1-m2,
……
第二子内容相似度k
1-mm};其中,该参考多媒体资源1对应的第二子内容相似度集合1中包含的第二子内容相似度的数量,与待识别账号发布的多媒体数量一致;第二子内容相似度k
1-m1表征参考多媒体资源1与多媒体资源1之间的内容相似度,第二子内容相似度k
1-m2表征参考多媒体资源1与多媒体资源2之间的内容相似度,第二子内容相似度k
1-mm表征参考多媒体资源1与多媒体资源m之间的内容相似度;
[0219]
同理,参考多媒体资源2对应的第二子内容相似度集合2为{第二子内容相似度k
2-m1,第二子内容相似度k
2-m2,
……
第二子内容相似度k
2-mm};
[0220]
以此类推,参考多媒体资源k对应的第二子内容相似度集合k为{第二子内容相似度k
k-m1,第二子内容相似度k
k-m2,
……
第二子内容相似度k
k-mm}。
[0221]
步骤s905,在各参考多媒体资源对应的第二子内容相似度集合中,筛选出第二目标子内容相似度;
[0222]
在本技术实施例中,在各个参考多媒体资源对应的第二子内容相似度集合中,筛选出第二子内容相似度的值最大的第二子内容相似度,并将筛选出的第二子内容相似度作为第二目标子内容相似度;
[0223]
比如,参考多媒体资源1对应的第二子内容相似度集合1{第二子内容相似度k
1-m1,第二子内容相似度k
1-m2,
……
第二子内容相似度k
1-mm}中,第二子内容相似度k
1-m2的内容相似度值最大,因此第二子内容相似度k
1-m2为筛选出的第二目标子内容相似度。并采用相同的方式从其他第二子内容相似度集合中筛选出相应的第二目标子内容相似度。
[0224]
步骤s906,基于从各个第二子内容相似度集合中筛选出的第二目标子内容相似度,确定第二目标内容相似度;
[0225]
第二目标内容相似度为各个第二目标子内容相似度的总和与参考账号已发布的参考多媒体资源的数量之间的比值,即第二目标内容相似度=(第二目标子内容相似度1 第二目标子内容相似度2
……
第二目标子内容相似度k)/k;其中,第二目标子内容相似度1为第二子内容相似度集合1中筛选出的,第二目标子内容相似度2为第二子内容相似度集合2中筛选出的,第二目标子内容相似度k为第二子内容相似度集合k中筛选出的。
[0226]
步骤s907,基于第一目标内容相似度和第二目标内容相似度,确定待识别账号与一个参考账号之间的账号相似度。
[0227]
在本技术实施例中,采用加权的方式确定待识别账号与一个参考账号之间的账号相似度,即账号相似度=β1*第一目标内容相似度 β2*第一目标内容相似度,其中,β1和β1为权重,β1和β1为预设的大于0的值,且满足β1 β1=1。
[0228]
在本技术实施例中,步骤s901中的第一子内容相似度集合中的第一子内容相似度,以及步骤s904中的第二子内容相似度集合中的第二子内容相似度是基于已训练的内容相似度模型确定的;内容相似度模型是基于大量的内容相似的多媒体资源对,以及内容不相似的多媒体资源对组成的训练集进行训练后获得的。
[0229]
请参考图10,图10示例性提供了本技术实施例中一种内容相似度模型的网络结构图;已训练的内容相似度模型主要用于:确定多媒体资源的内容特征,以及参考多媒体资源的内容特征,并基于多媒体资源的内容特征与参考多媒体资源的内容特征,确定多媒体资源与参考多媒体资源之间的内容相似度。
[0230]
需要说明的是,确定多媒体资源的内容特征使用的网络结构,以及确定参考多媒体资源的内容特征使用的网络结构,与图4中确定一个多媒体资源的内容特征的网络结构类似,在此不再详细介绍。
[0231]
步骤s303,基于获得的各个账号相似度,在各个参考账号中,筛选出至少一个关联账号,并基于至少一个关联账号的账号等级,确定待识别账号的第二参考账号等级。
[0232]
在本技术实施例中,各个参考账号与待识别账号之间都存在一个账号相似度。因
此,在基于各个账号相似度,从参考账号中,筛选出至少一个关联账号时,主要是基于账号相似度的值,从参考账号中筛选出相应的账号相似度的值大于账号相似度阈值的账号作为关联账号;
[0233]
比如,账号相似度阈值为98%,若参考账号1对应的账号相似度的值为97%,则不选择参考账号1作为关联账号;若参考账号2对应的账号相似度的值为99%,则选择参考账号2作为关联账号。采用该方式可以筛选出至少一个关联账号。
[0234]
在筛选出至少一个关联账号后,获取各个关联账号的账号等级;需要说明的是,各个关联账号的账号等级是已知的。因为大量的多媒体资源账号都会在该多媒体资源平台上发布多媒体资源,且该多媒体资源平台会确定各个多媒体资源账号的账号等级。此时,多媒体资源平台会预先筛选出一批账号等级比较稳定的多媒体资源账号,作为确定关联账号时使用的参考账号;或直接将多媒体资源平台中除待识别账号以外的各个账号,作为确定关联账号时使用的参考账号;因此关联账号的账号等级是已知的。
[0235]
在获得各个关联账号的账号等级后,基于各个关联账号的账号等级,确定待识别账号的第二参考账号等级。
[0236]
在一种可能的实现方式中,采用最简单的加权平均方式确定,即将各个关联账号的账号等级相加后,除以确定的关联账号的数量;比如,确定的关联账号的数量为p,第二参考账号等级=(关联账号1的账号等级 关联账号2的账号等级
……
关联账号p的账号等级)/p,其中p为正整数。
[0237]
在另一种可能的实现方式中,为使确定的第二参考账号等级更加准确,考虑到不同的关联账号与待识别账号之间的账号相似度不同,有的关联账号与待识别账号之间的账号相似度较高,有的关联账号与待识别账号之间的账号相似度就相对差一点。
[0238]
比如,账号相似度较高的关联账号的账号等级,对确定待识别账号的账号等级时,具有较大的参考性;而账号相似度相对差一点的关联账号的账号等级,对确定待识别账号的账号等级时,参考性就不如账号相似度较高的关联账号。因此,不同的关联账号的账号等级对待识别账号的账号等级的影响程度不同。
[0239]
本技术实施例中,采用第二权重参数表征关联账号的账号等级对待识别账号的账号等级的影响程度。
[0240]
由于对于各个关联账号而言,确定关联账号对应的第二权重参数的方式是一致的。因此通过如下方式对确定一个关联账号对应的第二权重参数进行说明:
[0241]
请参考图11,图11示例性提供本技术实施例中一种确定一个多媒体资源的第二权重参数的方法流程图,包括如下步骤:
[0242]
步骤s1100,获取一个关联账号与待识别账号之间的账号相似度;
[0243]
步骤s1101,获取筛选出的各个关联账号与待识别账号之间的账号相似度,并基于各个账号相似度确定账号相似度总和;
[0244]
步骤s1102,基于一个关联账号的账号相似度,与基于各个账号相似度确定账号相似度总和之间的比例关系,确定一个关联账号对应的第二权重参数。
[0245]
一个关联账号对应的第二权重参数=一个关联账号对应的账号相似度/(关联账号1对应的账号相似度 关联账号2对应的账号相似度
……
关联账号p对应的账号相似度)。
[0246]
在确定了各个关联账号对应的第二权重参数后,基于该关联账号对应的账号等级以及对应的第二权重参数,确定一个第二子参考账号等级;即,第二子参考账号等级=账号等级*第二权重参数。
[0247]
第二参考账号等级是基于各个第二子参考账号等级确定的,即第二参考账号等级为各个第二子参考账号等级的总和。也就是说,第二参考账号等级=(关联账号1的账号等级*关联账号1的第二权重参数) (关联账号2的账号等级*关联账号2的第二权重参数)
……
(关联账号p的账号等级*关联账号p的第二权重参数)。
[0248]
需要说明的是,在本技术实施例确定第一参考账号等级和第二参考账号等级时,也可以先确定第二参考账号等级,在确定第一参考账号等级,也可以同时确定,具体的顺序可以由本领域技术人员根据实际情况进行确定。
[0249]
步骤s304,基于第一参考账号等级和第二参考账号等级,确定待识别账号的目标账号等级。
[0250]
在本技术实施例中,基于第一参考账号等级和第二参考账号等级,采用加权的方式确定待识别账号的目标账号等级。
[0251]
具体的,目标账号等级=第一参考账号等级*γ1 第二参考账号等级*γ2,其中,γ1和γ2为权重,γ1和γ2为预设的大于0的值,满足γ1 γ2=1。
[0252]
需要说明的是,为了尽快识别待识别账号的账号等级,在待识别账号发布多媒体资源后,即可较实时的对待识别账号的账号等级更新计算,提高账号等级的时效性,无需等待待识别账号已发布的多媒体资源播放一定时间后再确定。本技术实施例中,在确定待识别账号的账号等级时,还可以通过下述方式确定:
[0253]
方式一:仅根据与待识别账号相似的关联账号的账号等级确定,即上述的第二参考账号等级为待识别账号的目标账号等级;此时参考了相似的关联账号的账号等级确定待识别账号的账号等级,无需等待待识别账号已发布的多媒体资源播放一定时间后再确定,在提高准确性的同时,也提升了时效性;或
[0254]
方式二:根据待识别账号的多媒体资源的内容质量等级,以及第二子播放等级,确定第一参考账号等级,将第一参考账号等级作为待识别账号的目标账号等级;基于内容质量等级以及第二子播放等级确定待识别账号的账号等级,相较于相关技术中仅根据播放次数确定的账号等级,更加准确,且此种方式无需等待待识别账号已发布的多媒体资源播放一定时间后再确定,提升了时效性;或
[0255]
方式三:采用方式一结合方式二的方式,确定待识别账号的账号等级。
[0256]
在采用上述三种方式中的一种方式确定待识别账号的账号等级后,还可以采用上述三种方式中的其他方式,对确定的待识别账号的账号等级进行验证更新,并基于参考了第一子播放等级的第一参考等级账号对待识别账号的账号等级进行更新,以使确定的账号等级更加准确。
[0257]
因此,本技术实施例中,在确定待识别账号的账号等级时,可以基于根据内容质量等级确定的第一参考账号等级、根据第一子播放等级确定的第一参考账号等级、根据第二子播放等级确定的第一参考账号等级以及根据与待识别账号相似的关联账号的账号等级确定的第二参考账号等级中的之一或组合确定待识别账号的账号等级。
[0258]
在本技术实施例中,在确定待识别账号的目标账号等级后,基于目标账号等级,对
待识别账号已发布的各个多媒体资源进行推荐。
[0259]
在一种可能的实现方式中,基于目标账号等级,进行多媒体资源推荐时,确定同一类型的多媒体资源对应的目标账号等级,基于目标账号等级,对多媒体资源进行排序,按照排列顺序进行多媒体资源的推荐。
[0260]
在本技术实施例中,通过利用待识别账号的已发布的多媒体资源的多媒体资源等级,以及与待识别账号相似的关联账号的账号等级,确定待识别账号的账号等级时,有效提高待识别账号的账号等级的准确率与合理性,避免造成账号等级固化。
[0261]
基于同一发明构思,本技术实施例提供一种账号等级识别装置1200,图12示例性提供了本技术实施例中一种账号等级识别装置1200,该装置包括:
[0262]
获得单元1201,用于分别获得待识别账号已发布的各个多媒体资源的多媒体资源等级,并基于获得的各个多媒体资源等级,确定待识别账号的第一参考账号等级;
[0263]
相似度匹配单元1202,用于基于各个多媒体资源,分别与各个参考账号已发布的各个参考多媒体资源之间的内容相似度,分别确定待识别账号与各个参考账号之间的账号相似度;
[0264]
筛选单元1203,基于获得的各个账号相似度,在各个参考账号中,筛选出至少一个关联账号,并基于至少一个关联账号的账号等级,确定待识别账号的第二参考账号等级;
[0265]
确定单元1204,基于第一参考账号等级和第二参考账号等级,确定待识别账号的目标账号等级。
[0266]
在一种可能的实现方式中,若多媒体资源等级包括内容质量等级;获得单元1201,具体用于:
[0267]
针对各个多媒体资源,分别执行以下操作:
[0268]
针对各个多媒体资源中的一个多媒体资源,获取一个多媒体资源的内容特征,其中,内容特征是基于图像特征信息、音频特征信息和文字特征信息中的至少一种确定的;
[0269]
基于内容特征,获得一个多媒体资源的内容质量等级。
[0270]
在一种可能的实现方式中,若多媒体资源等级包括目标播放等级;获得单元1201,具体用于:
[0271]
针对各个多媒体资源,分别执行以下操作:
[0272]
针对各个多媒体资源中的一个多媒体资源,基于获取的一个多媒体资源对应的目标播放参数,以及基于多媒体资源平台的所有多媒体资源确定的第一参考播放参数,确定一个多媒体资源对应的第一子播放等级,其中,目标播放参数是基于一个多媒体资源的目标播放次数、每次播放的播放时长、目标播放完成度以及总目标时长中的至少一种确定的;以及
[0273]
获取一个多媒体资源的内容特征,并基于内容特征,获得一个多媒体资源对应的第二子播放等级,其中,内容特征是基于图像特征信息、音频特征信息和文字特征信息中的至少一种确定的;
[0274]
基于一个多媒体资源的第一子播放等级和第二子播放等级,确定一个多媒体资源的目标播放等级。
[0275]
在一种可能的实现方式中,获得单元1201,还用于:
[0276]
基于目标播放参数与第一参考播放参数之间的比例关系,确定候选播放等级;
[0277]
将候选播放等级和预设播放等级上限值中最小的作为一个多媒体资源对应的第一子播放等级。
[0278]
在一种可能的实现方式中,获得单元1201,具体用于:
[0279]
针对各个多媒体资源,分别执行以下操作:针对各个多媒体资源中的一个多媒体资源,基于多媒体资源等级以及一个多媒体资源对应的第一权重参数,确定一个多媒体资源对于待识别账号的第一子参考账号等级;
[0280]
基于获得的各个第一子参考账号等级,确定待识别账号的第一参考账号等级。
[0281]
在一种可能的实现方式中,获得单元1201通过如下方式确定各个多媒体资源对应的第一权重参数:
[0282]
针对各个多媒体资源,分别执行以下操作:
[0283]
针对各个多媒体资源中的一个多媒体资源,基于一个多媒体资源对应的目标播放参数,与基于待识别账号已发布的所有多媒体资源确定的第二参考播放参数之前的比例关系,确定一个多媒体资源对应的第一权重参数。
[0284]
在一种可能的实现方式中,相似度匹配单元1202,具体用于:
[0285]
针对各个参考账号,分别执行以下操作:
[0286]
针对各个参考账号中的一个参考账号,获取一个参考账号已发布的各个参考多媒体资源;
[0287]
分别确定各个多媒体资源各自对应的第一子内容相似度集合,并基于从各个第一子内容相似度集合中筛选出的第一目标子内容相似度,确定第一目标内容相似度,其中,每个第一子内容相似度集合中包括基于相应的一个多媒体资源与各个参考多媒体资源之间的相似度,确定的第一子内容相似度;
[0288]
分别确定各个参考多媒体资源各自对应的第二子内容相似度集合,并基于从各个第二子内容相似度集合中筛选出的第二目标子内容相似度,确定第二目标内容相似度,其中,每个第二子内容相似度集合中包括基于相应的一个参考多媒体资源与各个多媒体资源之间的相似度,确定的第二子内容相似度;
[0289]
基于第一目标内容相似度和第二目标内容相似度,确定待识别账号与一个参考账号之间的账号相似度。
[0290]
在一种可能的实现方式中,筛选单元1203,具体用于:
[0291]
针对至少一个关联账号,分别执行以下操作:针对至少一个关联账号中的一个关联账号,基于一个关联账号的账号等级,和一个关联账号对应的第二权重参数,确定一个关联账号对应的第二子参考账号等级,其中,第二权重参数是基于一个关联账号对应的账号相似度,以及至少一个关联账号对应的账号相似度总和确定的;
[0292]
基于获得的各个第二子参考账号等级,确定待识别账号的第二参考账号等级。
[0293]
在一种可能的实现方式中,确定单元1204,还用于:
[0294]
确定待识别账号的目标账号等级之后,基于目标账号等级,对待识别账号已发布的各个多媒体资源进行推荐。
[0295]
为了描述的方便,以上各子模型按照功能划分为各单元(或模块)分别描述。当然,在实施本技术时可以把各单元(或模块)的功能在同每个或多个软件或硬件中实现。
[0296]
在介绍了本技术示例性实施方式的账号等级识别方法及装置后,接下来介绍本申
rom)、光存储器件、磁存储器件、或者上述的任意合适的组合。
[0307]
本技术的实施方式的短信息的发送控制的程序产品可以采用便携式紧凑盘只读存储器(cd-rom)并包括程序代码,并可以在计算装置上运行。
[0308]
可读信号介质可以包括在基带中或者作为载波一子模型传播的数据信号,其中承载了可读程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。可读信号介质还可以是可读存储介质以外的任何可读介质,该可读介质可以发送、传播或者传输用于由命令执行系统、装置或者器件使用或者与其结合使用的程序。
[0309]
可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于无线、有线、光缆、rf等等,或者上述的任意合适的组合。
[0310]
可以以一种或多种程序设计语言的任意组合来编写用于执行本技术操作的程序代码,程序设计语言包括面向对象的程序设计语言—诸如java、c 等,还包括常规的过程式程序设计语言—诸如“c”语言或类似的程序设计语言。
[0311]
应当注意,尽管在上文详细描述中提及了装置的若干单元或子单元,但是这种划分仅仅是示例性的并非强制性的。实际上,根据本技术的实施方式,上文描述的两种或更多单元的特征向量和功能可以在每个单元中具体化。反之,上文描述的每个单元的特征向量和功能可以进一步划分为由多个单元来具体化。
[0312]
此外,尽管在附图中以特定顺序描述了本技术方法的操作,但是,这并非要求或者暗示必须按照该特定顺序来执行这些操作,或是必须执行全部所示的操作才能实现期望的结果。附加地或备选地,可以省略某些步骤,将多个步骤合并为每个步骤执行,和/或将每个步骤分解为多个步骤执行。
[0313]
显然,本领域的技术人员可以对本技术进行各种改动和变型而不脱离本技术的精神和范围。这样,倘若本技术的这些修改和变型属于本技术权利要求及其等同技术的范围之内,则本技术也意图包含这些改动和变型在内。
再多了解一些

本文用于创业者技术爱好者查询,仅供学习研究,如用于商业用途,请联系技术所有人。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献