对象流量的控制方法、装置及介质与流程

2021-10-29 20:07:00 来源：中国专利 TAG：介质信息流装置对象流量控制

1.本技术涉及信息流领域，具体涉及一种对象流量的控制方法、装置及介质。

背景技术：

2.传统的推荐系统由于依赖推荐对象的特征数据和推荐结果的趋热，导致马太效应的出现，较少的热门对象占据了推荐系统中的大部分流量。如推荐对象为视频或新闻类的内容，推荐系统可以通过多级试探曝光来不断探索新热门内容。多级试探曝光即给新生产的内容一定流量进行冷启，并在其中找到转化率较高的进行二次试探曝光，通过多级曝光来找到潜在热门内容，同时可以节约曝光流量；但这种方式假设了内容生产是稳定的，如果一段时间内没有特别优质的内容产生，则会出现头部内容曝光聚集的情况也即马太效应，而尾部内容也即冷门对象无人问津。
3.在社交推荐的应用场景中，马太效应会有更严重的影响。如在群推荐业务中，对单个群的过度曝光会带来大量的入群申请，一方面群主面对大量申请感到厌烦不愿审批用户进群申请，甚至会违背建群初衷关闭进群渠道，造成进群转化率下降剧烈，另一方面申请入群的用户会觉得推荐的群却难以加入，极大影响用户的体验和用户对平台推荐结果的信任。

技术实现要素：

4.为了解决推荐系统中的马太效应，控制推荐系统的流量，本技术提供了一种对象流量的控制方法、装置及介质。所述技术方案如下：
5.第一方面，本技术提供了一种对象流量的控制方法，所述方法包括：
6.获取一个或多个对象的对象数据，并从所述一个或多个对象中确定目标对象；
7.根据所述对象数据计算得到所述目标对象在第一时间区间内的预期可分配流量上限；
8.根据所述对象数据计算得到所述目标对象在第二时间区间内的已分配流量；所述第一时间区间和所述第二时间区间根据当前时刻和预设的统计周期确定；
9.对所述目标对象在所述第一时间区间内的预期可分配流量上限和所述目标对象在所述第二时间区间内的已分配流量进行比较，得到比较结果，并根据所述比较结果确定所述目标对象在所述第一时间区间内的状态；
10.当所述目标对象的状态为可曝光状态时，则根据所述目标对象在所述第一时间区间内的预期可分配流量上限为所述目标对象分配流量。
11.第二方面，本技术提供了一种对象流量的控制装置，所述装置包括：
12.获取模块，用于获取一个或多个对象的对象数据，并从所述一个或多个对象中确定目标对象；
13.第一计算模块，用于根据所述对象数据计算得到所述目标对象在第一时间区间内的预期可分配流量上限；
14.第二计算模块，用于根据所述对象数据计算得到所述目标对象在第二时间区间内的已分配流量；所述第一时间区间和所述第二时间区间根据当前时刻和预设的统计周期确定；
15.比较模块，用于对所述目标对象在所述第一时间区间内的预期可分配流量上限和所述目标对象在所述第二时间区间内的已分配流量进行比较，得到比较结果，并根据所述比较结果确定所述目标对象在所述第一时间区间内的状态；
16.控制模块，用于当所述目标对象的状态为可曝光状态时，则根据所述目标对象在所述第一时间区间内的预期可分配流量上限为所述目标对象分配流量。
17.第三方面，本技术提供了一种计算机可读存储介质，所述计算机可读存储介质中存储有至少一条指令或至少一段程序，所述至少一条指令或至少一段程序由处理器加载并执行以实现如第一方面所述的一种对象流量的控制方法。
18.第四方面，本技术提供了一种计算机设备，所述计算机设备包括处理器和存储器，所述存储器中存储有至少一条指令或至少一段程序，所述至少一条指令或至少一段程序由所述处理器加载并执行以实现如第一方面所述的一种对象流量的控制方法。
19.第五方面，本发明提供了一种计算机程序产品或计算机程序，所述计算机程序产品或计算机程序包括计算机指令，该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令，处理器执行该计算机指令，使得该计算机设备执行如第一方面所述的一种对象流量的控制方法。
20.本技术提供的一种对象流量的控制方法、装置及介质，具有如下技术效果：
21.本技术提供的方案通过计算目标对象的预期可分配流量上限，所述预期可分配流量上限也即目标对象能承受的最大曝光数或称目标对象能承受的最大流量，将目标对象的预期可分配流量上限和已分配流量进行比较，确定目标对象的状态，当目标对象是可曝光状态时，根据目标对象的预期可分配流量上限为目标对象分配流量，当目标对象是被屏蔽状态，则降低目标对象的流量，从而可以通过控制曝光逻辑平衡系统中的流量分布，减弱系统中的马太效应等多种问题；同时对目标对象进行预期可分配流量上限的预估和已分配流量的更新设置周期，实现对目标对象可分配流量上限的动态测算以及目标对象状态和流量的实时调整，提升用户的产品体验。此外，本技术提供的方案根据大量业务数据预估目标对象的可分配流量上限，提升用户体验的同时也可以有效提升业务指标。
22.本技术的附加方面和优点将在下面的描述中部分给出，部分将从下面的描述中变得明显，或通过本技术的实践了解到。
附图说明
23.为了更清楚地说明本技术实施例或现有技术中的技术方案和优点，下面将对实施例或现有技术描述中所需要使用的附图作简单的介绍，显而易见地，下面描述中的附图仅仅是本技术的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其它附图。
24.图1是本技术实施例提供的一种对象流量的控制方法的实施环境示意图；
25.图2是本技术实施例提供的一种对象流量的控制方法的流程示意图；
26.图3是本技术实施例提供的一种群推荐的应用场景示意图；
27.图4是本技术实施例提供的申请通过率随申请量的变化趋势图；
28.图5是本技术实施例提供的一种数据处理平台架构示意图；
29.图6是本技术实施例提供的一种群组最大曝光数的计算公式示意图；
30.图7是本技术实施例提供的一种曝光控制逻辑的示意图；
31.图8(1)和8(2)是本技术实施例提供的不同种曝光逻辑下的群曝光量随时间的变化趋势示意图；
32.图9是本技术实施例提供的一种对象流量的控制装置的示意图；
33.图10是本技术实施例提供的用于实现一种对象流量的控制方法的设备的硬件结构示意图。
具体实施方式
34.下面将结合本技术实施例中的附图，对本技术实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本技术一部分实施例，而不是全部的实施例。基于本技术中的实施例，本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例，都属于本技术保护的范围。所述实施例的示例在附图中示出，其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。
35.需要说明的是，本技术的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象，而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换，以便这里描述的本技术的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外，术语“包括”和“具有”以及他们的任何变形，意图在于覆盖不排他的包含，例如，包含了一系列步骤或单元的过程、方法、系统、产品或服务器不必限于清楚地列出的那些步骤或单元，而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
36.为了便于理解本技术实施例所述的技术方案及其产生的技术效果，本技术实施例对于涉及到的相关专业名词进行解释：
37.社交推荐：基于用户社交网络的一种推荐模式，通常指好友推荐或者群推荐，即将单个用户或单个群通过某种推荐理由如你可能认识的人、你可能感兴趣的群等推荐给另一位用户，从而提升单个用户的用户体验和活跃程度，乃至整个社交网络的紧密性。
38.马太效应：指强者愈强、弱者愈弱的现象，广泛应用于社会心理学、教育、金融以及科学领域；在推荐系统中通常指很少的物品占据了大部分流量，在推荐系统中是有损整体生态发展的现象。
39.预期可分配流量上限：当分配给该物品更多流量时，对推荐系统整体收益很低甚至会带来负向收益。
40.tdbank：tencent data bank，腾讯实时数据采集系统；是一种大数据实时接入平台，主要负责数据的实时采集、分发以及配置管理工作，旨在统一数据入口，对外提供多样的数据接入方式，以及高效实时地分发数据。
41.kafka：是由apache软件基金会开发的一个开源流处理平台，由scala和java编写。kafka是一种高吞吐量的分布式发布订阅消息系统，它可以处理消费者在网站中的所有动作流数据。
42.oceanus：一个集开发、测试、部署和运维于一体的一站式可视化实时计算平台。oceanus集成了应用管理、计算引擎和资源管理等功能，提供了多种不同的应用开发方式。
43.spark：专为大规模数据处理而设计的快速通用的计算引擎，是一个统一的、快速的分布式计算引擎，能够同时支持批处理和流计算，充分利用内存做并行计。
44.hdfs：hadoop distributed file system，hadoop(分布式系统基础架构)分布式文件系统，是指被设计成适合运行在通用硬件(commodity hardware)上的分布式文件系统(distributed file system)。hdfs是一个高度容错性的系统，适合部署在廉价的机器上。hdfs能提供高吞吐量的数据访问，适合大规模数据集上的应用。
45.hive：基于hadoop的一个数据仓库工具，用来进行数据提取、转化、加载，这是一种可以存储、查询和分析存储在hadoop中的大规模数据的机制。hive十分适合对数据仓库进行统计分析。
46.elasticsearch：简称es，基于apache lucene的开源搜索引擎，elasticsearch是一个分布式、高扩展、高实时的搜索与数据分析引擎。
47.请参阅图1，其为本技术实施例提供的一种对象流量的控制方法的实施环境示意图，如图1所示，该实施环境可以至少包括客户端01和服务器02。
48.具体的，所述客户端01可以包括智能手机、台式电脑、平板电脑、笔记本电脑、数字助理、智能可穿戴设备、监控设备及语音交互设备等类型的设备，也可以包括运行于设备中的软体，例如一些服务商提供给用户的网页页面，也可以为该些服务商提供给用户的应用。具体的，所述客户端01可以用于采集业务数据以便服务器02根据业务数据获得对象数据。
49.具体的，所述服务器02可以是独立的物理服务器，也可以是多个物理服务器构成的服务器集群或者分布式系统，还可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、cdn(content delivery network，内容分发网络)以及大数据和人工智能平台等基础云计算服务的云服务器。所述服务器02可以包括有网络通信单元、处理器和存储器等等。终端以及服务器可以通过有线或无线通信方式进行直接或间接地连接，本技术在此不做限制。具体的，所述服务器02可以用于动态预估目标对象的预期可分配流量上限，并将目标对象的预期可分配流量上限和已分配流量比较，控制目标对象的状态以及为目标对象分配流量。
50.本技术实施例还可以结合云技术实现，云技术(cloud technology)是指在广域网或局域网内将硬件、软件及网络等系列资源统一起来，实现数据的计算、储存、处理和共享的一种托管技术，也可理解为基于云计算商业模式应用的网络技术、信息技术、整合技术、管理平台技术及应用技术等的总称，可以组成资源池，按需所用，灵活便利。云技术需要以云计算作为支撑。技术网络系统的后台服务需要大量的计算、存储资源，如视频网站、图片类网站和更多的门户网站。伴随着互联网行业的高度发展和应用，将来每个物品都有可能存在自己的识别标志，都需要传输到后台系统进行逻辑处理，不同程度级别的数据将会分开处理，各类行业数据皆需要强大的系统后盾支撑，只能通过云计算来实现。云计算是一种计算模式，它将计算任务分布在大量计算机构成的资源池上，使各种应用系统能够根据需要获取计算力、存储空间和信息服务。提供资源的网络被称为“云”。具体地，所述服务器02位于云端，所述服务器02可以是实体机器，也可以是虚拟化机器。
51.本技术实施例还可以结合大数据相关技术实现，大数据(big data)是指无法在一
定时间范围内用常规软件工具进行捕捉、管理和处理的数据集合，是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。随着云时代的来临，大数据也吸引了越来越多的关注，大数据需要特殊的技术，以有效地处理大量的容忍经过时间内的数据。适用于大数据的技术，包括大规模并行处理数据库、数据挖掘、分布式文件系统、分布式数据库、云计算平台、互联网和可扩展的存储系统。
52.以下介绍本技术提供的一种对象流量的控制方法。图2是本说明书实施例提供的一种对象流量的控制方法的流程图，本说明书提供了如实施例或流程图所述的方法操作步骤，但基于常规或者无创造性的劳动可以包括更多或者更少的操作步骤。实施例中列举的步骤顺序仅仅为众多步骤执行顺序中的一种方式，不代表唯一的执行顺序。在实际中的系统或服务器产品执行时，可以按照实施例或者附图所示的方法顺序执行或者并行执行(例如并行处理器或者多线程处理的环境)。请参照图2，本说明书实施例提供的一种对象流量的控制方法可以包括如下步骤：
53.s100：获取一个或多个对象的对象数据，并从所述一个或多个对象中确定目标对象。
54.示例性地，在社交推荐的应用场景中，推荐对象可以为单个用户或者单个群组。图3示出了一种群推荐的应用场景，根据用户的行为、兴趣爱好等为用户推荐其可能感兴趣的群。在推荐系统中均会存在马太效应，即热门对象占据系统中的大部分流量或称占据大部分曝光次数，影响推荐系统的计算性能和推荐效果，有损整个生态的发展。此外，不同于其他类型的推荐应用，当社交推荐中的推荐对象被大量曝光或称被大量推荐给其他用户时，虽然会一定程度上提高申请量，但也会引起单个用户或群主的反感心理，导致好友申请或入群申请的通过率集聚下降。如图4所示，图4示出了在群推荐业务中申请通过率申请量的变化趋势，图4中为脱敏数据，其中横轴数据表示申请量，纵轴数据表示申请通过率，申请通过率为申请量与群主处理入群申请并同意入群量的比例，由实线走向可知申请通过率会出现急剧下降的情形，图中虚线表征对数据的简单拟合。需要说明的是，一般入群有两种方式，一种是直接通过用户的入群申请，另一种是需要群主对入群申请进行审批，故在图4中会出现申请通过率大于100％的情形。因此，对于发出入群申请或好友申请的用户而言，申请不能被通过则严重影响用户的产品体验。
55.本说明书实施例提供的方法中，考虑到作为对象的单个用户或者群组具有其他类别的对象所没有的社会属性，故为目标对象设立预期可分配流量上限的指标，并通过业务数据计算目标对象的预期可分配流量上限。需要说明的是，本说明书实施例中以社交推荐为应用场景进行说明，基于相同或类似的构思，还可应用于其他推荐应用场景或者其他涉及流量控制的应用中，如搜索应用。
56.在本说明书的一个应用于社交推荐场景的实施例中，具体的，所述获取一个或多个对象的对象数据可以包括以下步骤：
57.s110：获取业务数据，所述业务数据包括在线任务数据、离线任务数据和近线任务数据。
58.在一种可行的实施方式中，根据任务的实时性将业务分为了在线任务、离线任务和近线任务。在线任务也可称为实时任务，实时任务一般根据实时数据提供实时的服务，离线任务一般根据离线数据生成离线结果供后续使用，近线任务可以根据实时数据或者离线
数据提供近实时服务。示例性地，以天为周期采集用户行为日志数据可视作一种离线任务，得到的数据可存储于分布式文件系统或者关系型数据库中。
59.在一种可行的数据处理平台架构下，如图5所示，在线任务数据或称实时数据通过采用kafka作为消息中间件的腾讯实时数据采集系统(tdbank)被以一定周期采集、分发至实时计算平台oceanus，离线任务和近线任务产生的数据被存储至分布式计算平台spark中的分布式文件系统hdfs和数据仓库hive中，以便后续数据的获取和离线处理。可以理解的是，这些平台工具可以独立于推荐系统存在，属于推荐系统的外部依赖。
60.s130：对所述在线任务数据进行实时计算处理以及对所述离线任务数据和所述近线任务数据进行批处理计算，得到所述一个或多个对象的对象数据。
61.在一种可行的数据处理平台架构下，如图5所示，通过实时计算平台oceanus中开发针对对象流量控制的实时计算应用以对所述在线任务数据进行实时计算处理，其中source表征实时计算应用接入的数据源算子，在图5中，接入的数据源为tdbank，http sink表征执行数据输出的算子。在该实时计算应用中，设置监听事件以从海量数据中选择得到跟该实时计算应用相关的数据，示例性的，如申请入群人数、同意入群次数等，进一步地，对数据进行聚合或划分完成对数据的预处理。在图5中，对离线任务和近线任务产生的数据在spark框架中进行存储计算，完成数据挖掘等工作，spark其实还可以完成流数据的计算，但实时性不高。
62.通过对业务数据的处理得到的对象数据可以包括但不限于曝光数据、申请数据、请求处理数据和人员数据。在群推荐业务中，群组的人员数据可以包括但不限于群人数上限、进群人数、退群人数，请求处理数据可以包括但不限于通过请求数据、请求通过数据、请求拒绝数据、请求未处理数据；在好友推荐业务(推荐对象为用户)中，用户的人员数据可以包括但不限于当前好友人数、新增好友人数、删除好友人数。可以理解的是，可以根据数据的不同类型、数据的存储计算形式、预期可分配流量上限的计算方式或预期可分配流量上限的刷新周期，为各类型数据设置对应的统计周期，以实现动态地计算和管理的效果。
63.示例性地，在推荐系统中，所述一个或多个对象可以是推荐系统中的全部对象，也可以是具有相同属性的一类对象的集合，还可以根据系统运维人员的筛选设置确定所述一个或多个对象。根据包含所述一个或多个对象的对象列表从所述一个或多个对象中确定目标对象，或者基于对象数据中对象的标识数据以及预设的选择条件确定目标对象的标识数据，进而确定目标对象。本说明书实施例提供的方法对一个或多个对象的选择方式以及目标对象的确定方式不作具体限定，以上仅作为示例。在一种可行的实施方式中，如在推荐系统中，需要对一个或多个对象中的每一个对象周期性地分配流量以更好地平衡系统流量，因此从一个或多个对象中确定目标对象可以是一个循环遍历的过程，也即一个或多个对象中的每一个对象都会被作为目标对象以执行本技术所提供的一种对象流量的控制方法。
64.s200：根据所述对象数据计算得到所述目标对象在第一时间区间内的预期可分配流量上限。
65.在本说明书实施例中，所述第一时间区间可以根据当前时刻和预设的统计周期中的预期可分配流量上限刷新周期确定。示例性地，所述目标对象的预期可分配流量上限的刷新周期为1小时，当前时刻为6时，则所述第一时间区间为6时至7时，故可以根据预设的周期每隔一小时对目标对象的预期可分配流量上限进行一次计算并更新数据。在本说明书实
施例中，统计周期可随业务需求和计算资源调整至分钟甚至秒，实现时效性更高的计算和管理，本说明书对此不作限定。
66.在本说明书实施例中，考虑到作为对象的单个用户或者群组具有其他类别的对象所没有的社会属性，故可为对象设立预期可分配流量上限的指标，所述预期可分配流量上限可以表征目标对象可承受的最大曝光次数。当分配给目标对象过多的流量时，反而会降低业务数据，如群推荐业务中的入群通过率。在本说明书实施例中，以推荐业务示例时，流量等同于曝光次数，后续内容中不再赘述。
67.在本说明书实施例提供的方法中，根据目标对象的预期可分配流量上限控制分配给目标对象的流量，可以有效减弱马太效应，同时在社交推荐业务中还可以提升用户的产品体验和推荐业务的转化率。
68.在本说明书的一个应用在群推荐场景的实施例中，具体的，所述目标对象为群组，所述对象数据包括曝光数据、申请数据、请求处理数据和人员数据；
69.所述根据所述对象数据计算得到所述目标对象在第一时间区间内的预期可分配流量上限可以包括以下步骤：
70.s210：根据所述人员数据计算得到所述群组的剩余可入群数。
71.示例性地，图6示出了一种可行的计算群组的预期可分配流量上限(也即群最大曝光数)的公式。如图6所示，对于群组(也可简称为群)，为了使其不过度曝光同时还可以达到较高的业务指标如申请通过率或群组消息量，需要考虑群组的剩余可入群数、进群效率因子和申请处理效率因子。需要说明的是，对于群组的预期可分配流量上限的计算公式可以根据群组的细分类型、数据类型或业务逻辑等确定，本说明书实施例对比不作限定。
72.在一种可行的实施方式中，所述根据所述人员数据计算得到所述群组的剩余可入群数可以包括以下步骤：
73.s211：根据当前时刻和预设的统计周期确定第一统计周期和第二统计周期，所述第二统计周期即为所述第一时间区间。
74.在本说明书实施例，根据当前时刻和预设的预期可分配流量上限的刷新周期确定所述第一统计周期和所述第二统计周期，所述第一统计周期表征在所述第二统计周期前的一个统计周期，同时是对所述第二统计周期内目标对象的预期可分配流量上限的数值进行更新，也即所述第二统计周期即为所述第一时间区间。示例性地，若预期可分配流量上限的刷新周期为1小时，当前时刻为6时，则所述第二统计周期也即第一时间区间为6时至7时，所述第一统计周期为5时至6时。
75.s212：基于所述人员数据中的所述群组的人员数量上限、所述群组在所述第一统计周期期末时的人员数、所述群组在所述第二统计周期内的进群人数以及所述群组在所述第二统计周期内的退群人数，得到所述群组的剩余可入群数。
76.具体地，如图6所示，在计算群最大曝光数的公式中，m
max
表示该群的规模上限，可以随群组等级而不同，如qq群的规模有100人、200人、500人、1000人、2000人等不同上限；m
cur
表示该群在第一统计周期期末的规模数；m
in
表示该群在第二统计周期内的进群人数；m
out
表示该群在第二统计周期内的退群人数。在这种计算方式下，优选地，对于进群人数、退群人数和当前人数等数据的统计周期应不低于预期可分配流量上限的刷新周期。
77.s220：根据所述曝光数据和所述人员数据计算得到所述群组的进群效率因子。
78.在一种可行的实施方式中，所述根据所述曝光数据和所述人员数据计算得到进群效率因子可以包括以下步骤：
79.s213：根据所述曝光数据和所述人员数据计算得到在所述第一时间区间内所述群组的第一转化率；所述第一转化率表征进群数在曝光次数中的占比。
80.示例性地，如图6所示，表示该群组在第二统计周期内的进群次数在曝光次数中的占比。也即可以根据曝光数据中该群组的曝光次数和人员数据中该群组的进群人数计算得到该群组的第一转化率。
81.s214：获取在所述第一时间区间内预设群组集的第一转化率。
82.可以理解的是，所述预设群组集包括一个或多个群组，所述预设群组集中的群组可以是预先指定的群组，也可以是根据预设规则和预设标准选出的群组。进一步地，所述预设群组集中可以包括或可以不包括作为所述目标对象的群组。
83.示例性地，如图6所示，表示在群推荐业务中所有群组在第二统计周期内的进群次数在曝光次数中的占比，也即预设群组集为推荐系统中所有群组构成的集合。类似地，若一个或多个对象中包含所有的群组，则可以也可以根据曝光数据中所有群组的曝光次数和人员数据中所有群组的进群人数计算得到由所有群组构成的预设群组集的第一转化率。在另一种可行的实施方式中，由特定的功能模块动态计算预设群组集的第一转化率，则在计算所述群组的进群效率因子的过程中，可以直接从特定的功能模块获取预设群组集的第一转化率，避免大量的重复计算。
84.s215：根据所述群组的第一转化率和所述预设群组集的第一转化率确定目标第一转化率，根据所述目标第一转化率计算得到所述群组的进群效率因子。
85.可行的，如图6所示，在二者中选取较大值作为目标第一转化率，对目标第一转化率取倒数得到进群效率因子。
86.s230：根据所述申请数据、所述曝光数据和所述请求处理数据计算得到所述群组的申请处理效率因子。
87.在一种可行的实施方式中，所述根据所述申请数据、所述曝光数据和所述请求处理数据计算得到申请处理效率因子可以包括以下步骤：
88.s216：根据所述申请数据和所述曝光数据计算得到在所述第一时间区间内所述群组的第二转化率；所述第二转化率表征申请数在曝光次数中的占比。
89.示例性地，如图6所示，表示该群组在第二统计周期内收到申请次数在曝光次数中的占比。也即可以根据曝光数据中该群组的曝光次数和申请数据中该群组收到申请次数计算得到该群组的第二转化率。
90.s217：获取在所述第一时间区间内预设群组集的第二转化率。
91.可以理解的是，所述预设群组集包括一个或多个群组，所述预设群组集中的群组可以是预先指定的群组，也可以是根据预设规则和预设标准选出的群组。进一步地，所述预设群组集中可以包括或可以不包括作为所述目标对象的群组。
92.示例性地，如图6所示，表示在群推荐业务中所有群组在第二统计周期内收到的申请次数在曝光次数中的占比，也即预设群组集为推荐系统中所有群组构成的集合。类
似地，若一个或多个对象中包含所有的群组，则可以根据曝光数据中所有群组的曝光次数和申请数据中所有群组的收到申请次数计算得到由所有群组构成的预设群组集的第二转化率。在另一种可行的实施方式中，由特定的功能模块动态计算预设群组集的第二转化率，则在计算所述群组的进群效率因子的过程中，可以直接从特定的功能模块获取预设群组集的第二转化率，避免大量的重复计算。
93.s218：根据所述群组的第二转化率和所述目标对象的第二转化率确定目标第二转化率，根据所述目标第二转化率和所述请求处理数据计算得到所述群组的申请处理效率因子。
94.示例性地，如图6所示，n
apply_processed
表示该群组的群主在第二统计周期内的处理申请次数。在群组的第二转化率和预设群组集的第二转化率中取较大值作为目标第二转化率，并通过如图6中所示的方法计算得到申请处理效率因子。
95.s240：根据所述群组的剩余可入群数、所述进群效率因子和所述申请处理效率因子计算得到所述群组在第一时间区间内的预期可分配流量上限，所述预期可分配流量上限也表征所述群组的最大曝光次数的预估值。
96.示例性地，如图6所示，根据示出的群最大曝光数的计算公式，当剩余可入群数为0时，群最高曝光数为0，也即表示群组人数已满不需要再分配推荐流量，在没有人员退出的情况下即使申请入群也无法加入群组。当剩余可入群数大于0，以及入群申请需要群主进行处理的情况下，若群主处理意愿较强也即进群效率因子或申请处理效率因子较高时，则群组可承受较大的曝光次数，若群主处理意愿较低也即进群效率因子或申请处理效率因子较低时，则群组只能承受较少的曝光次数。
97.在本说明书的一个应用在好友推荐场景的实施例中，对于作为目标对象的单个用户，类似地，可以考虑该用户的好友数量、新增好友效率因子、好友申请处理效率因子，进一步地，还可以考虑该用户最近一段时间内的活跃度。需要说明的是，对于单个用户的预期可分配流量上限的计算公式同样可以根据用户的细分类型、数据类型或业务逻辑等确定，同时参考计算群最大曝光数时数据的统计与计算方式，估算用户的最大曝光数，本说明书实施例对此不作限定。
98.s300：根据所述对象数据计算得到所述目标对象在第二时间区间内的已分配流量；所述第一时间区间和所述第二时间区间根据当前时刻和预设的统计周期确定。
99.在本说明书实施例中，所述第二时间区间可以根据当前时刻和预设的统计周期中的已分配流量统计周期确定。所述已分配流量可以用实际的已曝光次数表征。示例性地，目标对象的已分配流量统计周期可以有两个，分别以天和小时为周期。若当前时刻为6时，则所述第二时间区间为0时至6时，统计0时至6时时间范围内目标对象的实际已曝光次数作为已分配流量的数值。若当前时刻为0时，则将实际已曝光次数刷新为0，即每天的0点重新从0开始统计当天的实际已曝光次数。在本说明书实施例中，统计周期可随业务需求和计算资源调整至分钟甚至秒，实现时效性更高的计算和管理，本说明书对此不作限定。
100.s400：对所述目标对象在所述第一时间区间内的预期可分配流量上限和所述目标对象在所述第二时间区间内的已分配流量进行比较，得到比较结果，并根据所述比较结果确定所述目标对象在所述第一时间区间内的状态。
101.可以理解的是，所述目标对象的预期可分配流量上限，也即所述目标对象能承受
的最大曝光次数，所述已分配流量也可以用实际的已曝光次数表征，故可以将预期可分配流量上限和已分配流量进行数值上的比较。
102.在本说明书的一个实施例中，具体地，如图7所示，所述根据所述比较结果确定所述目标对象在所述第一时间区间内的状态可以包括以下步骤：
103.s410：当所述比较结果指示所述目标对象在所述第一时间区间内的预期可分配流量上限小于等于所述目标对象在所述第二时间区间内的已分配流量时，则确定所述目标对象在所述第一时间区间内为被屏蔽状态。
104.进一步地，当所述目标对象在所述第一时间区间内为被屏蔽状态时，对所述目标对象进行屏蔽处理，以使所述目标对象被分配的流量降低。所述屏蔽处理可以将所述目标对象在第一时间区间内的流量或称曝光次数设置为0；也可以在第三时间区间内的实际分配流量的基础上，将分配给目标对象的流量减少至预设值，或将第三时间区间内的实际分配流量按照预设比例或预设值进行削减，得到在第一时间区间内分配给目标对象的流量值，其中第三时间区间可以为第一时间区间之前的一个时间区间，此时第三时间区间内实际分配流量可以理解为不为零。当第三时间区间内的实际分配流量为零，同时在第一时间区间内是被屏蔽状态，则在第一时间区间内将分配给目标对象的流量控制为零。需要说明的是，本说明书实施例中对屏蔽处理中流量降低的方式不作限定，以上仅作为示例。
105.s430：当所述比较结果指示所述目标对象在所述第一时间区间内的预期可分配流量上限大于所述目标对象在所述第二时间区间内的已分配流量时，则确定所述目标对象在所述第一时间区间内为可曝光状态。
106.s500：当所述目标对象的状态为可曝光状态时，则根据所述目标对象在所述第一时间区间内的预期可分配流量上限为所述目标对象分配流量。
107.在本说明书实施例中，将目标对象的预期可分配流量上限和实际已分配流量进行比较，确定目标对象是可曝光状态还是被屏蔽状态，当目标对象在系统中为被屏蔽状态，则减少分配给目标对象的流量，降低曝光次数，当目标对象是可曝光状态时，则将目标对象进行正常的曝光。进一步地，根据预期可分配流量上限的大小分配具体的流量，从而可以平衡系统中的流量分布，减弱系统中的马太效应等多种问题。
108.具体地，所述目标对象当前为被屏蔽状态，若所述目标对象在所述第一时间区间内的预期可分配流量上限小于等于所述目标对象在所述第二时间区间内的已分配流量，则继续屏蔽，若所述目标对象在所述第一时间区间内的预期可分配流量上限大于所述目标对象在所述第二时间区间内的已分配流量时，则取消屏蔽进行曝光，该场景可以对应于在群员人数规模达到上限后有用户退出群组的情况。
109.具体地，所述目标对象当前为曝光状态，若所述目标对象在所述第一时间区间内的预期可分配流量上限小于等于所述目标对象在所述第二时间区间内的已分配流量，则停止曝光，屏蔽该目标对象，该场景可以表现为群员人数规模达到上限或者群主的审批处理意愿极低；若所述目标对象在所述第一时间区间内的预期可分配流量上限大于所述目标对象在所述第二时间区间内的已分配流量时，则继续曝光。
110.在本说明书实施例中，根据预期可分配流量上限的大小分配具体的流量，从而可以平衡推荐系统中的流量分布，减弱系统中的马太效应等多种问题。分配规则可以视业务需求和系统资源等确定，本说明书实施例对此不作限定。图8(1)和8(2)示出了使用不同曝
光逻辑时群曝光量随时间的变化趋势，其中数据均已脱敏。如图8(1)所示，在未使用本说明书实施例提供的方法(也即冷却前)，单个群的曝光量随时间呈整体增长趋势，故不可避免的造成流量的聚集和用户的反感。如图8(2)所示，在使用了本说明书实施例提供的上述方法(也即冷却后)，单个群的曝光量在达到一定程度后急剧降低，实现了当群人数达到规模上限后不再推荐该群，而在17时曝光量小幅增多，此时可对应于群成员退出群组的情形，因此本说明书实施例提供的方法可以实现对目标对象流量的动态控制。在一种实施方式中，应用于群推荐业务后，头部群(也可称为热门群)的曝光量减少50％，流量分发向腰部群和尾部群(相对冷门的群组)有效倾斜，减弱了马太效应，同时在整体推荐业务的点击率下跌4％的情况下，加群对数(用户成功加入一个群组称为一个加群对数)提升9％以上，消息量提升12％左右，有效提升用户的产品体验、推荐业务的转化率和社交网络的活跃度。
111.本技术实施例还提供了一种对象流量的控制装置900，如图9所示，所述装置可以包括：
112.获取模块910，用于获取一个或多个对象的对象数据，并从所述一个或多个对象中确定目标对象。
113.第一计算模块920，用于根据所述对象数据计算得到所述目标对象在第一时间区间内的预期可分配流量上限。
114.第二计算模块930，用于根据所述对象数据计算得到所述目标对象在第二时间区间内的已分配流量；所述第一时间区间和所述第二时间区间根据当前时刻和预设的统计周期确定。
115.比较模块940，用于对所述目标对象在所述第一时间区间内的预期可分配流量上限和所述目标对象在所述第二时间区间内的已分配流量进行比较，得到比较结果，并根据所述比较结果确定所述目标对象在所述第一时间区间内的状态。
116.控制模块950，用于当所述目标对象的状态为可曝光状态时，则根据所述目标对象在所述第一时间区间内的预期可分配流量上限为所述目标对象分配流量。
117.在本说明书的一个实施例中，所述获取模块910可以包括：
118.业务数据获取单元911，用于获取业务数据，所述业务数据包括在线任务数据、离线任务数据和近线任务数据。
119.业务数据计算单元912，用于对所述在线任务数据进行实时计算处理以及对所述离线任务数据和所述近线任务数据进行批处理计算，得到所述一个或多个对象的对象数据。
120.在本说明书的一个实施例中，所述目标对象为群组，所述对象数据包括曝光数据、申请数据、请求处理数据和人员数据，所述第一计算模块920可以包括：
121.第一计算单元921，用于根据所述人员数据计算得到所述群组的剩余可入群数。
122.第二计算单元922，用于根据所述曝光数据和所述人员数据计算得到所述群组的进群效率因子。
123.第三计算单元923，用于根据所述申请数据、所述曝光数据和所述请求处理数据计算得到所述群组的申请处理效率因子。
124.第四计算单元924，用于根据所述剩余可入群数、所述进群效率因子和所述申请处理效率因子计算得到所述群组在第一时间区间内的预期可分配流量上限。
125.需要说明的是，上述实施例提供的装置，在实现其功能时，仅以上述各功能模块的划分进行举例说明，实际应用中，可以根据需要而将上述功能分配由不同的功能模块完成，即将设备的内部结构划分成不同的功能模块，以完成以上描述的全部或者部分功能。另外，上述实施例提供的装置与方法实施例属于同一构思，其具体实现过程详见方法实施例，这里不再赘述。
126.本技术实施例提供了一种计算机设备，该计算机设备包括处理器和存储器，该存储器中存储有至少一条指令或至少一段程序，该至少一条指令或该至少一段程序由该处理器加载并执行以实现如上述方法实施例所提供的一种对象流量的控制方法。
127.图10示出了一种用于实现本技术实施例所提供的一种对象流量的控制方法的设备的硬件结构示意图，所述设备可以参与构成或包含本技术实施例所提供的装置或系统。如图10所示，设备10可以包括一个或多个(图中采用1002a、1002b，
……
，1002n来示出)处理器1002(处理器1002可以包括但不限于微处理器mcu或可编程逻辑器件fpga等的处理装置)、用于存储数据的存储器1004、以及用于通信功能的传输装置1006。除此以外，还可以包括：显示器、输入/输出接口(i/o接口)、通用串行总线(usb)端口(可以作为i/o接口的端口中的一个端口被包括)、网络接口、电源和/或相机。本领域普通技术人员可以理解，图10所示的结构仅为示意，其并不对上述电子装置的结构造成限定。例如，设备10还可包括比图10中所示更多或者更少的组件，或者具有与图10所示不同的配置。
128.应当注意到的是上述一个或多个处理器1002和/或其他数据处理电路在本文中通常可以被称为“数据处理电路”。该数据处理电路可以全部或部分的体现为软件、硬件、固件或其他任意组合。此外，数据处理电路可为单个独立的处理模块，或全部或部分的结合到设备10(或移动设备)中的其他元件中的任意一个内。如本技术实施例中所涉及到的，该数据处理电路作为一种处理器控制(例如与接口连接的可变电阻终端路径的选择)。
129.存储器1004可用于存储应用软件的软件程序以及模块，如本技术实施例中所述的方法对应的程序指令/数据存储装置，处理器1002通过运行存储在存储器1004内的软件程序以及模块，从而执行各种功能应用以及数据处理，即实现上述的一种对象流量的控制方法。存储器1004可包括高速随机存储器，还可包括非易失性存储器，如一个或者多个磁性存储装置、闪存、或者其他非易失性固态存储器。在一些实例中，存储器1004可进一步包括相对于处理器1002远程设置的存储器，这些远程存储器可以通过网络连接至设备10。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
130.传输装置1006用于经由一个网络接收或者发送数据。上述的网络具体实例可包括设备10的通信供应商提供的无线网络。在一个实例中，传输装置1006包括一个网络适配器(networkinterfacecontroller，nic)，其可通过基站与其他网络设备相连从而可与互联网进行通讯。在一个实例中，传输装置1006可以为射频(radiofrequency，rf)模块，其用于通过无线方式与互联网进行通讯。
131.显示器可以例如触摸屏式的液晶显示器(lcd)，该液晶显示器可使得用户能够与设备10(或移动设备)的用户界面进行交互。
132.本技术实施例还提供了一种计算机可读存储介质，所述计算机可读存储介质可设置于服务器之中以保存用于实现方法实施例中一种对象流量的控制方法相关的至少一条指令或至少一段程序，该至少一条指令或该至少一段程序由该处理器加载并执行以实现上
述方法实施例提供的一种对象流量的控制方法。
133.可选地，在本实施例中，上述存储介质可以位于计算机网络的多个网络服务器中的至少一个网络服务器。可选地，在本实施例中，上述存储介质可以包括但不限于：u盘、只读存储器(rom，read
‑
only memory)、随机存取存储器(ram，random access memory)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。
134.本发明实施例还提供了一种计算机程序产品或计算机程序，所述计算机程序产品或计算机程序包括计算机指令，该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令，处理器执行该计算机指令，使得该计算机设备执行上述各种可选实施方式中提供的一种对象流量的控制方法。
135.由上述本技术提供的一种对象流量的控制方法、装置及介质的实施例可见，
136.本技术提供的方案通过计算目标对象的预期可分配流量上限，所述预期可分配流量上限也即目标对象能承受的最大曝光数或称目标对象能承受的最大流量，将目标对象的预期可分配流量上限和已分配流量进行比较，确定目标对象的状态，当目标对象是可曝光状态时，根据目标对象的预期可分配流量上限为目标对象分配流量，当目标对象是被屏蔽状态，则降低目标对象的流量，从而可以通过控制曝光逻辑平衡系统中的流量分布，减弱系统中的马太效应等多种问题；同时对目标对象进行预期可分配流量上限的预估和已分配流量的更新设置周期，实现对目标对象可分配流量上限的动态测算以及目标对象状态和流量的实时调整，提升用户的产品体验。此外，本技术提供的方案根据大量业务数据预估目标对象的可分配流量上限，提升用户体验的同时也可以有效提升业务指标。
137.需要说明的是：上述本说明书实施例先后顺序仅仅为了描述，不代表实施例的优劣。且上述对本说明书特定实施例进行了描述。其它实施例在所附权利要求书的范围内。在一些情况下，在权利要求书中记载的动作或步骤可以按照不同于实施例中的顺序来执行并且仍然可以实现期望的结果。另外，在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中，多任务处理和并行处理也是可以的或者可能是有利的。
138.本说明书中的各个实施例均采用递进的方式描述，各个实施例之间相同相似的部分互相参见即可，每个实施例重点说明的都是与其他实施例的不同之处。尤其，对于装置、设备和存储介质实施例而言，由于其基本相似于方法实施例，所以描述的比较简单，相关之处参见方法实施例的部分说明即可。
139.本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完成，也可以通过程序来指令相关的硬件完成，所述的程序可以存储于一种计算机可读存储介质中，上述提到的存储介质可以是只读存储器，磁盘或光盘等。
140.以上所述仅为本技术的较佳实施例，并不用以限制本技术，凡在本技术的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本技术的保护范围之内。

再多了解一些

1/2 1 2 下一页尾页

本文用于企业家、创业者技术爱好者查询，结果仅供参考。

上一篇：返回列表
下一篇：一种组播通信方法、装置和系统与流程

对象流量的控制方法、装置及介质与流程

相关文献

最热文献