一种对快应用的用户进行聚类分析的方法及系统与流程

2022-10-13 00:08:36 来源：中国专利 TAG：

1.本技术涉及计算机技术领域，具体而言，涉及一种对快应用的用户进行聚类分析的方法及系统。

背景技术：

2.快应用是一种新型应用生态，由于其在使用时具有无需下载安装，无需存储，即点即用等优点，受到用户的青睐。通过快应用使得用户更容易获取到自己所需的服务。目前，也有越来越多的用户通过快应用来阅读电子书籍。
3.快应用框架深度集成进各厂商手机系统中，可以在操作系统层面实现用户需求与应用服务间的无缝连接，提升用户的使用体验和应用服务的转化效率，同时支持生成桌面图标等留存能力。“快应用”使用前端技术栈开发，原生渲染，同时具备h5页面和原生应用的双重优点。“快应用”将是传统通知栏、负一屏、信息流等用户直观感知的位置建立和搜索入口，包括短信、拍照、语音助手、卸载场景、卡包等等。基于华为手机的人工智能，将创造更多智能场景识别、硬件功能的权限调用、支付等入口场景。
4.因此如何针对不同用户提供相应的需求成为需要解决的技术问题。

技术实现要素：

5.本技术的目的在于提供一种对快应用的用户进行聚类分析的方法，其能够提供针对性的用户需求，提升用户体验。
6.本技术的另一目的在于提供一种对快应用的用户进行聚类分析的系统，其能够运行一种对快应用的用户进行聚类分析的方法。
7.本技术的实施例是这样实现的：
8.第一方面，本技术实施例提供一种对快应用的用户进行聚类分析的方法，其包括确定快应用的用户，并获取用户的至少一个特征数据；利用各个特征数据构建特征矩阵，基于特征矩阵获取用户在特征映射模型上混合分布的特征混合分布参数；基于特征混合分布参数确定聚类结果，以对快应用的用户进行聚类分析。
9.在本技术的一些实施例中，上述确定快应用的用户，并获取用户的至少一个特征数据包括：确定快应用的用户中的至少两个快应用时分别对应的历史数据，并将每个快应用的用户作为一个节点，将用户之间的关联关系作为节点之间的边，构建包含多个用户的网络图。
10.在本技术的一些实施例中，上述还包括：将每个用户以及对应的至少一个特征数据作为一个节点，将特征数据之间的关联关系作为节点之间的边，构建包含多个特征数据的网络图。
11.在本技术的一些实施例中，上述利用各个特征数据构建特征矩阵，基于特征矩阵获取用户在特征映射模型上混合分布的特征混合分布参数包括：在构建特征矩阵之前对特征数据进行预处理，以获得特征处理结果，基于特征处理结果构建特征矩阵。
12.在本技术的一些实施例中，上述还包括：根据特征混合分布参数，确定特征数据在特征映射模型的各个簇分布的概率。
13.在本技术的一些实施例中，上述基于特征混合分布参数确定聚类结果，以对快应用的用户进行聚类分析包括：根据每一个特征矩阵分别对应的特征混合分布参数，从确定的各个聚类结果和各个快应用的用户中对应的至少一个目标聚类结果。
14.在本技术的一些实施例中，上述还包括：根据目标聚类结果以及各个快应用的用户的使用数据所分别对应的至少两个目标快应用，确定各个快应用的用户分别对应的用户偏好程度，基于用户偏好程度对快应用的用户进行聚类分析。
15.第二方面，本技术实施例提供一种对快应用的用户进行聚类分析的系统，其包括获取模块，用于确定快应用的用户，并获取用户的至少一个特征数据；
16.特征映射模块，用于利用各个特征数据构建特征矩阵，基于特征矩阵获取用户在特征映射模型上混合分布的特征混合分布参数；
17.聚类分析模块，用于基于特征混合分布参数确定聚类结果，以对快应用的用户进行聚类分析。
18.在本技术的一些实施例中，上述包括：用于存储计算机指令的至少一个存储器；与上述存储器通讯的至少一个处理器，其中当上述至少一个处理器执行上述计算机指令时，上述至少一个处理器使上述系统执行：获取模块、特征映射模块及聚类分析模块。
19.第三方面，本技术实施例提供一种计算机可读存储介质，其上存储有计算机程序，该计算机程序被处理器执行时实现如一种对快应用的用户进行聚类分析的方法中任一项的方法。
20.相对于现有技术，本技术的实施例至少具有如下优点或有益效果：
21.通过对快应用用户的特征数据进行归一化处理，并且对特征处理结果进行聚类，进而获得快应用用户的聚类结果，以便根据针对不同用户提供相应的服务，提升用户体验，同事根据获得的映射模型中的不同簇的差异性，基于不同簇获得的用户在映射模型的各个簇分布的概率，能够使得最终的用户的聚类结果更符合实际，聚类结果更为准确。
附图说明
22.为了更清楚地说明本技术实施例的技术方案，下面将对实施例中所需要使用的附图作简单地介绍，应当理解，以下附图仅示出了本技术的某些实施例，因此不应被看作是对范围的限定，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他相关的附图。
23.图1为本技术实施例提供的一种对快应用的用户进行聚类分析的方法步骤示意图；
24.图2为本技术实施例提供的一种对快应用的用户进行聚类分析的方法详细步骤示意图；
25.图3为本技术实施例提供的一种对快应用的用户进行聚类分析的系统模块示意图；
26.图4为本技术实施例提供的一种电子设备。
27.图标：10-获取模块；20-特征映射模块；30-聚类分析模块；101-存储器；102-处理
器；103-通信接口。
具体实施方式
28.为使本技术实施例的目的、技术方案和优点更加清楚，下面将结合本技术实施例中的附图，对本技术实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本技术一部分实施例，而不是全部的实施例。通常在此处附图中描述和示出的本技术实施例的组件可以以各种不同的配置来布置和设计。
29.因此，以下对在附图中提供的本技术的实施例的详细描述并非旨在限制要求保护的本技术的范围，而是仅仅表示本技术的选定实施例。基于本技术中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本技术保护的范围。
30.应注意到：相似的标号和字母在下面的附图中表示类似项，因此，一旦某一项在一个附图中被定义，则在随后的附图中不需要对其进行进一步定义和解释。
31.需要说明的是，术语“包括”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下，由语句“包括一个
……”
限定的要素，并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
32.下面结合附图，对本技术的一些实施方式作详细说明。在不冲突的情况下，下述的各个实施例及实施例中的各个特征可以相互组合。
33.实施例1
34.请参阅图1，图1为本技术实施例提供的一种对快应用的用户进行聚类分析的方法步骤示意图，其如下所示：
35.步骤s100，确定快应用的用户，并获取用户的至少一个特征数据；
36.在一些实施方式中，可以采用例如数据仓库工具hive来从快应用服务器中获取前述用户的特征数据。在一些实施例中，该用户的特征数据可以包括但不仅限于用户在快应用上的充值金额以及活跃状态。其中，前述充值金额可以包括例如书币充值金额或者会员充值金额。前述活跃状态可以包括例如活跃天数、日均付费额、阅读字数、回流次数以及书籍数量。对特征数据进行归一化处理，以获得特征处理结果。在一个实施例中，可以利用例如最大最小值归一化方法对特征数据中的每个特征数据进行归一化处理，以获得对应的特征处理结果。即，通过最大最小值归一化方法将每个特征数据映射至[0,1]。例如以特征数据为充值金额为例，首先可以统计用户在快应用上的某一时间段(例如一天)内充值金额的最大值max和最小值min。
[0037]
步骤s110，利用各个特征数据构建特征矩阵，基于特征矩阵获取用户在特征映射模型上混合分布的特征混合分布参数；
[0038]
在一些实施方式中，通过获取至少两个用户使用至少两个应用软件时分别对应的使用数据，并利用各个使用数据构建特征矩阵，该特征矩阵中，同一行的各个元素为同一个用户使用各个应用软件时分别对应的使用数据，同一列的各个元素为各个用户使用同一个应用软件时分别对应的使用数据，由于该矩阵中的各个使用数据相似性极高，因此，可通过
聚类算法，从构建的特征矩阵中确定出至少两个目标特征矩阵，从而根据每一个目标特征矩阵的规模大小以及各个目标特征矩阵内的使用数据所分别对应的至少两个目标应用软件，确定各个应用软件分别对应的用户偏好程度。
[0039]
步骤s120，基于特征混合分布参数确定聚类结果，以对快应用的用户进行聚类分析。
[0040]
在一些实施方式中，在一些快应用中，快应用中注册的用户可以作为数据点，即作为图数据的节点。在这些快应用的用户中，用户之间可能存在关联关系，例如一些用户是其他用户的粉丝用户，或者，一些用户与其他用户互为对方的粉丝用户。将注册用户作为数据点(可以理解为节点)，将注册用户之间的关联关系信息作为边信息(边信息可以理解为数据点之间的连接结构信息)，基于数据点与边信息进而可以构建网络图。该网络图中的节点(表示用户)即为图结构化的数据点。简言之，在获得上述列举的快应用中，如果将用户作为图结构化的节点，则将用户之间的关联关系作为边，基于节点与边则可以构建用于表示该快应用中的用户的网络图。
[0041]
将这些网络图中的数据点布置在超球面上，然后基于该超球面构造特征映射模型。再之后，确认数据点在特征映射模型上混合分布的目标混合分布参数，根据目标混合分布参数，确定数据点在特征映射模型的各个簇中分布的概率；基于数据点在特征映射模型的各个簇中分布的概率，获得数据点的聚类结果信息。
[0042]
实施例2
[0043]
请参阅图2，图2为本技术实施例提供的一种对快应用的用户进行聚类分析的方法详细步骤示意图，其如下所示：
[0044]
步骤s200，确定快应用的用户中的至少两个快应用时分别对应的历史数据，并将每个快应用的用户作为一个节点，将用户之间的关联关系作为节点之间的边，构建包含多个用户的网络图。
[0045]
步骤s210，将每个用户以及对应的至少一个特征数据作为一个节点，将特征数据之间的关联关系作为节点之间的边，构建包含多个特征数据的网络图。
[0046]
步骤s220，在构建特征矩阵之前对特征数据进行预处理，以获得特征处理结果，基于特征处理结果构建特征矩阵。
[0047]
步骤s230，根据特征混合分布参数，确定特征数据在特征映射模型的各个簇分布的概率。
[0048]
步骤s240，根据每一个特征矩阵分别对应的特征混合分布参数，从确定的各个聚类结果和各个快应用的用户中对应的至少一个目标聚类结果。
[0049]
步骤s250，根据目标聚类结果以及各个快应用的用户的使用数据所分别对应的至少两个目标快应用，确定各个快应用的用户分别对应的用户偏好程度，基于用户偏好程度对快应用的用户进行聚类分析。
[0050]
在一些实施方式中，对多个用户的充值金额和活跃天数进行归一化后对应的特征处理结果的分布。其中，横坐标表示充值金额归一化后对应的特征处理结果，纵坐标表示活跃天数归一化后对应的特征处理结果，并且其值均处于[0,1]范围内。根据每个向量的轮廓系数可以确定初始聚类结果的组数，进而可以确定初始聚类结果。在一个示例性场景中，假设根据每个向量的轮廓系数确定初始聚类结果的组数为五组，由此可以将初始聚类中心确
定为五个。在该场景下，可以从特征处理结果的多个向量中任意选取五个点，作为初始聚类中心，并且基于初始聚类中心和剩余向量即可确定用户相关的初始聚类结果。
[0051]
通过计算其余向量点与前述初始聚类中心之间的相似度(例如距离)，并将其余向量点分配至与其相似度接近的对应的初始聚类中心，形成相应的聚类组。假设经过计算向量点与初始聚类中心之间的相似度最接近，则可以将该向量点分配至初始聚类中心。类似地，可以将所有剩余向量点对应配置至初始聚类中心，并且对应形成以向量点为初始聚类中心的聚类组。可以理解，该聚类组为获得的初始聚类结果，进而可以根据初始聚类结果确定与用户相关的最终聚类结果。
[0052]
实施例3
[0053]
请参阅图3，图3为本技术实施例提供的一种对快应用的用户进行聚类分析的系统模块示意图，其如下所示：
[0054]
获取模块10，用于确定快应用的用户，并获取用户的至少一个特征数据；
[0055]
特征映射模块20，用于利用各个特征数据构建特征矩阵，基于特征矩阵获取用户在特征映射模型上混合分布的特征混合分布参数；
[0056]
聚类分析模块30，用于基于特征混合分布参数确定聚类结果，以对快应用的用户进行聚类分析。
[0057]
如图4所示，本技术实施例提供一种电子设备，其包括存储器101，用于存储一个或多个程序；处理器102。当一个或多个程序被处理器102执行时，实现如上述第一方面中任一项的方法。
[0058]
还包括通信接口103，该存储器101、处理器102和通信接口103相互之间直接或间接地电性连接，以实现数据的传输或交互。例如，这些元件相互之间可通过一条或多条通讯总线或信号线实现电性连接。存储器101可用于存储软件程序及模块，处理器102通过执行存储在存储器101内的软件程序及模块，从而执行各种功能应用以及数据处理。该通信接口103可用于与其他节点设备进行信令或数据的通信。
[0059]
其中，存储器101可以是但不限于，随机存取存储器101(random access memory，ram)，只读存储器101(read only memory，rom)，可编程只读存储器101(programmable read-only memory，prom)，可擦除只读存储器101(erasable programmable read-only memory，eprom)，电可擦除只读存储器101(electric erasable programmable read-only memory，eeprom)等。
[0060]
处理器102可以是一种集成电路芯片，具有信号处理能力。该处理器102可以是通用处理器102，包括中央处理器102(central processing unit，cpu)、网络处理器102(network processor，np)等；还可以是数字信号处理器102(digital signal processing，dsp)、专用集成电路(application specific integrated circuit，asic)、现场可编程门阵列(field－programmable gate array，fpga)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。
[0061]
在本技术所提供的实施例中，应该理解到，所揭露的方法及系统，也可以通过其它的方式实现。以上所描述的方法及系统实施例仅仅是示意性的，例如，附图中的流程图和框图显示了根据本技术的多个实施例的方法及系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上，流程图或框图中的每个方框可以代表一个模块、程序段或
代码的一部分，所述模块、程序段或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意，在有些作为替换的实现方式中，方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如，两个连续的方框实际上可以基本并行地执行，它们有时也可以按相反的顺序执行，这依所涉及的功能而定。也要注意的是，框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合，可以用执行规定的功能或动作的专用的基于硬件的系统来实现，或者可以用专用硬件与计算机指令的组合来实现。
[0062]
另外，在本技术各个实施例中的各功能模块可以集成在一起形成一个独立的部分，也可以是各个模块单独存在，也可以两个或两个以上模块集成形成一个独立的部分。
[0063]
另一方面，本技术实施例提供一种计算机可读存储介质，其上存储有计算机程序，该计算机程序被处理器102执行时实现如上述第一方面中任一项的方法。所述功能如果以软件功能模块的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本技术的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行本技术各个实施例所述方法的全部或部分步骤。而前述的存储介质包括：u盘、移动硬盘、只读存储器101(rom，read-only memory)、随机存取存储器101(ram，random access memory)、磁碟或者光盘等各种可以存储程序代码的介质。
[0064]
综上所述，本技术实施例提供的一种对快应用的用户进行聚类分析的方法及系统，通过对快应用用户的特征数据进行归一化处理，并且对特征处理结果进行聚类，进而获得快应用用户的聚类结果，以便根据针对不同用户提供相应的服务，提升用户体验，同事根据获得的映射模型中的不同簇的差异性，基于不同簇获得的用户在映射模型的各个簇分布的概率，能够使得最终的用户的聚类结果更符合实际，聚类结果更为准确。
[0065]
以上仅为本技术的优选实施例而已，并不用于限制本技术，对于本领域的技术人员来说，本技术可以有各种更改和变化。凡在本技术的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本技术的保护范围之内。
[0066]
对于本领域技术人员而言，显然本技术不限于上述示范性实施例的细节，而且在不背离本技术的精神或基本特征的情况下，能够以其它的具体形式实现本技术。因此，无论从哪一点来看，均应将实施例看作是示范性的，而且是非限制性的，本技术的范围由所附权利要求而不是上述说明限定，因此旨在将落在权利要求的等同要件的含义和范围内的所有变化囊括在本技术内。不应将权利要求中的任何附图标记视为限制所涉及的权利要求。

再多了解一些

1/2 1 2 下一页尾页

本文用于创业者技术爱好者查询，仅供学习研究，如用于商业用途，请联系技术所有人。

上一篇：返回列表
下一篇：基于资源配置的信息处理方法、装置、设备及介质与流程

一种对快应用的用户进行聚类分析的方法及系统与流程

相关文献

最热文献