用户行为画像生成方法、装置、电子设备及存储介质与流程

2022-06-05 07:52:42 来源：中国专利 TAG：

1.本发明涉及人工智能技术领域，具体涉及一种用户行为画像生成方法、装置、电子设备及存储介质。

背景技术：

2.用户画像技术的核心在于给用户打上“标签”，目前，标签通常是由人为提炼出的高精度的特征标识，如年龄、地域、兴趣等。而用户画像技术即为通过从不同维度上对用户进行标签刻画，实现对用户的整体全貌描述的技术。在商业领域中，用户画像技术可以有效预测推断用户的需求、感兴趣的内容，使得可以针对用户的需求和感兴趣的内容对用户投放相应的产品或者服务，提升真实客户的转化率，同时也可以为商业活动策划及营销决策提供辅助支持。
3.但是，目前的用户画像技术生成的用户行为画像细粒度不足，只能粗略反用户在哪个领域下更活跃，而无法反映因为该领域下的什么因素而活跃，从而使得对用户投放的产品和服务无法精准的抓住用户真正的需求和喜好，在造成投放的有效率低、真实客户的转化率低的同时，也提升了投放成本。

技术实现要素：

4.为了解决现有技术中存在的上述问题，本技术实施方式提供了一种用户行为画像生成方法、装置、电子设备及存储介质，可以生成细粒度更高的用户行为画像，继而更加精准的推断用户的需求和喜好。
5.第一方面，本技术的实施方式提供了一种用户行为画像生成方法，包括：
6.对用户行为数据进行数据提取，得到单一行为矩阵、联合行为矩阵和非特定行为矩阵；
7.对单一行为矩阵进行矩阵分解，得到单一行为特征组，并根据单一行为特征组进行用户画像构建，得到单一行为画像；
8.对联合行为矩阵进行矩阵分解，得到联合行为特征组，并根据联合行为特征组进行用户画像构建，得到联合行为画像；
9.对非特定行为矩阵进行矩阵分解，得到非特定行为特征组，并根据非特定行为特征组进行用户画像构建，得到非特定行为画像；
10.将单一行为画像、联合行为画像和非特定行为画像输入权重确定模型，确定单一行为画像对应的第一权重、联合行为画像对应的第二权重和非特定行为画像对应的第三权重；
11.根据第一权重、第二权重和第三权重，对单一行为画像、联合行为画像和非特定行为画像进行加权求和处理，得到用户的用户行为画像。
12.第二方面，本技术的实施方式提供了一种用户行为画像生成装置，包括：
13.提取模块，用于对用户行为数据进行数据提取，得到单一行为矩阵、联合行为矩阵
和非特定行为矩阵；
14.分解模块，用于对单一行为矩阵进行矩阵分解，得到单一行为特征组，并根据单一行为特征组进行用户画像构建，得到单一行为画像，对联合行为矩阵进行矩阵分解，得到联合行为特征组，并根据联合行为特征组进行用户画像构建，得到联合行为画像，以及对非特定行为矩阵进行矩阵分解，得到非特定行为特征组，并根据非特定行为特征组进行用户画像构建，得到非特定行为画像；
15.权重确定模块，用于将单一行为画像、联合行为画像和非特定行为画像输入权重确定模型，确定单一行为画像对应的第一权重、联合行为画像对应的第二权重和非特定行为画像对应的第三权重；
16.画像生成模块，用于根据第一权重、第二权重和第三权重，对单一行为画像、联合行为画像和非特定行为画像进行加权求和处理，得到用户的用户行为画像。
17.第三方面，本技术实施方式提供一种电子设备，包括：处理器，处理器与存储器相连，存储器用于存储计算机程序，处理器用于执行存储器中存储的计算机程序，以使得电子设备执行如第一方面的方法。
18.第四方面，本技术实施方式提供一种计算机可读存储介质，计算机可读存储介质存储有计算机程序，计算机程序使得计算机执行如第一方面的方法。
19.第五方面，本技术实施方式提供一种计算机程序产品，计算机程序产品包括存储了计算机程序的非瞬时性计算机可读存储介质，计算机可操作来使计算机执行如第一方面的方法。
20.实施本技术实施方式，具有如下有益效果：
21.在本技术实施方式中，通过将用户行为划分为单一行为，联合行为和非特定行为，将用户行为数据进一步细粒化。继而在单一行为矩阵、联合行为矩阵和非特定行为矩阵的基础上，分别对单一行为矩阵、联合行为矩阵和非特定行为矩阵进行矩阵分解，构建单一行为画像、联合行为画像和非特定行为画像。最后，通过权重确定模型确定单一行为画像、联合行为画像和非特定行为画像各自的权重，继而对单一行为画像、联合行为画像和非特定行为画像进行加权求和处理，得到最终的用户行为画像。由此，生成的用户行为画像拥有更高细粒度，可以反映用户在各个领域或话题下的活跃程度，更可以反映导致该用户在各个领域或话题下活跃的原因。基于此，可以更加精准的推断用户的喜好，继而针对性的对用户投放相应的产品和服务，提升了投放的有效率和真实客户的转化率，同时降低了投放成本。
附图说明
22.为了更清楚地说明本技术实施方式中的技术方案，下面将对实施方式描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图是本技术的一些实施方式，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。
23.图1为本技术实施方式提供的一种用户行为画像生成装置的硬件结构示意图；
24.图2为本技术实施方式提供的一种用户行为画像生成方法的流程示意图；
25.图3为本技术实施方式提供的一种对用户行为数据进行数据提取，得到单一行为矩阵、联合行为矩阵和非特定行为矩阵的方法的流程示意图；
26.图4为本技术实施方式提供的一种单一行为矩阵、联合行为矩阵和非特定行为矩阵的示意图；
27.图5为本技术实施方式提供的一种用户行为画像生成装置的功能模块组成框图；
28.图6为本技术实施方式提供的一种电子设备的结构示意图。
具体实施方式
29.下面将结合本技术实施方式中的附图，对本技术实施方式中的技术方案进行清楚、完整地描述，显然，所描述的实施方式是本技术一部分实施方式，而不是全部的实施方式。基于本技术中的实施方式，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施方式，都属于本技术保护的范围。
30.本技术的说明书和权利要求书及所述附图中的术语“第一”、“第二”、“第三”和“第四”等是用于区别不同对象，而不是用于描述特定顺序。此外，术语“包括”和“具有”以及它们任何变形，意图在于覆盖不排他的包含。例如包含了一系列步骤或单元的过程、方法、系统、产品或设备没有限定于已列出的步骤或单元，而是可选地还包括没有列出的步骤或单元，或可选地还包括对于这些过程、方法、产品或设备固有的其它步骤或单元。
31.在本文中提及“实施方式”意味着，结合实施方式描述的特定特征、结果或特性可以包含在本技术的至少一个实施方式中。在说明书中的各个位置出现该短语并不一定均是指相同的实施方式，也不是与其它实施方式互斥的独立的或备选的实施方式。本领域技术人员显式地和隐式地理解的是，本文所描述的实施方式可以与其它实施方式相结合。
32.首先，参阅图1，图1为本技术实施方式提供的一种用户行为画像生成装置的硬件结构示意图。该用户行为画像生成装置100包括至少一个处理器101，通信线路102，存储器103以及至少一个通信接口104。
33.在本实施方式中，处理器101，可以是一个通用中央处理器(central processing unit，cpu)，微处理器，特定应用集成电路(application-specific integrated circuit，asic)，或一个或多个用于控制本技术方案程序执行的集成电路。
34.通信线路102，可以包括一通路，在上述组件之间传送信息。
35.通信接口104，可以是任何收发器一类的装置(如天线等)，用于与其他设备或通信网络通信，例如以太网，ran，无线局域网(wireless local area networks，wlan)等。
36.存储器103，可以是只读存储器(read-only memory，rom)或可存储静态信息和指令的其他类型的静态存储设备，随机存取存储器(random access memory，ram)或者可存储信息和指令的其他类型的动态存储设备，也可以是电可擦可编程只读存储器(electrically erasable programmable read-only memory，eeprom)、只读光盘(compact disc read-only memory，cd-rom)或其他光盘存储、光碟存储(包括压缩光碟、激光碟、光碟、数字通用光碟、蓝光光碟等)、磁盘存储介质或者其他磁存储设备、或者能够用于携带或存储具有指令或数据结构形式的期望的程序代码并能够由计算机存取的任何其他介质，但不限于此。
37.在本实施方式中，存储器103可以独立存在，通过通信线路102与处理器101相连接。存储器103也可以和处理器101集成在一起。本技术实施方式提供的存储器103通常可以具有非易失性。其中，存储器103用于存储执行本技术方案的计算机执行指令，并由处理器
101来控制执行。处理器101用于执行存储器103中存储的计算机执行指令，从而实现本技术下述实施方式中提供的方法。
38.在可选的实施方式中，计算机执行指令也可以称之为应用程序代码，本技术对此不作具体限定。
39.在可选的实施方式中，处理器101可以包括一个或多个cpu，例如图1中的cpu0和cpu1。
40.在可选的实施方式中，该用户行为画像生成装置100可以包括多个处理器，例如图1中的处理器101和处理器107。这些处理器中的每一个可以是一个单核(single-cpu)处理器，也可以是一个多核(multi-cpu)处理器。这里的处理器可以指一个或多个设备、电路、和/或用于处理数据(例如计算机程序指令)的处理核。
41.在可选的实施方式中，若用户行为画像生成装置100为服务器，例如，可以是独立的服务器，也可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、内容分发网络(contentdelivery network，cdn)、以及大数据和人工智能平台等基础云计算服务的云服务器。则用户行为画像生成装置100还可以包括输出设备105和输入设备106。输出设备105和处理器101通信，可以以多种方式来显示信息。例如，输出设备105可以是液晶显示器(liquid crystal display，lcd)，发光二级管(light emitting diode，led)显示设备，阴极射线管(cathode ray tube，crt)显示设备，或投影仪(projector)等。输入设备106和处理器101通信，可以以多种方式接收用户的输入。例如，输入设备106可以是鼠标、键盘、触摸屏设备或传感设备等。
42.上述的用户行为画像生成装置100可以是一个通用设备或者是一个专用设备。本技术实施方式不限定用户行为画像生成装置100的类型。
43.其次，需要说明的是，本技术所公开的实施方式可以基于人工智能技术对相关的数据进行获取和处理。其中，人工智能(artificial intelligence，ai)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能，感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。
44.人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、操作/交互系统、机电一体化等技术。人工智能软件技术主要包括计算机视觉技术、机器人技术、生物识别技术、语音处理技术、自然语言处理技术以及机器学习/深度学习等几大方向。
45.最后，本技术中的用户行为画像生成方法可以应用到电商销售、线下实体销售、业务推广、电话外呼、社交平台推广等场景。本技术中主要以社交平台推广场景为例说明该用户行为画像生成方法方法，其他场景中的用户行为画像生成方法与社交平台推广场景下的实现方式类似，在此不再叙述。
46.以下，将对本技术所公开的用户行为画像生成方法进行说明：
47.参阅图2，图2为本技术实施方式提供的一种用户行为画像生成方法的流程示意图。该用户行为画像生成方法包括以下步骤：
48.201：对用户行为数据进行数据提取，得到单一行为矩阵、联合行为矩阵和非特定行为矩阵。
49.在本实施方式中，当用户在社交平台上进行交互时，通常会通过一些列的行为，比
如发帖、点赞、收藏、评论、购买、分享等完成相应目的的交互。基于此，可以通过社交平台的系统后台记录每个用户在线上的行为操作数据，作为该用户的用户行为的数据。
50.在本实施方式中，可以将用户的行为分为单一行为、联合行为和非特定行为。具体而言，单一行为表示一种不可以再进行细分的行为，对于社交平台而言，可以是：点赞行为、评论行为等行为；联合行为则是由多种相互之间存在一定的关联的多种单一行为的组合，对于社交平台而言，联合行为可以是诸如包括了单一行为中的发帖行为和评论行为的发布行为等；非特定行为则是所有单一行为的组合，简单而言，只要用户做出了某种行为，都可以属于非特定行为的范畴。由此，通过将用户的行为划分为单一行为、联合行为和非特定行为，从而实现对用户行为的进一步细粒化，同时可以使用户行为数据与特定的行为(单一行为、联合行为或非特定行为)之间的联系更加明显，以提升后续模型训练时的细粒度。
51.示例性的，本实施方式提供了一种对用户行为数据进行数据提取，得到单一行为矩阵、联合行为矩阵和非特定行为矩阵的方法，如图3所示，该方法包括：
52.301：根据用户行为数据所属的平台，确定至少一个领域标签。
53.在本实施方式中，社交平台中可以包括多个领域或话题，对此，对该多个领域或话题每个领域或话题赋予一个对应的领域标签，作为不同的领域或话题之间的区分。
54.302：对至少一个领域标签中的每个领域标签进行单一行为特征提取，得到每个领域标签对应的至少一个单一行为标签。
55.在本实施方式中，对于不同的领域或话题，用户在该领域或话题下的行为也是不同的。基于此，可以通过领域标签获取该领域或话题下的历史用户行为数据，继而分析该历史用户行为数据中每种行为的频度，继而将频度满足预设条件的行为提取为标签，得到该至少一个单一行为标签。由此，在后续提取行为数据时可以直接调用该至少一个单一行为标签进行行为匹配，从而无需在提取时同时识别行为的标签，提升了数据的提取效率。
56.303：将每个领域标签对应的至少一个单一行为标签与预设的联合行为表进行匹配，得到至少一个联合行为标签。
57.在本实施方式中，确定每个领域标签下包括的单一行为标签后，即可根据这些单一行为标签查询预设的联合行为表，得到至少一个联合行为标签。具体而言，联合行为表中记录了一些常见的联合行为和单一行为的映射关系，例如，对于联合行为“发布”，其意义为发表自己的言论，则单一行为“发帖”和“评论”均满足联合行为“发布”的意义，因此，可以将该两个单一行为标签“发帖”和“评论”组合为联合行为标签：“发布”，存储于联合行为表中。同样的，这些联合行为标签在后续提取行为数据时可以直接调用进行行为匹配，从而无需在提取时同时识别行为的标签，提升了数据的提取效率。
58.304：根据至少一个领域标签，对用户行为数据进行拆分处理，得到与至少一个领域标签一一对应的至少一个用户行为子数据。
59.在本实施方式中，将用户行为数据根据该用户活跃的领域或话题进行拆分，继而得到该用户所活跃的领域或话题的用户行为子数据。具体而言，可以将每个用户行为所发生的页面的领域标签作为每个用户行为的领域标签，继而将领域标签相同的用户行为划分为一类。基于此，拆分所得的用户行为子数据的数量应当等于该用户所活跃的领域或话题的数量。例如：某用户在社交媒体平台上，活跃于体育和娱乐领域，则应当将该用户的行为数据根据该行为是发生在体育领域，还是娱乐领域，将该行为数据拆分为体育行为子数据
和娱乐行为子数据。
60.305：对于至少一个用户行为子数据中的每个用户行为子数据，分别根据每个用户行为子数据对应的至少一个单一行为标签和至少一个联合行为标签，对每个用户行为子数据进行数据提取，得到单一子行为数据、联合子行为数据和非特定子行为数据。
61.示例性的，某个用户在社交平台上进行了若干次点赞、发帖和评论行为，且这些行为集中在体育和娱乐领域。则该用户对应的用户行为数据将被拆分为体育行为子数据和娱乐行为子数据。同时，体育领域下的单一行为标签为：点赞、发帖、评论和看比赛；联合行为标签为：发布(即发帖和评论的组合)和观赛(即点赞和看比赛的组合)；非特定行为标签为：全部行为(即点赞、发帖和评论的组合)。娱乐领域下的单一行为标签为：点赞、发帖和评论；联合行为标签为：发布(即发帖和评论的组合)；非特定行为标签为：全部行为(即点赞、发帖和评论的组合)。
62.基于此，在提取数据时，以体育行为子数据为例，分别提取行为数据中符合点赞行为、发帖行为、评论行为和看比赛行为的行为数据，作为单一子行为数据；再根据联合行为标签的组合模式，将不同的单一子行为数据进行组合，得到联合子行为数据；最后将所有单一子行为数据进行汇总，得到非特定子行为数据。
63.306：分别将每个用户行为子数据对应的单一子行为数据、联合子行为数据和非特定子行为数据进行组合，得到单一行为矩阵、联合行为矩阵和非特定行为矩阵。
64.在本实施方式中，行为矩阵可以为二维矩阵，其中，行为矩阵的每一行代表一个用户，每一列代表一个领域或话题，相交的每个元素代表该元素对应的用户在该元素对应的话题或领域下的行为得分。
65.示例性的，在本实施方式中，该行为得分可以通过统计行为次数获取。具体而言，用户1在社交媒体上进行了7次点赞行为，其中，在体育领域中点赞4次，在娱乐领域中点赞3次；5次发帖行为，其中，在体育领域中发帖2次，在娱乐领域中发帖3次；以及10次评论行为，其中，在体育领域中评论4次，在娱乐领域中评论6次。用户2在社交媒体上进行了6次点赞行为，其中，在体育领域中点赞3次，在娱乐领域中点赞3次；7次发帖行为，其中，在体育领域中发帖4次，在娱乐领域中发帖3次；以及8次评论行为，其中，在体育领域中评论3次，在娱乐领域中评论5次。由此，可以得到如图4所示的单一行为矩阵、联合行为矩阵和非特定行为矩阵。
66.202：对单一行为矩阵进行矩阵分解，得到单一行为特征组，并根据单一行为特征组进行用户画像构建，得到单一行为画像。
67.在本实施方式中，在对单一行为矩阵进行矩阵分解之前，还需要对单一行为矩阵中的缺失值进行补全，以消除或减轻缺失值造成的误差。具体而言，单一行为矩阵中每一行代表一个用户，而每一列则代表一个领域或话题，若某个用户对某个领域或话题有过行为，则矩阵中处于该用户所在的行和对应的该领域或话题所在的列的交叉的位置的元素值用于表示该用户在该领域或话题下的某种行为的分值。而如果该用户对该领域或话题没有做出行为，则在生成矩阵时该交叉位置会置空处理。但是，这些置空的位置会对后续的数据分析造成一定的影响，继而影响后续所建立的用户行为画像的准确性。因此，在本实施方式中，需要对这些置空的位置进行补全。
68.示例性的，在本实施方式中，可以根据单一行为矩阵中每个确定元素的元素值，将
单一行为矩阵分解为第一补全矩阵和第二补全矩阵。简单而言，该确定元素为单一行为矩阵中除去缺失实际值的元素之外的所有元素，即拥有明确值的元素。换而言之，在本次分解中，仅考虑单一行为矩阵中确定元素的元素值，在分解后分解的结果是否准确。由此，可以得到没有空置位置的第一补全矩阵和第二补全矩阵。此时，再通过将分解过程逆向还原，即可通过第一补全矩阵和第二补全矩阵，确定单一行为矩阵中每个缺失元素的元素值，得到补全后的单一行为矩阵，即第一单一行为矩阵。
69.示例性的，可以采用奇异值分解(singular value decomposition，svd)对单一行为矩阵进行矩阵分解。具体而言，通过奇异值分解中的funk-svd算法，将单一行为矩阵m(m*n)分解成第一补全矩阵p(m*d)和第二补全矩阵q(d*n)，其中，d为自定义维度。继而，第一行为矩阵m(m*n)中的缺失元素的元素值、第一补全矩阵p(m*d)和第二补全矩阵q(d*n)之间满足公式
①
：
[0070][0071]
其中，m
uv
表示单一行为矩阵m中第u行第v列的缺失元素的元素值，d为自定义维度，p
uk
为第一补全矩阵p中第u行第k列的值，q
kv
为第二补全矩阵q中第k行第v列的值，d、u、v、k为大于或等于1的整数。
[0072]
在可选的实施方式中，还可以采用简单补全的方式，比如用全局平均值或者用户话题的平均值，补全未评分的分值，得到补全后的矩阵。具体而言，可以确定单一行为矩阵中所有确定元素的元素值的平均值，其中，确定元素为单一行为矩阵中除去缺失实际值的元素之外的所有元素。再将平均值作为单一行为矩阵中每个缺失元素的元素值，得到第一单一行为矩阵，其中，缺失元素为单一行为矩阵中除去所有确定元素之外的所有元素。
[0073]
在获得被补全的第一单一行为矩阵后，即可将第一单一行为矩阵进行矩阵分解，得到第一分解矩阵和第二分解矩阵。继而根据第一分解矩阵和第二分解矩阵，确定单一行为特征组。
[0074]
具体而言，在本实施方式中，可以采用非负分解的方式，分解该第一单一行为矩阵，由此，第一单一行为矩阵、第一分解矩阵和第二分解矩阵之间满足公式
②
：
[0075][0076]
其中，v
ij
表示第一单一行为矩阵中第i行第j列的值，e
ih
表示分解所得的第一矩阵中第i行第h列的值，g
hj
表示分解所得的第二矩阵中第h行第j列的值，λ
ij
表示v
ij
的误差项，q为自定义维度，且h、q、i、j为大于或等于0的整数。
[0077]
此外，在本实施方式中，通过特征组进行用户画像构建的方式为本领域中常用的构建方式，例如：可以将单一行为特征组输入预设的画像构建模型，继而得到单一行为画像。换而言之，本领域中任何可以实现由行为特征构建用户画像的方法均可应用于本实施方式，在此不再赘述。
[0078]
203：对联合行为矩阵进行矩阵分解，得到联合行为特征组，并根据联合行为特征组进行用户画像构建，得到联合行为画像。
[0079]
在本实施方式中，对联合行为矩阵进行矩阵分解，得到联合行为特征组，并根据联合行为特征组进行用户画像构建，得到联合行为画像的方法，与步骤202中对单一行为矩阵
进行矩阵分解，得到单一行为特征组，并根据单一行为特征组进行用户画像构建，得到单一行为画像的方法相似，在此不再赘述。
[0080]
204：对非特定行为矩阵进行矩阵分解，得到非特定行为特征组，并根据非特定行为特征组进行用户画像构建，得到非特定行为画像。
[0081]
在本实施方式中，对非特定行为矩阵进行矩阵分解，得到非特定行为特征组，并根据非特定行为特征组进行用户画像构建，得到非特定行为画像的方法，与步骤202中对单一行为矩阵进行矩阵分解，得到单一行为特征组，并根据单一行为特征组进行用户画像构建，得到单一行为画像的方法相似，在此不再赘述。
[0082]
205：将单一行为画像、联合行为画像和非特定行为画像输入权重确定模型，确定单一行为画像对应的第一权重、联合行为画像对应的第二权重和非特定行为画像对应的第三权重。
[0083]
在本实施方式中，该权重确定模型可以是基于机器学习的分类器模型。
[0084]
206：根据第一权重、第二权重和第三权重，对单一行为画像、联合行为画像和非特定行为画像进行加权求和处理，得到用户的用户行为画像。
[0085]
综上所述，本发明所提供的用户行为画像生成方法中，通过将用户行为划分为单一行为，联合行为和非特定行为，将用户行为数据进一步细粒化。继而在单一行为矩阵、联合行为矩阵和非特定行为矩阵的基础上，分别对单一行为矩阵、联合行为矩阵和非特定行为矩阵进行矩阵分解，构建单一行为画像、联合行为画像和非特定行为画像。最后，通过权重确定模型确定单一行为画像、联合行为画像和非特定行为画像各自的权重，继而对单一行为画像、联合行为画像和非特定行为画像进行加权，得到最终的用户行为画像。由此，生成的用户行为画像拥有更高细粒度，可以反映用户在各个领域或话题下的活跃程度，更可以反映导致该用户在各个领域或话题下活跃的原因。基于此，可以更加精准的推断用户的喜好，继而针对性的对用户投放相应的产品和服务，提升了投放的有效率和真实客户的转化率，同时降低了投放成本。
[0086]
参阅图5，图5为本技术实施方式提供的一种用户行为画像生成装置的功能模块组成框图。如图5所示，该用户行为画像生成装置500包括：
[0087]
提取模块501，用于对用户行为数据进行数据提取，得到单一行为矩阵、联合行为矩阵和非特定行为矩阵；
[0088]
分解模块502，用于对单一行为矩阵进行矩阵分解，得到单一行为特征组，并根据单一行为特征组进行用户画像构建，得到单一行为画像，对联合行为矩阵进行矩阵分解，得到联合行为特征组，并根据联合行为特征组进行用户画像构建，得到联合行为画像，以及对非特定行为矩阵进行矩阵分解，得到非特定行为特征组，并根据非特定行为特征组进行用户画像构建，得到非特定行为画像；
[0089]
权重确定模块503，用于将单一行为画像、联合行为画像和非特定行为画像输入权重确定模型，确定单一行为画像对应的第一权重、联合行为画像对应的第二权重和非特定行为画像对应的第三权重；
[0090]
画像生成模块504，用于根据第一权重、第二权重和第三权重，对单一行为画像、联合行为画像和非特定行为画像进行加权求和处理，得到用户的用户行为画像。
[0091]
在本发明的实施方式中，在对用户行为数据进行数据提取，得到单一行为矩阵、联
合行为矩阵和非特定行为矩阵方面，提取模块501，具体用于：
[0092]
根据用户行为数据所属的平台，确定至少一个领域标签；
[0093]
对至少一个领域标签中的每个领域标签进行单一行为特征提取，得到每个领域标签对应的至少一个单一行为标签；
[0094]
将每个领域标签对应的至少一个单一行为标签与预设的联合行为表进行匹配，得到至少一个联合行为标签；
[0095]
根据至少一个领域标签，对用户行为数据进行拆分处理，得到至少一个用户行为子数据，其中，至少一个用户行为子数据与至少一个领域标签一一对应；
[0096]
对于至少一个用户行为子数据中的每个用户行为子数据，分别根据每个用户行为子数据对应的至少一个单一行为标签和至少一个联合行为标签，对每个用户行为子数据进行数据提取，得到单一子行为数据、联合子行为数据和非特定子行为数据；
[0097]
分别将每个用户行为子数据对应的单一子行为数据、联合子行为数据和非特定子行为数据进行组合，得到单一行为矩阵、联合行为矩阵和非特定行为矩阵。
[0098]
在本发明的实施方式中，在对单一行为矩阵进行矩阵分解，得到单一行为特征组方面，分解模块502，具体用于：
[0099]
对单一行为矩阵进行补全处理，得到第一单一行为矩阵；
[0100]
将第一单一行为矩阵进行矩阵分解，得到第一分解矩阵和第二分解矩阵，其中，第一单一行为矩阵、第一分解矩阵和第二分解矩阵，满足公式
③
：
[0101][0102]
其中，v
ij
表示第一单一行为矩阵中第i行第j列的值，e
ih
表示分解所得的第一矩阵中第i行第h列的值，g
hj
表示分解所得的第二矩阵中第h行第j列的值，λ
ij
表示v
ij
的误差项，q为自定义维度，且h、q、i、j为大于或等于0的整数；
[0103]
根据第一分解矩阵和第二分解矩阵，确定单一行为特征组。
[0104]
在本发明的实施方式中，在对单一行为矩阵进行补全处理，得到第一单一行为矩阵方面，分解模块502，具体用于：
[0105]
根据单一行为矩阵中每个确定元素的元素值，将单一行为矩阵分解为第一补全矩阵和第二补全矩阵，其中，确定元素为单一行为矩阵中除去缺失实际值的元素之外的所有元素；
[0106]
根据第一补全矩阵和第二补全矩阵，确定单一行为矩阵中每个缺失元素的元素值，得到第一单一行为矩阵，其中，缺失元素为单一行为矩阵中除去所有确定元素之外的所有元素，且每个缺失元素的元素值、第一补全矩阵和第二补全矩阵满足公式
④
：
[0107][0108]
其中，m
uv
表示单一行为矩阵中第u行第v列的缺失元素的元素值，d为自定义维度，p
uk
为第一补全矩阵中第u行第k列的值，q
kv
为第二补全矩阵中第k行第v列的值，d、u、v、k为大于或等于1的整数。
[0109]
在本发明的实施方式中，在对单一行为矩阵进行补全处理，得到第一单一行为矩阵方面，分解模块502，具体用于：
[0110]
确定单一行为矩阵中所有确定元素的元素值的平均值，其中，确定元素为单一行为矩阵中除去缺失实际值的元素之外的所有元素；
[0111]
将平均值作为单一行为矩阵中每个缺失元素的元素值，得到第一单一行为矩阵，其中，缺失元素为单一行为矩阵中除去所有确定元素之外的所有元素。
[0112]
参阅图6，图6为本技术实施方式提供的一种电子设备的结构示意图。如图6所示，电子设备600包括收发器601、处理器602和存储器603。它们之间通过总线604连接。存储器603用于存储计算机程序和数据，并可以将存储器603存储的数据传输给处理器602。
[0113]
处理器602用于读取存储器603中的计算机程序执行以下操作：
[0114]
对用户行为数据进行数据提取，得到单一行为矩阵、联合行为矩阵和非特定行为矩阵；
[0115]
对单一行为矩阵进行矩阵分解，得到单一行为特征组，并根据单一行为特征组进行用户画像构建，得到单一行为画像；
[0116]
对联合行为矩阵进行矩阵分解，得到联合行为特征组，并根据联合行为特征组进行用户画像构建，得到联合行为画像；
[0117]
对非特定行为矩阵进行矩阵分解，得到非特定行为特征组，并根据非特定行为特征组进行用户画像构建，得到非特定行为画像；
[0118]
将单一行为画像、联合行为画像和非特定行为画像输入权重确定模型，确定单一行为画像对应的第一权重、联合行为画像对应的第二权重和非特定行为画像对应的第三权重；
[0119]
根据第一权重、第二权重和第三权重，对单一行为画像、联合行为画像和非特定行为画像进行加权求和处理，得到用户的用户行为画像。
[0120]
在本发明的实施方式中，在对用户行为数据进行数据提取，得到单一行为矩阵、联合行为矩阵和非特定行为矩阵方面，处理器602，具体用于执行以下操作：
[0121]
根据用户行为数据所属的平台，确定至少一个领域标签；
[0122]
对至少一个领域标签中的每个领域标签进行单一行为特征提取，得到每个领域标签对应的至少一个单一行为标签；
[0123]
将每个领域标签对应的至少一个单一行为标签与预设的联合行为表进行匹配，得到至少一个联合行为标签；
[0124]
根据至少一个领域标签，对用户行为数据进行拆分处理，得到至少一个用户行为子数据，其中，至少一个用户行为子数据与至少一个领域标签一一对应；
[0125]
对于至少一个用户行为子数据中的每个用户行为子数据，分别根据每个用户行为子数据对应的至少一个单一行为标签和至少一个联合行为标签，对每个用户行为子数据进行数据提取，得到单一子行为数据、联合子行为数据和非特定子行为数据；
[0126]
分别将每个用户行为子数据对应的单一子行为数据、联合子行为数据和非特定子行为数据进行组合，得到单一行为矩阵、联合行为矩阵和非特定行为矩阵。
[0127]
在本发明的实施方式中，在对单一行为矩阵进行矩阵分解，得到单一行为特征组方面，处理器602，具体用于执行以下操作：
[0128]
对单一行为矩阵进行补全处理，得到第一单一行为矩阵；
[0129]
将第一单一行为矩阵进行矩阵分解，得到第一分解矩阵和第二分解矩阵，其中，第
一单一行为矩阵、第一分解矩阵和第二分解矩阵，满足公式
⑤
：
[0130][0131]
其中，v
ij
表示第一单一行为矩阵中第i行第j列的值，e
ih
表示分解所得的第一矩阵中第i行第h列的值，g
hj
表示分解所得的第二矩阵中第h行第j列的值，λ
ij
表示v
ij
的误差项，q为自定义维度，且h、q、i、j为大于或等于0的整数；
[0132]
根据第一分解矩阵和第二分解矩阵，确定单一行为特征组。
[0133]
在本发明的实施方式中，在对单一行为矩阵进行补全处理，得到第一单一行为矩阵方面，处理器602，具体用于执行以下操作：
[0134]
根据单一行为矩阵中每个确定元素的元素值，将单一行为矩阵分解为第一补全矩阵和第二补全矩阵，其中，确定元素为单一行为矩阵中除去缺失实际值的元素之外的所有元素；
[0135]
根据第一补全矩阵和第二补全矩阵，确定单一行为矩阵中每个缺失元素的元素值，得到第一单一行为矩阵，其中，缺失元素为单一行为矩阵中除去所有确定元素之外的所有元素，且每个缺失元素的元素值、第一补全矩阵和第二补全矩阵满足公式
⑥
：
[0136][0137]
其中，m
uv
表示单一行为矩阵中第u行第v列的缺失元素的元素值，d为自定义维度，p
uk
为第一补全矩阵中第u行第k列的值，q
kv
为第二补全矩阵中第k行第v列的值，d、u、v、k为大于或等于1的整数。
[0138]
在本发明的实施方式中，在对单一行为矩阵进行补全处理，得到第一单一行为矩阵方面，处理器602，具体用于执行以下操作：
[0139]
确定单一行为矩阵中所有确定元素的元素值的平均值，其中，确定元素为单一行为矩阵中除去缺失实际值的元素之外的所有元素；
[0140]
将平均值作为单一行为矩阵中每个缺失元素的元素值，得到第一单一行为矩阵，其中，缺失元素为单一行为矩阵中除去所有确定元素之外的所有元素。
[0141]
应理解，本技术中的用户行为画像生成装置可以包括智能手机(如android手机、ios手机、windows phone手机等)、平板电脑、掌上电脑、笔记本电脑、移动互联网设备mid(mobile internet devices，简称：mid)、机器人或穿戴式设备等。上述用户行为画像生成装置仅是举例，而非穷举，包含但不限于上述用户行为画像生成装置。在实际应用中，上述用户行为画像生成装置还可以包括：智能车载终端、计算机设备等等。
[0142]
通过以上的实施方式的描述，本领域的技术人员可以清楚地了解到本发明可借助软件结合硬件平台的方式来实现。基于这样的理解，本发明的技术方案对背景技术做出贡献的全部或者部分可以以软件产品的形式体现出来，该计算机软件产品可以存储在存储介质中，如rom/ram、磁碟、光盘等，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行本发明各个实施方式或者实施方式的某些部分所述的方法。
[0143]
因此，本技术实施方式还提供一种计算机可读存储介质，所述计算机可读存储介质存储有计算机程序，所述计算机程序被处理器执行以实现如上述方法实施方式中记载的
任何一种用户行为画像生成方法的部分或全部步骤。例如，所述存储介质可以包括硬盘、软盘、光盘、磁带、磁盘、优盘、闪存等。
[0144]
本技术实施方式还提供一种计算机程序产品，所述计算机程序产品包括存储了计算机程序的非瞬时性计算机可读存储介质，所述计算机程序可操作来使计算机执行如上述方法实施方式中记载的任何一种用户行为画像生成方法的部分或全部步骤。
[0145]
需要说明的是，对于前述的各方法实施方式，为了简单描述，故将其都表述为一系列的动作组合，但是本领域技术人员应该知悉，本技术并不受所描述的动作顺序的限制，因为依据本技术，某些步骤可以采用其他顺序或者同时进行。其次，本领域技术人员也应该知悉，说明书中所描述的实施方式均属于可选的实施方式，所涉及的动作和模块并不一定是本技术所必须的。
[0146]
在上述实施方式中，对各个实施方式的描述都各有侧重，某个实施方式中没有详述的部分，可以参见其他实施方式的相关描述。
[0147]
在本技术所提供的几个实施方式中，应该理解到，所揭露的装置，可通过其它的方式实现。例如，以上所描述的装置实施方式仅仅是示意性的，例如所述单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，例如多个单元或组件可以结合或者可以集成到另一个系统，或一些特征可以忽略，或不执行。另一点，所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口，装置或单元的间接耦合或通信连接，可以是电性或其它的形式。
[0148]
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施方式方案的目的。
[0149]
另外，在本技术各个实施方式中的各功能单元可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现，也可以采用软件程序模块的形式实现。
[0150]
所述集成的单元如果以软件程序模块的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储器中。基于这样的理解，本技术的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储器中，包括若干指令用以使得一台计算机设备(可为个人计算机、服务器或者网络设备等)执行本技术各个实施方式所述方法的全部或部分步骤。而前述的存储器包括：u盘、只读存储器(rom，read-only memory)、随机存取存储器(ram，random access memory)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。
[0151]
本领域普通技术人员可以理解上述实施方式的各种方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成，该程序可以存储于一计算机可读存储器中，存储器可以包括：闪存盘、只读存储器(英文：read-only memory，简称：rom)、随机存取器(英文：random access memory，简称：ram)、磁盘或光盘等。
[0152]
以上对本技术实施方式进行了详细介绍，本文中应用了具体个例对本技术的原理及实施方式进行了阐述，以上实施方式的说明只是用于帮助理解本技术的方法及其核心思想；同时，对于本领域的一般技术人员，依据本技术的思想，在具体实施方式及应用范围上
均会有改变之处，综上所述，本说明书内容不应理解为对本技术的限制。

再多了解一些

1/2 1 2 下一页尾页

本文用于企业家、创业者技术爱好者查询，结果仅供参考。

上一篇：返回列表
下一篇：生命周期消息的分发方法、系统、设备、介质与流程

用户行为画像生成方法、装置、电子设备及存储介质与流程

相关文献

最热文献